Modul Word Graph Frasa Kata Pada

advertisement
2
aplikasi BogorDelftConstruct berdasarkan hasil
analisis aturan dari penelitian sebelumnya.
Ruang Lingkup
Ruang lingkup untuk penelitian ini dibatasi
pada pengembangan modul sistem aplikasi
BogorDelftConstruct untuk membuat modul
word graph frasa kata sesuai aturan-aturan
pembentukan kata dari hasil analisis penelitian
sebelumnya yang dilakukan oleh Mahmuda
(2010). Berikut ini merupakan batasan – batasan
sistem pada pengembangan yang dilakukan:
a
Pada sistem ini yang menjadi masukan
adalah 2 sampai 3 kata.
b
Makna semantik dari frasa kata tidak
diperhatikan.
c
Penggambaran graph disesuaikan dengan
sistem
BogorDelftConstruct
Deni
Romadoni (2009).
Manfaat
Penelitian ini diharapkan dapat memberikan
manfaat agar dapat memvisualisasikan makna
suatu frasa kata yang direpresentasikan dalam
bentuk word graph sehingga tidak terjadi
ambiguitas.
TINJAUAN PUSTAKA
Natural Language Processing (NLP)
Secara umum, natural language atau bahasa
alami (yang digunakan manusia) adalah metode
dan sistem simbol yang paling banyak
digunakan untuk mengekspresikan pikiran
manusia dan pertukaran informasi. Terdapat
sebuah pemisah antara bahasa formal atau
bahasa buatan (yang digunakan oleh komputer)
dan bahasa alami. Komunikasi antara komputer
dan manusia hanya dimungkinkan ketika
banyak penelitian yang bertujuan untuk
menjembatani pemisah di antara keduanya
(Zhang 2002). Secara alami menggambarkan
dan memodelkan bahasa alami adalah dasar
untuk perkembangan dari proses memaknai
bahasa alami dan menentukan arah proses
penelitian dari bahasa alami.
Proses memahami bahasa alami disebut
parsing. Dalam melakukan parsing terhadap
sebuah kalimat, diperlukan tata bahasa untuk
menggambarkan bagian-bagian dari kalimat
tersebut. Ada dua faktor yang diperhatikan
dalam menganalisis sebuah kalimat, yaitu
sintaksis dan semantik. Perbedaan sintaksis dan
semantik adalah sintaksis melakukan analisis
berdasarkan bentuk dari sebuah kalimat
sedangkan semantik menganalisis bagaimana
mengartikan suatu kalimat (Hulliyah 2007).
Stemming
Stemming merupakan proses menemukan
kata dasar dari suatu kata berimbuhan dengan
membuang awalan (prefiks) dan akhiran
(sufiks). Tujuannya adalah untuk menghemat
media penyimpanan dan mempercepat proses
pencarian kata (Liddy 2001).
Knowledge Graph (KG)
Teori KG adalah jenis sudut pandang baru,
yang digunakan untuk menggambarkan bahasa
manusia saat lebih memfokuskan pada aspek
semantik daripada aspek sintatik. KG
mempunyai kemampuan lebih kuat untuk
mengekspresikan dan menggambarkan lebih
dalam semantic layers. KG juga dapat
meminimumkan penggunaan relation set dan
menirukan pengertian dari jalan pikiran manusia
(Zhang 2002).
KG sebagai bagian dari metode baru yang
merepresentasikan pengetahuan, tergolong pada
kategori semantic network. Dalam prinsipnya,
KG tersusun dari concept (tokens dan types) dan
relationship (binary dan multivariate relation)
(Zhang 2002).
Concept
Representasi
pemikiran
yang
dapat
dimodelkan dengan KG disebut dengan mind
graph. Concept merupakan komponen dari
mind graph yang menerangkan persepsi
mengenai sesuatu (Zhang 2002).
Token
Token merupakan node dalam KG, yang
dinyatakan dengan simbol □. Token
menyatakan segala sesuatu yang kita alami
dalam dunia nyata atau bahkan mengenai
sebuah konsep dalam pikiran kita. Dalam
metode
KG
segala
sesuatu
akan
direpresentasikan atau digambarkan sebagai
sebuah token (Zhang 2002) .
Type
Type adalah konsep yang berisi informasi
umum. Type bersifat objektif karena merupakan
hasil kesepakatan bersama (Zhang 2002).
Word Graph
Word Graph adalah unit dasar dari NLP.
Word graph dibangun dari kata depan dan kata
tambahan (seperti kata sifat dan kata
keterangan) (Zhang
2002). Word graph
3
merupakan graph dari kata atau serangkaian
kata. Dalam metode KG, setiap kata
berhubungan dengan sebuah word graph,
menyatakan arti kata yang disebut dengan
semantic word graph. Gabungan semantic word
graph dalam sebuah kalimat akan membentuk
sentence graph. Graf yang merepresentasikan
gabungan dari sentence graph dalam sebuah
teks disebut text graph yang terdapat
pengetahuan di dalamnya (Hoede & Nurdiati
2008).
3 EQU (Equality)
Relasi ini digunakan di antara dua token
yang mengekspresikan keduanya adalah sama
dan sederajat. Contoh: “anjing bernama Pluto”.
Pernyataan tersebut dapat dilihat pada Gambar
3.
anjing
EQU
ALI
Pluto
EQU
Aspek Ontologi
Ontologi adalah ilmu untuk menggambarkan
beberapa konsep dan relasi-relasi diantaranya
dengan maksud memberikan definisi yang
cukup terhadap ide-ide yang dituangkan dengan
komputer untuk merepresentasikan ide-ide
tersebut dan logikanya (Hulliyah
2007).
Berdasarkan ontologi yang dimiliki inilah KG
dapat membangun sebuah model yang dapat
digunakan untuk memahami bahasa alami. Hal
ini diperlukan agar arti dari suatu kalimat dapat
diekspresikan. Arti dari kata harus terlebih
dahulu diketahui untuk dapat mengartikan
sebuah kalimat (Rusiyamti 2008).
Ontologi word graph sampai saat ini
direpresentasikan dengan sebuah node, 8 types
binary relationship, dan 4 types n-ary
relationship
atau
disebut juga
frame
relationship serta Ontologi F (Focus). Berikut
ini adalah gambaran dari 8 types relationship
(Zhang 2002) dan Ontologi F (Focus):
1 ALI (Alikeness)
Relasi ALI digunakan di antara dua token
yang memilki unsur-unsur yang sama. Contoh
penggunaan relasi ALI dapat dilihat pada
Gambar 1.
Gambar 3 Contoh penggunaan relasi EQU.
4 SUB (Subset)
Bila
terdapat
dua
token
yang
mengekspresikan
dua
rangkaian
secara
berurutan dan satu token merupakan bagian dari
token yang lainnya, di antara kedua token
tersebut terdapat relasi SUB. Contoh: “ekor
merupakan bagian dari kucing”. Pernyataan
tersebut dapat dilihat pada Gambar 4.
ALI
ekor
SUB
ALI
kucing
Gambar 4 Contoh penggunaan relasi SUB.
5 DIS (Dissparatness)
Relasi
DIS
digunakan
untuk
mengekspresikan bahwa dua token tidak
memiliki hubungan satu dengan yang lainnya.
Contoh relasi DIS digunakan untuk menunjukan
kata “berbeda”, misalnya: “air berbeda dengan
minyak” dapat dinyatakan dengan graph yang
diperlihatkan pada Gambar 5.
air
ALI
DIS
ALI
minyak
ALI
tumbuhan
Gambar 5 Contoh penggunaan relasi DIS.
Gambar 1 Contoh penggunaan relasi ALI.
2 CAU (Causality)
Relasi CAU mengekspresikan hubungan
antara sebab dan akibat, atau sesuatu hal yang
memengaruhi sesuatu yang lain. Contoh: “Ibu
makan nasi”. Kalimat tersebut dapat dilihat
pada Gambar 2.
ibu
ALI
CAU
CAU
ALI
nasi
ALI
makan
Gambar 2 Contoh penggunaan relasi CAU.
6 ORD (Ordering)
Relasi ORD mengekspresikan bahwa dua
hal mempunyai urutan satu sama lain. Contoh
penggunaan relasi ORD untuk menyatakan
“pagi sampai sore”, ditunjukkan pada Gambar
6.
pagi
ALI
ORD
ALI
sore
Gambar 6 Contoh penggunaan relasi ORD.
4
7 PAR (Attribute)
Relasi PAR mengekspresikan bahwa sebuah
token adalah sebuah atribut dari token yang
lain. Contohnya untuk menyatakan frasa “apel
merah” . Pernyataan tersebut dapat dilihat pada
Gambar 7.
apel ALI
PAR
ALI
merah
Gambar 7 Contoh penggunaan relasi PAR.
8 SKO (Informational Dependency)
Relasi skolem (SKO) digunakan jika suatu
token informasinya bergantung pada token
yang
lainnya.
Contoh:
pernyataan
∀x ∈ N, ∃ y ∈ N (x 2 = y) yang memuat
pada Gambar 10 menunjukkan bahwa adik tidak
bahagia.
Gambar 10 Contoh penggunaan frame
NEGPAR.
3 POSPAR : Possibility of a situation
POSPAR mengekspresikan kemungkinan
terjadi dari isi frame. Misalkan diketahui a:
“Adik Bahagia”. Frame pada Gambar 11
menunjukkan bahwa mungkin saja adik
bahagia.
universal quantifiers. Pada pernyataan tersebut
nilai y bergantung pada x . Bentuk grafnya
dapat dilihat pada Gambar 8.
x
ALI
SKO
ALI
y
Gambar 8 Contoh penggunaan relasi SKO.
9 Ontologi F (Focus)
Ontologi F digunakan untuk menunjukkan
fokus dari suatu graf (Nurdiati & Hoede 2009).
Ontologi F digunakan untuk menunjukkan kata
atau kalimat yang diterangkan dalam suatu
pernyataan (inti).
Sebuah frame adalah sebuah node yang
diberikan label (Zhang 2002). Adapun untuk
empat frame relationship dapat dijelaskan
sebagai berikut:
1 FPAR: Focusing on a situation
FPAR mengekspresikan bahwa sekumpulan
subgraph dari graph adalah bagian dari seluruh
graph yang telah dibentuk. Misalkan dinyatakan
bahwa a: “Adik Bahagia”. Pernyataan tersebut
dapat dilihat pada Gambar 9.
Gambar 9 Contoh penggunaan frame FPAR.
2 NEGPAR: Negation of a situation
NEGPAR mengekspresikan peniadaan atau
pengingkaran terjadinya isi dari frame.
Misalkan diketahui a: “Adik Bahagia”. Frame
Gambar 11 Contoh penggunaan frame
POSPAR.
4 NECPAR : Necessity of a situation
NECPAR mengekspresikan perlu, butuh
atau keharusan terjadi dari isi frame. Misalkan
diketahui a: “Adik Bahagia”. Frame pada
Gambar 12 menunjukkan bahwa seharusnya
adik bahagia.
Gambar 12 Contoh penggunaan frame
NECPAR.
Ekspresi Semantik dengan KG
Dalam metode KG untuk membangun
model pemahaman bahasa alami dibutuhkan
kemampuan untuk menyatakan makna kata atau
kalimat. Kemampuan untuk memahami makna
kalimat harus disertai pemahaman makna setiap
kata. Kemudian makna setiap kata disusun
menjadi makna suatu kalimat secara
keseluruhan (Zhang 2002).
Pemaknaan setiap kata menjadi dasar
pembentukan word graph. Pemaknaan kata
dinyatakan dalam bentuk hubungan antar
konsep. Makna kata dalam metode KG
membangun struktur arti sehingga dapat
mengatasi ambiguitas.
5
Frasa Kata
Pike (1977) menyatakan bahwa frasa adalah
perluasan kata. Wujudnya dua kata atau lebih.
Tataran frasa urutannya ada di bawah klausa
dan di atas kata (Cook 1969). Frasa dibentuk
dari beberapa kata dan mengisi gatra pada
tataran klausa. Jadi, beda kata dari frasa
hanyalah kenyataan bahwa frasa merupakan
perluasan dari kata atau dengan kata lain frasa
adalah bentuk bahasa dimana kata menjadi
unsur pembentuknya. Dalam frasa tunggal, kata
adalah unsur langsungnya.
Frasa adalah satuan gramatikal berupa
gabungan
kata
dengan
kata
bersifat
nonprediktif. Menurut hubungan unsur dalam
strukturnya, frasa dapat dibedakan atas:
1 Frasa Eksosentris
Sebuah frasa bersifat eksosentris bila hasil
gabungan itu berlainan kelasnya dari unsur yang
membentuknya (Keraf 1991). Konstruksi ini
dapat dibedakan atas :
•
Frasa eksosentris direktif
Dalam bentuk semacam ini sebuah
unsur pembentuk frasa akan bertindak sebagai
partikel, sedang unsur lainnya merupakan
sumbu
(aksis).
Misalnya:
mengalami
penurunan dan pemerasan kopra.
•
Frasa eksosentris konektif
Dalam bentuk ini salah satu unsurnya
adalah konektor yang berfungsi sebagai
penghubung antar unsur pembentuk frasa yang
menjadi atribut predikat dengan subjeknya
(Keraf 1991). Dalam hal ini atribut predikat
tidak menerangkan konektornya, tetapi
menerangkan subjeknya. Misalnya: menjadi
tepung dan adalah keberagaman.
2 Frasa Endosentris
Sebuah frasa bersifat endosentris bila
gabungan dua kata atau lebih yang
menunjukkan bahwa kelas kata dari perpaduan
itu sama dengan kelas kata dari salah satu (atau
lebih) unsur pembentuknya (Keraf 1991). Kata
yang kelas katanya sama dengan kelas kata
penggabungan itu disebut inti atau pusat. Frasa
endosentris dapat dibedakan menjadi:
•
Misalnya: kebun petani dan pendapatan
petani.
•
Frasa koordinatif
Frasa koordinatif adalah frasa yang
unsur-unsur
pembentuknya
sama
kedudukannya. Dalam tipe frasa ini, kelas dari
gabungan itu sama dengan kedua atau lebih
unsurnya. Misalnya: masuk keluar dan manis
pahit.
Di samping berdasarkan hubungan unsur
dalam strukturnya, frasa juga dapat dibedakan
berdasarkan kelas kata yang menjadi inti frasa
(Keraf 1991). Jenis frasa koordinatif adalah:
1 Frasa Nominal (FN)
Frasa nominal atau frasa kata benda adalah
kelompok kata yang menyatakan atau menunjuk
suatu benda. Inti frasa nominal adalah kata
benda. Misalnya: modal bersama dan mutu
tepung jagung.
2 Frasa Verbal
Frasa verbal atau frasa kata kerja adalah
kelompok kata yang menyatakan tindakan atau
perbuatan. Inti frasa verbal adalah kata kerja.
Misalnya: dihadapi petani dan meningkatkan
biaya pengendalian.
3 Frasa Adjektival
Frasa adjektival atau frasa kata sifat adalah
kelompok kata yang menyatakan sifat atau
keadaan. Inti frasa adjektival adalah kata sifat.
Misalnya: tahan kekeringan dan putih bening.
4 Frasa Preposisional
Frasa Preposisional atau frasa kata depan
adalah kelompok kata yang terdiri dari preposisi
sebagai inti diikuti oleh kata atau kelompok kata
lain terutama kata benda. Fungsi frasa preposisi
antara lain menunjuk arah, tempat, dan waktu.
Misalnya: di lapangan dan dari pangkal daun.
Gabungan antara kata dengan kata yang
membentuk
sebuah
frasa
menimbulkan
pengertian baru atau mendukung sebuah relasi
tertentu (Keraf 1991). Hubungan makna antar
unsur yang membentuk frasa dapat berupa:
1
Relasi posesif adalah relasi yang
menunjukkan hubungan pemilik. Kata
kedua (pembatas) adalah pemilik kata
pertama. Frasa ini dapat dipisahkan
dengan kata milik dan kepunyaan.
Misalnya: ”kemampuan petani” dan
kandungan nutrisi jagung.
2
Relasi subjektif adalah relasi yang
pembatasnya adalah pelaku dari kata yang
Frasa atribut atau subordinatif
Frasa atribut atau subordinatif adalah
frasa yang salah satu dari unsur pembentuknya
bertindak sebagai inti. Adapun unsur yang
lainnya bertindak sebagai atribut dari inti.
Download