2 aplikasi BogorDelftConstruct berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup Ruang lingkup untuk penelitian ini dibatasi pada pengembangan modul sistem aplikasi BogorDelftConstruct untuk membuat modul word graph frasa kata sesuai aturan-aturan pembentukan kata dari hasil analisis penelitian sebelumnya yang dilakukan oleh Mahmuda (2010). Berikut ini merupakan batasan – batasan sistem pada pengembangan yang dilakukan: a Pada sistem ini yang menjadi masukan adalah 2 sampai 3 kata. b Makna semantik dari frasa kata tidak diperhatikan. c Penggambaran graph disesuaikan dengan sistem BogorDelftConstruct Deni Romadoni (2009). Manfaat Penelitian ini diharapkan dapat memberikan manfaat agar dapat memvisualisasikan makna suatu frasa kata yang direpresentasikan dalam bentuk word graph sehingga tidak terjadi ambiguitas. TINJAUAN PUSTAKA Natural Language Processing (NLP) Secara umum, natural language atau bahasa alami (yang digunakan manusia) adalah metode dan sistem simbol yang paling banyak digunakan untuk mengekspresikan pikiran manusia dan pertukaran informasi. Terdapat sebuah pemisah antara bahasa formal atau bahasa buatan (yang digunakan oleh komputer) dan bahasa alami. Komunikasi antara komputer dan manusia hanya dimungkinkan ketika banyak penelitian yang bertujuan untuk menjembatani pemisah di antara keduanya (Zhang 2002). Secara alami menggambarkan dan memodelkan bahasa alami adalah dasar untuk perkembangan dari proses memaknai bahasa alami dan menentukan arah proses penelitian dari bahasa alami. Proses memahami bahasa alami disebut parsing. Dalam melakukan parsing terhadap sebuah kalimat, diperlukan tata bahasa untuk menggambarkan bagian-bagian dari kalimat tersebut. Ada dua faktor yang diperhatikan dalam menganalisis sebuah kalimat, yaitu sintaksis dan semantik. Perbedaan sintaksis dan semantik adalah sintaksis melakukan analisis berdasarkan bentuk dari sebuah kalimat sedangkan semantik menganalisis bagaimana mengartikan suatu kalimat (Hulliyah 2007). Stemming Stemming merupakan proses menemukan kata dasar dari suatu kata berimbuhan dengan membuang awalan (prefiks) dan akhiran (sufiks). Tujuannya adalah untuk menghemat media penyimpanan dan mempercepat proses pencarian kata (Liddy 2001). Knowledge Graph (KG) Teori KG adalah jenis sudut pandang baru, yang digunakan untuk menggambarkan bahasa manusia saat lebih memfokuskan pada aspek semantik daripada aspek sintatik. KG mempunyai kemampuan lebih kuat untuk mengekspresikan dan menggambarkan lebih dalam semantic layers. KG juga dapat meminimumkan penggunaan relation set dan menirukan pengertian dari jalan pikiran manusia (Zhang 2002). KG sebagai bagian dari metode baru yang merepresentasikan pengetahuan, tergolong pada kategori semantic network. Dalam prinsipnya, KG tersusun dari concept (tokens dan types) dan relationship (binary dan multivariate relation) (Zhang 2002). Concept Representasi pemikiran yang dapat dimodelkan dengan KG disebut dengan mind graph. Concept merupakan komponen dari mind graph yang menerangkan persepsi mengenai sesuatu (Zhang 2002). Token Token merupakan node dalam KG, yang dinyatakan dengan simbol □. Token menyatakan segala sesuatu yang kita alami dalam dunia nyata atau bahkan mengenai sebuah konsep dalam pikiran kita. Dalam metode KG segala sesuatu akan direpresentasikan atau digambarkan sebagai sebuah token (Zhang 2002) . Type Type adalah konsep yang berisi informasi umum. Type bersifat objektif karena merupakan hasil kesepakatan bersama (Zhang 2002). Word Graph Word Graph adalah unit dasar dari NLP. Word graph dibangun dari kata depan dan kata tambahan (seperti kata sifat dan kata keterangan) (Zhang 2002). Word graph 3 merupakan graph dari kata atau serangkaian kata. Dalam metode KG, setiap kata berhubungan dengan sebuah word graph, menyatakan arti kata yang disebut dengan semantic word graph. Gabungan semantic word graph dalam sebuah kalimat akan membentuk sentence graph. Graf yang merepresentasikan gabungan dari sentence graph dalam sebuah teks disebut text graph yang terdapat pengetahuan di dalamnya (Hoede & Nurdiati 2008). 3 EQU (Equality) Relasi ini digunakan di antara dua token yang mengekspresikan keduanya adalah sama dan sederajat. Contoh: “anjing bernama Pluto”. Pernyataan tersebut dapat dilihat pada Gambar 3. anjing EQU ALI Pluto EQU Aspek Ontologi Ontologi adalah ilmu untuk menggambarkan beberapa konsep dan relasi-relasi diantaranya dengan maksud memberikan definisi yang cukup terhadap ide-ide yang dituangkan dengan komputer untuk merepresentasikan ide-ide tersebut dan logikanya (Hulliyah 2007). Berdasarkan ontologi yang dimiliki inilah KG dapat membangun sebuah model yang dapat digunakan untuk memahami bahasa alami. Hal ini diperlukan agar arti dari suatu kalimat dapat diekspresikan. Arti dari kata harus terlebih dahulu diketahui untuk dapat mengartikan sebuah kalimat (Rusiyamti 2008). Ontologi word graph sampai saat ini direpresentasikan dengan sebuah node, 8 types binary relationship, dan 4 types n-ary relationship atau disebut juga frame relationship serta Ontologi F (Focus). Berikut ini adalah gambaran dari 8 types relationship (Zhang 2002) dan Ontologi F (Focus): 1 ALI (Alikeness) Relasi ALI digunakan di antara dua token yang memilki unsur-unsur yang sama. Contoh penggunaan relasi ALI dapat dilihat pada Gambar 1. Gambar 3 Contoh penggunaan relasi EQU. 4 SUB (Subset) Bila terdapat dua token yang mengekspresikan dua rangkaian secara berurutan dan satu token merupakan bagian dari token yang lainnya, di antara kedua token tersebut terdapat relasi SUB. Contoh: “ekor merupakan bagian dari kucing”. Pernyataan tersebut dapat dilihat pada Gambar 4. ALI ekor SUB ALI kucing Gambar 4 Contoh penggunaan relasi SUB. 5 DIS (Dissparatness) Relasi DIS digunakan untuk mengekspresikan bahwa dua token tidak memiliki hubungan satu dengan yang lainnya. Contoh relasi DIS digunakan untuk menunjukan kata “berbeda”, misalnya: “air berbeda dengan minyak” dapat dinyatakan dengan graph yang diperlihatkan pada Gambar 5. air ALI DIS ALI minyak ALI tumbuhan Gambar 5 Contoh penggunaan relasi DIS. Gambar 1 Contoh penggunaan relasi ALI. 2 CAU (Causality) Relasi CAU mengekspresikan hubungan antara sebab dan akibat, atau sesuatu hal yang memengaruhi sesuatu yang lain. Contoh: “Ibu makan nasi”. Kalimat tersebut dapat dilihat pada Gambar 2. ibu ALI CAU CAU ALI nasi ALI makan Gambar 2 Contoh penggunaan relasi CAU. 6 ORD (Ordering) Relasi ORD mengekspresikan bahwa dua hal mempunyai urutan satu sama lain. Contoh penggunaan relasi ORD untuk menyatakan “pagi sampai sore”, ditunjukkan pada Gambar 6. pagi ALI ORD ALI sore Gambar 6 Contoh penggunaan relasi ORD. 4 7 PAR (Attribute) Relasi PAR mengekspresikan bahwa sebuah token adalah sebuah atribut dari token yang lain. Contohnya untuk menyatakan frasa “apel merah” . Pernyataan tersebut dapat dilihat pada Gambar 7. apel ALI PAR ALI merah Gambar 7 Contoh penggunaan relasi PAR. 8 SKO (Informational Dependency) Relasi skolem (SKO) digunakan jika suatu token informasinya bergantung pada token yang lainnya. Contoh: pernyataan ∀x ∈ N, ∃ y ∈ N (x 2 = y) yang memuat pada Gambar 10 menunjukkan bahwa adik tidak bahagia. Gambar 10 Contoh penggunaan frame NEGPAR. 3 POSPAR : Possibility of a situation POSPAR mengekspresikan kemungkinan terjadi dari isi frame. Misalkan diketahui a: “Adik Bahagia”. Frame pada Gambar 11 menunjukkan bahwa mungkin saja adik bahagia. universal quantifiers. Pada pernyataan tersebut nilai y bergantung pada x . Bentuk grafnya dapat dilihat pada Gambar 8. x ALI SKO ALI y Gambar 8 Contoh penggunaan relasi SKO. 9 Ontologi F (Focus) Ontologi F digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F digunakan untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Sebuah frame adalah sebuah node yang diberikan label (Zhang 2002). Adapun untuk empat frame relationship dapat dijelaskan sebagai berikut: 1 FPAR: Focusing on a situation FPAR mengekspresikan bahwa sekumpulan subgraph dari graph adalah bagian dari seluruh graph yang telah dibentuk. Misalkan dinyatakan bahwa a: “Adik Bahagia”. Pernyataan tersebut dapat dilihat pada Gambar 9. Gambar 9 Contoh penggunaan frame FPAR. 2 NEGPAR: Negation of a situation NEGPAR mengekspresikan peniadaan atau pengingkaran terjadinya isi dari frame. Misalkan diketahui a: “Adik Bahagia”. Frame Gambar 11 Contoh penggunaan frame POSPAR. 4 NECPAR : Necessity of a situation NECPAR mengekspresikan perlu, butuh atau keharusan terjadi dari isi frame. Misalkan diketahui a: “Adik Bahagia”. Frame pada Gambar 12 menunjukkan bahwa seharusnya adik bahagia. Gambar 12 Contoh penggunaan frame NECPAR. Ekspresi Semantik dengan KG Dalam metode KG untuk membangun model pemahaman bahasa alami dibutuhkan kemampuan untuk menyatakan makna kata atau kalimat. Kemampuan untuk memahami makna kalimat harus disertai pemahaman makna setiap kata. Kemudian makna setiap kata disusun menjadi makna suatu kalimat secara keseluruhan (Zhang 2002). Pemaknaan setiap kata menjadi dasar pembentukan word graph. Pemaknaan kata dinyatakan dalam bentuk hubungan antar konsep. Makna kata dalam metode KG membangun struktur arti sehingga dapat mengatasi ambiguitas. 5 Frasa Kata Pike (1977) menyatakan bahwa frasa adalah perluasan kata. Wujudnya dua kata atau lebih. Tataran frasa urutannya ada di bawah klausa dan di atas kata (Cook 1969). Frasa dibentuk dari beberapa kata dan mengisi gatra pada tataran klausa. Jadi, beda kata dari frasa hanyalah kenyataan bahwa frasa merupakan perluasan dari kata atau dengan kata lain frasa adalah bentuk bahasa dimana kata menjadi unsur pembentuknya. Dalam frasa tunggal, kata adalah unsur langsungnya. Frasa adalah satuan gramatikal berupa gabungan kata dengan kata bersifat nonprediktif. Menurut hubungan unsur dalam strukturnya, frasa dapat dibedakan atas: 1 Frasa Eksosentris Sebuah frasa bersifat eksosentris bila hasil gabungan itu berlainan kelasnya dari unsur yang membentuknya (Keraf 1991). Konstruksi ini dapat dibedakan atas : • Frasa eksosentris direktif Dalam bentuk semacam ini sebuah unsur pembentuk frasa akan bertindak sebagai partikel, sedang unsur lainnya merupakan sumbu (aksis). Misalnya: mengalami penurunan dan pemerasan kopra. • Frasa eksosentris konektif Dalam bentuk ini salah satu unsurnya adalah konektor yang berfungsi sebagai penghubung antar unsur pembentuk frasa yang menjadi atribut predikat dengan subjeknya (Keraf 1991). Dalam hal ini atribut predikat tidak menerangkan konektornya, tetapi menerangkan subjeknya. Misalnya: menjadi tepung dan adalah keberagaman. 2 Frasa Endosentris Sebuah frasa bersifat endosentris bila gabungan dua kata atau lebih yang menunjukkan bahwa kelas kata dari perpaduan itu sama dengan kelas kata dari salah satu (atau lebih) unsur pembentuknya (Keraf 1991). Kata yang kelas katanya sama dengan kelas kata penggabungan itu disebut inti atau pusat. Frasa endosentris dapat dibedakan menjadi: • Misalnya: kebun petani dan pendapatan petani. • Frasa koordinatif Frasa koordinatif adalah frasa yang unsur-unsur pembentuknya sama kedudukannya. Dalam tipe frasa ini, kelas dari gabungan itu sama dengan kedua atau lebih unsurnya. Misalnya: masuk keluar dan manis pahit. Di samping berdasarkan hubungan unsur dalam strukturnya, frasa juga dapat dibedakan berdasarkan kelas kata yang menjadi inti frasa (Keraf 1991). Jenis frasa koordinatif adalah: 1 Frasa Nominal (FN) Frasa nominal atau frasa kata benda adalah kelompok kata yang menyatakan atau menunjuk suatu benda. Inti frasa nominal adalah kata benda. Misalnya: modal bersama dan mutu tepung jagung. 2 Frasa Verbal Frasa verbal atau frasa kata kerja adalah kelompok kata yang menyatakan tindakan atau perbuatan. Inti frasa verbal adalah kata kerja. Misalnya: dihadapi petani dan meningkatkan biaya pengendalian. 3 Frasa Adjektival Frasa adjektival atau frasa kata sifat adalah kelompok kata yang menyatakan sifat atau keadaan. Inti frasa adjektival adalah kata sifat. Misalnya: tahan kekeringan dan putih bening. 4 Frasa Preposisional Frasa Preposisional atau frasa kata depan adalah kelompok kata yang terdiri dari preposisi sebagai inti diikuti oleh kata atau kelompok kata lain terutama kata benda. Fungsi frasa preposisi antara lain menunjuk arah, tempat, dan waktu. Misalnya: di lapangan dan dari pangkal daun. Gabungan antara kata dengan kata yang membentuk sebuah frasa menimbulkan pengertian baru atau mendukung sebuah relasi tertentu (Keraf 1991). Hubungan makna antar unsur yang membentuk frasa dapat berupa: 1 Relasi posesif adalah relasi yang menunjukkan hubungan pemilik. Kata kedua (pembatas) adalah pemilik kata pertama. Frasa ini dapat dipisahkan dengan kata milik dan kepunyaan. Misalnya: ”kemampuan petani” dan kandungan nutrisi jagung. 2 Relasi subjektif adalah relasi yang pembatasnya adalah pelaku dari kata yang Frasa atribut atau subordinatif Frasa atribut atau subordinatif adalah frasa yang salah satu dari unsur pembentuknya bertindak sebagai inti. Adapun unsur yang lainnya bertindak sebagai atribut dari inti.