Analisis Pembentukan Word Graph Kata Kerja

advertisement
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Pada saat ini telah berkembang cabang ilmu bahasa komputasi berupa
teknologi Natural Language Processing (NLP). Teknologi NLP adalah teknologi
yang memungkinkan untuk melakukan transaksi bahasa alami, yaitu bahasa yang
biasa disampaikan oleh manusia. Beberapa di antara kategori aplikasi NLP adalah
natural language translator, translator, dan text summarization (Arman 2004).
Kategori terakhir telah menghasilkan suatu sistem yang melakukan ringkasan dari
puluhan bahkan ratusan teks dengan tema yang sama untuk kemudian menjadi
rangkuman sehingga dihasilkan pengetahuan baru.
Salah satu metode baru NLP yang sedang diteliti adalah knowledge graph
(KG). Metode ini mencoba melakukan tinjauan dalam menggambarkan atau
menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya
dengan
latar
belakang
pengetahuannya
sehingga
menghasilkan
sebuah
pengetahuan baru (Zhang 2002). Setiap orang dalam menganalisis teks pasti
berbeda-beda dan bersifat subjektif. Perbedaan inilah yang menyebabkan
ambiguitas dalam memahami sebuah naskah, oleh karenanya diperlukan kejelasan
dalam penggunaan bahasa. Menurut Zhang, sudut pandang suatu masalah bagi
setiap orang sangat subjektif, orang yang berbeda akan menggambarkan
pengalaman yang ditemui ke dalam konsep secara berbeda; artinya, satu konsep
dengan bahasa yang sama belum tentu diinterpretasikan dengan pemahaman yang
sama pula.
Beberapa penelitian sebelumnya telah membahas proses ekstraksi teks, di
antaranya bagaimana meringkas teks dari dokumen yang panjang menjadi
beberapa paragraf sehingga didapat pengetahuan baru yang lebih sederhana tanpa
mengurangi informasi yang terkandung dalam teks tersebut. Tentunya, hal ini
sangat menguntungkan dan memudahkan bagi pengguna dalam memahami teks
2
yang banyak. Salah satu metode yang digunakan pada proses pemangkasan teks
tersebut adalah text summarization yang lebih dulu diteliti.
Pada penelitian selanjutnya, metode knowledge graph menjadi objek
pembahasan yang penting, karena cara menganalisisnya memperhatikan teks
berdasarkan semantik (arti kata). Meskipun pada prinsipnya metode knowledge
graph hampir sama dengan text summarization, namun sudut pandang dan dasar
analisisnya berbeda.
Penelitian tentang KG telah dilakukan oleh beberapa orang, di antaranya:
Hulliyah (2007) yang menganalisis teks dengan tema pendidikan nasional,
Ikhwati (2007) menganalisis teks dengan tema kemiskinan, Berri (2008)
memodifikasi
kalimat
sembarang
menjadi
kalimat
efektif
kemudian
menransformasi menjadi text graph dan merancang algoritme dari text graph
tersebut, Wulandari (2008) meneliti perancangan algoritme dari combined graph
dan simplified graph, serta Rusiyamti (2008) yang membangun prosedur chunk
indicator kemudian membuat chunk graph dan menggabungkan beberapa chunk
graph menjadi sentence graph.
Masing-masing penelitian di atas, belum sepenuhnya menyentuh secara
spesifik aturan bagaimana merumuskan word graph kata benda, kata kerja, kata
sifat, maupun preposisi. Perancangan aturan untuk semua jenis kata agar
terbangun word graph bukanlah sesuatu yang mudah dan cepat, melainkan perlu
waktu yang relatif lama dan kerja keras. Oleh karena itu, penulis tertarik
melakukan penelitian tentang KG dan membatasinya pada aturan pembentukan
word graph kata kerja.
1.2 Tujuan dan Manfaat Penelitian
Tujuan
Penelitian ini bertujuan:
1.2.1
menganalisis struktur kata kerja dalam bahasa Indonesia,
1.2.2
merancang aturan pembentukan word graph kata kerja,
1.2.3
menguji aturan pembentukan word graph kata kerja,
3
Manfaat
Penelitian ini bermanfaat bagi penelitian-penelitian berikutnya sebagai salah satu
pelengkap untuk penelitian yang panjang yaitu terciptanya satu software yang
berfungsi sebagai pembaca sembarang dokumen berbahasa Indonesia serta
menghasilkan informasi dalam bentuk graf.
1.3 Ruang Lingkup
Pada penelitian ini, penulis melakukan analisis terhadap kata kerja yang sering
digunakan dalam bidang pertanian meskipun tidak menutup kemungkinan katakata tersebut ditemukan dan digunakan dalam bidang lain.
Download