BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada saat ini telah berkembang cabang ilmu bahasa komputasi berupa teknologi Natural Language Processing (NLP). Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan transaksi bahasa alami, yaitu bahasa yang biasa disampaikan oleh manusia. Beberapa di antara kategori aplikasi NLP adalah natural language translator, translator, dan text summarization (Arman 2004). Kategori terakhir telah menghasilkan suatu sistem yang melakukan ringkasan dari puluhan bahkan ratusan teks dengan tema yang sama untuk kemudian menjadi rangkuman sehingga dihasilkan pengetahuan baru. Salah satu metode baru NLP yang sedang diteliti adalah knowledge graph (KG). Metode ini mencoba melakukan tinjauan dalam menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru (Zhang 2002). Setiap orang dalam menganalisis teks pasti berbeda-beda dan bersifat subjektif. Perbedaan inilah yang menyebabkan ambiguitas dalam memahami sebuah naskah, oleh karenanya diperlukan kejelasan dalam penggunaan bahasa. Menurut Zhang, sudut pandang suatu masalah bagi setiap orang sangat subjektif, orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam konsep secara berbeda; artinya, satu konsep dengan bahasa yang sama belum tentu diinterpretasikan dengan pemahaman yang sama pula. Beberapa penelitian sebelumnya telah membahas proses ekstraksi teks, di antaranya bagaimana meringkas teks dari dokumen yang panjang menjadi beberapa paragraf sehingga didapat pengetahuan baru yang lebih sederhana tanpa mengurangi informasi yang terkandung dalam teks tersebut. Tentunya, hal ini sangat menguntungkan dan memudahkan bagi pengguna dalam memahami teks 2 yang banyak. Salah satu metode yang digunakan pada proses pemangkasan teks tersebut adalah text summarization yang lebih dulu diteliti. Pada penelitian selanjutnya, metode knowledge graph menjadi objek pembahasan yang penting, karena cara menganalisisnya memperhatikan teks berdasarkan semantik (arti kata). Meskipun pada prinsipnya metode knowledge graph hampir sama dengan text summarization, namun sudut pandang dan dasar analisisnya berbeda. Penelitian tentang KG telah dilakukan oleh beberapa orang, di antaranya: Hulliyah (2007) yang menganalisis teks dengan tema pendidikan nasional, Ikhwati (2007) menganalisis teks dengan tema kemiskinan, Berri (2008) memodifikasi kalimat sembarang menjadi kalimat efektif kemudian menransformasi menjadi text graph dan merancang algoritme dari text graph tersebut, Wulandari (2008) meneliti perancangan algoritme dari combined graph dan simplified graph, serta Rusiyamti (2008) yang membangun prosedur chunk indicator kemudian membuat chunk graph dan menggabungkan beberapa chunk graph menjadi sentence graph. Masing-masing penelitian di atas, belum sepenuhnya menyentuh secara spesifik aturan bagaimana merumuskan word graph kata benda, kata kerja, kata sifat, maupun preposisi. Perancangan aturan untuk semua jenis kata agar terbangun word graph bukanlah sesuatu yang mudah dan cepat, melainkan perlu waktu yang relatif lama dan kerja keras. Oleh karena itu, penulis tertarik melakukan penelitian tentang KG dan membatasinya pada aturan pembentukan word graph kata kerja. 1.2 Tujuan dan Manfaat Penelitian Tujuan Penelitian ini bertujuan: 1.2.1 menganalisis struktur kata kerja dalam bahasa Indonesia, 1.2.2 merancang aturan pembentukan word graph kata kerja, 1.2.3 menguji aturan pembentukan word graph kata kerja, 3 Manfaat Penelitian ini bermanfaat bagi penelitian-penelitian berikutnya sebagai salah satu pelengkap untuk penelitian yang panjang yaitu terciptanya satu software yang berfungsi sebagai pembaca sembarang dokumen berbahasa Indonesia serta menghasilkan informasi dalam bentuk graf. 1.3 Ruang Lingkup Pada penelitian ini, penulis melakukan analisis terhadap kata kerja yang sering digunakan dalam bidang pertanian meskipun tidak menutup kemungkinan katakata tersebut ditemukan dan digunakan dalam bidang lain.