BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi lain. Sedangkan dalam bentuk lisan, bahasa berperan dalam mengarahkan tingkah laku manusia sehari-hari dalam berhubungan dengan orang lain. Tujuan yang mendasari penelitian bahasa alami adalah bagaimana mengimplementasikan pengetahuan manusia yang kebanyakan tersimpan dalam bentuk bahasa, agar komputer juga dapat mengerti sehingga dapat mengakses informasi berdasarkan pengetahuan yang manusia tanamkan. Pengetahuan yang diberikan berupa pengenalan terhadap struktur perubahan variasi imbuhan awal akibat perubahan fonem. Mendeteksi kelas kata tertentu dalam sejumlah besar kalimat yang tergabung dalam wacana tertentu, tentunya memakan waktu yang tidak sedikit. Namun, akan lebih mudah dan cepat jika diimplementasikan kedalam bentuk sistem. Penelitian dalam bidang pemrosesan bahasa alami sudah banyak dilakukan. Namun kebanyakan penelitian tersebut dilakukan terhadap bahasa Inggris. Penelitian bahasa alami yang dilakukan terhadap bahasa Indonesia masih sedikit dilakukan dan kurang dipublikasikan. Berdasarkan penelitian pada skripsi terdahulu menggunakan metode Nondeterministic Finite Automata (NFA) mengalami beberapa kekurangan, salah satunya ketidakakuratan keluaran yang dideteksi sebagai kata kerja, karena semua kata yang memiliki pola kata kerja akan diterima oleh sistem sehingga bentuk kata tertentu yang awal suku katanya menyerupai imbuhan juga terdeteksi sebagai kata kerja. Salah satu komponen terpenting dalam pemrosesan bahasa alami adalah pengurai (parser) struktur morfologis dari suatu kalimat. Pengurai morfologis ini mengidentifikasi dan memberi label imbuhan yang tergabung dalam sebuah 1 morfem leksikalis sehingga membentuk satu kesatuan kelas kata yang memiliki makna tunggal ataupun bermakna ganda. Proses penguraian morfem yang terkandung dalam jenis kata tertentu dalam sebuah kalimat bahkan lebih atau pada paragraf dalam sebuah teks, mirip dengan proses penguraian dalam tata bahasa pemrograman dalam dunia komputer. Perbedaan yang mendasar pada keduanya adalah tata bahasa dalam dunia komputer merupakan tata bahasa yang bebas konteks (context free grammar), sedangkan tata bahasa pada bahasa Indonesia merupakan tata bahasa alami yang peka terhadap konteks (context sensitive). Pada pengerjaan tugas akhir ini penulis akan membuat sebuah sistem untuk mendeteksi kata kerja pada Bahasa Indonesia dengan variasi awalan meN-, memper-, di- dan diper-, serta kemudian diberikan keluaran pelabelan struktur morfologis dari kata kerja tersebut. Pendeteksian akan dilakukan dengan proses parsing morfologis, sedangkan untuk keluaran menggunakan pemodelan Finite State Transducer (FST). Diharapkan dengan adanya program bantu ini, maka akan mempermudah dalam mendeteksi, memparsing, dan mendapatkan pola pelabelan struktur morfologis dari kata kerja berimbuhan meN-, memper-, di- dan diper-. 1.2 Perumusan Masalah Berdasarkan arti pentingnya parsing morfologis serta kompleksitas perubahan morfem dengan awalan imbuhan meN-, memper-, di- dan diper- maka permasalahan yang menjadi titik berat dalam penelitian ini adalah sebagai berikut: 1. Bagaimana merumuskan morfologi kata kerja aktif dari bentuk alomorfisme prefiks meN- (mem-, men-, meny-, meng-, menge-, me-) dan memper- pada morfem leksikalis/root kata tertentu? 2. Bagaimana merumuskan morfologi kata kerja pasif yang dibentuk oleh prefiks di- dan diper- pada morfem leksikalis/root kata tertentu? 3. Bagaimana memberikan pengetahuan kepada komputer agar mampu mengenali perumusan di atas? 2 4. Bagaimana mengimplementasikan perumusan di atas dengan pemodelan keluaran menggunakan metode Finate State Ttransducer (FST)? 1.3 Batasan Masalah Aplikasi sistem yang akan diimplementasikan memiliki beberapa batasan atau parameter yang tidak di bahas dalam penelitian ini, antara lain sebagai berikut: 1. Pada penelitian ini masalah morfologi kata kerja yang diteliti hanya terbatas pada morfem leksikalis/root kata yang disisipi oleh morfem meN-, memper-, di dan diper- dan harus sesuai dengan tata aturan morfologis kata kerja dalam KBBI (Kamus Besar Bahasa Indonesia). 2. Tidak memperdulikan makna atau arti dari kata kerja tertentu dalam sebuah kalimat. Jika satu bentuk kata kerja sama bentuk, berbeda kata dasar pembentuknya, maka keluaran mesin otomata akan menampilkan semua kemungkinan yang ada sesuai dengan daftar kata pada leksikon kata kerja yang ditampung, sebagai standar pengetahuan sistem. 3. Jenis upload file yang akan dideteksi hanya terbatas pada file teks *.txt. 4. Hanya mengeluarkan keluaran dalam dua level, yakni pertama pada level leksikal, yang menghasilkan struktur morfologis dari suatu morfem, dan kedua pada level permukaan (surface) untuk menampilkan variasi morfem berimbuhan meN- dan di- seperti pada tingkat realistis yang dipakai. 1.4 Tujuan Penelitian Adapun beberapa tujuan yang melandasi penelitian tugas akhir ini, antara lain adalah sebagai berikut : 1. Menghasilkan sebuah mesin maya untuk membedakan variasi morfofonemis (perubahan bunyi) dalam variasi penggabungan awalan (prefiks) meN- dan di- dengan bentuk dasar kata tunggal atau kompleks. 2. Melakukan penelitian awal atau penyediaan basis data untuk penelitian selanjutnya seperti untuk pemetaan teks ke dalam bentuk bunyi ujaran, misalnya dalam bahasa Inggris dan lain sebagainya. Untuk bentuk kata 3 yang sama kadang memiliki makna lebih dari satu dan karena perbedaan pelafalannya dalam bahasa tertentu maka akan menghasilkan makna yang berbeda pula. Merupakan komponen penting dalam penerapan ASR (Automated Speech Recognition), TTS (Text-to-Speech synthesis), machine translation, spell-checking, dan information-extraction applications (Jurafsky&Martin, 2000:22). 1.5 Metode Penelitian Metode atau tahapan proses yang dilakukan dalam penelitian Tugas akhir ini meliputi tiga hal, pertama dilakukan pengumpulan data lewat leksikon kata kerja berimbuhan dan sebagai penunjang penelitian diperlukan juga studi pustaka seperti jurnal ilmiah dan buku-buku literatur yang relevan. Kedua, melakukan pembangunan sistem dengan pendekatan otomata yakni dengan finite state transducer (FST) yang akan menghasilkan keluaran pada level permukaan dan leksikal. Sedangkan yang ketiga, merupakan analisis sistem dengan pendekatan perhitungan nilai presisi, untuk mengukur tingkat keakuratan sistem. 1.6 Sistematika Penulisan Sistematika Tugas Akhir ini secara garis besar dapat dituliskan sebagai berikut: Bab 1 bagian Pendahuluan, membahas hal–hal yang menjadi dasar dalam pembuatan laporan Tugas Akhir ini. Berisi latar belakang masalah, perumusan masalah, batasan masalah, tujuan penelitian, metode penelitian dan sistematika penulisan. Bab 2 bagian Tinjauan Pustaka, terdiri dari dua bagian utama, yakni Tinjauan Pustaka dan Landasan teori. Tinjauan pustaka terdiri dari berbagai teori secara umum yang melatarbelakangi Tugas Akhir ini, yang didapatkan dari berbagai sumber pustaka. Sedangkan landasan teori memuat penjelasan tentang konsep dan prinsip utama yang diperlukan untuk memecahkan permasalahan yang terdapat dalam Tugas Akhir ini. 4 Bab3 bagian Perancangan Sistem, berisi tentang metode penelitian, pemilihan sistem operasi dan bahasa pemrograman, spesifikasi kebutuhan sistem, profil pengguna, analisis kebutuhan teknis sistem, alat dan bahan, diagram aliran data pada sistem, kamus data, perancangan sistem dan flowchart/diagram alir. Bab 4 Implementasi dan Analisis Sistem, berisi konsep aturan/rule morfologis baru, implementasi sistem, uji coba sistem dan analisa kelebihan maupun kekurangan sistem. Bab 5 Kesimpulan dan Saran merupakan bagian terakhir dari isi penulisan. Di mana penulis membuat beberapa kesimpulan serta memberikan beberapa saran yang dapat dipakai dalam pengembangan sistem lebih lanjut. Kesimpulan berupa pernyataan singkat dan tepat yang dijabarkan dari hasil kegiatan penelitian dan implementasi dalam penyusunan skripsi. Saran-saran untuk penelitian lebih lanjut juga diberikan. Saran-saran ini memuat aktifitas atau langkah-langkah kegiatan dalam metode dan teknik pengembangan yang belum dilakukan didalam penelitian namun dirasa akan memperbaiki kinerja sistem jika langkah-langkah tersebut dilaksanakan pada penelitian selanjutnya. 5