parsing morfologis kata kerja berimbuhan

advertisement
BAB 1
PENDAHULUAN
1.1 Latar Belakang Masalah
Bahasa merupakan salah satu komponen yang paling penting dalam
kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari
satu generasi ke generasi lain. Sedangkan dalam bentuk lisan, bahasa berperan
dalam mengarahkan tingkah laku manusia sehari-hari dalam berhubungan dengan
orang lain.
Tujuan yang mendasari penelitian bahasa alami adalah bagaimana
mengimplementasikan pengetahuan manusia yang kebanyakan tersimpan dalam
bentuk bahasa, agar komputer juga dapat mengerti sehingga dapat mengakses
informasi berdasarkan pengetahuan yang manusia tanamkan. Pengetahuan yang
diberikan berupa pengenalan terhadap struktur perubahan variasi imbuhan awal
akibat perubahan fonem. Mendeteksi kelas kata tertentu dalam sejumlah besar
kalimat yang tergabung dalam wacana tertentu, tentunya memakan waktu yang
tidak sedikit. Namun, akan lebih mudah dan cepat jika diimplementasikan
kedalam bentuk sistem.
Penelitian dalam bidang pemrosesan bahasa alami sudah banyak
dilakukan. Namun kebanyakan penelitian tersebut dilakukan terhadap bahasa
Inggris. Penelitian bahasa alami yang dilakukan terhadap bahasa Indonesia masih
sedikit dilakukan dan kurang dipublikasikan. Berdasarkan penelitian pada skripsi
terdahulu menggunakan metode Nondeterministic Finite Automata (NFA)
mengalami beberapa kekurangan, salah satunya ketidakakuratan keluaran yang
dideteksi sebagai kata kerja, karena semua kata yang memiliki pola kata kerja
akan diterima oleh sistem sehingga bentuk kata tertentu yang awal suku katanya
menyerupai imbuhan juga terdeteksi sebagai kata kerja.
Salah satu komponen terpenting dalam pemrosesan bahasa alami adalah
pengurai (parser) struktur morfologis dari suatu kalimat. Pengurai morfologis ini
mengidentifikasi dan memberi label imbuhan yang tergabung dalam sebuah
1
morfem leksikalis sehingga membentuk satu kesatuan kelas kata yang memiliki
makna tunggal ataupun bermakna ganda. Proses penguraian morfem yang
terkandung dalam jenis kata tertentu dalam sebuah kalimat bahkan lebih atau
pada paragraf dalam sebuah teks, mirip dengan proses penguraian dalam tata
bahasa pemrograman dalam dunia komputer. Perbedaan yang mendasar pada
keduanya adalah tata bahasa dalam dunia komputer merupakan tata bahasa yang
bebas konteks (context free grammar), sedangkan tata bahasa pada bahasa
Indonesia merupakan tata bahasa alami yang peka terhadap konteks (context
sensitive).
Pada pengerjaan tugas akhir ini penulis akan membuat sebuah sistem
untuk mendeteksi kata kerja pada Bahasa Indonesia dengan variasi awalan meN-,
memper-, di- dan diper-, serta kemudian diberikan keluaran pelabelan struktur
morfologis dari kata kerja tersebut. Pendeteksian akan dilakukan dengan proses
parsing morfologis, sedangkan untuk keluaran menggunakan pemodelan Finite
State Transducer (FST). Diharapkan dengan adanya program bantu ini, maka
akan mempermudah dalam mendeteksi, memparsing, dan mendapatkan pola
pelabelan struktur morfologis dari kata kerja berimbuhan meN-, memper-, di- dan
diper-.
1.2 Perumusan Masalah
Berdasarkan arti pentingnya parsing morfologis serta kompleksitas
perubahan morfem dengan awalan imbuhan meN-, memper-, di- dan diper- maka
permasalahan yang menjadi titik berat dalam penelitian ini adalah sebagai berikut:
1. Bagaimana merumuskan morfologi kata kerja aktif dari bentuk
alomorfisme prefiks meN- (mem-, men-, meny-, meng-, menge-, me-) dan
memper- pada morfem leksikalis/root kata tertentu?
2. Bagaimana merumuskan morfologi kata kerja pasif yang dibentuk oleh
prefiks di- dan diper- pada morfem leksikalis/root kata tertentu?
3. Bagaimana memberikan pengetahuan kepada komputer agar mampu
mengenali perumusan di atas?
2
4. Bagaimana mengimplementasikan perumusan di atas dengan pemodelan
keluaran menggunakan metode Finate State Ttransducer (FST)?
1.3 Batasan Masalah
Aplikasi sistem yang akan diimplementasikan memiliki beberapa batasan atau
parameter yang tidak di bahas dalam penelitian ini, antara lain sebagai berikut:
1. Pada penelitian ini masalah morfologi kata kerja yang diteliti hanya
terbatas pada morfem leksikalis/root kata yang disisipi oleh morfem meN-,
memper-, di dan diper- dan harus sesuai dengan tata aturan morfologis
kata kerja dalam KBBI (Kamus Besar Bahasa Indonesia).
2. Tidak memperdulikan makna atau arti dari kata kerja tertentu dalam
sebuah kalimat. Jika satu bentuk kata kerja sama bentuk, berbeda kata
dasar pembentuknya, maka keluaran mesin otomata akan menampilkan
semua kemungkinan yang ada sesuai dengan daftar kata pada leksikon
kata kerja yang ditampung, sebagai standar pengetahuan sistem.
3. Jenis upload file yang akan dideteksi hanya terbatas pada file teks *.txt.
4. Hanya mengeluarkan keluaran dalam dua level, yakni pertama pada level
leksikal, yang menghasilkan struktur morfologis dari suatu morfem, dan
kedua pada level permukaan (surface) untuk menampilkan variasi morfem
berimbuhan meN- dan di- seperti pada tingkat realistis yang dipakai.
1.4 Tujuan Penelitian
Adapun beberapa tujuan yang melandasi penelitian tugas akhir ini, antara lain
adalah sebagai berikut :
1. Menghasilkan
sebuah
mesin
maya
untuk
membedakan
variasi
morfofonemis (perubahan bunyi) dalam variasi penggabungan awalan
(prefiks) meN- dan di- dengan bentuk dasar kata tunggal atau kompleks.
2. Melakukan penelitian awal atau penyediaan basis data untuk penelitian
selanjutnya seperti untuk pemetaan teks ke dalam bentuk bunyi ujaran,
misalnya dalam bahasa Inggris dan lain sebagainya. Untuk bentuk kata
3
yang sama kadang memiliki makna lebih dari satu dan karena perbedaan
pelafalannya dalam bahasa tertentu maka akan menghasilkan makna yang
berbeda pula. Merupakan komponen penting dalam penerapan ASR
(Automated Speech Recognition), TTS (Text-to-Speech synthesis),
machine
translation,
spell-checking,
dan
information-extraction
applications (Jurafsky&Martin, 2000:22).
1.5 Metode Penelitian
Metode atau tahapan proses yang dilakukan dalam penelitian Tugas akhir
ini meliputi tiga hal, pertama dilakukan pengumpulan data lewat leksikon kata
kerja berimbuhan dan sebagai penunjang penelitian diperlukan juga studi pustaka
seperti jurnal ilmiah dan buku-buku literatur yang relevan. Kedua, melakukan
pembangunan sistem dengan pendekatan otomata yakni dengan finite state
transducer (FST) yang akan menghasilkan keluaran pada level permukaan dan
leksikal. Sedangkan yang ketiga, merupakan analisis sistem dengan pendekatan
perhitungan nilai presisi, untuk mengukur tingkat keakuratan sistem.
1.6 Sistematika Penulisan
Sistematika Tugas Akhir ini secara garis besar dapat dituliskan sebagai
berikut:
Bab 1 bagian Pendahuluan, membahas hal–hal yang menjadi dasar dalam
pembuatan laporan Tugas Akhir ini. Berisi latar belakang masalah, perumusan
masalah, batasan masalah, tujuan penelitian, metode penelitian dan sistematika
penulisan.
Bab 2 bagian Tinjauan Pustaka, terdiri dari dua bagian utama, yakni
Tinjauan Pustaka dan Landasan teori. Tinjauan pustaka terdiri dari berbagai teori
secara umum yang melatarbelakangi Tugas Akhir ini, yang didapatkan dari
berbagai sumber pustaka. Sedangkan landasan teori memuat penjelasan tentang
konsep dan prinsip utama yang diperlukan untuk memecahkan permasalahan yang
terdapat dalam Tugas Akhir ini.
4
Bab3 bagian Perancangan Sistem, berisi tentang metode penelitian,
pemilihan sistem operasi dan bahasa pemrograman, spesifikasi kebutuhan sistem,
profil pengguna, analisis kebutuhan teknis sistem, alat dan bahan, diagram aliran
data pada sistem, kamus data, perancangan sistem dan flowchart/diagram alir.
Bab 4 Implementasi dan Analisis Sistem, berisi konsep aturan/rule
morfologis baru, implementasi sistem, uji coba sistem dan analisa kelebihan
maupun kekurangan sistem.
Bab 5 Kesimpulan dan Saran merupakan bagian terakhir dari isi penulisan.
Di mana penulis membuat beberapa kesimpulan serta memberikan beberapa saran
yang dapat dipakai dalam pengembangan sistem lebih lanjut. Kesimpulan berupa
pernyataan singkat dan tepat yang dijabarkan dari hasil kegiatan penelitian dan
implementasi dalam penyusunan skripsi. Saran-saran untuk penelitian lebih lanjut
juga diberikan. Saran-saran ini memuat aktifitas atau langkah-langkah kegiatan
dalam metode dan teknik pengembangan yang belum dilakukan didalam
penelitian namun dirasa akan memperbaiki kinerja sistem jika langkah-langkah
tersebut dilaksanakan pada penelitian selanjutnya.
5
Download