Direct Parsing Pada Pengenalan Pola Kalimat Berbahasa Indonesia

advertisement
Direct Parsing Pada Pengenalan Pola
Kalimat Berbahasa Indonesia
Fawaid Effendi
Jurusan Teknik Informatika, STT Nurul Jadid Paiton
PO BOX 1 Paiton – Probolinggo 67291
Email : [email protected]
ABSTRACT
Natural language processing (NLP) is the one such application of Artificial
Intelligence study. This teory focusing on the natural interaction among man and machine,
especially in the structure of human natural conversation or language. Natural language
processing can be implemented in our society of daily live activity. There are much
application using NLP study in the word, but not in Indonesia. In our country this NLP
implementation doesn’t develop quickly. The problem is how to collaborate the powerfull of
computer processing and the linguistic study that still difficult to implement. In this research
I will develop Indonesian Language structure understanding by using natural language
concept approach. The implementation is how to make computer recognizing Bahasa
Indonesia structure and understanding that this sentence are not false in syntax analysis
(SPOK) which adjusted by EYD rule.
Keyword : natural language processing, direct parsing, SPOK
1. PENDAHULUAN
Perkembangan dibidang teknologi komputer dewasa ini mengalami
kemajuan yang sangat pesat. Perkembangan ini dimaksudkan untuk memenuhi
tuntunan kebutuhan manusia yang semakin hari semakin banyak dan kompleks.
Komputer sebagai alat bantu manusia untuk mengolah data dan menghasilkan
informasi, diharapkan dapat membantu manusia untuk mengambil keputusan secara
cepat dan tepat. Komputer banyak dilibatkan dalam berbagai bidang kerja manusia.
Keterlibatan komputer dalam berbagai bidang kerja manusia mendorong para ahli
untuk selalu berusaha mengembangkan komputer supaya memiliki kemampuan
seperti manusia. Salah satu usaha untuk mengembangkan kecerdasan buatan adalah
Natural Language Processing (NLP). Artificial Intelligence atau inteligensi buatan
adalah salah satu bidang ilmu komputer yang mempunyai titik berat terhadap
rekayasa komputer sehingga mampu menduplikasikan kemampuan manusia dalam
belajar, yaitu menyerap suatu informasi, menyimpan, dan mampu mencari dengan
cepat jika informasi itu dibutuhkan kembali. Manusia dapat melakukan hal ini tanpa
mengganggu informasi atau fakta-fakta yang telah ada sebelumnya. Sebuah program
AI bekerja sangat mirip dengan cara kerja otak manusia, bahwa program AI mampu
menyimpan semua informasi yang dibutuhkan secara otomatis tanpa perlu
melakukan rekontruksi ulang terhadap program tersebut.
Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah
suatu ilmu yang menekankan perhatiannya pada usaha untuk membuat komputer
mampu memahami perintah-perintah tertulis dalam bahasa manusia yang standar,
dalam hal ini adalah bahasa Indonesia. Aplikasi Natural language processing ini
dapat diterapkan di masyarakat untuk keperluan sehari-hari misalnya pengenalan
10
tata pola kalimat Bahasa Indonesia. Hal ini dapat dimaklumi karena Bahasa
Indonesia masih dapat dikatakan merupakan bahasa yang memiliki tata bahasa yang
secara pasti mengikuti aturan yang baku. Selain itu, ilmu kecerdasan buatan ini
banyak dikembangkan oleh ahli komputer di belahan bumi sebelah barat.
Permasalahan pada penelitian ini adalah bagaimana mengenali tata pola kalimat
Bahasa Indonesia secara baik dan benar dengan menggunakan pemrosesan bahasa
alami. Dengan adanya permasalahan ini maka dibuat suatu implementasi natural
language processing dalam bentuk simulasi program komputer guna menentukan
pengenalan pola, dalam kasus pengenalan pola kalimat Bahasa Indonesia. Sehingga
dengan menggunakan metode ini pengenalan pola kalimat Bahasa Indonesia akan
lebih cepat dikenal dan sesuai dengan SPOK serta ejaan yang disesuaikan (EYD).
Suatu program komputer yang standar hanya mampu menyediakan atau
menyelesaikan suatu permasalahan yang sesuai dengan apa yang telah diprogramkan
kepadanya. Sebagai contoh program untuk mencari bilangan prima dengan
jangkauan antara 1 hingga N, maka program tersebut hanya mampu untuk
menghasilkan solusi berupa bilangan prima dari kisaran 1 hingga N saja.
Jika program standard tadi dimodifikasi agar dapat menangani informasi
yang baru, maka keseluruhan program mungkin akan diperiksa hingga menemukan
ruang yang cukup untuk meletakkan modifikasi tesebut. Hal ini tidak hanya
memboroskan waktu, namun mungkin ada suatu bagian dari program akan
menyebabkan ketidak efektifan proses dan tentunya akan mengakibatkan terjadinya
kesalahan. Kecerdasan buatan membuat komputer akan mampu berpikir secara
semu. Dengan menyederhanakan struktur program yang ada, maka AI
menduplikasikan kemampuan dasar manusia dalam belajar, dapat menyerap suatu
informasi yang baru dan akan selalu mengingatnya bila sewaktu-waktu dibutuhkan
di masa yang akan datang. Pikiran manusia dapat mengolah informasi sedemikian
rupa tanpa mengubah aturan pemikiran itu sendiri atau menganggu semua fakta atau
informasi-informasi yang telah tersimpan dalam otak manusia.
1.2 Rumusan Masalah
Dari latar belakang permasalahan dapat dirumuskan masalah : bagaimana
menerapkan natural language processing dalam kasus pengenalan tata pola kalimat
Bahasa Indonesia yang sesuai dengan ejaan yang disempurnakan (EYD) dan pola
SPOK dengan model direct parsing yang valid atau tidak.
1.3 Batasan Masalah
Berdasarkan uraian latar belakang di atas maka penulis akan membatasi
masalah yang akan dibahas sebagai berikut :
1. Program NLP yang dibuat penulis hanya untuk tata bahasa yang sederhana.
Bahasa Indonesia yang tidak menggunakan tanda baca dan pemakaian kata
penghubung yang dapat mengakibatkan kalimat tersebut mempunyai dua makna
atau merupakan kalimat tunggal.
2. Program ini hanya mampu mengenali kalimat yang kata-katanya ada dalam
database program, selain dari itu maka program akan menghasilkan pesan
kesalahan atau kalimat tidak dikenal.
3. Program ini masih belum dapat membedakan mana kalimat yang masuk akal dan
mana yang bukan (kalimat semantik), oleh sebab itu walaupun input kalimat
11
yang dimasukkan tidak masuk akal, tetapi memenuhi syarat suatu pola kalimat
yang benar, maka hasil keluaran program menyatakan kalimat tersebut
“VALID”.
2 NATURAL LANGUAGE PROCESSING (NLP)
Natural language processing atau pengolahan bahasa alami merupakan
aplikasi kedua terbesar untuk kecerdasan buatan (artificial intelligence). AI
merupakan ilmu yang berdasar pada proses pemikiran manusia, maka penyelidikan
tentang bagaimana manusia berpikir adalah sangat penting. Tentu saja tidak seorang
pun yang tahu dengan pasti bagaimana pikiran manusia bekerja. Menurut Suparman
[SUP91] : “Kecerdasan manusia adalah kemampuan manusia untuk memperoleh
pengetahuan dan pandai melaksanakannya dalam praktek. Hal ini berarti
kemampuan berfikir dan menalar. Pada batas-batas tertentu artificial komputer
memungkinkan komputer bisa menerima pengetahuan melalui input manusia dan
menggunakan pengetahuannya itu melalui simulasi proses penalaran dan berpikir
manusia untuk memecahkan berbagai masalah.”
Jika manusia sudah bisa berkomunikasi langsung dengan komputer dengan
menggunakan bahasa manusia, sudah pasti banyak masalah dan kendala-kendala
bisa dikurangi atau hilangkan sama sekali. Manusia tidak perlu lagi harus
mempelajari bahasa-bahasa komputer seperti Cobol, Pascal, C, Fortran dan lain-lain.
Dengan mudah manusia bisa memasukkan perintah-perintah, pesan-pesan atau
informasi dalam bentuk yang menyenangkan dan komputer bisa menjawab dengan
pintar segala perintah, instruksi dan informasi yang diberikan. Pengolahan bahasa
alami atau natural language processing merupakan bentuk lain dari sistem
pangkalan atau basis pengetahuan. Untuk bisa memahami pertanyaan dalam bahasa
alami, komputer harus mengerti gramatika dan defenisi kata-kata. Dalam hubungan
ini teknik Artificial Intelligence digunakan untuk menampilkan pengetahuan internal
dan mengolah input. Pelacakan klasik dan teknik pencocokan pola (pattern
matching) digunakan bersama dengan pangkalan/basis pengetahuan agar komputer
bisa mengerti apa yang dimasukkan dalam bahasa alami. Bila komputer sudah
mengerti input dari pengguna, maka komputer bisa melakukan hal-hal yang
diharapkan oleh pengguna. Dalam membuat suatu program yang dapat mengerti
bahasa alami dalam bentuk teks, dibutuhkan pengetahuan tentang leksikal, sintaksis
dan semantik (arti kata) dari bahasa yang bersangkutan. Untuk dapat memahami
suatu gambaran yang sesuai pada suatu kalimat diperlukan dua hal yang penting
yaitu :
a. Pemahaman masing-masing kata dalam kalimat.
b. Penggabungan kata-kata tersebut dalam struktur kalimat yang dapat
menggambarkan arti dari keseluruhan kalimat.
Untuk melakukan hal tersebut suatu pengolahan bahasa alami atau natural
language processing memiliki tiga bagian utama yaitu parser, sistem representasi
pengetahuan dan penerjemahan output.
12
Gambar 2.1 Komponen utama sistem pengolahan bahasa alami
Seperti terlihat dalam gambar 2.1, kalimat masukan yang berupa bahasa alami akan
diterima oleh bagian sistem yaitu parser. Parser akan mengurai kalimat masukan
tersebut ke dalam beberapa bagian gramatika (kata benda hidup, kata benda mati,
kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk dan
kata ganti).
Masukan : ”Adik pergi ke sekolah tadi pagi”
Penjabaran masukan adalah:
Adik = kata benda hidup
Pergi = kata kerja
Ke = kata penghubung tempat/petunjuk
Sekolah = kata benda mati
Tadi = kata keterangan penguatan
Pagi = kata keterangan waktu
Langkah tersebut merupakan langkah pertama dalam menentukan fungsi
setiap kata dalam satu kalimat dan cara menghubungkan antara satu kata dengan
kata yang lain. Untuk menentukan mendeteksi suatu pola kalimat, kamus
dihubungkan dengan parser. Disini kamus hanya mempunyai perbendaharaan kata
yang terbatas. Seperti halnya program-program kecerdasan buatan lainnya,
pengolahan bahasa alami memiliki kemampuan yang terbatas atau hanya
diperuntukkan memecahkan masalah-masalah tertentu yang terbatas. Semakin besar
data yang tersimpan dalam kamus, maka semakin baik hasil yang didapat.
Setelah melewati parser (terdapat bermacam-macam jenis parser), sistem
pengetahuan (knowledge representation system) menganalisa keluaran yang
dihasilkan oleh parser untuk menentukan maknanya. Pada bagian akhir, penerjemah
keluaran menginterpretasikan sistem pengetahuan dan melakukan langkah-langkah
dalam menampilkan keluaran. Dalam hal ini keluaran yang dihasilkan bisa
merupakan jawaban dari kalimat masukan atau keluaran khusus lainnya.
2.2 Perbendaharaan Kata Bahasa Alami
2.2.1 Perbendaharaan Kata dan Leksikon
Perbendaharaan kata adalah sekumpulan kata-kata dan prasa-prasa yang
digunakan dalam bahasa tertentu. Leksikon adalah kamus yang mendaftar kata –
13
kata bahasa tersebut berdasarkan abjad. Kamus memilah-milah ejaan kata yang
benar, pembubuhan tanda baca, mendefenisikan setiap kata dan pengucapannya.
2.2.2 Gramatika, Sintak dan Semantik
Gramatika merupakan suatu sistem kaidah untuk meletakkan kata-kata ke
dalam bentuk kalimat lengkap sebagai suatu ekspresi pikiran. Gramatika tersusun
dari dua bagian pokok yaitu sintak dan semantik. Sintak merupakan cabang
gramatika yang mengatur penggabungan dan pengurutan jenis kata yang berbeda
seperti kata benda hidup, kata benda mati, kata sifat, kata kerja, kata keterangan,
kata depan, kata sandang, kata petunjuk dan kata ganti. Sintak adalah metoda
penempatan kata-kata di dalam urutan tertentu sehingga suatu kalimat merupakan
suatu bentuk bahasa yang benar. Semantik menunjuk kepada arti bahasa. Semantik
merupakan pengkajian hubungan-hubungan antara kata-kata dan cara
penggabungannya sehingga menjadi wujud pikiran.
2.3 Sintaksis : Fungsi, Kategori dan peran
2.3.1 Mengenal Istilah Fungsi, Kategori dan Peran Sebagai Dasar Analisis
Kalimat Bahasa Indonesia
Menganalisis kalimat merupakan salah satu aktivitas penting dalam
mempelajari bahasa sebagai alat komunikasi, termasuk mempelajari Bahasa
Indonesia (BI). Analisis kalimat merupakan usaha mengenali seluk-beluk kalimat.
Kalimat yang dianalisis dengan benar akan diketahui pola dan bentuknya, satuansatuan gramatik yang dikandungnya. Keterampilan menganalisis kalimat dengan
benar memberikan kontribusi positif terhadap kemampuan berbahasa, khususnya
kemampuan menyusun kalimat. Agar dapat melakukan analisis kalimat dengan
benar diperlukan pengetahuan tentang kalimat dan latihan-latihan menyusun kalimat
pengetahuan dasar, diperlukan untuk memberikan keterampilan menerapkan
pengetahuan tentang kalimat tersebut. Dengan kata lain pengetahuan tentang kalimat
dan latihan menyusun kalimat akan memberikan keterampilan dasar “Bongkar
Pasang” kalimat.
Salah satu pengetahuan dasar tentang kalimat yang diperlukan dalam
menganalisis kalimat adalah pengetahuan tentang istilah fungsi, kategori, dan peran.
Ketiga istilah ini akan diuraikan secara rinci, sehingga terlihat perbedaan konsep,
perbedaan wujud penerapan, dan manfaatnya bagi guru yang membelajarkan Bahasa
Indonesia, khususnya tentang kalimat.
2.3.2 Pengertian Fungsi, Kategori, dan Peran
Para ahli bahasa menjelaskan bahasa yang dimaksud dengan fungsi tidak
lain adalah seperti apa yang secara tradisional disebut subjek, predikat, objek dan
keterangan. Fungsi bersifat relasional, artinya adanya fungsi yang satu tidak dapat
dimengerti tanpa dihubungkan dengan fungsi yang lain. Kita tidak dapat mengatakan
itu fungsi predikat (P) tanpa dihubungkan dengan fungsi subjek (S). Demikian pula
kita tidak dapat menyebut dengan istilah objek (O) atau keterangan (K) tanpa
dihubungkan dengan P itulah sebabnya Verhaar menyebut fungsi ini dengan istilah
fungsi sintaktik ; yakni adanya S, P, O dan K sebagai akibat adanya hubungan
sintaktik dalam kalimat. Fungsi-fungsi sintaktik, seperti S, P, O, K, menurut
Sudaryanto merupakan tataran tertinggi atau pertama dan paling abstrak.
14
Pembayaran adanya suatu fungsi akan dapat ditemukan jika dihubungkan dengan
fungsi yang lain. Tataran di bawahnya dan oleh karena itu tingkat keabstrakkannya
juga lebih rendah adalah kategori. Kategori adalah istilah untuk menyebutkan
terhadap apa yang secara umum dikatakan kata benda (nonem), kata kerja (verbal),
kata sifat (ajektiva), kata bilangan (numerasi) dan lain-lain. Kategori tidak bersifat
relasional (sintaktik), melainkan bersifat sistemik. Artinya, penyebutan sesuatu itu
verbal tidak disebabkan adanya hubungan atau dihubungkan dengan nonem, verba,
ajektiva, numerasia atau yang lainnya. Penyebutan nonem, verba. Ajektiva,
numerasi, atau lainnya itu semata-mata kepentingan sistem. Tatanan ketiga dan yang
tingkat keabstrakannya paling rendah adalah peran. Peran tidak lain adalah sebutan
terhadap apa yang secara umum dikatakan pelaku (agen), penderita (objektif),
penerima (benefaktif), alat instrumental), keadaan (eventif), dan sebagainya. Peran
juga bersifat relasional atau bersifat sintaktik. Penyebutan peran pelaku adanya
peran penderita, peran penerima atau yang lain. Peran pelaku tidak dapat disebutkan
tanpa dihubungkan dengan adanya peran penderita, peran penerima atau yang lain.
Agar lebih jelas perbedaan ketiganya, dapat dilihat dalam penjelasan tentang
hubungan ketiga istilah tersebut dalam kalimat.
2.3.3 Hubungan Fungsi, Kategori, peran, dan Kalimat
Untuk mempermudah pemahaman tentang hubungan fungsi, kategori dan
peran marilah kita ambil contoh kalimat yang memiliki unsur agak lengkap sebagai
pada table 2.1 dibawah ini
Tabel 2.1 Hubungan Fungsi, Kategori, Peran, dan Kalimat (1)
Asep Memukul
Eko
Dengan Rotan
Fungsi
S
P
O
K
Kategori Benda Kerja
Benda
benda
Peran
Pelaku Tindakan Penderita alat
Contoh pertama menunjukkan bahwa sebenarnya kata Asep sebagai S, kata memukul
sebagai P, kata Eko sebagai O, dan kata dengan rotan sebagai K, belum memberikan
informasi “apapun” kecuali S berada di depan P dan diikuti oleh O dan K. Informasi
yang diperoleh semata-mata hanya pola urutan fungsi-fungsi itu mesti dimulai dari S
kemudian diikuti P,O, dan terakhir K, meski K tidak jarang berubah-ubah tempat
dalam kalimat BI. Menurut Verhaar fungsi-fungsi itu hanyalah “tempat kosong”.
Kalimat tersebut bermakna jika diisi dengan kategori dan peran “tempat kosong”
tersebut tidak akan memberikan kontribusi apapun kepada pengguna bahasa dalam
mengungkapkan gagasan.Contoh kedua
Tabel 2.2 Hubungan Fungsi, Kategori, Peran, dan Kalimat (2)
Eko
Memukul
Asep
Dengan Rotan
Fungsi
S
P
O
K
Kategori Benda
Kerja
Benda
Benda
Peran
Pelaku Pembuatan penderita Alat
Terlihat bahwa ada perubahan peran. Asep yang semula (contoh-1) berperan
sebagai pelaku sekarang berperan sebagai penderita (contoh-2). Mengapa kata Asep
yang semula menjadi pelaku berubah menjadi penderita? Sebabnya adalah karena
15
kategori benda “Asep” yang semula mempunyai fungsi sebagai S (contoh-1)
berubah fungsi menjadi O. Pengubahan kalimat (1) menjadi kalimat (2) juga
memberikan informasi kepada pengguna bahasa memang benar apa yang dikatakan
Verhaar yang namanya fungsi itu hanyalah “tempat kosong” yang harus diisi dengan
kategori dan peran tertentu. Di samping itu juga memberikan informasi kepada
pengguna bahasa bahwa kategori benda “Asep” dan kategori “Eko” dapat saling
bertukar fungsi. Hal ini terjadi karena baik kategori benda “Asep” maupun”Eko”
samasama kategori benda hidup. Namun pengisian fungsi kategori dan peran itu ada
aturan tertentu, jika pengisiannya sembarangan akan menjadikan kalimat tidak
bermakna. Contoh ketiga:
Tabel 2.3 Hubungan Fungsi, Kategori, Peran, dan Kalimat (3)
Ayah
Membaca
Buku
Di Ruang Tamu
Fungsi
S
P
O
K
Kategori Benda
Kerja
Benda
Benda
Peran
Pelaku Pembuatan penderita Tempat
Kalimat (4) sebagai ubahan dari kalimat (3) di atas merupakan bukti bahwa
tidak sembarangan kata, yang berketegori benda dapat berperan sebagai pelaku
meskipun kata itu dapat mengisi fungsi S maupun O. Benda yang dapat mengisi
fungsi S atau O dan sekaligus dapat berperan sebagai pelaku hanyalah kata yang
berkategori benda hidup. Aturan tertentu itu juga berlaku bagi pengisian fungsi P.
Fungsi P yang kemudian memerlukan kehadiran O adalah kata yang berkategori
kerja transitif. Demikian pula kata yang mengisi fungsi K harus mengikuti aturan
tertentu sesuai dengan kategori dan peran yang harus di mainkan dalam suatu
kalimat. Jadi hubungan antara fungsi, kategori dan peran sangatlah erat dan saling
bergantung. Untuk memperjelas hubungan ketiga istilah tersebut dalam
“membentuk” suatu kalimat dapat dilihat diagram yang dikutip dari buku yang
berjudul Pengantar Linguistik, Jilid Pertama.
2.3.4 Mengenal Perilaku Objek, Pelengkap, dan Keterangan dalam kalimat
Bahasa Indonesia
Mengenal kalimat sederhana Bahasa Indonesia (BI) merupakan salah satu
syarat dalam memahami pola kalimat pada umumnya. Dengan pemahaman pola
kalimat secara baik, pengguna bahasa akan dapat mengungkapkan gagasan dengan
baik pula. Hal ini selaras dengan pendapat bahwa belajar berbahasa pada hakikatnya
dimulai dengan mempelajari kalimat-kalimat, karena kalimat merupakan satuan
gagasan. Pola kalimat sederhana BI yang sering diidentifikasi sebagai kalimat
tunggal, sekurang-kurangnya terdiri atas subjek-predikat (S-P). Pada tingkatan yang
lebih luas kalimat tunggal dapat terdiri atas subjek-predikat-objek (S-P-O); subjekpredikat-pelengkap (S-P-Pel), dan subjek-predikat-keterangan (S-P-K), atau yang
lain.
Ada pola tertentu yang “mengatur “ hubungan antar fungsi kalimat,
khususnya fungsi penguasa (biasanya berupa P) dan fungsi pembatas (bisa O, Pel,
ataupun K). Pola urutan penguasa-pembatas ini memberikan informasi kepada
pengguna BI tentang seberapa erat hubungan (penguasaan-pembatasan), P terhadap
O, Pel, dan K tersebut. Pola urutan penguasa-pembatas secara terbatas akan
16
digunakan untuk menganalisis kalimat dalam rangka mengetahui perbedaan O, Pel,
dan K secara gramatik tersebut dalam kalimat yang berterima. Berdasar
pemindahan-posisian itu dilihat pula kemungkinan perpindahan fungsi kalimat,
khususnya jika pemindah-posisian itu berupa pemasifan. Dapatnya dipindahposisikan unsur-unsur gramatikal suatu kalimat itu, dalam analisis itu disebut
dengan istilah “perilaku gramatik”. Jadi yang dimaksud perilaku O, Pel, dan K
dalam tulisan ini tidak lain adalah kemungkinan dapat berpindah posisi ketiganya
dalam kalimat yang gramatikal.
2.4 Analisis Sintak dan Semantik
Dalam konsep Artificial Intelligence, dinyatakan bahwa untuk menganalisis
dan mengartikan suatu masukan bahasa alami dapat dilakukan dengan analisis
sintaks dan semantik. Dengan menggunakan analisis sintaks dan semantik, suatu
input kalimat dapat dengan pasti diketahui struktur dan maknanya. Sebuah kalimat
terdiri dari rangkaian kata-kata yang mempunyai makna sendiri-sendiri. Disamping
mempunyai makna sendiri, suatu kata juga termasuk dalam berbagai kategori yang
dikenal sebagai ujaran, yaitu kata benda, kata ganti, kata kerja, kata sifat, kata kerja
tambahan, kata depan, kata penghubung dan kata pemisah. Dalam Bahasa Indonesia,
sebuah kata dapat memiliki lebih dari satu arti (makna ganda) dalam sebuah kalimat.
Sebagai contoh pada kalimat berikut “Istri Pak Asep yang cacat”, kalimat tersebut
dikatakan sebagai kalimat yang rancu dikarenakan memiliki dua buah arti,
“Siapakah sebenarnya yang cacat?” Istri Pak Asep atau Pak Asep sendiri,
dibuktikan dari pemenggalan kalimatnya seperti pada contoh di bawah ini :
Istri / Pak Asep yang cacat
dan
Istri Pak Asep / yang cacat
Pada kalimat tersebut terjadi ambiguity atau kalimat yang rancu. Pada
dasarnya sebuah kalimat tersusun atas dua buah bagian khusus yaitu subjek atau
pokok kalimat dan predikat atau sering disebut sebagai kata kerja. Pokok kalimat
dapat berbentuk kata benda, objek atau benda yang menjadi fokus utama dalam
kalimat. Sedangkan predikat menyatakan sesuatu perbuatan yang dilakukan oleh
pokok kalimat. Dalam menganalisa input suatu kalimat, program melacak kalimat
masukan tersebut kata demi kata. Program akan meneliti arus input untuk mencari
spasi maupun tanda-tanda baca agar bisa mengetahui setiap kata terpisah.
2.4.1 Parser
Parser adalah elemen yang paling menentukan dalam suatu program pemahaman
bahasa alami. Parser merupakan sepenggal software yang dapat menganalisis
masukan kalimat secara sintaktik. Parser melakukan identifikasi tiap-tiap kata dan
kemudian membuat peta kata-kata tersebut dalam struktur yang disebut pohon
parser. Pohon parser menunjukkan makna dalam semua kata dan bagaimana cara
menggabungkan kata-kata tersebut. Parser mengidentifikasi prasa kata kerja, prasa
kata benda dan selanjutnya memilah-milah ke dalam elemen-elemen yang lain.
17
2.4.2 Lexicon
Leksikon berisi semua kata yang dikenal oleh program, selain itu juga berisi
ejaan setiap kata yang benar dan merancang bagian ujarannya. Karena dalam setiap
kata memiliki makna lebih dari satu, makna leksikon mendaftar makna yang
diperbolehkan oleh sistem. Parser dan leksikon bekerja sama untuk mengurangi
kalimat pohon parser dan membentuk struktur data yang membantu menerangkan
makna yang dimaksud dalam sebuah kalimat. Pada waktu beroperasi, parser
merupakan alat untuk mencocokan pola. Setelah kata individual di identifikasi,
parser melacak leksikon untuk membandingkan setiap input kata dengan semua kata
yang disimpan dalam program. Jika sudah cocok, kata tersebut kemudian disimpan
bersama informasi leksikon yang lain. Kemudian parser terus menganalisis katakata
tambahannya sampai membentuk pohon parser.
2.4.3 Knowledge Base dan Understander
Understander bekerja sama dengan knowledge base (pangkalan
pengetahuan) untuk menentukan makna sebuah kalimat. Tujuan understander adalah
untuk memanfaatkan pohon parser agar mengacu kepada pangkalan pengetahuan.
2.4.4 Generator
Generator adalah input yang sudah dimengerti untuk membuat hasil
keluaran (output) yang berguna. Tugas dari understander adalah menyusun struktur
data yang berisi makna, memahami kalimat input yang dimasukan dan yang terakhir
menyimpannya dalam memori. Struktur data kemudian digunakan untuk mengawali
tindakan-tindakan atau langkah-langkah berikutnya. Jika suatu program pengolahan
bahasa alami merupakan bagian dari interface atau kode khusus yang
mengendalikan program lainnya.
2.5 Membangun Kamus
Kamus (lexicon) berhubungan dengan kata-kata individual dan artinya, dan
informasi tentang bagaimana mereka dipakai. Setiap entry dalam kamus
merepresentasikan informasi tentang kata benda hidup, kata benda mati, kata sifat,
kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk dan kata ganti
yang diketahui untuk sistem pengolahan bahasa alami. Untuk membangun sebuah
sistem yang mampu mengidentifikasikan kalimat Bahasa Indonesia, juga diperlukan
perbendaharaan kata yang mampu untuk mendukung kinerja sistem tersebut. Sebuah
kalimat menurut tata Bahasa Indonesia harus terdiri dari pokok kalimat (Subject) dan
sebutan (Predicate) serta pelengkap (Object) dengan :



18
Pokok kalimat (Subject) adalah sesuatu yang dibicarakan di dalam kalimat
yang letaknya harus sebelum kata kerja (Verbi) dan syarat dari Subject harus
berupa kata benda (Noun), kata ganti diri (Pronoun) atau kata-kata lain yang
dapat digolongkan dengan kata benda tersebut.
Sebutan (Predicate) adalah keterangan pokok kalimat dan setiap sebutan
haruslah kata kerja (Verb) atau kata kerja bantu (Auxiliary Verb). Jadi
sebutan (Predicate) adalah apa yang dibicarakan dari hal atau yang
mengenai Subject.
Pelengkap (Object) adalah tujuan kerja dari Subject yang tempatnya sesudah
Predicate. Untuk membangun sebuah sistem yang mampu
mengidentifikasikan semua kalimat yang terdapat dalam tata Bahasa
Indonesia membutuhkan suatu basis pengetahuan yang lengkap tentang tata
Bahasa Indonesia.
3. ANALISIS KEBUTUHAN PERANGKAT LUNAK
Dalam pembuatan aplikasi pengenalan tata pola kalimat Bahasa Indonesia
ini terdapat beberapa unsur yang dibutuhkan, berupa :
3.1 Metode Analisis
Pada tahap analisis digunakan untuk mengetahui dan mendeteksi pola
kalimat bahasa Indonesia dalam pola SPOK. Oleh karena itu dalam tahap analisis
digunakan untuk mendapatkan data-data yang diperlukan untuk kepentingan
membangun sistem. Hasil akhir dari analisis diharapkan akan didapatkan suatu
sistem yang strukturnya dapat didefenisikan dengan baik dan jelas. Dengan
diciptakannya software yang mampu untuk mendeteksi kalimat, maka proses parsing
kedalam pola SPOK akan lebih cepat dan dapat dilakukan
secara berulang-ulang.
3.2 Hasil Analisis
3.2.1 Analisis Kebutuhan Data Masukan
Untuk kebutuhan masukan data ke dalam sistem yang akan dibangun berupa
data kata-kata dalam bahasa Indonesia, yang terdiri dari data kata benda hidup, kata
benda mati, kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata
petunjuk, dan kata ganti. Untuk keperluan ini tiap kata dalam Bahasa Indonesia
harus di kelompokan berdasarkan tipe/jenis kata. Dan kata yang di simpan tidak
boleh ada yang sama dengan tipe/jenis kata yang lain.
3.3 Analisis Kebutuhan Proses
Untuk kebutuhan proses dalam sistem yang akan dibangun, dapat dijabarkan
menjadi beberapa proses, yaitu :
a. Pemasukan kalimat yang akan di deteksi (kalimat Bahasa Indonesia).
b. Kata disusun berdasarkan penyusun kalimat.
c. Proses tokenisasi, yaitu memecahkan kalimat menjadi bentuk-bentuk kata.
d. Pencocokan kata (token) yang sudah dipecah dengan kata yang ada dalam
database tipe/jenis kata. Hasil pencocokan tersebut akan dilanjutkan pada
proses parsing.
e. Kata hasil pencocokan dengan database akan menghasilkan kalimat tunggal
dalam bentuk pola SPOK.
f. Pola kalimat dan jenis/tipe kata akan ditampilkan dalam satu form.
4. PENUTUP
4.1 Kesimpulan
Setelah menyelesaikan pembuatan program aplikasi (software) yang dapat
digunakan untuk mendeteksi pola kalimat dalam bahasa Indonesia, kemudian
dilakukan dengan pengujian beberapa contoh kalimat untuk masing-masing bentuk
kalimat. Dapat diambil kesimpulan berdasar hasil pengujian maupun metode yang
digunakan dalam pembuatan program, bahwa teknik kecerdasan buatan (artificial
intelligence) yaitu pengolahan bahasa alami dapat dimanfaatkan untuk membangun
19
sebuah sistem yang mampu melakukan pengenalan pola kalimat Bahasa Indonesia
dengan menggunakan proses parsing.
4.2 Saran
Berdasarkan hasil pengujian yang dilakukan terhadap program aplikasi ini,
program masih perlu dikembangkan lagi agar kinerja program lebih baik. Hal ini
dilakukan dengan menambah fasilitas-fasilitas, antara lain :
a. Membuat tampilan program agar lebih menarik, misalnya dengan
menambahkan sound scheme.
b. Menambah aturan pola kalimat yang baru, misalnya dapat mendeteksi lebih
dari satu kalimat, karena semakin banyak aturan yang diberikan maka sistem
akan lebih banyak dapat mengenali suatu pola kalimat.
DAFTAR PUSTAKA
[SET03] Setiawan, Kuswara. “Paradigma Sistem Cerdas”. BayuMedia
Publishing, Malang, Jawa Timur. 2003.
[PUS00] Pustaka, Balai. Struktur Bahasa yang disempurnakan sesuai EYD. 2000.
[MAN00] Mandala Rila, Takenobu Takunaga, Hozumi Tanaka. (2000). “The
exploration and Analysis of Using Multiple Thesaurus types for Query
Expansion in Information Retrieval”. International Journal of
Information Processing.
20
Download