Direct Parsing Pada Pengenalan Pola Kalimat Berbahasa Indonesia Fawaid Effendi Jurusan Teknik Informatika, STT Nurul Jadid Paiton PO BOX 1 Paiton – Probolinggo 67291 Email : [email protected] ABSTRACT Natural language processing (NLP) is the one such application of Artificial Intelligence study. This teory focusing on the natural interaction among man and machine, especially in the structure of human natural conversation or language. Natural language processing can be implemented in our society of daily live activity. There are much application using NLP study in the word, but not in Indonesia. In our country this NLP implementation doesn’t develop quickly. The problem is how to collaborate the powerfull of computer processing and the linguistic study that still difficult to implement. In this research I will develop Indonesian Language structure understanding by using natural language concept approach. The implementation is how to make computer recognizing Bahasa Indonesia structure and understanding that this sentence are not false in syntax analysis (SPOK) which adjusted by EYD rule. Keyword : natural language processing, direct parsing, SPOK 1. PENDAHULUAN Perkembangan dibidang teknologi komputer dewasa ini mengalami kemajuan yang sangat pesat. Perkembangan ini dimaksudkan untuk memenuhi tuntunan kebutuhan manusia yang semakin hari semakin banyak dan kompleks. Komputer sebagai alat bantu manusia untuk mengolah data dan menghasilkan informasi, diharapkan dapat membantu manusia untuk mengambil keputusan secara cepat dan tepat. Komputer banyak dilibatkan dalam berbagai bidang kerja manusia. Keterlibatan komputer dalam berbagai bidang kerja manusia mendorong para ahli untuk selalu berusaha mengembangkan komputer supaya memiliki kemampuan seperti manusia. Salah satu usaha untuk mengembangkan kecerdasan buatan adalah Natural Language Processing (NLP). Artificial Intelligence atau inteligensi buatan adalah salah satu bidang ilmu komputer yang mempunyai titik berat terhadap rekayasa komputer sehingga mampu menduplikasikan kemampuan manusia dalam belajar, yaitu menyerap suatu informasi, menyimpan, dan mampu mencari dengan cepat jika informasi itu dibutuhkan kembali. Manusia dapat melakukan hal ini tanpa mengganggu informasi atau fakta-fakta yang telah ada sebelumnya. Sebuah program AI bekerja sangat mirip dengan cara kerja otak manusia, bahwa program AI mampu menyimpan semua informasi yang dibutuhkan secara otomatis tanpa perlu melakukan rekontruksi ulang terhadap program tersebut. Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah suatu ilmu yang menekankan perhatiannya pada usaha untuk membuat komputer mampu memahami perintah-perintah tertulis dalam bahasa manusia yang standar, dalam hal ini adalah bahasa Indonesia. Aplikasi Natural language processing ini dapat diterapkan di masyarakat untuk keperluan sehari-hari misalnya pengenalan 10 tata pola kalimat Bahasa Indonesia. Hal ini dapat dimaklumi karena Bahasa Indonesia masih dapat dikatakan merupakan bahasa yang memiliki tata bahasa yang secara pasti mengikuti aturan yang baku. Selain itu, ilmu kecerdasan buatan ini banyak dikembangkan oleh ahli komputer di belahan bumi sebelah barat. Permasalahan pada penelitian ini adalah bagaimana mengenali tata pola kalimat Bahasa Indonesia secara baik dan benar dengan menggunakan pemrosesan bahasa alami. Dengan adanya permasalahan ini maka dibuat suatu implementasi natural language processing dalam bentuk simulasi program komputer guna menentukan pengenalan pola, dalam kasus pengenalan pola kalimat Bahasa Indonesia. Sehingga dengan menggunakan metode ini pengenalan pola kalimat Bahasa Indonesia akan lebih cepat dikenal dan sesuai dengan SPOK serta ejaan yang disesuaikan (EYD). Suatu program komputer yang standar hanya mampu menyediakan atau menyelesaikan suatu permasalahan yang sesuai dengan apa yang telah diprogramkan kepadanya. Sebagai contoh program untuk mencari bilangan prima dengan jangkauan antara 1 hingga N, maka program tersebut hanya mampu untuk menghasilkan solusi berupa bilangan prima dari kisaran 1 hingga N saja. Jika program standard tadi dimodifikasi agar dapat menangani informasi yang baru, maka keseluruhan program mungkin akan diperiksa hingga menemukan ruang yang cukup untuk meletakkan modifikasi tesebut. Hal ini tidak hanya memboroskan waktu, namun mungkin ada suatu bagian dari program akan menyebabkan ketidak efektifan proses dan tentunya akan mengakibatkan terjadinya kesalahan. Kecerdasan buatan membuat komputer akan mampu berpikir secara semu. Dengan menyederhanakan struktur program yang ada, maka AI menduplikasikan kemampuan dasar manusia dalam belajar, dapat menyerap suatu informasi yang baru dan akan selalu mengingatnya bila sewaktu-waktu dibutuhkan di masa yang akan datang. Pikiran manusia dapat mengolah informasi sedemikian rupa tanpa mengubah aturan pemikiran itu sendiri atau menganggu semua fakta atau informasi-informasi yang telah tersimpan dalam otak manusia. 1.2 Rumusan Masalah Dari latar belakang permasalahan dapat dirumuskan masalah : bagaimana menerapkan natural language processing dalam kasus pengenalan tata pola kalimat Bahasa Indonesia yang sesuai dengan ejaan yang disempurnakan (EYD) dan pola SPOK dengan model direct parsing yang valid atau tidak. 1.3 Batasan Masalah Berdasarkan uraian latar belakang di atas maka penulis akan membatasi masalah yang akan dibahas sebagai berikut : 1. Program NLP yang dibuat penulis hanya untuk tata bahasa yang sederhana. Bahasa Indonesia yang tidak menggunakan tanda baca dan pemakaian kata penghubung yang dapat mengakibatkan kalimat tersebut mempunyai dua makna atau merupakan kalimat tunggal. 2. Program ini hanya mampu mengenali kalimat yang kata-katanya ada dalam database program, selain dari itu maka program akan menghasilkan pesan kesalahan atau kalimat tidak dikenal. 3. Program ini masih belum dapat membedakan mana kalimat yang masuk akal dan mana yang bukan (kalimat semantik), oleh sebab itu walaupun input kalimat 11 yang dimasukkan tidak masuk akal, tetapi memenuhi syarat suatu pola kalimat yang benar, maka hasil keluaran program menyatakan kalimat tersebut “VALID”. 2 NATURAL LANGUAGE PROCESSING (NLP) Natural language processing atau pengolahan bahasa alami merupakan aplikasi kedua terbesar untuk kecerdasan buatan (artificial intelligence). AI merupakan ilmu yang berdasar pada proses pemikiran manusia, maka penyelidikan tentang bagaimana manusia berpikir adalah sangat penting. Tentu saja tidak seorang pun yang tahu dengan pasti bagaimana pikiran manusia bekerja. Menurut Suparman [SUP91] : “Kecerdasan manusia adalah kemampuan manusia untuk memperoleh pengetahuan dan pandai melaksanakannya dalam praktek. Hal ini berarti kemampuan berfikir dan menalar. Pada batas-batas tertentu artificial komputer memungkinkan komputer bisa menerima pengetahuan melalui input manusia dan menggunakan pengetahuannya itu melalui simulasi proses penalaran dan berpikir manusia untuk memecahkan berbagai masalah.” Jika manusia sudah bisa berkomunikasi langsung dengan komputer dengan menggunakan bahasa manusia, sudah pasti banyak masalah dan kendala-kendala bisa dikurangi atau hilangkan sama sekali. Manusia tidak perlu lagi harus mempelajari bahasa-bahasa komputer seperti Cobol, Pascal, C, Fortran dan lain-lain. Dengan mudah manusia bisa memasukkan perintah-perintah, pesan-pesan atau informasi dalam bentuk yang menyenangkan dan komputer bisa menjawab dengan pintar segala perintah, instruksi dan informasi yang diberikan. Pengolahan bahasa alami atau natural language processing merupakan bentuk lain dari sistem pangkalan atau basis pengetahuan. Untuk bisa memahami pertanyaan dalam bahasa alami, komputer harus mengerti gramatika dan defenisi kata-kata. Dalam hubungan ini teknik Artificial Intelligence digunakan untuk menampilkan pengetahuan internal dan mengolah input. Pelacakan klasik dan teknik pencocokan pola (pattern matching) digunakan bersama dengan pangkalan/basis pengetahuan agar komputer bisa mengerti apa yang dimasukkan dalam bahasa alami. Bila komputer sudah mengerti input dari pengguna, maka komputer bisa melakukan hal-hal yang diharapkan oleh pengguna. Dalam membuat suatu program yang dapat mengerti bahasa alami dalam bentuk teks, dibutuhkan pengetahuan tentang leksikal, sintaksis dan semantik (arti kata) dari bahasa yang bersangkutan. Untuk dapat memahami suatu gambaran yang sesuai pada suatu kalimat diperlukan dua hal yang penting yaitu : a. Pemahaman masing-masing kata dalam kalimat. b. Penggabungan kata-kata tersebut dalam struktur kalimat yang dapat menggambarkan arti dari keseluruhan kalimat. Untuk melakukan hal tersebut suatu pengolahan bahasa alami atau natural language processing memiliki tiga bagian utama yaitu parser, sistem representasi pengetahuan dan penerjemahan output. 12 Gambar 2.1 Komponen utama sistem pengolahan bahasa alami Seperti terlihat dalam gambar 2.1, kalimat masukan yang berupa bahasa alami akan diterima oleh bagian sistem yaitu parser. Parser akan mengurai kalimat masukan tersebut ke dalam beberapa bagian gramatika (kata benda hidup, kata benda mati, kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk dan kata ganti). Masukan : ”Adik pergi ke sekolah tadi pagi” Penjabaran masukan adalah: Adik = kata benda hidup Pergi = kata kerja Ke = kata penghubung tempat/petunjuk Sekolah = kata benda mati Tadi = kata keterangan penguatan Pagi = kata keterangan waktu Langkah tersebut merupakan langkah pertama dalam menentukan fungsi setiap kata dalam satu kalimat dan cara menghubungkan antara satu kata dengan kata yang lain. Untuk menentukan mendeteksi suatu pola kalimat, kamus dihubungkan dengan parser. Disini kamus hanya mempunyai perbendaharaan kata yang terbatas. Seperti halnya program-program kecerdasan buatan lainnya, pengolahan bahasa alami memiliki kemampuan yang terbatas atau hanya diperuntukkan memecahkan masalah-masalah tertentu yang terbatas. Semakin besar data yang tersimpan dalam kamus, maka semakin baik hasil yang didapat. Setelah melewati parser (terdapat bermacam-macam jenis parser), sistem pengetahuan (knowledge representation system) menganalisa keluaran yang dihasilkan oleh parser untuk menentukan maknanya. Pada bagian akhir, penerjemah keluaran menginterpretasikan sistem pengetahuan dan melakukan langkah-langkah dalam menampilkan keluaran. Dalam hal ini keluaran yang dihasilkan bisa merupakan jawaban dari kalimat masukan atau keluaran khusus lainnya. 2.2 Perbendaharaan Kata Bahasa Alami 2.2.1 Perbendaharaan Kata dan Leksikon Perbendaharaan kata adalah sekumpulan kata-kata dan prasa-prasa yang digunakan dalam bahasa tertentu. Leksikon adalah kamus yang mendaftar kata – 13 kata bahasa tersebut berdasarkan abjad. Kamus memilah-milah ejaan kata yang benar, pembubuhan tanda baca, mendefenisikan setiap kata dan pengucapannya. 2.2.2 Gramatika, Sintak dan Semantik Gramatika merupakan suatu sistem kaidah untuk meletakkan kata-kata ke dalam bentuk kalimat lengkap sebagai suatu ekspresi pikiran. Gramatika tersusun dari dua bagian pokok yaitu sintak dan semantik. Sintak merupakan cabang gramatika yang mengatur penggabungan dan pengurutan jenis kata yang berbeda seperti kata benda hidup, kata benda mati, kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk dan kata ganti. Sintak adalah metoda penempatan kata-kata di dalam urutan tertentu sehingga suatu kalimat merupakan suatu bentuk bahasa yang benar. Semantik menunjuk kepada arti bahasa. Semantik merupakan pengkajian hubungan-hubungan antara kata-kata dan cara penggabungannya sehingga menjadi wujud pikiran. 2.3 Sintaksis : Fungsi, Kategori dan peran 2.3.1 Mengenal Istilah Fungsi, Kategori dan Peran Sebagai Dasar Analisis Kalimat Bahasa Indonesia Menganalisis kalimat merupakan salah satu aktivitas penting dalam mempelajari bahasa sebagai alat komunikasi, termasuk mempelajari Bahasa Indonesia (BI). Analisis kalimat merupakan usaha mengenali seluk-beluk kalimat. Kalimat yang dianalisis dengan benar akan diketahui pola dan bentuknya, satuansatuan gramatik yang dikandungnya. Keterampilan menganalisis kalimat dengan benar memberikan kontribusi positif terhadap kemampuan berbahasa, khususnya kemampuan menyusun kalimat. Agar dapat melakukan analisis kalimat dengan benar diperlukan pengetahuan tentang kalimat dan latihan-latihan menyusun kalimat pengetahuan dasar, diperlukan untuk memberikan keterampilan menerapkan pengetahuan tentang kalimat tersebut. Dengan kata lain pengetahuan tentang kalimat dan latihan menyusun kalimat akan memberikan keterampilan dasar “Bongkar Pasang” kalimat. Salah satu pengetahuan dasar tentang kalimat yang diperlukan dalam menganalisis kalimat adalah pengetahuan tentang istilah fungsi, kategori, dan peran. Ketiga istilah ini akan diuraikan secara rinci, sehingga terlihat perbedaan konsep, perbedaan wujud penerapan, dan manfaatnya bagi guru yang membelajarkan Bahasa Indonesia, khususnya tentang kalimat. 2.3.2 Pengertian Fungsi, Kategori, dan Peran Para ahli bahasa menjelaskan bahasa yang dimaksud dengan fungsi tidak lain adalah seperti apa yang secara tradisional disebut subjek, predikat, objek dan keterangan. Fungsi bersifat relasional, artinya adanya fungsi yang satu tidak dapat dimengerti tanpa dihubungkan dengan fungsi yang lain. Kita tidak dapat mengatakan itu fungsi predikat (P) tanpa dihubungkan dengan fungsi subjek (S). Demikian pula kita tidak dapat menyebut dengan istilah objek (O) atau keterangan (K) tanpa dihubungkan dengan P itulah sebabnya Verhaar menyebut fungsi ini dengan istilah fungsi sintaktik ; yakni adanya S, P, O dan K sebagai akibat adanya hubungan sintaktik dalam kalimat. Fungsi-fungsi sintaktik, seperti S, P, O, K, menurut Sudaryanto merupakan tataran tertinggi atau pertama dan paling abstrak. 14 Pembayaran adanya suatu fungsi akan dapat ditemukan jika dihubungkan dengan fungsi yang lain. Tataran di bawahnya dan oleh karena itu tingkat keabstrakkannya juga lebih rendah adalah kategori. Kategori adalah istilah untuk menyebutkan terhadap apa yang secara umum dikatakan kata benda (nonem), kata kerja (verbal), kata sifat (ajektiva), kata bilangan (numerasi) dan lain-lain. Kategori tidak bersifat relasional (sintaktik), melainkan bersifat sistemik. Artinya, penyebutan sesuatu itu verbal tidak disebabkan adanya hubungan atau dihubungkan dengan nonem, verba, ajektiva, numerasia atau yang lainnya. Penyebutan nonem, verba. Ajektiva, numerasi, atau lainnya itu semata-mata kepentingan sistem. Tatanan ketiga dan yang tingkat keabstrakannya paling rendah adalah peran. Peran tidak lain adalah sebutan terhadap apa yang secara umum dikatakan pelaku (agen), penderita (objektif), penerima (benefaktif), alat instrumental), keadaan (eventif), dan sebagainya. Peran juga bersifat relasional atau bersifat sintaktik. Penyebutan peran pelaku adanya peran penderita, peran penerima atau yang lain. Peran pelaku tidak dapat disebutkan tanpa dihubungkan dengan adanya peran penderita, peran penerima atau yang lain. Agar lebih jelas perbedaan ketiganya, dapat dilihat dalam penjelasan tentang hubungan ketiga istilah tersebut dalam kalimat. 2.3.3 Hubungan Fungsi, Kategori, peran, dan Kalimat Untuk mempermudah pemahaman tentang hubungan fungsi, kategori dan peran marilah kita ambil contoh kalimat yang memiliki unsur agak lengkap sebagai pada table 2.1 dibawah ini Tabel 2.1 Hubungan Fungsi, Kategori, Peran, dan Kalimat (1) Asep Memukul Eko Dengan Rotan Fungsi S P O K Kategori Benda Kerja Benda benda Peran Pelaku Tindakan Penderita alat Contoh pertama menunjukkan bahwa sebenarnya kata Asep sebagai S, kata memukul sebagai P, kata Eko sebagai O, dan kata dengan rotan sebagai K, belum memberikan informasi “apapun” kecuali S berada di depan P dan diikuti oleh O dan K. Informasi yang diperoleh semata-mata hanya pola urutan fungsi-fungsi itu mesti dimulai dari S kemudian diikuti P,O, dan terakhir K, meski K tidak jarang berubah-ubah tempat dalam kalimat BI. Menurut Verhaar fungsi-fungsi itu hanyalah “tempat kosong”. Kalimat tersebut bermakna jika diisi dengan kategori dan peran “tempat kosong” tersebut tidak akan memberikan kontribusi apapun kepada pengguna bahasa dalam mengungkapkan gagasan.Contoh kedua Tabel 2.2 Hubungan Fungsi, Kategori, Peran, dan Kalimat (2) Eko Memukul Asep Dengan Rotan Fungsi S P O K Kategori Benda Kerja Benda Benda Peran Pelaku Pembuatan penderita Alat Terlihat bahwa ada perubahan peran. Asep yang semula (contoh-1) berperan sebagai pelaku sekarang berperan sebagai penderita (contoh-2). Mengapa kata Asep yang semula menjadi pelaku berubah menjadi penderita? Sebabnya adalah karena 15 kategori benda “Asep” yang semula mempunyai fungsi sebagai S (contoh-1) berubah fungsi menjadi O. Pengubahan kalimat (1) menjadi kalimat (2) juga memberikan informasi kepada pengguna bahasa memang benar apa yang dikatakan Verhaar yang namanya fungsi itu hanyalah “tempat kosong” yang harus diisi dengan kategori dan peran tertentu. Di samping itu juga memberikan informasi kepada pengguna bahasa bahwa kategori benda “Asep” dan kategori “Eko” dapat saling bertukar fungsi. Hal ini terjadi karena baik kategori benda “Asep” maupun”Eko” samasama kategori benda hidup. Namun pengisian fungsi kategori dan peran itu ada aturan tertentu, jika pengisiannya sembarangan akan menjadikan kalimat tidak bermakna. Contoh ketiga: Tabel 2.3 Hubungan Fungsi, Kategori, Peran, dan Kalimat (3) Ayah Membaca Buku Di Ruang Tamu Fungsi S P O K Kategori Benda Kerja Benda Benda Peran Pelaku Pembuatan penderita Tempat Kalimat (4) sebagai ubahan dari kalimat (3) di atas merupakan bukti bahwa tidak sembarangan kata, yang berketegori benda dapat berperan sebagai pelaku meskipun kata itu dapat mengisi fungsi S maupun O. Benda yang dapat mengisi fungsi S atau O dan sekaligus dapat berperan sebagai pelaku hanyalah kata yang berkategori benda hidup. Aturan tertentu itu juga berlaku bagi pengisian fungsi P. Fungsi P yang kemudian memerlukan kehadiran O adalah kata yang berkategori kerja transitif. Demikian pula kata yang mengisi fungsi K harus mengikuti aturan tertentu sesuai dengan kategori dan peran yang harus di mainkan dalam suatu kalimat. Jadi hubungan antara fungsi, kategori dan peran sangatlah erat dan saling bergantung. Untuk memperjelas hubungan ketiga istilah tersebut dalam “membentuk” suatu kalimat dapat dilihat diagram yang dikutip dari buku yang berjudul Pengantar Linguistik, Jilid Pertama. 2.3.4 Mengenal Perilaku Objek, Pelengkap, dan Keterangan dalam kalimat Bahasa Indonesia Mengenal kalimat sederhana Bahasa Indonesia (BI) merupakan salah satu syarat dalam memahami pola kalimat pada umumnya. Dengan pemahaman pola kalimat secara baik, pengguna bahasa akan dapat mengungkapkan gagasan dengan baik pula. Hal ini selaras dengan pendapat bahwa belajar berbahasa pada hakikatnya dimulai dengan mempelajari kalimat-kalimat, karena kalimat merupakan satuan gagasan. Pola kalimat sederhana BI yang sering diidentifikasi sebagai kalimat tunggal, sekurang-kurangnya terdiri atas subjek-predikat (S-P). Pada tingkatan yang lebih luas kalimat tunggal dapat terdiri atas subjek-predikat-objek (S-P-O); subjekpredikat-pelengkap (S-P-Pel), dan subjek-predikat-keterangan (S-P-K), atau yang lain. Ada pola tertentu yang “mengatur “ hubungan antar fungsi kalimat, khususnya fungsi penguasa (biasanya berupa P) dan fungsi pembatas (bisa O, Pel, ataupun K). Pola urutan penguasa-pembatas ini memberikan informasi kepada pengguna BI tentang seberapa erat hubungan (penguasaan-pembatasan), P terhadap O, Pel, dan K tersebut. Pola urutan penguasa-pembatas secara terbatas akan 16 digunakan untuk menganalisis kalimat dalam rangka mengetahui perbedaan O, Pel, dan K secara gramatik tersebut dalam kalimat yang berterima. Berdasar pemindahan-posisian itu dilihat pula kemungkinan perpindahan fungsi kalimat, khususnya jika pemindah-posisian itu berupa pemasifan. Dapatnya dipindahposisikan unsur-unsur gramatikal suatu kalimat itu, dalam analisis itu disebut dengan istilah “perilaku gramatik”. Jadi yang dimaksud perilaku O, Pel, dan K dalam tulisan ini tidak lain adalah kemungkinan dapat berpindah posisi ketiganya dalam kalimat yang gramatikal. 2.4 Analisis Sintak dan Semantik Dalam konsep Artificial Intelligence, dinyatakan bahwa untuk menganalisis dan mengartikan suatu masukan bahasa alami dapat dilakukan dengan analisis sintaks dan semantik. Dengan menggunakan analisis sintaks dan semantik, suatu input kalimat dapat dengan pasti diketahui struktur dan maknanya. Sebuah kalimat terdiri dari rangkaian kata-kata yang mempunyai makna sendiri-sendiri. Disamping mempunyai makna sendiri, suatu kata juga termasuk dalam berbagai kategori yang dikenal sebagai ujaran, yaitu kata benda, kata ganti, kata kerja, kata sifat, kata kerja tambahan, kata depan, kata penghubung dan kata pemisah. Dalam Bahasa Indonesia, sebuah kata dapat memiliki lebih dari satu arti (makna ganda) dalam sebuah kalimat. Sebagai contoh pada kalimat berikut “Istri Pak Asep yang cacat”, kalimat tersebut dikatakan sebagai kalimat yang rancu dikarenakan memiliki dua buah arti, “Siapakah sebenarnya yang cacat?” Istri Pak Asep atau Pak Asep sendiri, dibuktikan dari pemenggalan kalimatnya seperti pada contoh di bawah ini : Istri / Pak Asep yang cacat dan Istri Pak Asep / yang cacat Pada kalimat tersebut terjadi ambiguity atau kalimat yang rancu. Pada dasarnya sebuah kalimat tersusun atas dua buah bagian khusus yaitu subjek atau pokok kalimat dan predikat atau sering disebut sebagai kata kerja. Pokok kalimat dapat berbentuk kata benda, objek atau benda yang menjadi fokus utama dalam kalimat. Sedangkan predikat menyatakan sesuatu perbuatan yang dilakukan oleh pokok kalimat. Dalam menganalisa input suatu kalimat, program melacak kalimat masukan tersebut kata demi kata. Program akan meneliti arus input untuk mencari spasi maupun tanda-tanda baca agar bisa mengetahui setiap kata terpisah. 2.4.1 Parser Parser adalah elemen yang paling menentukan dalam suatu program pemahaman bahasa alami. Parser merupakan sepenggal software yang dapat menganalisis masukan kalimat secara sintaktik. Parser melakukan identifikasi tiap-tiap kata dan kemudian membuat peta kata-kata tersebut dalam struktur yang disebut pohon parser. Pohon parser menunjukkan makna dalam semua kata dan bagaimana cara menggabungkan kata-kata tersebut. Parser mengidentifikasi prasa kata kerja, prasa kata benda dan selanjutnya memilah-milah ke dalam elemen-elemen yang lain. 17 2.4.2 Lexicon Leksikon berisi semua kata yang dikenal oleh program, selain itu juga berisi ejaan setiap kata yang benar dan merancang bagian ujarannya. Karena dalam setiap kata memiliki makna lebih dari satu, makna leksikon mendaftar makna yang diperbolehkan oleh sistem. Parser dan leksikon bekerja sama untuk mengurangi kalimat pohon parser dan membentuk struktur data yang membantu menerangkan makna yang dimaksud dalam sebuah kalimat. Pada waktu beroperasi, parser merupakan alat untuk mencocokan pola. Setelah kata individual di identifikasi, parser melacak leksikon untuk membandingkan setiap input kata dengan semua kata yang disimpan dalam program. Jika sudah cocok, kata tersebut kemudian disimpan bersama informasi leksikon yang lain. Kemudian parser terus menganalisis katakata tambahannya sampai membentuk pohon parser. 2.4.3 Knowledge Base dan Understander Understander bekerja sama dengan knowledge base (pangkalan pengetahuan) untuk menentukan makna sebuah kalimat. Tujuan understander adalah untuk memanfaatkan pohon parser agar mengacu kepada pangkalan pengetahuan. 2.4.4 Generator Generator adalah input yang sudah dimengerti untuk membuat hasil keluaran (output) yang berguna. Tugas dari understander adalah menyusun struktur data yang berisi makna, memahami kalimat input yang dimasukan dan yang terakhir menyimpannya dalam memori. Struktur data kemudian digunakan untuk mengawali tindakan-tindakan atau langkah-langkah berikutnya. Jika suatu program pengolahan bahasa alami merupakan bagian dari interface atau kode khusus yang mengendalikan program lainnya. 2.5 Membangun Kamus Kamus (lexicon) berhubungan dengan kata-kata individual dan artinya, dan informasi tentang bagaimana mereka dipakai. Setiap entry dalam kamus merepresentasikan informasi tentang kata benda hidup, kata benda mati, kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk dan kata ganti yang diketahui untuk sistem pengolahan bahasa alami. Untuk membangun sebuah sistem yang mampu mengidentifikasikan kalimat Bahasa Indonesia, juga diperlukan perbendaharaan kata yang mampu untuk mendukung kinerja sistem tersebut. Sebuah kalimat menurut tata Bahasa Indonesia harus terdiri dari pokok kalimat (Subject) dan sebutan (Predicate) serta pelengkap (Object) dengan : 18 Pokok kalimat (Subject) adalah sesuatu yang dibicarakan di dalam kalimat yang letaknya harus sebelum kata kerja (Verbi) dan syarat dari Subject harus berupa kata benda (Noun), kata ganti diri (Pronoun) atau kata-kata lain yang dapat digolongkan dengan kata benda tersebut. Sebutan (Predicate) adalah keterangan pokok kalimat dan setiap sebutan haruslah kata kerja (Verb) atau kata kerja bantu (Auxiliary Verb). Jadi sebutan (Predicate) adalah apa yang dibicarakan dari hal atau yang mengenai Subject. Pelengkap (Object) adalah tujuan kerja dari Subject yang tempatnya sesudah Predicate. Untuk membangun sebuah sistem yang mampu mengidentifikasikan semua kalimat yang terdapat dalam tata Bahasa Indonesia membutuhkan suatu basis pengetahuan yang lengkap tentang tata Bahasa Indonesia. 3. ANALISIS KEBUTUHAN PERANGKAT LUNAK Dalam pembuatan aplikasi pengenalan tata pola kalimat Bahasa Indonesia ini terdapat beberapa unsur yang dibutuhkan, berupa : 3.1 Metode Analisis Pada tahap analisis digunakan untuk mengetahui dan mendeteksi pola kalimat bahasa Indonesia dalam pola SPOK. Oleh karena itu dalam tahap analisis digunakan untuk mendapatkan data-data yang diperlukan untuk kepentingan membangun sistem. Hasil akhir dari analisis diharapkan akan didapatkan suatu sistem yang strukturnya dapat didefenisikan dengan baik dan jelas. Dengan diciptakannya software yang mampu untuk mendeteksi kalimat, maka proses parsing kedalam pola SPOK akan lebih cepat dan dapat dilakukan secara berulang-ulang. 3.2 Hasil Analisis 3.2.1 Analisis Kebutuhan Data Masukan Untuk kebutuhan masukan data ke dalam sistem yang akan dibangun berupa data kata-kata dalam bahasa Indonesia, yang terdiri dari data kata benda hidup, kata benda mati, kata sifat, kata kerja, kata keterangan, kata depan, kata sandang, kata petunjuk, dan kata ganti. Untuk keperluan ini tiap kata dalam Bahasa Indonesia harus di kelompokan berdasarkan tipe/jenis kata. Dan kata yang di simpan tidak boleh ada yang sama dengan tipe/jenis kata yang lain. 3.3 Analisis Kebutuhan Proses Untuk kebutuhan proses dalam sistem yang akan dibangun, dapat dijabarkan menjadi beberapa proses, yaitu : a. Pemasukan kalimat yang akan di deteksi (kalimat Bahasa Indonesia). b. Kata disusun berdasarkan penyusun kalimat. c. Proses tokenisasi, yaitu memecahkan kalimat menjadi bentuk-bentuk kata. d. Pencocokan kata (token) yang sudah dipecah dengan kata yang ada dalam database tipe/jenis kata. Hasil pencocokan tersebut akan dilanjutkan pada proses parsing. e. Kata hasil pencocokan dengan database akan menghasilkan kalimat tunggal dalam bentuk pola SPOK. f. Pola kalimat dan jenis/tipe kata akan ditampilkan dalam satu form. 4. PENUTUP 4.1 Kesimpulan Setelah menyelesaikan pembuatan program aplikasi (software) yang dapat digunakan untuk mendeteksi pola kalimat dalam bahasa Indonesia, kemudian dilakukan dengan pengujian beberapa contoh kalimat untuk masing-masing bentuk kalimat. Dapat diambil kesimpulan berdasar hasil pengujian maupun metode yang digunakan dalam pembuatan program, bahwa teknik kecerdasan buatan (artificial intelligence) yaitu pengolahan bahasa alami dapat dimanfaatkan untuk membangun 19 sebuah sistem yang mampu melakukan pengenalan pola kalimat Bahasa Indonesia dengan menggunakan proses parsing. 4.2 Saran Berdasarkan hasil pengujian yang dilakukan terhadap program aplikasi ini, program masih perlu dikembangkan lagi agar kinerja program lebih baik. Hal ini dilakukan dengan menambah fasilitas-fasilitas, antara lain : a. Membuat tampilan program agar lebih menarik, misalnya dengan menambahkan sound scheme. b. Menambah aturan pola kalimat yang baru, misalnya dapat mendeteksi lebih dari satu kalimat, karena semakin banyak aturan yang diberikan maka sistem akan lebih banyak dapat mengenali suatu pola kalimat. DAFTAR PUSTAKA [SET03] Setiawan, Kuswara. “Paradigma Sistem Cerdas”. BayuMedia Publishing, Malang, Jawa Timur. 2003. [PUS00] Pustaka, Balai. Struktur Bahasa yang disempurnakan sesuai EYD. 2000. [MAN00] Mandala Rila, Takenobu Takunaga, Hozumi Tanaka. (2000). “The exploration and Analysis of Using Multiple Thesaurus types for Query Expansion in Information Retrieval”. International Journal of Information Processing. 20