PEMBUATAN APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN MENGGUNAKAN METODE NATURAL LANGUAGE PROCESSING TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: NUR MUHAMMAD RIKZA RATMAN 08560284 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013 i LEMBAR PERSETUJUAN PEMBUATAN APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN MENGGUNAKAN METODE NATURAL LANGUAGE PROCESSING TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Menyetujui Pembimbing I Pembimbing II Machmud Effendy, M.Eng Hardianto W., S.Kom NIDN 0715067402 NIDN 0721038602 ii LEMBAR PENGESAHAN PEMBUATAN APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN MENGGUNAKAN METODE NATURAL LANGUAGE PROCESSING TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun Oleh: Nur Muhammad Rikza Ratman 08560284 Menyetujui, Penguji I Penguji II Yufis Ashar, M.Kom Diah Risqiwati, M.T NIDN 0728088701 Mengetahui, Ketua Jurusan Teknik Informatika Eko Budi Cahyono, M. Kom NIP 108.9504.0330 iii LEMBAR PERNYATAAN Yang bertanda tangan di bawah ini: Nama : NUR MUHAMMAD RIKZA RATMAN Nim : 08560284 Fak/Jur : TEKNIK/ TEKNIK INFORMATIKA Dengan ini saya menyampaikan bahwa Tugas Akhir dengan judul PEMBUATAN APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN MENGGUNAKAN NATURAL LANGUAGE PROCESSING beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya. Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini, maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku. Mengetahui, Malang, Mahmud Effendy, M.Eng Nur Muhammad Rikza Ratman NIP 108.0203.0363 iv ABSTRAK Sejalan dengan berkembangnya suatu daerah membuat banyak investor, terutama investor asing berdatangan ikut serta dalam menanamkan modalnya di daerah tersebut. Dalam perjalanan mengembangkan bisnisnya investor asing mengalami kesulitan dalam berkomunikasi dengan dengan masyarakat daerah khususnya daerah Madura. Untuk membantu dalam berkomunikasi dibuatlah aplikasi terjemahan bahasa Inggris – bahasa Madura Enggi Bunten dengan menggunakan metode Natural Language Processing. Natural Language Processing adalah suatu proses pembuatan model komputasi dari bahasa, sehingga dapat terjadi suatu interaksi antara manusia dengan computer dengan perantara bahasa alami. Ada dua hal penting dalam proses pembuatan aplikasi terjemahan menggunakan metode Natural Language Processing, yaitu proses parsing dan proses stemming. Tujuan dari proses parsing yaitu untuk memecahkan kalimat menjadi bagian terkecil yaitu kata. Proses selanjutnya adalah proses stemming, yaitu mencari kata dasar atau menghilangkan imbuhan yang ada di dalam bahasa Inggris, sehingga dapat ditemukan kata dasarnya (root word). Dengan adanya aplikasi terjemahan bahasa Inggris – bahasa Madura Enggi Bunten pengguna dapat dengan mudah menerjemahkan bahasa Inggris ke bahasa Madura Enggi Bunten, serta mampu menghasilkan keakurasian terjemahan sebesar 83,33%. Kata Kunci: Aplikasi terjemahan, Parsing, Stemming, Natural Language Processing, Enggi Bunten v ABSTRACT In line with the development of an area makes a lot of investors, especially foreign investors flock to participate in investing in this area. In the course of developing the business of foreign investors have difficulty in communicating with the local community in particular areas of Madura. To assist in communication, made English – Madurese Enggi Bunten translate aplication using Natural Language Processing. Natural Language Processing is a process of computational modeling of language, so that an interaction can occur between humans and computers with natural language intermediaries. There are two important things in the process of making the translation application using Natural Language Processing methods, there are parsing process and stemming process. The purpose of the parsing process is to break the sentence into the smallest part of the word. The next process is stemming process, which is looking for a base or eliminate the suffix in the English language, so it can be found basically word (root word). With the translation application of English-language - Madura Enggi Bunten users can easily translate English into Madura Enggi Bunten Language, and capable producing the translation accuracy until 83.33%. Keyword: translate aplication, parsing, stemming, Natural Language Processing, Enggi Bunten vi LEMBAR PERSEMBAHAN Puji syukur kepada Allah SWT atas rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada: 1. Bapak Mahmud Effendy, M.Eng dan Bapak Hardianto W, S.Kom selaku pembimbing Tugas Akhir. 2. Bapak/Ibu Dekan Fakultas Teknik Universitas Muhammadiyah Malang. 3. Bapak Ketua Jurusan Teknik Universitas Muhammadiyah Malang. 4. Bapak/Ibu dosen Jurusan Teknik Universitas Muhammadiyah Malang yang telah menyalurkan ilmunya. 5. Kedua orang tua yang selalu memberikan semangat dan doa. 6. Teman-teman kos Taman Embong Ayar II blok L.1 dan kos Al-Ikhlas Margobasuki yang selalu menemani dan memberikan semangat saat suka dan duka. vii KATA PENGANTAR Alhamdulillah segala puji bagi Allah atas limpahan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul PEMBUATAN APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN MENGGUNAKAN METODE NATURAL LANGUAGE PROCESSING. Tugas Akhir ini disusun sebagai salah satu syarat kelulusan tingkat sarjana di Jurusan Teknik Informatika Fakultas Teknik Universitas Muhammadiyah Malang. Pada Tugas Akhir ini penulis mencoba membuat aplikasi terjemahan dengan menggunakan metode Natural Language Processing. Penulis menyadari bahwa dalam penulisan Tugas Akhir ini masih banyak kekurangan yang harus disempurnakan. Untuk itu penulis mengharapkan kritik dan saran berkaitan dengan Tugas Akhir ini. Akhir kata penulis mengharapkan semoga Tugas Akhir ini dapat bermanfaat bagi pembacanya. Malang, Penulis viii DAFTAR ISI HALAMAN JUDUL ............................................................................................... i LEMBAR PERSETUJUAN ................................................................................... ii LEMBAR PENGESAHAN .................................................................................... iii LEMBAR PERNYATAAN .................................................................................... iv ABSTRAK ............................................................................................................... v ABSTRACT ............................................................................................................. vi LEMBAR PERSEMBAHAN ................................................................................. vii KATA PENGANTAR ............................................................................................. viii DAFTAR ISI .......................................................................................................... ix DAFTAR GAMBAR ................................................................................................ xii DAFTAR TABEL ................................................................................................... xiv BAB I PENDAHULUAN 1. 1. Latar belakang .............................................................................. 1 1. 2. Rumusan Masalah ........................................................................ 2 1. 3. Tujuan ............................................................................................ 3 1. 4. Batasan Masalah ........................................................................... 3 1. 5. Metodologi ..................................................................................... 3 1. 6. Sistematika Penulisan ................................................................... 6 BAB II LANDASAN TEORI 2.1. Tata bahasa bahasa Inggris ......................................................... 8 2.1.1 Jenis kata bahasa Inggris ................................................. 8 2.1.2 Sistem kala bahasa Inggris ............................................... 11 2.2. Tata bahasa bahasa Madura ....................................................... 17 2.2.1 Kosakata ............................................................................ 17 2.2.2 Sistem pengucapan ............................................................ 18 2.2.3 Morfologi bahasa Madura ................................................ 18 2.2.4 Bentuk verba ..................................................................... 19 2.2.5 Tingkatan bahasa .............................................................. 22 2.3. Natural Language Processing ...................................................... 23 2.3.1 Bidang pengetahuan dalam Natural Language .............. 23 2.3.2 Aplikasi dalam bidang Natural Language ...................... 25 ix 2.3.3 Komponen bahasa alami aplikasi terjemahan ............... 27 2.4. PHP ................................................................................................ 28 2.4.1 Teknik menggunakan PHP .............................................. 28 2.4.2 Menampilkan data di dalam program ........................... 30 2.4.3 PHP di dalam tag HTML ................................................. 31 2.5. MySQL ........................................................................................... 31 2.6. Parsing ........................................................................................... 32 2.6.1 Top-down Parsing ............................................................. 33 2.6.2 Button-up Parsing ............................................................. 34 2.6.3 Proses parsing .................................................................... 34 2.7. Stemming ....................................................................................... 35 2.7.1 Proses stemming bahasa Inggris ...................................... 36 BAB III ANALISA DAN PERANCANGAN SISTEM 3.1. Analisa Kebutuhan ........................................................................ 39 3.1.1 Aktor .................................................................................. 39 3.1.2 Data .................................................................................... 40 3.2. Perancangan Sistem ...................................................................... 40 3.2.1 Perancangan aplikasi terjemahan ................................... 41 3.2.2 Perancangan proses parsing ............................................ 41 3.2.3 Perancangan proses stemming ......................................... 41 3.2.4 Perancangan prose bahasa alami .................................... 42 3.2.5 Flowchart aplikasi terjemahan ......................................... 42 3.2.6 Flowchart stemming bahasa Inggris ................................ 43 3.2.7 Data flow diagram (DFD) .................................................. 46 3.2.8 Usecase diagram ................................................................. 47 3.2.9 Skenario user ...................................................................... 47 3.2.10 Activity diagram................................................................. 48 3.2.11 Sequence diagram .............................................................. 52 3.3. Desain Interface ............................................................................ 55 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1. Implementasi sistem ...................................................................... 56 4.2. Pengujian sistem dan analisa ....................................................... 56 4.2.1 Menu Home ....................................................................... 56 x 4.2.2 Menu terjemahan .............................................................. 57 4.2.3 Menu cari kosakata ........................................................... 58 4.2.4 Menu tambah kosakata .................................................... 59 4.2.5 Menu hapus kosakata ........................................................ 60 4.2.6 Proses penerjemahan aplikasi terjemahan bahasa Inggris ke bahasa Madura Enggi Bunten ........................ 61 4.2.7 Pengujian Natural Language Processing ......................... 64 BAB V PENUTUP 5.1. Kesimpulan ..................................................................................... 66 5.2. Saran .............................................................................................. 66 DAFTAR PUSTAKA .............................................................................................. 67 xi DAFTAR GAMBAR Gambar 1.1 Komponen bahasa alami untuk aplikasi terjemahan ................... 4 Gambar 2.1 Komponen bahasa alami untuk aplikasi terjemahan ................... 27 Gambar 2.2 Cara kerja top-down parser ............................................................ 33 Gambar 2.3 Cara kerja button-up parser ........................................................... 34 Gambar 3.1 Tabel kosakata terjemahan bahaa Inggris – bahasa Madura Enggi Bunten ................................................................................... 40 Gambar 3.2 Perancangan aplikasi terjemahan bahasa Inggris – bahasa Madura Enggi Bunten .................................................................... 41 Gambar 3.3 Perancangan proses parsing kalimat ............................................. 41 Gambar 3.4 Perancangan proses stemming kata .............................................. 41 Gambar 3.5 Perancangan proses bahasa alami ................................................. 42 Gambar 3.6 Flowchart program terjemahan ..................................................... 42 Gambar 3.7 Flowchart stemming bahaa Inggris ................................................ 43 Gambar 3.8 Data flow diagram level 0 ................................................................ 46 Gambar 3.9 Data flow diagram level 1 ................................................................ 46 Gambar 3.10 Usecase diagram aplikasi terjemahan bahasa Inggris – bahasa Madura Enggi Bunten ........................................................ 47 Gambar 3.11 Activity diagram terjemahan kalimat ............................................ 48 Gambar 3.12 Activity diagram mencari kosakata................................................ 49 Gambar 3.13 Activity diagram menambah kosakata .......................................... 50 Gambar 3.14 Activity diagram menghapus kosakata .......................................... 51 Gambar 3.15 Sequence diagram menerjemahkan kalimat ................................. 52 Gambar 3.16 Sequence diagram mencari kosakata ............................................. 53 Gambar 3.17 Sequence diagram menambah kosakata ........................................ 54 Gambar 3.18 Sequence diagram menghapus kosakata........................................ 55 Gambar 3.19 Desain interface aplikasi terjemahan ............................................. 55 Gambar 4.1 Tampilan menu home ...................................................................... 56 Gambar 4.2 Tampilan menu terjemahan ............................................................ 57 Gambar 4.3 Tampilan menu cari kosakata ......................................................... 58 Gambar 4.4 Tampilan menu tambah kosakata .................................................. 59 Gambar 4.5 Tampilan hapus kosakata ................................................................ 60 xii Gambar 4.6 Source code menjadikan inputan user ke array ............................ 61 Gambar 4.7 Kutipan source code memecah atau memisahkan kumpulan Array ................................................................................................. 61 Gambar 4.8 Kutipan source code proses stemming kata ................................... 62 Gambar 4.9 Kutipan source code proses penyusunan kata ke dalam bahasa Madura .............................................................................................. 63 Gambar 4.10 Hasil terjemahan menggunakan aplikasi terjemahan bahasa Inggris – bahasa Madura Enggi Bunten ........................... 63 xiii DAFTAR TABEL Tabel 2.1 Untuk pembuka program PHP ......................................................... 28 Tabel 3.1 User requirement ............................................................................... 39 Tabel 3.2 Skenario user ...................................................................................... 46 Tabel 4.1 Perangkat uji sistem .......................................................................... 56 Tabel 4.2 Tabel kalimat uji ................................................................................ 64 xiv DAFTAR PUSTAKA [1] Agusta, Ledy. 2009. PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA. http://yudiagusta.files.wordpress.com/2009/11/196-201-knsi09-036perbandingan-algoritma-stemming-porter-dengan-algoritma-naziefadriani-untuk-stemming-dokumen-teks-bahasa-indonesia.pdf. didownload pada tanggal 18 april 2013. [2] Arifin, Setiono. KLASIFIKASI DOKUMEN BERITA KEJADIAN BERBAHASA INDONESIA DENGAN ALGORITMA SINGLE PASS CLUSTERING. Teknik Informatika. Institute Teknologi Sepuluh November Surabaya. [3] Asian, Jelita. 2007. EFFECTIVE TECHNIQUES FOR INDONESIAN TEXT RETRIVAL. Tesis. Scool of Computer Science and Information Technologi. RMIT University. [4] Asian, Williams, Tahaghoghi. 2005. STEMMING INDONESIAN. School of Computer Science and Information Technology. RMIT University. [5] Dwiyoga, Purwitasari. IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN Informatika. METODE CORPUS BASED STEMMING. Institute Teknologi Sepuluh November Teknik Surabaya. http://digilib.its.ac.id/public/ITS-Undergraduate-14255-paperpdf.pdf. [6] Ika, Bastari. 2009. KOSA KATA BAHASA MADURA. Surabaya:Karya Simpati Mandiri. [7] Makhfud, Ghazali. KOSA KATA BAHASA MADURA. Surabaya: Sarana Ilmu. [8] Nugroho, Eko. 2011. PERANCANGAN SISTEM DETEKSI PLAGIARISME DOKUMEN TEKS DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP. Tugas Akhir. Ilmu Komputer. Universitas Brawijaya. 1 [9] didownload pada tanggal 18 april 2013. [10] Waluyo, Hariyanto. 2011. ENGLISH GRAMMAR COMPLETE EDITION. Mahirsindo Utama. [11] http://nurzay.wordpress.com/2011/04/30/antara-enja%E2%80%99-iyeenggi-enten-dan-enggi-bunten-dalam-kehidupan-orang-madura/. Diakses tanggal 20 April 2013. [12] http://wongzo.blogspot.com/2012/10/16-tenses-bahasa-inggris-besertarumus.html. Diakses tanggal 11 Mei 2013. [13] http://endhy.wordpress.com/2008/01/09/stemming-bahasa-inggris-porterstemmer/. Diakses tanggal 11 Mei 2013. [14] http://pusatbahasaalazhar.wordpress.com/artikel-bahasa/verba-bahasamadura/. Diakses tanggal 29 Mei 2013. [15] http://pusatbahasaalazhar.wordpress.com/artikel-bahasa/verba-bahasamadura/. diakses pada tanggal 2 Juni 2013. [16] http://lecturer.eepisits.edu/~entin/Kecerdasan%20Buatan/Buku/Bab%205%20Natural%20Lan guage%20Processing.pdf. Diakses tanggal 10 Juni 2013. [17] http://snowball.tartarus.org/algorithms/porter/stemmer.html. Diakses tanggal 15 Juni 2013. [18] http://www.weberdev.com/get_example.php3?ExampleID=1503. Diakses tanggal 15 Juni 2013. 2