pembuatan aplikasi terjemahan bahasa inggris – bahasa

advertisement
PEMBUATAN APLIKASI TERJEMAHAN
BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN
MENGGUNAKAN METODE
NATURAL LANGUAGE PROCESSING
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Oleh:
NUR MUHAMMAD RIKZA RATMAN
08560284
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2013
i
LEMBAR PERSETUJUAN
PEMBUATAN APLIKASI TERJEMAHAN
BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN
MENGGUNAKAN METODE
NATURAL LANGUAGE PROCESSING
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui
Pembimbing I
Pembimbing II
Machmud Effendy, M.Eng
Hardianto W., S.Kom
NIDN 0715067402
NIDN 0721038602
ii
LEMBAR PENGESAHAN
PEMBUATAN APLIKASI TERJEMAHAN
BAHASA INGGRIS – BAHASA MADURA ENGGI BUNTEN
MENGGUNAKAN METODE
NATURAL LANGUAGE PROCESSING
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh:
Nur Muhammad Rikza Ratman
08560284
Menyetujui,
Penguji I
Penguji II
Yufis Ashar, M.Kom
Diah Risqiwati, M.T
NIDN 0728088701
Mengetahui,
Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, M. Kom
NIP 108.9504.0330
iii
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini:
Nama
: NUR MUHAMMAD RIKZA RATMAN
Nim
: 08560284
Fak/Jur
: TEKNIK/ TEKNIK INFORMATIKA
Dengan ini saya menyampaikan bahwa Tugas Akhir dengan judul PEMBUATAN
APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI
BUNTEN MENGGUNAKAN NATURAL LANGUAGE PROCESSING beserta seluruh
isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian
maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila
kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini,
atau ada klaim dari pihak lain terhadap keaslian karya saya ini, maka saya siap
menanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui,
Malang,
Mahmud Effendy, M.Eng
Nur Muhammad Rikza Ratman
NIP 108.0203.0363
iv
ABSTRAK
Sejalan dengan berkembangnya suatu daerah membuat banyak investor, terutama
investor asing berdatangan ikut serta dalam menanamkan modalnya di daerah tersebut.
Dalam perjalanan mengembangkan bisnisnya investor asing mengalami kesulitan dalam
berkomunikasi dengan dengan masyarakat daerah khususnya daerah Madura. Untuk
membantu dalam berkomunikasi dibuatlah aplikasi terjemahan bahasa Inggris – bahasa
Madura Enggi Bunten dengan menggunakan metode Natural Language Processing. Natural
Language Processing adalah suatu proses pembuatan model komputasi dari bahasa,
sehingga dapat terjadi suatu interaksi antara manusia dengan computer dengan perantara
bahasa alami. Ada dua hal penting dalam proses pembuatan aplikasi terjemahan
menggunakan metode Natural Language Processing, yaitu proses parsing dan proses
stemming. Tujuan dari proses parsing yaitu untuk memecahkan kalimat menjadi bagian
terkecil yaitu kata. Proses selanjutnya adalah proses stemming, yaitu mencari kata dasar
atau menghilangkan imbuhan yang ada di dalam bahasa Inggris, sehingga dapat
ditemukan kata dasarnya (root word). Dengan adanya aplikasi terjemahan bahasa Inggris –
bahasa Madura Enggi Bunten pengguna dapat dengan mudah menerjemahkan bahasa
Inggris ke bahasa Madura Enggi Bunten, serta mampu menghasilkan keakurasian
terjemahan sebesar 83,33%.
Kata Kunci: Aplikasi terjemahan, Parsing, Stemming, Natural Language Processing,
Enggi Bunten
v
ABSTRACT
In line with the development of an area makes a lot of investors, especially foreign
investors flock to participate in investing in this area. In the course of developing the
business of foreign investors have difficulty in communicating with the local community in
particular areas of Madura. To assist in communication, made English – Madurese Enggi
Bunten translate aplication using Natural Language Processing. Natural Language
Processing is a process of computational modeling of language, so that an interaction can
occur between humans and computers with natural language intermediaries. There are two
important things in the process of making the translation application using Natural
Language Processing methods, there are parsing process and stemming process. The
purpose of the parsing process is to break the sentence into the smallest part of the word.
The next process is stemming process, which is looking for a base or eliminate the suffix in
the English language, so it can be found basically word (root word). With the translation
application of English-language - Madura Enggi Bunten users can easily translate English
into Madura Enggi Bunten Language, and capable producing the translation accuracy until
83.33%.
Keyword: translate aplication, parsing, stemming, Natural Language Processing, Enggi
Bunten
vi
LEMBAR PERSEMBAHAN
Puji syukur kepada Allah SWT atas rahmat dan karunia-Nya, sehingga penulis
dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan ucapan terima kasih yang
sebesar-besarnya kepada:
1. Bapak Mahmud Effendy, M.Eng dan Bapak Hardianto W, S.Kom selaku pembimbing
Tugas Akhir.
2. Bapak/Ibu Dekan Fakultas Teknik Universitas Muhammadiyah Malang.
3. Bapak Ketua Jurusan Teknik Universitas Muhammadiyah Malang.
4. Bapak/Ibu dosen Jurusan Teknik Universitas Muhammadiyah Malang yang telah
menyalurkan ilmunya.
5. Kedua orang tua yang selalu memberikan semangat dan doa.
6. Teman-teman kos Taman Embong Ayar II blok L.1 dan kos Al-Ikhlas Margobasuki
yang selalu menemani dan memberikan semangat saat suka dan duka.
vii
KATA PENGANTAR
Alhamdulillah segala puji bagi Allah atas limpahan rahmat dan karunia-Nya,
sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul PEMBUATAN
APLIKASI TERJEMAHAN BAHASA INGGRIS – BAHASA MADURA ENGGI
BUNTEN MENGGUNAKAN METODE NATURAL LANGUAGE PROCESSING.
Tugas Akhir ini disusun sebagai salah satu syarat kelulusan tingkat sarjana di Jurusan
Teknik Informatika Fakultas Teknik Universitas Muhammadiyah Malang.
Pada Tugas Akhir ini penulis mencoba membuat aplikasi terjemahan dengan
menggunakan metode Natural Language Processing.
Penulis menyadari bahwa dalam penulisan Tugas Akhir ini masih banyak
kekurangan yang harus disempurnakan. Untuk itu penulis mengharapkan kritik dan saran
berkaitan dengan Tugas Akhir ini. Akhir kata penulis mengharapkan semoga Tugas Akhir
ini dapat bermanfaat bagi pembacanya.
Malang,
Penulis
viii
DAFTAR ISI
HALAMAN JUDUL ............................................................................................... i
LEMBAR PERSETUJUAN ................................................................................... ii
LEMBAR PENGESAHAN .................................................................................... iii
LEMBAR PERNYATAAN .................................................................................... iv
ABSTRAK ............................................................................................................... v
ABSTRACT ............................................................................................................. vi
LEMBAR PERSEMBAHAN ................................................................................. vii
KATA PENGANTAR ............................................................................................. viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR GAMBAR ................................................................................................ xii
DAFTAR TABEL ................................................................................................... xiv
BAB I
PENDAHULUAN
1. 1. Latar belakang .............................................................................. 1
1. 2. Rumusan Masalah ........................................................................ 2
1. 3. Tujuan ............................................................................................ 3
1. 4. Batasan Masalah ........................................................................... 3
1. 5. Metodologi ..................................................................................... 3
1. 6. Sistematika Penulisan ................................................................... 6
BAB II LANDASAN TEORI
2.1. Tata bahasa bahasa Inggris ......................................................... 8
2.1.1 Jenis kata bahasa Inggris ................................................. 8
2.1.2 Sistem kala bahasa Inggris ............................................... 11
2.2. Tata bahasa bahasa Madura ....................................................... 17
2.2.1
Kosakata ............................................................................ 17
2.2.2
Sistem pengucapan ............................................................ 18
2.2.3
Morfologi bahasa Madura ................................................ 18
2.2.4
Bentuk verba ..................................................................... 19
2.2.5
Tingkatan bahasa .............................................................. 22
2.3. Natural Language Processing ...................................................... 23
2.3.1
Bidang pengetahuan dalam Natural Language .............. 23
2.3.2
Aplikasi dalam bidang Natural Language ...................... 25
ix
2.3.3
Komponen bahasa alami aplikasi terjemahan ............... 27
2.4. PHP ................................................................................................ 28
2.4.1
Teknik menggunakan PHP .............................................. 28
2.4.2
Menampilkan data di dalam program ........................... 30
2.4.3
PHP di dalam tag HTML ................................................. 31
2.5. MySQL ........................................................................................... 31
2.6. Parsing ........................................................................................... 32
2.6.1
Top-down Parsing ............................................................. 33
2.6.2
Button-up Parsing ............................................................. 34
2.6.3
Proses parsing .................................................................... 34
2.7. Stemming ....................................................................................... 35
2.7.1
Proses stemming bahasa Inggris ...................................... 36
BAB III ANALISA DAN PERANCANGAN SISTEM
3.1. Analisa Kebutuhan ........................................................................ 39
3.1.1 Aktor .................................................................................. 39
3.1.2 Data .................................................................................... 40
3.2. Perancangan Sistem ...................................................................... 40
3.2.1
Perancangan aplikasi terjemahan ................................... 41
3.2.2
Perancangan proses parsing ............................................ 41
3.2.3
Perancangan proses stemming ......................................... 41
3.2.4
Perancangan prose bahasa alami .................................... 42
3.2.5
Flowchart aplikasi terjemahan ......................................... 42
3.2.6
Flowchart stemming bahasa Inggris ................................ 43
3.2.7
Data flow diagram (DFD) .................................................. 46
3.2.8
Usecase diagram ................................................................. 47
3.2.9
Skenario user ...................................................................... 47
3.2.10 Activity diagram................................................................. 48
3.2.11 Sequence diagram .............................................................. 52
3.3. Desain Interface ............................................................................ 55
BAB IV IMPLEMENTASI DAN PENGUJIAN
4.1. Implementasi sistem ...................................................................... 56
4.2. Pengujian sistem dan analisa ....................................................... 56
4.2.1
Menu Home ....................................................................... 56
x
4.2.2
Menu terjemahan .............................................................. 57
4.2.3
Menu cari kosakata ........................................................... 58
4.2.4
Menu tambah kosakata .................................................... 59
4.2.5
Menu hapus kosakata ........................................................ 60
4.2.6
Proses penerjemahan aplikasi terjemahan bahasa
Inggris ke bahasa Madura Enggi Bunten ........................ 61
4.2.7
Pengujian Natural Language Processing ......................... 64
BAB V PENUTUP
5.1. Kesimpulan ..................................................................................... 66
5.2. Saran .............................................................................................. 66
DAFTAR PUSTAKA .............................................................................................. 67
xi
DAFTAR GAMBAR
Gambar 1.1 Komponen bahasa alami untuk aplikasi terjemahan ................... 4
Gambar 2.1 Komponen bahasa alami untuk aplikasi terjemahan ................... 27
Gambar 2.2 Cara kerja top-down parser ............................................................ 33
Gambar 2.3 Cara kerja button-up parser ........................................................... 34
Gambar 3.1 Tabel kosakata terjemahan bahaa Inggris – bahasa Madura
Enggi Bunten ................................................................................... 40
Gambar 3.2 Perancangan aplikasi terjemahan bahasa Inggris – bahasa
Madura Enggi Bunten .................................................................... 41
Gambar 3.3 Perancangan proses parsing kalimat ............................................. 41
Gambar 3.4 Perancangan proses stemming kata .............................................. 41
Gambar 3.5 Perancangan proses bahasa alami ................................................. 42
Gambar 3.6 Flowchart program terjemahan ..................................................... 42
Gambar 3.7 Flowchart stemming bahaa Inggris ................................................ 43
Gambar 3.8 Data flow diagram level 0 ................................................................ 46
Gambar 3.9 Data flow diagram level 1 ................................................................ 46
Gambar 3.10 Usecase diagram aplikasi terjemahan bahasa Inggris –
bahasa Madura Enggi Bunten ........................................................ 47
Gambar 3.11 Activity diagram terjemahan kalimat ............................................ 48
Gambar 3.12 Activity diagram mencari kosakata................................................ 49
Gambar 3.13 Activity diagram menambah kosakata .......................................... 50
Gambar 3.14 Activity diagram menghapus kosakata .......................................... 51
Gambar 3.15 Sequence diagram menerjemahkan kalimat ................................. 52
Gambar 3.16 Sequence diagram mencari kosakata ............................................. 53
Gambar 3.17 Sequence diagram menambah kosakata ........................................ 54
Gambar 3.18 Sequence diagram menghapus kosakata........................................ 55
Gambar 3.19 Desain interface aplikasi terjemahan ............................................. 55
Gambar 4.1 Tampilan menu home ...................................................................... 56
Gambar 4.2 Tampilan menu terjemahan ............................................................ 57
Gambar 4.3 Tampilan menu cari kosakata ......................................................... 58
Gambar 4.4 Tampilan menu tambah kosakata .................................................. 59
Gambar 4.5 Tampilan hapus kosakata ................................................................ 60
xii
Gambar 4.6 Source code menjadikan inputan user ke array ............................ 61
Gambar 4.7 Kutipan source code memecah atau memisahkan kumpulan
Array ................................................................................................. 61
Gambar 4.8 Kutipan source code proses stemming kata ................................... 62
Gambar 4.9 Kutipan source code proses penyusunan kata ke dalam bahasa
Madura .............................................................................................. 63
Gambar 4.10 Hasil terjemahan menggunakan aplikasi terjemahan
bahasa Inggris – bahasa Madura Enggi Bunten ........................... 63
xiii
DAFTAR TABEL
Tabel 2.1
Untuk pembuka program PHP ......................................................... 28
Tabel 3.1
User requirement ............................................................................... 39
Tabel 3.2
Skenario user ...................................................................................... 46
Tabel 4.1
Perangkat uji sistem .......................................................................... 56
Tabel 4.2
Tabel kalimat uji ................................................................................ 64
xiv
DAFTAR PUSTAKA
[1]
Agusta, Ledy. 2009. PERBANDINGAN ALGORITMA STEMMING
PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK
STEMMING
DOKUMEN
TEKS
BAHASA
INDONESIA.
http://yudiagusta.files.wordpress.com/2009/11/196-201-knsi09-036perbandingan-algoritma-stemming-porter-dengan-algoritma-naziefadriani-untuk-stemming-dokumen-teks-bahasa-indonesia.pdf. didownload
pada tanggal 18 april 2013.
[2]
Arifin, Setiono. KLASIFIKASI DOKUMEN BERITA KEJADIAN
BERBAHASA INDONESIA DENGAN ALGORITMA SINGLE PASS
CLUSTERING.
Teknik
Informatika.
Institute
Teknologi
Sepuluh
November Surabaya.
[3]
Asian, Jelita. 2007. EFFECTIVE TECHNIQUES FOR INDONESIAN
TEXT RETRIVAL. Tesis. Scool of Computer Science and Information
Technologi. RMIT University.
[4]
Asian, Williams, Tahaghoghi. 2005. STEMMING INDONESIAN. School
of Computer Science and Information Technology. RMIT University.
[5]
Dwiyoga, Purwitasari. IMPLEMENTASI MODIFIKASI ENHANCED
CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA
DENGAN
Informatika.
METODE
CORPUS
BASED
STEMMING.
Institute
Teknologi
Sepuluh
November
Teknik
Surabaya.
http://digilib.its.ac.id/public/ITS-Undergraduate-14255-paperpdf.pdf.
[6]
Ika, Bastari. 2009. KOSA KATA BAHASA MADURA. Surabaya:Karya
Simpati Mandiri.
[7]
Makhfud, Ghazali. KOSA KATA BAHASA MADURA. Surabaya: Sarana
Ilmu.
[8]
Nugroho,
Eko.
2011.
PERANCANGAN
SISTEM
DETEKSI
PLAGIARISME DOKUMEN TEKS DENGAN MENGGUNAKAN
ALGORITMA RABIN-KARP. Tugas Akhir. Ilmu Komputer. Universitas
Brawijaya.
1
[9]
didownload pada tanggal 18 april 2013.
[10]
Waluyo,
Hariyanto.
2011.
ENGLISH
GRAMMAR
COMPLETE
EDITION. Mahirsindo Utama.
[11]
http://nurzay.wordpress.com/2011/04/30/antara-enja%E2%80%99-iyeenggi-enten-dan-enggi-bunten-dalam-kehidupan-orang-madura/.
Diakses
tanggal 20 April 2013.
[12]
http://wongzo.blogspot.com/2012/10/16-tenses-bahasa-inggris-besertarumus.html. Diakses tanggal 11 Mei 2013.
[13]
http://endhy.wordpress.com/2008/01/09/stemming-bahasa-inggris-porterstemmer/. Diakses tanggal 11 Mei 2013.
[14]
http://pusatbahasaalazhar.wordpress.com/artikel-bahasa/verba-bahasamadura/. Diakses tanggal 29 Mei 2013.
[15]
http://pusatbahasaalazhar.wordpress.com/artikel-bahasa/verba-bahasamadura/. diakses pada tanggal 2 Juni 2013.
[16]
http://lecturer.eepisits.edu/~entin/Kecerdasan%20Buatan/Buku/Bab%205%20Natural%20Lan
guage%20Processing.pdf. Diakses tanggal 10 Juni 2013.
[17]
http://snowball.tartarus.org/algorithms/porter/stemmer.html.
Diakses
tanggal 15 Juni 2013.
[18]
http://www.weberdev.com/get_example.php3?ExampleID=1503. Diakses
tanggal 15 Juni 2013.
2
Download