PROGRAM KAMUS KATA JEPANG-INDONESIA-INGGRIS BERBASIS WEB DENGAN MEMANFAATKAN STANDAR UNICODE Agus Prijono1, Yohannes Budianto Irawan2 Jurusan Teknik Elektro Universitas Kristen Maranatha Jl. Prof.Drg.Suria Sumantri MPH No. 65, Bandung Telp.: +62370-634338, e-mail: [email protected], [email protected] Abstract Japanese language is one of the languages which enthused by many Indonesians especially young people. To study Japanese, we must pay attention to the three type letter owned by the language, namely hiragana, katakana, and kanji. This paper proposes a web-based JapaneseIndonesian-English word dictionary to translate word in Indonesian to Japanese, English to Japanese, Japanese to Indonesian, and Japanese to English. The proposed dictionary accepts Japanese words in hiragana and katakana only. This web-based dictionary has virtual keyboard to input word in hiragana and katakana. In addition, an administrator can update and delete data in the dictionary. Unicode is chosen as a storage format since it is a computing industry standard for the consistent encoding, representation and handling of text expressed in most of the world's writing systems. The resulting web-based Japanese-Indonesia-English word dictionary is presented in this paper. Keywords: word dictionary, unicode, hiragana, katakana. 1. PENDAHULUAN Pada era informasi ini internet menjadi salah satu media informasi yang hangat untuk dibahas. Pada internet seringkali ditemui berbagai situs web yang menggunakan bahasa asing antara lain bahasa Inggris, bahasa Jepang, bahasa Korea, bahasa China dan sebagainya. Beberapa situs web yang berasal dari negara Jepang masih menggunakan huruf-huruf Jepang yaitu hiragana, katakana dan Kanji sehingga banyak orang Indonesia yang tidak mengerti bahasa Jepang kesulitan untuk memahami situs web tersebut. Untuk itulah saat ini akan dibuat kamus kata berbasis web yang akan dapat menterjemahkan kata dari bahasa Jepang ke bahasa Indonesia atau bahasa Inggris maupun sebaliknya. Pada dasarnya, metode-metode untuk sistem pengenalan font dapat dikelompokkan menjadi 2, yaitu: ASCII code dan unicode. Dulu hanya melihat set karakter ASCII sebanyak 256 huruf atau glyph (8 bit), berkembang menjadi 16 bit dan terpecah-pecah dalam standar ISO, misalnya ISO8859-1 untuk set karakter Latin dan beberapa karakter negara Eropa. Kini kemajuan digital lebih tinggi lagi sehingga karakter cukup direpresentasikan dalam satu sistem, yaitu unicode. Dengan menggunakan unicode, maka tidak perlu dikonversi ke dalam set karakter tertentu karena unicode mewadahi semua set karakter di dunia, tentunya yang telah diajukan dan disetujui. Kelebihan-kelebihan inilah yang menyebabkan unicode banyak digunakan untuk pengenalan huruf dalam suatu program atau situs web. Ruang lingkup program kamus kata berbasis web yang dibuat adalah: Menggunakan HTML, PHP dan Java Script sebagai bahasa pemrograman. Menggunakan MySQL sebagai database. Situs web yang diuji coba adalah diakses melalui local host (127.0.0.1). Kosakata awal 250 kata. Program mempunyai fasilitas untuk menambahkan, menghapus dan mengubah kosakata baru. Huruf Jepang yang digunakan adalah hurufhuruf hiragana dan katakana, sedangkan huruf Kanji belum dimasukkan dalam program ini. Unicode [1] adalah suatu standar industri yang dirancang untuk memampukan teks dan simbol dari hampir semua sistem tulisan di dunia untuk ditampilkan dan dimanipulasi secara konsisten oleh komputer. Unicode mengandung suatu kumpulan karakter, suatu metodologi pengkodean dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi visual, deskripsi sifat karakter seperti huruf besar dan huruf kecil, suatu kumpulan data Program Kamus Kata … (A. Prijono, Y. B. Irawan) 127 referensi berkas komputer, serta aturan normalisasi, dekomposisi, pembandingan (collation), serta penggambaran (rendering). Unicode Consortium [1] merupakan suatu organisasi nirlaba yang mengkoordinasikan pengembangan unicode. Organisasi ini memiliki tujuan untuk dapat menggantikan skema pengkodean karakter yang ada dengan unicode dan skema Unicode Transformation Format (UTF) nya, karena banyak skema yang ada sekarang memiliki keterbatasan ukuran dan lingkup dan ketidakserasian dengan lingkungan multibahasa. Kesuksesan unicode menyatukan set karakter telah membawa pada penggunaannya yang luas dan pemanfaatannya untuk diterapkan pada perangkat lunak komputer. Standar ini telah diterapkan pada teknologi-teknologi terkini, termasuk XML, bahasa pemrograman Java, dan sistem operasi modern. Berbagai macam perangkat lunak pun telah mendukung penulisan dan penampilan aksara tradisional di dunia yang dibakukan oleh unicode consortium pada standar UTF-8. Gambar berikut ini merupakan gambar screenshot perangkat lunak pengolah kata yang telah mendukung standar UTF-8 dari unicode. Tabel 1. CJK unified ideographs Block Name Chart Range Scripts CJK Unified Ideographs 4E00-62FF Han CJK Unified Ideographs 6300-77FF Han CJK Unified Ideographs 7800-8CFF Han CJK Unified Ideographs 8D00-9FFF Han CJK Unified Ideographs, 3400-4DBF Extension A Han CJK Unified Ideographs, 20000-215FF Han Extension B CJK Unified Ideographs, 21600-230FF Han Extension B CJK Unified Ideographs, 23100-245FF Han Extension B CJK Unified Ideographs, 24600-260FF Han Extension B CJK Unified Ideographs, 26100-275FF Han Extension B CJK Unified Ideographs, 27600-290FF Han Extension B CJK Unified Ideographs, 29100-2A6DF Han Extension B CJK Unified Ideographs, 2A700-2B73F Han Extension C CJK Unified Ideographs, 2B740-2B81F Han Extension D Gambar 1. Penggunaan unicode pada program pengolah kata Gambar 1 di atas merupakan contoh penggunaan standar unicode pada program pengolah kata yang didukung dengan menampilkan huruf-huruf hiragana dan katakana yang telah memiliki register unicode yang diwakili font jenis MS Gothic. Untuk huruf-huruf dari China, Jepang, dan Korea disebut CJK (Unified Ideographs [1]) di unicode dengan pembagian nama blok (block name) sebagaimana dijelaskan pada tabel 1 berikut berikut: 128 CJK Radicals Supplement 2E80-2EFF Han, Common Kangxi Radicals 2F00-2FDF Han Ideographic Description Characters 2FF0-2FFF Common CJK Symbols and Punctuation 3000-303F Han, Common, Inherited CJK Strokes 31C0-31EF Common Enclosed CJK Letters and 3200-32FF Months Katakana, Hangul, Common CJK Compatibility 3300-33FF Katakana, Common CJK Compatibility Ideographs F900-FAFF Han CJK Compatibility Forms FE30-FE4F CJK Compatibility Ideographs Supplement Common 2F800-2FA1F Han Huruf-huruf hiragana [2] Hiragana (ひらがな、 平 仮 名 ) adalah suatu cara penulisan bahasa Jepang dan mewakili sebutan sukukata. Pada masa silam, hiragana juga dikenali sebagai onna de ( 女 手 ) atau 'tulisan wanita' karena biasa digunakan oleh kaum wanita. Kaum lelaki pada masa itu menulis menggunakan tulisan Kanji dan Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135 katakana. hiragana mulai digunakan secara luas pada abad ke-10 Masehi. Berikut ini adalah tabel yang menampilkan daftar huruf-huruf hiragana beserta romanisasi hepburn-nya: bunyi (onomatope) dan kata-kata asli bahasa Jepang, hal ini hanya bersifat penegasan saja. Tabel 3 di bawah ini berisi huruf-huruf katakana standar: Tabel 3. Huruf katakana standar Tabel 2. Huruf hiragana standar Huruf Dasar Huruf Dasar Huruf Rangkap あ a い i う u え e お o (ya) (yu) (yo) か ka き ki く ku け ke こ ko きゃ kya きゅ kyu きょ kyo さ sa し shi す su せ se そ so しゃ sha しゅ shu しょ sho た ta ち chi つ tsu て te と to ちゃ cha ちゅ chu ちょ cho な na に ni ぬ nu ね ne の no にゃ nya にゅ nyu にょ nyo は ha ひ hi ふ fu へ he ほ ho ひゃ hya ひゅ hyu ひょ hyo ま ma み mi む mu め me も mo みゃ mya みゅ myu みょ myo りゃ rya りゅ ryu りょ ryo や ya ゆ yu ら ra り ri わ wa ゐ wi* る ru よ yo れ re ろ ro ゑ we* を wo Huruf Rangkap ア a イ i ウ u エ e オ o カ ka キ ki ク ku ケ ke コ ko キャ kya キュ kyu キョ kyo サ sa シ shi ス su セ se ソ so シャ sha シュ shu ショ sho タ ta チ chi ツ tsu テ te ト to チャ cha チュ chu チョ cho ナ na ニ ni ヌ nu ネ ne ノ no ニャ nya ニュ nyu ニョ nyo ハ ha ヒ hi フ fu ヘ he ホ ho ヒャ hya ヒュ hyu ヒョ hyo マ ma ミ mi ム mu メ me モ mo ミャ mya ミュ myu ミョ myo リャ rya リュ ryu リョ ryo ヤ ya ユ yu ラ ra リ ri ワ wa ヰ wi* ル ru ヨ yo レ re ロ ro ヱ we* ヲ wo ン n ん n が ga ぎ gi ぐ gu げ ge ご go ぎゃ gya ぎゅ gyu ぎょ gyo ざ za じ ji ず zu ぜ ze ぞ zo じゃ ja じゅ ju じょ jo だ da ぢ (ji) づ (zu) で de ど do ぢゃ (ja) ぢゅ (ju) ぢょ (jo) ば ba び bi ぶ bu べ be ぼ bo びゃ bya びゅ byu びょ byo ぱ pa ぴ pi ぷ pu ぺ pe ぽ po ぴゃ pya ぴゅ pyu ぴょ pyo ガ ga ギ gi グ gu ゲ ge ゴ go ギャ gya ギュ gyu ギョ gyo ザ za ジ ji ズ zu ゼ ze ゾ zo ジャ ja ジュ ju ジョ jo ダ da ヂ ji ヅ zu デ de ド do バ ba ビ bi ブ bu ベ be ボ bo ビャ bya ビュ byu ビョ byo パ pa ピ pi プ pu ペ pe ポ po ピャ pya ピュ pyu ピョ pyo Keterangan : * Huruf yang sudah tidak digunakan Keterangan : * Huruf yang sudah tidak digunakan Huruf-huruf katakana [3] Katakana adalah salah satu dari tiga cara penulisan bahasa Jepang. Katakana biasanya digunakan untuk menulis kata-kata yang berasal dari bahasa asing yang sudah diserap ke dalam bahasa Jepang (外来語 /gairaigo) selain itu juga digunakan untuk menuliskan kata-kata yang menirukan persamaan Sedangkan tabel 4 di bawah ini berisi hurufhuruf katakana tambahan dalam zaman modern. Huruf-huruf ini biasanya digunakan untuk merepresentasikan kata-kata dari bahasa asing. Program Kamus Kata … (A. Prijono, Y. B. Irawan) 129 Tabel 4. Daftar huruf katakana tambahan Huruf Rangkap イェ ye ウィ wi ヴァ va ヴィ vi ヴ vu ウェ we ウォ wo ヴェ ve ヴォ vo シェ she ジェ je チェ che ティ ti トゥ tu MySQL didukung oleh hampir semua program aplikasi baik yang open source seperti PHP maupun yang tidak open source yang ada pada platform windows seperti Visual Basic, Delphi dan lainnya. 2. METODE Pada diagram blok sistem (gambar 2) terlihat bahwa interpreter PHP dalam mengeksekusi kode PHP berada pada sisi server (server side), sedangkan tanpa adanya interpreter PHP, maka semua script dan aplikasi PHP yang dibuat tidak dapat dijalankan. Proses eksekusi kode PHP yang dilakukan oleh apache web server dan interpreter secara diagram dapat digambarkan pada gambar 2 di bawah ini: .PHP Doc テュ tyu ディ di ドゥ du Client (Web Browsing) デュ dyu ツァ tsa ツィ tsi ツェ tse ツォ tso ファ fa フィ fi フェ fe フォ fo フュ fyu PHP [4,6] PHP merupakan kependekan dari Hypertext Preprocesor. Ini merupakan bahasa pemrograman yang hanya dapat berjalan pada server dan hasilnya dapat ditampilkan pada Client. PHP merupakan bahasa standar yang digunakan dalam pemrograman website, PHP adalah bahasa pemrograman yang berbentuk script yang diletakkan di dalam server web. MySQL [5,6] MySQL (My Structured Query Language) adalah sebuah program pembuat dan pengelola database atau yang sering disebut DBMS (DataBase Management System), sifat dari DBMS ini adalah Open Source. Selain itu MySQL juga merupakan program pengakses database yang bersifat jaringan, sehingga dapat digunakan untuk aplikasi multi user. Kelebihan lain dari MySQL adalah menggunakan bahasa query standar SQL (Structured Query Language). 130 Web Server (Apache) PHP Engine HTML Format Database (My SQL) Gambar 2. Diagram blok sistem Pada gambar 2 terdapat proses yang menggunakan java script, yang tidak perlu melalui web server yaitu untuk proses pengiriman data dan dapat langsung melalui komputer client. Pada gambar 2, juga terdapat database (MySQL) untuk penyimpanan data, penghapusan ataupun pengubahan data melalui PHP engine. 3. DISKUSI Program ini terbagi menjadi tiga bagian blok flowchart. Menu utama yang dapat memanggil subprogram pencarian kata (searching), subprogram menambah data, serta subprogram ubah dan hapus data. Pencarian kata (searching) adalah proses pencarian kata berdasarkan bahasa Indonesia-Inggris-Jepang. Menambah data dan ubah dan hapus data adalah proses penambahan, penghapusan dan pengubahan data pada database yang penyimpanan huruf Jepangnya berdasarkan kode unicode. Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135 Gambar 3. Flowchart menu utama dan searching Gambar 4. Flowchart menambah data Program Kamus Kata … (A. Prijono, Y. B. Irawan) 131 Gambar 5. Flowchart ubah dan hapus data 4. HASIL Pada bab ini akan dijelaskan hasil implementasi dari program kamus kata Jepang- Indonesia-Inggris dan juga hasil evaluasi serta kesimpulan. Gambar 6. Tampilan form menu utama 132 Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135 Gambar 6 merupakan tampilan form menu utama. Tampilan ini adalah tampilan awal atau menu awal ketika user menjalankan program kamus kata Jepang-Indonesia-Inggris. User dapat memilih menu mana yang akan digunakan. Gambar 7 merupakan tampilan form kamus hiragana-Indonesia. Tampilan ini adalah tampilan kamus bahasa Jepang (hiragana)-Indonesia. User harus memasukkan huruf hiragana yang ingin dicari dengan menggunakan virtual keyboard dan kemudian akan ditampilkan artinya dalam bahasa Indonesia. Tabel 6 berikut adalah komponenkomponen yang digunakan untuk membuat form ini. Gambar 7. Tampilan form kamus hiragana-Indonesia Gambar 8. Tampilan form menambah data Program Kamus Kata … (A. Prijono, Y. B. Irawan) 133 Gambar 8 merupakan tampilan form menambah data. Tampilan ini adalah tampilan untuk menambahkan data pada program kamus kata Jepang-Indonesia-Inggris. Password: Kolom ini digunakan untuk menyimpan data password dari setiap username. Tabel 9. Tabel Kamus Tabel 8. Tabel password Field id_nama Type Int (4) Null Not null nama Varchar Not (50) null password Varchar Not (50) null Key Primary Key Extra Auto_incre ment Database Di atas adalah tabel yang memperlihatkan field, tipe dan ukuran yang dipergunakan pada pembuatan tabel dalam database. Dalam database kamus kata kata ini terdapat dua tabel yakni tabel 8 (tabel password) dan tabel 9 (tabel kamus). Dari tabel password di atas, dapat dijelaskan bagian-bagiannya sebagai berikut: Id_nama: Kolom ini digunakan untuk menyimpan nomor alamat dari baris data nama dan password. Nama: Kolom ini digunakan untuk menyimpan data nama user yang mempunyai akses terhadap website kamus ini. Field Type id_bahasa Int (4) Jepang Varchar (50) Baca Varchar (50) Indonesia Varchar (50) Field Type Inggris Varchar (50) Null Not null Not null Not null Not null Null Not null Key Extra Primary Auto_increment Key Key Dari tabel kamus di atas, dapat dijelaskan bagianbagiannya sebagai berikut: Id_bahasa: Kolom ini digunakan untuk menyimpan nomor alamat dari baris data bahasa Jepang, Indonesia, Inggris dan cara baca. Jepang: Kolom ini digunakan untuk menyimpan data huruf Jepang. Baca: Kolom ini digunakan untuk menyimpan data cara membaca huruf Jepang. Indonesia: Kolom ini digunakan untuk menyimpan data kata dalam bahasa Indonesia. Inggris: Kolom ini digunakan untuk menyimpan data kata dalam bahasa Inggris Gambar 9. Tampilan tabel password di MySQL 134 Extra Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135 Gambar 10. Tampilan tabel kamus di MySQL Kesimpulan Program kamus kata JepangIndonesia-Inggris berbasis web dengan memanfaatkan standar unicode yaitu standard unicode huruf Jepang berhasil dibuat dan diuji coba melalui local host (127.0.0.1). Penelitian ini bukan untuk mengungguli program kamus lain karena kosakata awal hanya sebanyak 250 kata. Penelitian ini hanya untuk mencoba penggunaan unicode khususnya huruf Jepang pada database dan kemudian dibuat suatu contoh program kamus kata berbasis web. Berdasarkan hal tersebut maka dapat diambil beberapa kesimpulan berdasarkan uji coba program yang telah dilakukan, yaitu : Program ini telah berhasil melakukan penyimpanan data dalam huruf Jepang dengan menggunakan unicode. Program kamus kata berbasis web ini telah berhasil menggunakan unicode huruf Jepang dalam menampilkan huruf Jepang hiragana dan katakana. Pada kamus Indonesia-Jepang dan InggrisJepang, pencarian kata untuk jenis huruf besar dan huruf kecil tidak berpengaruh terhadap pencarian kata yang ada di database. Untuk penelitian selanjutnya (future research), dapat ditingkatkan kemampuan program untuk menterjemahkan kalimat. 5. DAFTAR PUSTAKA [1] The Unicode Consortium, Unicode Standard, Version 5.0, 2006. [2] Anonim, Membaca Aksara Jepang Hiragana dan Katakana, Edisi Pertama, Gakushudo, Jakarta, 1998. [3] S.A. Mangunsuwito, Kamus Umum JepangIndonesia Indonesia-Jepang, Edisi Pertama, Yrama Widya, Bandung, 2001. [4] Stig Sæther Bakken, PHP Manual, 2000. [5] Maria, MySQL 5.1 with Maria Reference Manual, 2009. [6] B. Nugroho, Latihan Membuat Aplikasi Web PHP dan MySQL dengan Dreamweaver MX (6, 7, 2004) dan 8, Edisi Pertama, Gava Media, Yogyakarta, 2008. Program Kamus Kata … (A. Prijono, Y. B. Irawan) 135