simulasi penentuan posisi sensor mitigasi curah hujan untuk

advertisement
PROGRAM KAMUS KATA JEPANG-INDONESIA-INGGRIS BERBASIS
WEB DENGAN MEMANFAATKAN STANDAR UNICODE
Agus Prijono1, Yohannes Budianto Irawan2
Jurusan Teknik Elektro
Universitas Kristen Maranatha
Jl. Prof.Drg.Suria Sumantri MPH No. 65, Bandung
Telp.: +62370-634338, e-mail: [email protected], [email protected]
Abstract
Japanese language is one of the languages
which enthused by many Indonesians especially
young people. To study Japanese, we must pay
attention to the three type letter owned by the
language, namely hiragana, katakana, and kanji.
This paper proposes a web-based JapaneseIndonesian-English word dictionary to translate
word in Indonesian to Japanese, English to
Japanese, Japanese to Indonesian, and Japanese
to English. The proposed dictionary accepts
Japanese words in hiragana and katakana only.
This web-based dictionary has virtual keyboard
to input word in hiragana and katakana. In
addition, an administrator can update and delete
data in the dictionary. Unicode is chosen as a
storage format since it is a computing industry
standard
for
the
consistent
encoding,
representation and handling of text expressed in
most of the world's writing systems. The resulting
web-based Japanese-Indonesia-English word
dictionary is presented in this paper.
Keywords: word dictionary, unicode, hiragana,
katakana.
1. PENDAHULUAN
Pada era informasi ini internet menjadi salah
satu media informasi yang hangat untuk dibahas.
Pada internet seringkali ditemui berbagai situs
web yang menggunakan bahasa asing antara lain
bahasa Inggris, bahasa Jepang, bahasa Korea,
bahasa China dan sebagainya. Beberapa situs web
yang berasal dari negara Jepang masih
menggunakan huruf-huruf Jepang yaitu hiragana,
katakana dan Kanji sehingga banyak orang
Indonesia yang tidak mengerti bahasa Jepang
kesulitan untuk memahami situs web tersebut.
Untuk itulah saat ini akan dibuat kamus kata
berbasis web yang akan dapat menterjemahkan
kata dari bahasa Jepang ke bahasa Indonesia atau
bahasa Inggris maupun sebaliknya.
Pada dasarnya, metode-metode untuk sistem
pengenalan font dapat dikelompokkan menjadi 2,
yaitu: ASCII code dan unicode. Dulu hanya
melihat set karakter ASCII sebanyak 256 huruf
atau glyph (8 bit), berkembang menjadi 16 bit dan
terpecah-pecah dalam standar ISO, misalnya ISO8859-1 untuk set karakter Latin dan beberapa
karakter negara Eropa.
Kini kemajuan digital lebih tinggi lagi
sehingga karakter cukup direpresentasikan dalam
satu sistem, yaitu unicode. Dengan menggunakan
unicode, maka tidak perlu dikonversi ke dalam set
karakter tertentu karena unicode mewadahi semua
set karakter di dunia, tentunya yang telah
diajukan dan disetujui. Kelebihan-kelebihan
inilah yang menyebabkan unicode banyak
digunakan untuk pengenalan huruf dalam suatu
program atau situs web.
Ruang lingkup program kamus kata berbasis
web yang dibuat adalah:
Menggunakan HTML, PHP dan Java Script
sebagai bahasa pemrograman.
Menggunakan MySQL sebagai database.
Situs web yang diuji coba adalah diakses
melalui local host (127.0.0.1).
Kosakata awal 250 kata.
Program
mempunyai
fasilitas
untuk
menambahkan, menghapus dan mengubah
kosakata baru.
Huruf Jepang yang digunakan adalah hurufhuruf hiragana dan katakana, sedangkan
huruf Kanji belum dimasukkan dalam
program ini.
Unicode [1] adalah suatu standar industri
yang dirancang untuk memampukan teks dan
simbol dari hampir semua sistem tulisan di dunia
untuk ditampilkan dan dimanipulasi secara
konsisten oleh komputer. Unicode mengandung
suatu kumpulan karakter, suatu metodologi
pengkodean dan kumpulan standar penyandian
karakter, suatu kumpulan bagan kode untuk
referensi visual, deskripsi sifat karakter seperti
huruf besar dan huruf kecil, suatu kumpulan data
Program Kamus Kata … (A. Prijono, Y. B. Irawan)
127
referensi berkas komputer, serta aturan
normalisasi,
dekomposisi,
pembandingan
(collation), serta penggambaran (rendering).
Unicode Consortium [1] merupakan suatu
organisasi nirlaba yang mengkoordinasikan
pengembangan unicode. Organisasi ini memiliki
tujuan untuk dapat menggantikan skema
pengkodean karakter yang ada dengan unicode
dan skema Unicode Transformation Format
(UTF) nya, karena banyak skema yang ada
sekarang memiliki keterbatasan ukuran dan
lingkup dan ketidakserasian dengan lingkungan
multibahasa. Kesuksesan unicode menyatukan set
karakter telah membawa pada penggunaannya
yang luas dan pemanfaatannya untuk diterapkan
pada perangkat lunak komputer. Standar ini telah
diterapkan pada teknologi-teknologi terkini,
termasuk XML, bahasa pemrograman Java, dan
sistem operasi modern. Berbagai macam
perangkat lunak pun telah mendukung penulisan
dan penampilan aksara tradisional di dunia yang
dibakukan oleh unicode consortium pada standar
UTF-8. Gambar berikut ini merupakan gambar
screenshot perangkat lunak pengolah kata yang
telah mendukung standar UTF-8 dari unicode.
Tabel 1. CJK unified ideographs
Block Name
Chart Range
Scripts
CJK Unified Ideographs
4E00-62FF
Han
CJK Unified Ideographs
6300-77FF
Han
CJK Unified Ideographs
7800-8CFF
Han
CJK Unified Ideographs
8D00-9FFF
Han
CJK Unified Ideographs, 3400-4DBF
Extension A
Han
CJK Unified Ideographs, 20000-215FF Han
Extension B
CJK Unified Ideographs, 21600-230FF Han
Extension B
CJK Unified Ideographs, 23100-245FF Han
Extension B
CJK Unified Ideographs, 24600-260FF Han
Extension B
CJK Unified Ideographs, 26100-275FF Han
Extension B
CJK Unified Ideographs, 27600-290FF Han
Extension B
CJK Unified Ideographs, 29100-2A6DF Han
Extension B
CJK Unified Ideographs, 2A700-2B73F Han
Extension C
CJK Unified Ideographs, 2B740-2B81F Han
Extension D
Gambar 1. Penggunaan unicode pada program
pengolah kata
Gambar 1 di atas merupakan contoh
penggunaan standar unicode pada program
pengolah
kata
yang
didukung
dengan
menampilkan huruf-huruf hiragana dan katakana
yang telah memiliki register unicode yang
diwakili font jenis MS Gothic.
Untuk huruf-huruf dari China, Jepang, dan
Korea disebut CJK (Unified Ideographs [1]) di
unicode dengan pembagian nama blok (block
name) sebagaimana dijelaskan pada tabel 1
berikut berikut:
128
CJK Radicals Supplement 2E80-2EFF
Han, Common
Kangxi Radicals
2F00-2FDF
Han
Ideographic Description
Characters
2FF0-2FFF
Common
CJK Symbols and
Punctuation
3000-303F
Han, Common,
Inherited
CJK Strokes
31C0-31EF
Common
Enclosed CJK Letters and 3200-32FF
Months
Katakana, Hangul,
Common
CJK Compatibility
3300-33FF
Katakana,
Common
CJK Compatibility
Ideographs
F900-FAFF
Han
CJK Compatibility Forms FE30-FE4F
CJK Compatibility
Ideographs Supplement
Common
2F800-2FA1F Han
Huruf-huruf hiragana [2] Hiragana (ひらがな、
平 仮 名 ) adalah suatu cara penulisan bahasa
Jepang dan mewakili sebutan sukukata. Pada
masa silam, hiragana juga dikenali sebagai onna
de ( 女 手 ) atau 'tulisan wanita' karena biasa
digunakan oleh kaum wanita. Kaum lelaki pada
masa itu menulis menggunakan tulisan Kanji dan
Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135
katakana. hiragana mulai digunakan secara luas
pada abad ke-10 Masehi.
Berikut ini adalah tabel yang menampilkan
daftar huruf-huruf hiragana beserta romanisasi
hepburn-nya:
bunyi (onomatope) dan kata-kata asli bahasa
Jepang, hal ini hanya bersifat penegasan saja.
Tabel 3 di bawah ini berisi huruf-huruf
katakana standar:
Tabel 3. Huruf katakana standar
Tabel 2. Huruf hiragana standar
Huruf Dasar
Huruf Dasar
Huruf Rangkap
あ
a
い
i
う
u
え
e
お
o
(ya)
(yu)
(yo)
か
ka
き
ki
く
ku
け
ke
こ
ko
きゃ
kya
きゅ
kyu
きょ
kyo
さ
sa
し
shi
す
su
せ
se
そ
so
しゃ
sha
しゅ
shu
しょ
sho
た
ta
ち
chi
つ
tsu
て
te
と
to
ちゃ
cha
ちゅ
chu
ちょ
cho
な
na
に
ni
ぬ
nu
ね
ne
の
no
にゃ
nya
にゅ
nyu
にょ
nyo
は
ha
ひ
hi
ふ
fu
へ
he
ほ
ho
ひゃ
hya
ひゅ
hyu
ひょ
hyo
ま
ma
み
mi
む
mu
め
me
も
mo
みゃ
mya
みゅ
myu
みょ
myo
りゃ
rya
りゅ
ryu
りょ
ryo
や
ya
ゆ
yu
ら
ra
り
ri
わ
wa
ゐ
wi*
る
ru
よ
yo
れ
re
ろ
ro
ゑ
we*
を
wo
Huruf Rangkap
ア
a
イ
i
ウ
u
エ
e
オ
o
カ
ka
キ
ki
ク
ku
ケ
ke
コ
ko
キャ
kya
キュ
kyu
キョ
kyo
サ
sa
シ
shi
ス
su
セ
se
ソ
so
シャ
sha
シュ
shu
ショ
sho
タ
ta
チ
chi
ツ
tsu
テ
te
ト
to
チャ
cha
チュ
chu
チョ
cho
ナ
na
ニ
ni
ヌ
nu
ネ
ne
ノ
no
ニャ
nya
ニュ
nyu
ニョ
nyo
ハ
ha
ヒ
hi
フ
fu
ヘ
he
ホ
ho
ヒャ
hya
ヒュ
hyu
ヒョ
hyo
マ
ma
ミ
mi
ム
mu
メ
me
モ
mo
ミャ
mya
ミュ
myu
ミョ
myo
リャ
rya
リュ
ryu
リョ
ryo
ヤ
ya
ユ
yu
ラ
ra
リ
ri
ワ
wa
ヰ
wi*
ル
ru
ヨ
yo
レ
re
ロ
ro
ヱ
we*
ヲ
wo
ン
n
ん
n
が
ga
ぎ
gi
ぐ
gu
げ
ge
ご
go
ぎゃ
gya
ぎゅ
gyu
ぎょ
gyo
ざ
za
じ
ji
ず
zu
ぜ
ze
ぞ
zo
じゃ
ja
じゅ
ju
じょ
jo
だ
da
ぢ
(ji)
づ
(zu)
で
de
ど
do
ぢゃ
(ja)
ぢゅ
(ju)
ぢょ
(jo)
ば
ba
び
bi
ぶ
bu
べ
be
ぼ
bo
びゃ
bya
びゅ
byu
びょ
byo
ぱ
pa
ぴ
pi
ぷ
pu
ぺ
pe
ぽ
po
ぴゃ
pya
ぴゅ
pyu
ぴょ
pyo
ガ
ga
ギ
gi
グ
gu
ゲ
ge
ゴ
go
ギャ
gya
ギュ
gyu
ギョ
gyo
ザ
za
ジ
ji
ズ
zu
ゼ
ze
ゾ
zo
ジャ
ja
ジュ
ju
ジョ
jo
ダ
da
ヂ
ji
ヅ
zu
デ
de
ド
do
バ
ba
ビ
bi
ブ
bu
ベ
be
ボ
bo
ビャ
bya
ビュ
byu
ビョ
byo
パ
pa
ピ
pi
プ
pu
ペ
pe
ポ
po
ピャ
pya
ピュ
pyu
ピョ
pyo
Keterangan : * Huruf yang sudah tidak digunakan
Keterangan : * Huruf yang sudah tidak digunakan
Huruf-huruf katakana [3] Katakana adalah
salah satu dari tiga cara penulisan bahasa Jepang.
Katakana biasanya digunakan untuk menulis
kata-kata yang berasal dari bahasa asing yang
sudah diserap ke dalam bahasa Jepang (外来語
/gairaigo) selain itu juga digunakan untuk
menuliskan kata-kata yang menirukan persamaan
Sedangkan tabel 4 di bawah ini berisi hurufhuruf katakana tambahan dalam zaman modern.
Huruf-huruf ini biasanya digunakan untuk
merepresentasikan kata-kata dari bahasa asing.
Program Kamus Kata … (A. Prijono, Y. B. Irawan)
129
Tabel 4. Daftar huruf katakana tambahan
Huruf Rangkap
イェ
ye
ウィ
wi
ヴァ
va
ヴィ
vi
ヴ
vu
ウェ
we
ウォ
wo
ヴェ
ve
ヴォ
vo
シェ
she
ジェ
je
チェ
che
ティ
ti
トゥ
tu
MySQL didukung oleh hampir semua
program aplikasi baik yang open source seperti
PHP maupun yang tidak open source yang ada
pada platform windows seperti Visual Basic,
Delphi dan lainnya.
2. METODE
Pada diagram blok sistem (gambar 2) terlihat
bahwa interpreter PHP dalam mengeksekusi kode
PHP berada pada sisi server (server side),
sedangkan tanpa adanya interpreter PHP, maka
semua script dan aplikasi PHP yang dibuat tidak
dapat dijalankan. Proses eksekusi kode PHP yang
dilakukan oleh apache web server dan interpreter
secara diagram dapat digambarkan pada gambar 2
di bawah ini:
.PHP
Doc
テュ
tyu
ディ
di
ドゥ
du
Client
(Web Browsing)
デュ
dyu
ツァ
tsa
ツィ
tsi
ツェ
tse
ツォ
tso
ファ
fa
フィ
fi
フェ
fe
フォ
fo
フュ
fyu
PHP [4,6] PHP merupakan kependekan dari
Hypertext Preprocesor. Ini merupakan bahasa
pemrograman yang hanya dapat berjalan pada
server dan hasilnya dapat ditampilkan pada Client.
PHP merupakan bahasa standar yang digunakan
dalam pemrograman website, PHP adalah bahasa
pemrograman yang berbentuk script yang
diletakkan di dalam server web.
MySQL [5,6] MySQL (My Structured Query
Language) adalah sebuah program pembuat dan
pengelola database atau yang sering disebut
DBMS (DataBase Management System), sifat
dari DBMS ini adalah Open Source. Selain itu
MySQL juga merupakan program pengakses
database yang bersifat jaringan, sehingga dapat
digunakan untuk aplikasi multi user. Kelebihan
lain dari MySQL adalah menggunakan bahasa
query standar SQL (Structured Query Language).
130
Web
Server
(Apache)
PHP
Engine
HTML
Format
Database
(My SQL)
Gambar 2. Diagram blok sistem
Pada gambar 2 terdapat proses yang
menggunakan java script, yang tidak perlu
melalui web server yaitu untuk proses pengiriman
data dan dapat langsung melalui komputer client.
Pada gambar 2, juga terdapat database (MySQL)
untuk penyimpanan data, penghapusan ataupun
pengubahan data melalui PHP engine.
3. DISKUSI
Program ini terbagi menjadi tiga bagian blok
flowchart. Menu utama yang dapat memanggil
subprogram
pencarian
kata
(searching),
subprogram menambah data, serta subprogram
ubah dan hapus data. Pencarian kata (searching)
adalah proses pencarian kata berdasarkan bahasa
Indonesia-Inggris-Jepang. Menambah data dan
ubah dan hapus data adalah proses penambahan,
penghapusan dan pengubahan data pada database
yang penyimpanan huruf Jepangnya berdasarkan
kode unicode.
Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135
Gambar 3. Flowchart menu utama dan searching
Gambar 4. Flowchart menambah data
Program Kamus Kata … (A. Prijono, Y. B. Irawan)
131
Gambar 5. Flowchart ubah dan hapus data
4. HASIL
Pada bab ini akan dijelaskan hasil
implementasi dari program kamus kata Jepang-
Indonesia-Inggris dan juga hasil evaluasi serta
kesimpulan.
Gambar 6. Tampilan form menu utama
132
Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135
Gambar 6 merupakan tampilan form menu
utama. Tampilan ini adalah tampilan awal atau
menu awal ketika user menjalankan program
kamus kata Jepang-Indonesia-Inggris. User dapat
memilih menu mana yang akan digunakan.
Gambar 7 merupakan tampilan form kamus
hiragana-Indonesia. Tampilan ini adalah tampilan
kamus bahasa Jepang (hiragana)-Indonesia. User
harus memasukkan huruf hiragana yang ingin
dicari dengan menggunakan virtual keyboard dan
kemudian akan ditampilkan artinya dalam bahasa
Indonesia. Tabel 6 berikut adalah komponenkomponen yang digunakan untuk membuat form
ini.
Gambar 7. Tampilan form kamus hiragana-Indonesia
Gambar 8. Tampilan form menambah data
Program Kamus Kata … (A. Prijono, Y. B. Irawan)
133
Gambar 8 merupakan tampilan form
menambah data. Tampilan ini adalah tampilan
untuk menambahkan data pada program kamus
kata Jepang-Indonesia-Inggris.
Password: Kolom ini digunakan untuk
menyimpan data password dari setiap
username.
Tabel 9. Tabel Kamus
Tabel 8. Tabel password
Field
id_nama
Type
Int (4)
Null
Not
null
nama
Varchar Not
(50)
null
password Varchar Not
(50)
null
Key
Primary
Key
Extra
Auto_incre
ment
Database Di atas adalah tabel yang
memperlihatkan field, tipe dan ukuran yang
dipergunakan pada pembuatan tabel dalam
database. Dalam database kamus kata kata ini
terdapat dua tabel yakni tabel 8 (tabel password)
dan tabel 9 (tabel kamus).
Dari tabel password di atas, dapat dijelaskan
bagian-bagiannya sebagai berikut:
Id_nama: Kolom ini digunakan untuk
menyimpan nomor alamat dari baris data
nama dan password.
Nama: Kolom ini digunakan untuk
menyimpan
data
nama
user
yang
mempunyai akses terhadap website kamus ini.
Field
Type
id_bahasa Int (4)
Jepang
Varchar
(50)
Baca
Varchar
(50)
Indonesia Varchar
(50)
Field
Type
Inggris
Varchar
(50)
Null
Not
null
Not
null
Not
null
Not
null
Null
Not
null
Key
Extra
Primary Auto_increment
Key
Key
Dari tabel kamus di atas, dapat dijelaskan bagianbagiannya sebagai berikut:
Id_bahasa: Kolom ini digunakan untuk
menyimpan nomor alamat dari baris data
bahasa Jepang, Indonesia, Inggris dan cara
baca.
Jepang: Kolom ini digunakan untuk
menyimpan data huruf Jepang.
Baca:
Kolom ini digunakan untuk
menyimpan data cara membaca huruf Jepang.
Indonesia: Kolom ini digunakan untuk
menyimpan data kata dalam bahasa
Indonesia.
Inggris: Kolom ini digunakan untuk
menyimpan data kata dalam bahasa Inggris
Gambar 9. Tampilan tabel password di MySQL
134
Extra
Jurnal Ilmiah Ilmu Komputer, Vol. 7 No. 2 Maret 2011: 127-135
Gambar 10. Tampilan tabel kamus di MySQL
Kesimpulan Program kamus kata JepangIndonesia-Inggris
berbasis
web
dengan
memanfaatkan standar unicode yaitu standard
unicode huruf Jepang berhasil dibuat dan diuji
coba melalui local host (127.0.0.1). Penelitian ini
bukan untuk mengungguli program kamus lain
karena kosakata awal hanya sebanyak 250 kata.
Penelitian ini hanya untuk mencoba penggunaan
unicode khususnya huruf Jepang pada database
dan kemudian dibuat suatu contoh program
kamus kata berbasis web.
Berdasarkan hal tersebut maka dapat diambil
beberapa kesimpulan berdasarkan uji coba
program yang telah dilakukan, yaitu :
Program ini telah berhasil melakukan
penyimpanan data dalam huruf Jepang
dengan menggunakan unicode.
Program kamus kata berbasis web ini telah
berhasil menggunakan unicode huruf Jepang
dalam menampilkan huruf Jepang hiragana
dan katakana.
Pada kamus Indonesia-Jepang dan InggrisJepang, pencarian kata untuk jenis huruf besar
dan huruf kecil tidak berpengaruh terhadap
pencarian kata yang ada di database.
Untuk
penelitian
selanjutnya
(future
research), dapat ditingkatkan kemampuan
program untuk menterjemahkan kalimat.
5. DAFTAR PUSTAKA
[1] The Unicode Consortium, Unicode Standard,
Version 5.0, 2006.
[2] Anonim, Membaca Aksara Jepang Hiragana
dan Katakana, Edisi Pertama, Gakushudo,
Jakarta, 1998.
[3] S.A. Mangunsuwito, Kamus Umum JepangIndonesia Indonesia-Jepang, Edisi Pertama,
Yrama Widya, Bandung, 2001.
[4] Stig Sæther Bakken, PHP Manual, 2000.
[5] Maria, MySQL 5.1 with Maria Reference
Manual, 2009.
[6] B. Nugroho, Latihan Membuat Aplikasi Web
PHP dan MySQL dengan Dreamweaver MX
(6, 7, 2004) dan 8, Edisi Pertama, Gava
Media, Yogyakarta, 2008.
Program Kamus Kata … (A. Prijono, Y. B. Irawan)
135
Download