sistem penerjemah mobile berbasis citra digital

advertisement
SISTEM PENERJEMAH MOBILE BERBASIS CITRA DIGITAL DENGAN
TEKNOLOGI WEB SERVICE
MOBILE TRANSLATED BASED IMAGE PROSSECING WITH WEB
SERVICE TEKNOLOGY
1
1
Baso Habibi, 2Muhammad Tola, 2Amil Ahmad Ilham
Program Studi Teknik Informatika, Fakultas Teknik Informatika, Sekolah Tinggi Manajemen
Informatika dan Komputer Handayani Makassar
3
Jurusan Elektro, Prodi Informatika, Fakultas Teknik,
Universitas Hasanuddin,
Alamat Koresponden :
Baso Habibi
Fakultas Teknik Informatika Program Studi Teknik Informatika
Sekolah Tinggi Manajemen Informatika dan Komputer Handayani Makassar
Makassar, 9022
Tamalate 3 No. 136
081355440844
Email : [email protected]
ABSTRAK
Aplikasi penerjemah saat ini yang umumnya digunakan adalah aplikasi berbasis text seperti
googletranslate.apk, kamus.apk, English-indonesi.apk. Kekurangan aplikasi ini adalah teks yang akan
diterjemahkan harus di input secara manual. Tujuan penelitian ini adalah membuat suatu sistem penerjemah
berbasis citra atau gambar. Text yang akan diterjemahkan tidak lagi di input secara manual melainkan di
capture dengan kamera mobile. Text yang telah dicapture kemudian diproses dengan menggunakan pengolahan
citra dengan metode OCR. Tahap-tahap OCR dimulai dari proses binerisasi, normalisasi, segmentasi dan
template maching. Hasil pengenalan text kemudian dikirim ke tools penerjemah untuk melakukan translate text
yang diinginkan. Hasil penelitian yang didapatkan dengan pengujian menggunakan smartphone Samsung tab
7+ adalah sistem ini dapat menerjemahkan text dengan input gambar melalui kamera. Sistem ini dapat
mengenali huruf Katakana dan Hiragana. Pengenalan teks mencapai 100% dengan ukuran font mulai dari font
10 dengan jarak 2 cm. Penggenalan teks terhadap data gambar dengan warna teks dan background yang
beragam sangat ditentukan oleh kualitas kamera smarphone yang digunakan. Sistem ini juga dapat mengenali
berbagai karakter teks seperti : karakter Jepang, karakter huruf, karakter korea, dan karakter cina.. Kesimpulan
penelitian ini adalah sistem ini dapat menerjemahkan teks dengan hanya mencapture dengan camera
smartphone
Kata Kunci: Penerjemah, OCR, Smartphone
ABSTRACT
Translator app now commonly used is the text-based applications such as googletranslate.apk,
kamus.apk, English-indonesi.apk. This application is a shortage of text to be translated must be input manually.
The purpose of this research is to create a system image or image-based translator. Translated text will no
longer be manually input capture with a camera but rather in mobile. Text that has been captured and then
processed using image processing with OCR methods. OCR beginning stages of the process binerisation,
normalization, segmentation and template matching. Text recognition results are then sent to the translator tools
to translate the desired text. The results obtained by testing using a Smartphone is the Samsung tab 7 + This
system can translate text to input images through the camera. This system can recognize Katakana and
Hiragana letters. Text recognition reached 100% with font size 10 fonts from a distance of 2 cm. Introduction
text for image data with text and background colors vary greatly determined by the quality of the camera used
Smartphone. The system can also recognize text characters such as Japanese characters, characters, characters
Korean, and Chinese characters. The conclusion of this study is that this system can translate the text with only
captured with Smartphone camera
Keywords: Translate, OCR, Smartphone
PENDAHULUAN
Sistem penerjemah saat ini umum aplikasi stand alone dan aplikasi berbasis web.
Aplikasi stand alone seperti: Japanese-IndonesianDict.apk, Kamus Japan-Indonesia.jar,
Inggris-Indonesi.exe, kamus.exe. Aplikasi berbasis web seperti: googletranslate.com,
kamusjapan.com, kamus.com, kamus.javakedaton.com. Pengguna aplikasi ini harus
menginput manual kata yang akan diterjemahkan. Hal ini menjadi permasalahan bagi
pengguna jika perangkat atau aplikasi yang digunakan di lengkapi dengan keyboard dengan
karakter Jepang atau keyboard virtual. Begitu pula aplikasi yang berbasis web, pengguna
terlebih dahulu harus mengatur keyboard virtual dengan karakter bahasa Jepang. Untuk
aplikasi penerjemah google translate adalah yang paling akurat dan terbaik secara online
(Liwan, 2011).
Dengan semakin berkembangnya teknologi mobile phone dan penggunanya, pada tahun
2002 saja tercatat sekitar 7,3 juta pengguna handphone dan 56% diantaranya adalah kelompok
anak muda di bawah umur 20 tahun (Komputer, 2012). Handphone atau smartphone ini
memiliki fungsi lebih selain sebagai alat komunikasi seperti dilengkapi dengan fitur
multimedia (musik dan video), kamera, browser, dll. Perangkat ini juga memungkinkan
running beberapa aplikasi yang dibutuhkan seperti: aplikasi chating, aplikasi googlemap,
aplikasi translate, aplikasi e-mail, dll. Terlebih lagi kebiasan yang senang mengambil
gambar/capture. Sehingga sistem diterjemahkan mobile berbasis citra digital sangat
membantu pengguna karena ketika ingin menerjemahkan kata, pengguna hanya mencapture
kata yang akan diterjemahkan.
Sistem ini sangat berpotensi digunakan oleh orang yang akan berpergian keluar negeri,
salah satunya misalnya ke Jepang baik untuk keperluan jalan-jalan, pekerjaan sampai kuliah
yang jumlah semakin bertambah setiap tahunnya. Umumnya warga Indonesia yang ke Jepang,
Saudi Arabia, Korea, Cina dan Negara lainnya tidak mengerti bahasa Jepang dan tulisan
tersebut sehingga akan sulit untuk berkomunikasi dengan penduduk lokal.
Tujuan penelitian ini adalah akan dibuat suatu aplikasi penerjemah berbasis smartphone
dimana kata yang akan diterjemahkan tidak lagi diinput secara manual melainkan dicapture
dan diproses dengan metode pengenalan citra digital, teknologi web service, dan api google.
BAHAN DAN METODE
Lokasi Penelitian
Penelitian ini dilakukan di Laboratorium Fakultas Teknik Jurusan Teknik Elektro.
Jenis Penelitian
Metode yang digunakan dalam penelitian ini adalah metode eksperimental yaitu dengan
melakukan perancangan dan pembuatan model sistem.
Rancangan Penelitian
Pada penelitian ini digunakan pendekatan metode studi literature (library research) dan
studi lapangan (field research) untuk perancangan sistem. Adapun tahapan penelitian
meliputi:
Pengumpulan Data dan Studi Literatur
Merupakan tahap mengumpulkan informasi dan data-data karakter teks. Proses ini lebih
banyak merupakan studi literatur yang mengacu pada referensi-referensi dalam negeri dan
luar negeri. Pengkajian mengarah pada pengumpulan informasi tentang karakteristik teks
yang selanjutnya berupaya mengaitkannya dengan studi data tentang teknologi yang tepat
untuk implementasi sistemnya. Tahap ini melakukan evaluasi terhadap kemungkinan
penerapan suatu teknologi dibanding teknologi lainnya.
Analisi Kebutuhan Sistem
Pada tahapan ini dilakukan estimasi terhadap kebutuhan sistem yaitu: input, output
sistem dan proses yang terjadi didalam sistem. Untuk melihat kesesuaian sistem yang akan
dirancang dengan sistem diterjemahkan mobile berbasis citra digital dengan teknologi web
servis.
Perancangan Sistem
Perancangan dilaksanakan mengacu pada kebutuhan-kebutuhan apa saja yang
diperlukan pada pernagkat lunak yang berkaitan dengan aplikasi translate, yang telah
didapatkan
dan
ditentukan
pada
tahap
analisis.
Perancangan
bertujuan
untuk
merepresentasikan kebutuhan ke dalam suatu model perangkat lunak yang akan digunakan
sebagai acuan pada proses pengkodean.
Implementasi Sistem
Tugas utama pada tahap ini adalah menerjemahkan perancangan yang telah dibuat
menjadi suatu perangkat lunak.
Pengujian dan Perbaikan
Pengujian dilakukan terhadap perangkat lunak yang telah selesai dibangun. Pengujian
difokuskan pada fungsi-fungsi yang terdapat pada perangkat lunak untuk memastikan fungsifungsi tersebut berjalan sesuai dengan yang dikehendaki
HASIL
Pengujian OCR berdasarkan ukuran gambar
Pengujian ini dilakukan untuk mengukur seberapa besar waktu yang dibutuhkan untuk
proses pengenalan OCR recognition secara offline dengan memberikan data gambar dengan
melakukan cropping atau tidak sebelum gambar dikirim.
Pengujian ini dilakukan dengan dengan menggunakan smarphone Samsung tab 7+
dengan provider 3. Dari hasil pengujian pada tabel 1 di dapatkan waktu yang di butuhkan
untuk proses recognition secara berdasarkan ukuran hasil cropping. Semakin kecil cropping
gambar semakin cepat waktu proses.
Pengujian OCR berdasarkan kemiringan teks
Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR
dengan memberikan data gambar dengan kemiringan gambar yang beragam.
Pengujian dilakukan dengan pengenalan kata dengan jarak 25 cm antara teks dengan
smarphone samsung tab 7+. Pengujian dilakukan dengan membuat teks dengan kemiringan
tertentu kemudian di capture dengan posisi camera 00. Dari hasil pengujian pada tabel 2 di
dapatkan akurasi pengenalan mencapai 100% jika sudut kemiringan pengambilan gambar
sebesar <800.
Sistem ini hanya dapat mengenali karakter jepang dengan kemiringan teks <900. Hal ini
di karenakan pada posisi 900 maka sistem mengenali dengan huruf berderet horisontal. Untuk
posisi kemiringan >900-<2700 maka sistem memutar teks ke posisi yagn paling mendekati
sumbu x yaitu 1800.
Pengujian OCR berdasarkan panjang teks
Pengujian ini dilakukan untuk mengukur seberapa besar waktu yang dibutuhkan untuk
proses pengenalan OCR secara offline dengan memberikan data gambar dengan melakukan
cropping atau tidak sebelum gambar dikirim.
Pengujian ini dilakukan dengan dengan menggunakan smarphone Samsung tab 7+. Dari
hasil pengujian pada tabel 3 di dapatkan waktu yang di butuhkan untuk proses OCR
berdasarkan ukuran hasil cropping. Semakin sedikit teks semakin cepat waktu proses.
Pengujian OCR berdasarkan warna
Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR
dengan memberikan data gambar dengan warna teks dan background yang beragam.
Pengujian dilakukan dengan pengenalan kata dengan jarak 10 cm antara teks dengan
smarphone samsung Tab 1 dan Tab 2. Dari hasil pengujian pada tabel 4 di dapatkan akurasi
pengenalan sangat tergantung dari kualitas kamera smartphone yang digunakan. Dari tabel 4
di dapatkan bakwa kualitas penggunaan kamera smartphone sangat menentukan akurasi OCR.
Dari uji coba penggunaan dua smarphone dengan resulusi camera yang sama tetepi TAB 1
memliki LED flash di dapatkan penggunaa smarphone TAB 1 lebih baik dalam akurasi OCR
yang di hasilkan.
Pengujian OCR berdasarkan jenis karakter
Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR
recognition dengan memberikan data gambar dengan ukuran font yang beragam.
Pengujian dilakukan dengan pengenalan kata dengan jarak 2 cm antara teks dengan
smarphone samsung tab 7+. Dari hasil pengujian pada tabel 5 di dapatkan bahwa aplikasi
dapat mengenali karakter teks yang berbeda. Sistem aplikasi tidak dapat mengenali karakter
Arab karena pada karaktek arab setiap huruf dalam 1 kalimat tersambung. Sehingga pada
proses Box Wrapper tidak dapat mengenali box per huruf melaikan per kata sehingga tidak di
dapat pada data template maching.
Pengujian Api translate
Pengujian ini dilakukan untuk mengukur hasil terjemahan menggunakan Api
microsoft translate dan Api goole translate dengan memberikan data teks berdasarkan pola
teks yang beragam. Pengujian dilakukan dengan translate kata dengan melihat hasil
terjemahan dengan Api microsoft translate dan Api goole translate.
PEMBAHASAN
Penelitian ini memperlihatkan suatu aplikasi penerjemah dimana teks yang akan di
terjemahkan tidak lagi di ketik secara manual melainkan dicapture dengan camera
smartphone. Aplikasi ini dapat mengenali karakter alphabet, karakter jepang, karakter cina,
karakter korea, dan sebagainya kecuali karakter arab. Akurasi pengenalan pada sistem ini
mencapai 100% dengan karakter yang dicapture dengan menggunakan font 10 dengan
kemiringan ±900. Hasil pengenalan karakter juga sangat ditentukan oleh kualitas dari camera
smartphone. Terjemahan teks pada sistem ini diproses oleh api google translate dan api
Microsoft translate.
Pada penelitian Optical Character Recognition menggunakan Algoritma Template
Matching Correlation (Suryo, 2012) memperlihatkan sebuah aplikasi Optical Character
Recognition menggunakan algoritma Template Matching Correlation. Algoritma Template
Matching Correlation cukup efektif untuk pengenalan karakter huruf cetak. Rata-rata tingkat
keberhasilan pengenalan yang dihasilkan sebesar 92,90%. Penelitian ini hanya sistem untuk
mengenali karakter alphabet.
Penggunaan tools translate pada penelitian Rancang Bangun Aplikasi Chatting
Translator Berbasiskan Java Menggunakan Application Programing Interface (Api) Google
Translate (Anggoro, 2012) memperlihatkan pada pembuatan aplikasi komputer yang dapat
digunakan oleh user sehingga dapat memahami chatting translator secara akurat dan lebih
mudah tanpa merasa bosan ataupun jenuh. Didalam penelitian ini terdapat beberapa hal yang
harus diperlukan dalam proses pengambilan kesimpulan yang dimasukkan berupa aplikasi
yang berkaitan dengan sistem aplikasi sistem chatting translator yang telah diuji coba dalam
bentuk program sehingga lebih mudah dalam mempelajarinya. Aplikasi chatting translator ini
masih sederhana didapat output yang berupa chatting translator yang akurat dan tetapi cukup
fleksibel karena didukung dengan Aplication Programing Interface. Hal ini juga selaras
dengan penelitian Implementasi Google Translate API pada Mobile Phone menggunakan
J2ME (Saputra, 2010) menyelesaikan masalah diatas dengan cara mengembangkan sebuah
aplikasi yang dapat memanfaatkan layanan web translator milik google secara langsung dari
telepon genggam. Hasil percobaan menunjukkan bahwa aplikasi ini layak untuk dipakai dan
mudah untuk digunakan. Selain itu, aplikasi ini lebih cepat dalam mengakses layanan google
daripada menggunakan browser bawaan yang ada pada telepon genggam.
Hal ini juga selaras dengan penelitian Pembuatan Aplikasi Server Inline Translator
Dengan Teknologi Web Service (Nuraini, 2012) yang menunjukkan suatu aplikasi
penerjemah bahasa yang diberi nama aplikasi Server Inline Translator bertujuan agar
pengguna internet di Indonesia lebih mudah memahami situs bahasa asing khususnya bahasa
inggris. Aplikasi ini dibuat dengan metode klasifikasi teks menggunakan Naive Bayesian
Classifier dan Potter Stemming Algorithm. Serta menerapkan teknologi REST web service
pada platform J2EE, JPA, XML dan Quartz. Di samping itu, kumpulan arti kata diperoleh dari
server kosakata yang telah tersedia pada Google Translate API.
Sistem penerjemah berbasis citra digital dengan teknologi web service yang dirancang
pada penelitian ini menghasilkan suatu user interface yang berisi beberapa halaman yang
dapat digunakan user untuk berinteraksi dengan sistem. Interaksi yang dilakukan user dengan
sistem adalah dengan penginputan data dan pengaturan aplikasi yang dibutuhkan untuk
menghasilkan informasi hasil terjemahan.
Sistem ini dirancang menggunakan bahasa pemrograman Java dipilih sebagai bahasa
pemrograman untuk merancang sistem ini agar nantinya sistem ini dapat digunakan di
berbagai macam smarphone.
Proses penelitian bertujuan untuk melakukan pengambilan gambar, pengenalan citra
dan penerjemahan. Proses di mulai dengan menampilkan gambar yang akan diterjemahkan
secara realtime, kemudian dilakukan cropping untuk memperkecil ukuran gambar. Cropping
ini dilakukan untuk mempercepat proses recognitions. Pengambilan Gambar dioptimalkan
dengan pengaktifan autofocus camera smartphone. Menampilkan hasil pengambilan gambar
diatas tampilan gambar secara realtime.
Gambar yang telah diambil kemudian dilakukan dengan proses pengenalan citra
dengan metode OCR, dimulai dengan binerisasi, segmentasi, normalisasi dan template
maching.
Proses terjemahan dilukukan dengan dengan menggunakan Google Translate. Hasil
yang telah didapatkan pada OCR kemudian di kirim ke server dengan teknologi web service
SOAP. Web service melakukan proses otorisasi account google sehingga dapat mengirim data
berserta parameter seperi data texk, api key, api http Refrensi dan ID bahasa. Hasil request di
ambil kembali oleh web service dan di kirim ke smartphone kemudian ditampilkan di
smartphone.
KESIMPULAN DAN SARAN
Kesimpulan dari penelitian ini adalah sistem ini dapat melakukan penerjemahan teks
dengan dengan memoto dengan kamera teks yang akan di terjemahkan. Hasil akhir dari
penelitian ini belum sempurna, oleh karenanya untuk meningkatkan hasil yang dicapai dapat
dilakukan adalah Kekurangan sistem ini adalah proses translating masih bekerja secara online
sehingga sistem sangat tergantung terhadap jaringan seluler. Kualitas gambar sangat di
tunjang dari kemanpuan smartphone. Untuk peneliti selanjutnya dapat melakukan pengenalan
karakter arab dan karakter tulisan tangan.
UCAPAN TERIMA KASIH
Penelitian ini dapat selesai berkat bantuan dan kerjasama beberapa pihak. Terima kasih
kepada Prof.Dr.Ir.H.Muh.Tola,M.Eng dan Amil Ahmad Ilham,S.T.,MIT.,Ph.D sebagai
pembimbing I dan pembimbing II, kepada Dr.Ilyas Palantei,S.T.,M.Eng dan Dr.Eng.
Wardi.S.T.,M.Eng serta Merna Baharuddin,S.T.,M.Tel.Eng.,Ph.D sebagai penguji, serta
kepada teman-teman Pasca Sarjana UNHAS Teknik Informatika Angkatan 2011.
REFERENCES
Fauziah, Wahyuddin M Iwan. (2009). Metode Jaringan Saraf Tiruan Penjejakan Balik Untuk
Pengenalan Huruf Cetak pada Citra Digital. Jurnal Artificial, Vol.3 No.1 Januari 2009.
ISSN 1978-9491.
Fahrial Fauzi, Arnia Fitri. (2012). Analisis Kinerja Metode Binerisasi Pada Proses
Pemisahan Text Dari Background Menggunakan Perangkat Lunak OCR. KITEKTRO.
Vol.1 No.2 2012: 25-32. e-ISSN: 2252-703.
Suryo Hartanto, Sugiharto Aris, Sukmawati NE. (2012). Optical Character
Recognitionmenggunakan Algoritma Template Matching Correlation. Journal of
Informatics and Technology, Vol 1, No 1.
Raden SB, Irfan M. (2012). Perbandingan Algoritma Template Matching Dan Feature
Extraction Pada Optical Character Recognition. Jurnal Komputer dan Informatika
(KOMPUTA) Edisi. I Volume. 1.
Anggoro, Sunu Puji. (2012). Rancang Bangun Aplikasi Chatting Translator Berbasiskan Java
Menggunakan Application Programing Interface (Api) Google Translate. E-jurnal:
Universitas Stikubank (UNISBANK). (http://eprints.unisbank.ac.id diakses pada 2
Desember 2012)
Saputra, Bhagas Arga. (2010). Implementasi Google Translate API pada Mobile Phone
menggunakan J2ME,
E-jurnal: Institus Teknologi Sepuluh Nopember.
(http://library.its.ac.id diakses pada 2 Desember 2012)
Nuraini Novi Tri. (2012). Pembuatan Aplikasi Server Inline Translator Dengan Teknologi
Web Service. E-jurnal: Institus Teknologi Sepuluh Nopember. (http://library.its.ac.id
diakses pada 2 Desember 2012)
Lampiran
Tabel 1. Pengujian OCR recognition berdasarkan ukuran teks
No.
Panjang teks
waktu
1
2
3
4
5
6
7
8
9
10
3 kata (1 baris)
1 baris
2 baris
3 baris
4 baris
5 baris
6 baris
7 baris
8 baris
9 baris
0:0:1:05
0:0:2:01
0:0:3:56
0:0:4:46
0:0:6:02
0:0:7:09
0:0:8:59
0:0:9:08
0:1:9:10
0:2:3:52
Jumlah
karakter
12
34
70
110
143
175
211
246
271
304
Jumlah
salah
0
3
9
10
12
16
18
20
24
24
Akurasi
100 %
91
87%
90%
91%
90%
91%
91%
91%
92%
Tabel 2. Pengujian OCR berdasarkan kemiringan teks
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Sudut kemiringan teks
00
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
200
300
400
3400
3500
3550
3560
3570
3580
3590
Hasil Pengenalan
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Tidak Berhasil
Tidak Berhasil
Tidak Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Berhasil
Akurasi (%)
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
50 %
30 %
50%
100%
100%
100%
100%
100%
100%
Tabel 3. Pengujian OCR berdasarkan ukuran teks
No.
Panjang teks
waktu
1
2
3
4
5
6
7
8
9
10
3 kata (1 baris)
1 baris
2 baris
3 baris
4 baris
5 baris
6 baris
7 baris
8 baris
9 baris
0:0:1:05
0:0:2:01
0:0:3:56
0:0:4:46
0:0:6:02
0:0:7:09
0:0:8:59
0:0:9:08
0:1:9:10
0:2:3:52
Jumlah
karakter
12
34
70
110
143
175
211
246
271
304
Jumlah
salah
0
3
9
10
12
16
18
20
24
24
Akurasi
100 %
91
87%
90%
91%
90%
91%
91%
91%
92%
Tabel 4. Pengujian OCR berdasarkan warna
No.
1
2
3
4
5
6
7
8
teks
Hitam
Kuning
Putih
Biru
Orange
Biru
Orange
Putih
Warna
background
merah
merah
biru
putih
putih
Hijau
Merah
Abu-abu
Hasil Pengenalan
Barhasil
Barhasil
Barhasil
Barhasil
Barhasil
Tidak Berhasil
Tidak Berhasil
Tidak Berhasil
Akurasi
(%)
100%
100%
100%
100%
100%
30%
35%
10%
Tabel 5. Pengujian OCR berdasarkan karakter teks
No.
1
2
3
4
5
Jenis Teks
Huruf
Arab
Jepang
Cina
Korea
Hasil
sukses
gagal
sukses
sukses
sukses
Download