SISTEM PENERJEMAH MOBILE BERBASIS CITRA DIGITAL DENGAN TEKNOLOGI WEB SERVICE MOBILE TRANSLATED BASED IMAGE PROSSECING WITH WEB SERVICE TEKNOLOGY 1 1 Baso Habibi, 2Muhammad Tola, 2Amil Ahmad Ilham Program Studi Teknik Informatika, Fakultas Teknik Informatika, Sekolah Tinggi Manajemen Informatika dan Komputer Handayani Makassar 3 Jurusan Elektro, Prodi Informatika, Fakultas Teknik, Universitas Hasanuddin, Alamat Koresponden : Baso Habibi Fakultas Teknik Informatika Program Studi Teknik Informatika Sekolah Tinggi Manajemen Informatika dan Komputer Handayani Makassar Makassar, 9022 Tamalate 3 No. 136 081355440844 Email : [email protected] ABSTRAK Aplikasi penerjemah saat ini yang umumnya digunakan adalah aplikasi berbasis text seperti googletranslate.apk, kamus.apk, English-indonesi.apk. Kekurangan aplikasi ini adalah teks yang akan diterjemahkan harus di input secara manual. Tujuan penelitian ini adalah membuat suatu sistem penerjemah berbasis citra atau gambar. Text yang akan diterjemahkan tidak lagi di input secara manual melainkan di capture dengan kamera mobile. Text yang telah dicapture kemudian diproses dengan menggunakan pengolahan citra dengan metode OCR. Tahap-tahap OCR dimulai dari proses binerisasi, normalisasi, segmentasi dan template maching. Hasil pengenalan text kemudian dikirim ke tools penerjemah untuk melakukan translate text yang diinginkan. Hasil penelitian yang didapatkan dengan pengujian menggunakan smartphone Samsung tab 7+ adalah sistem ini dapat menerjemahkan text dengan input gambar melalui kamera. Sistem ini dapat mengenali huruf Katakana dan Hiragana. Pengenalan teks mencapai 100% dengan ukuran font mulai dari font 10 dengan jarak 2 cm. Penggenalan teks terhadap data gambar dengan warna teks dan background yang beragam sangat ditentukan oleh kualitas kamera smarphone yang digunakan. Sistem ini juga dapat mengenali berbagai karakter teks seperti : karakter Jepang, karakter huruf, karakter korea, dan karakter cina.. Kesimpulan penelitian ini adalah sistem ini dapat menerjemahkan teks dengan hanya mencapture dengan camera smartphone Kata Kunci: Penerjemah, OCR, Smartphone ABSTRACT Translator app now commonly used is the text-based applications such as googletranslate.apk, kamus.apk, English-indonesi.apk. This application is a shortage of text to be translated must be input manually. The purpose of this research is to create a system image or image-based translator. Translated text will no longer be manually input capture with a camera but rather in mobile. Text that has been captured and then processed using image processing with OCR methods. OCR beginning stages of the process binerisation, normalization, segmentation and template matching. Text recognition results are then sent to the translator tools to translate the desired text. The results obtained by testing using a Smartphone is the Samsung tab 7 + This system can translate text to input images through the camera. This system can recognize Katakana and Hiragana letters. Text recognition reached 100% with font size 10 fonts from a distance of 2 cm. Introduction text for image data with text and background colors vary greatly determined by the quality of the camera used Smartphone. The system can also recognize text characters such as Japanese characters, characters, characters Korean, and Chinese characters. The conclusion of this study is that this system can translate the text with only captured with Smartphone camera Keywords: Translate, OCR, Smartphone PENDAHULUAN Sistem penerjemah saat ini umum aplikasi stand alone dan aplikasi berbasis web. Aplikasi stand alone seperti: Japanese-IndonesianDict.apk, Kamus Japan-Indonesia.jar, Inggris-Indonesi.exe, kamus.exe. Aplikasi berbasis web seperti: googletranslate.com, kamusjapan.com, kamus.com, kamus.javakedaton.com. Pengguna aplikasi ini harus menginput manual kata yang akan diterjemahkan. Hal ini menjadi permasalahan bagi pengguna jika perangkat atau aplikasi yang digunakan di lengkapi dengan keyboard dengan karakter Jepang atau keyboard virtual. Begitu pula aplikasi yang berbasis web, pengguna terlebih dahulu harus mengatur keyboard virtual dengan karakter bahasa Jepang. Untuk aplikasi penerjemah google translate adalah yang paling akurat dan terbaik secara online (Liwan, 2011). Dengan semakin berkembangnya teknologi mobile phone dan penggunanya, pada tahun 2002 saja tercatat sekitar 7,3 juta pengguna handphone dan 56% diantaranya adalah kelompok anak muda di bawah umur 20 tahun (Komputer, 2012). Handphone atau smartphone ini memiliki fungsi lebih selain sebagai alat komunikasi seperti dilengkapi dengan fitur multimedia (musik dan video), kamera, browser, dll. Perangkat ini juga memungkinkan running beberapa aplikasi yang dibutuhkan seperti: aplikasi chating, aplikasi googlemap, aplikasi translate, aplikasi e-mail, dll. Terlebih lagi kebiasan yang senang mengambil gambar/capture. Sehingga sistem diterjemahkan mobile berbasis citra digital sangat membantu pengguna karena ketika ingin menerjemahkan kata, pengguna hanya mencapture kata yang akan diterjemahkan. Sistem ini sangat berpotensi digunakan oleh orang yang akan berpergian keluar negeri, salah satunya misalnya ke Jepang baik untuk keperluan jalan-jalan, pekerjaan sampai kuliah yang jumlah semakin bertambah setiap tahunnya. Umumnya warga Indonesia yang ke Jepang, Saudi Arabia, Korea, Cina dan Negara lainnya tidak mengerti bahasa Jepang dan tulisan tersebut sehingga akan sulit untuk berkomunikasi dengan penduduk lokal. Tujuan penelitian ini adalah akan dibuat suatu aplikasi penerjemah berbasis smartphone dimana kata yang akan diterjemahkan tidak lagi diinput secara manual melainkan dicapture dan diproses dengan metode pengenalan citra digital, teknologi web service, dan api google. BAHAN DAN METODE Lokasi Penelitian Penelitian ini dilakukan di Laboratorium Fakultas Teknik Jurusan Teknik Elektro. Jenis Penelitian Metode yang digunakan dalam penelitian ini adalah metode eksperimental yaitu dengan melakukan perancangan dan pembuatan model sistem. Rancangan Penelitian Pada penelitian ini digunakan pendekatan metode studi literature (library research) dan studi lapangan (field research) untuk perancangan sistem. Adapun tahapan penelitian meliputi: Pengumpulan Data dan Studi Literatur Merupakan tahap mengumpulkan informasi dan data-data karakter teks. Proses ini lebih banyak merupakan studi literatur yang mengacu pada referensi-referensi dalam negeri dan luar negeri. Pengkajian mengarah pada pengumpulan informasi tentang karakteristik teks yang selanjutnya berupaya mengaitkannya dengan studi data tentang teknologi yang tepat untuk implementasi sistemnya. Tahap ini melakukan evaluasi terhadap kemungkinan penerapan suatu teknologi dibanding teknologi lainnya. Analisi Kebutuhan Sistem Pada tahapan ini dilakukan estimasi terhadap kebutuhan sistem yaitu: input, output sistem dan proses yang terjadi didalam sistem. Untuk melihat kesesuaian sistem yang akan dirancang dengan sistem diterjemahkan mobile berbasis citra digital dengan teknologi web servis. Perancangan Sistem Perancangan dilaksanakan mengacu pada kebutuhan-kebutuhan apa saja yang diperlukan pada pernagkat lunak yang berkaitan dengan aplikasi translate, yang telah didapatkan dan ditentukan pada tahap analisis. Perancangan bertujuan untuk merepresentasikan kebutuhan ke dalam suatu model perangkat lunak yang akan digunakan sebagai acuan pada proses pengkodean. Implementasi Sistem Tugas utama pada tahap ini adalah menerjemahkan perancangan yang telah dibuat menjadi suatu perangkat lunak. Pengujian dan Perbaikan Pengujian dilakukan terhadap perangkat lunak yang telah selesai dibangun. Pengujian difokuskan pada fungsi-fungsi yang terdapat pada perangkat lunak untuk memastikan fungsifungsi tersebut berjalan sesuai dengan yang dikehendaki HASIL Pengujian OCR berdasarkan ukuran gambar Pengujian ini dilakukan untuk mengukur seberapa besar waktu yang dibutuhkan untuk proses pengenalan OCR recognition secara offline dengan memberikan data gambar dengan melakukan cropping atau tidak sebelum gambar dikirim. Pengujian ini dilakukan dengan dengan menggunakan smarphone Samsung tab 7+ dengan provider 3. Dari hasil pengujian pada tabel 1 di dapatkan waktu yang di butuhkan untuk proses recognition secara berdasarkan ukuran hasil cropping. Semakin kecil cropping gambar semakin cepat waktu proses. Pengujian OCR berdasarkan kemiringan teks Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR dengan memberikan data gambar dengan kemiringan gambar yang beragam. Pengujian dilakukan dengan pengenalan kata dengan jarak 25 cm antara teks dengan smarphone samsung tab 7+. Pengujian dilakukan dengan membuat teks dengan kemiringan tertentu kemudian di capture dengan posisi camera 00. Dari hasil pengujian pada tabel 2 di dapatkan akurasi pengenalan mencapai 100% jika sudut kemiringan pengambilan gambar sebesar <800. Sistem ini hanya dapat mengenali karakter jepang dengan kemiringan teks <900. Hal ini di karenakan pada posisi 900 maka sistem mengenali dengan huruf berderet horisontal. Untuk posisi kemiringan >900-<2700 maka sistem memutar teks ke posisi yagn paling mendekati sumbu x yaitu 1800. Pengujian OCR berdasarkan panjang teks Pengujian ini dilakukan untuk mengukur seberapa besar waktu yang dibutuhkan untuk proses pengenalan OCR secara offline dengan memberikan data gambar dengan melakukan cropping atau tidak sebelum gambar dikirim. Pengujian ini dilakukan dengan dengan menggunakan smarphone Samsung tab 7+. Dari hasil pengujian pada tabel 3 di dapatkan waktu yang di butuhkan untuk proses OCR berdasarkan ukuran hasil cropping. Semakin sedikit teks semakin cepat waktu proses. Pengujian OCR berdasarkan warna Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR dengan memberikan data gambar dengan warna teks dan background yang beragam. Pengujian dilakukan dengan pengenalan kata dengan jarak 10 cm antara teks dengan smarphone samsung Tab 1 dan Tab 2. Dari hasil pengujian pada tabel 4 di dapatkan akurasi pengenalan sangat tergantung dari kualitas kamera smartphone yang digunakan. Dari tabel 4 di dapatkan bakwa kualitas penggunaan kamera smartphone sangat menentukan akurasi OCR. Dari uji coba penggunaan dua smarphone dengan resulusi camera yang sama tetepi TAB 1 memliki LED flash di dapatkan penggunaa smarphone TAB 1 lebih baik dalam akurasi OCR yang di hasilkan. Pengujian OCR berdasarkan jenis karakter Pengujian ini dilakukan untuk mengukur seberapa besar akurasi pengenalan OCR recognition dengan memberikan data gambar dengan ukuran font yang beragam. Pengujian dilakukan dengan pengenalan kata dengan jarak 2 cm antara teks dengan smarphone samsung tab 7+. Dari hasil pengujian pada tabel 5 di dapatkan bahwa aplikasi dapat mengenali karakter teks yang berbeda. Sistem aplikasi tidak dapat mengenali karakter Arab karena pada karaktek arab setiap huruf dalam 1 kalimat tersambung. Sehingga pada proses Box Wrapper tidak dapat mengenali box per huruf melaikan per kata sehingga tidak di dapat pada data template maching. Pengujian Api translate Pengujian ini dilakukan untuk mengukur hasil terjemahan menggunakan Api microsoft translate dan Api goole translate dengan memberikan data teks berdasarkan pola teks yang beragam. Pengujian dilakukan dengan translate kata dengan melihat hasil terjemahan dengan Api microsoft translate dan Api goole translate. PEMBAHASAN Penelitian ini memperlihatkan suatu aplikasi penerjemah dimana teks yang akan di terjemahkan tidak lagi di ketik secara manual melainkan dicapture dengan camera smartphone. Aplikasi ini dapat mengenali karakter alphabet, karakter jepang, karakter cina, karakter korea, dan sebagainya kecuali karakter arab. Akurasi pengenalan pada sistem ini mencapai 100% dengan karakter yang dicapture dengan menggunakan font 10 dengan kemiringan ±900. Hasil pengenalan karakter juga sangat ditentukan oleh kualitas dari camera smartphone. Terjemahan teks pada sistem ini diproses oleh api google translate dan api Microsoft translate. Pada penelitian Optical Character Recognition menggunakan Algoritma Template Matching Correlation (Suryo, 2012) memperlihatkan sebuah aplikasi Optical Character Recognition menggunakan algoritma Template Matching Correlation. Algoritma Template Matching Correlation cukup efektif untuk pengenalan karakter huruf cetak. Rata-rata tingkat keberhasilan pengenalan yang dihasilkan sebesar 92,90%. Penelitian ini hanya sistem untuk mengenali karakter alphabet. Penggunaan tools translate pada penelitian Rancang Bangun Aplikasi Chatting Translator Berbasiskan Java Menggunakan Application Programing Interface (Api) Google Translate (Anggoro, 2012) memperlihatkan pada pembuatan aplikasi komputer yang dapat digunakan oleh user sehingga dapat memahami chatting translator secara akurat dan lebih mudah tanpa merasa bosan ataupun jenuh. Didalam penelitian ini terdapat beberapa hal yang harus diperlukan dalam proses pengambilan kesimpulan yang dimasukkan berupa aplikasi yang berkaitan dengan sistem aplikasi sistem chatting translator yang telah diuji coba dalam bentuk program sehingga lebih mudah dalam mempelajarinya. Aplikasi chatting translator ini masih sederhana didapat output yang berupa chatting translator yang akurat dan tetapi cukup fleksibel karena didukung dengan Aplication Programing Interface. Hal ini juga selaras dengan penelitian Implementasi Google Translate API pada Mobile Phone menggunakan J2ME (Saputra, 2010) menyelesaikan masalah diatas dengan cara mengembangkan sebuah aplikasi yang dapat memanfaatkan layanan web translator milik google secara langsung dari telepon genggam. Hasil percobaan menunjukkan bahwa aplikasi ini layak untuk dipakai dan mudah untuk digunakan. Selain itu, aplikasi ini lebih cepat dalam mengakses layanan google daripada menggunakan browser bawaan yang ada pada telepon genggam. Hal ini juga selaras dengan penelitian Pembuatan Aplikasi Server Inline Translator Dengan Teknologi Web Service (Nuraini, 2012) yang menunjukkan suatu aplikasi penerjemah bahasa yang diberi nama aplikasi Server Inline Translator bertujuan agar pengguna internet di Indonesia lebih mudah memahami situs bahasa asing khususnya bahasa inggris. Aplikasi ini dibuat dengan metode klasifikasi teks menggunakan Naive Bayesian Classifier dan Potter Stemming Algorithm. Serta menerapkan teknologi REST web service pada platform J2EE, JPA, XML dan Quartz. Di samping itu, kumpulan arti kata diperoleh dari server kosakata yang telah tersedia pada Google Translate API. Sistem penerjemah berbasis citra digital dengan teknologi web service yang dirancang pada penelitian ini menghasilkan suatu user interface yang berisi beberapa halaman yang dapat digunakan user untuk berinteraksi dengan sistem. Interaksi yang dilakukan user dengan sistem adalah dengan penginputan data dan pengaturan aplikasi yang dibutuhkan untuk menghasilkan informasi hasil terjemahan. Sistem ini dirancang menggunakan bahasa pemrograman Java dipilih sebagai bahasa pemrograman untuk merancang sistem ini agar nantinya sistem ini dapat digunakan di berbagai macam smarphone. Proses penelitian bertujuan untuk melakukan pengambilan gambar, pengenalan citra dan penerjemahan. Proses di mulai dengan menampilkan gambar yang akan diterjemahkan secara realtime, kemudian dilakukan cropping untuk memperkecil ukuran gambar. Cropping ini dilakukan untuk mempercepat proses recognitions. Pengambilan Gambar dioptimalkan dengan pengaktifan autofocus camera smartphone. Menampilkan hasil pengambilan gambar diatas tampilan gambar secara realtime. Gambar yang telah diambil kemudian dilakukan dengan proses pengenalan citra dengan metode OCR, dimulai dengan binerisasi, segmentasi, normalisasi dan template maching. Proses terjemahan dilukukan dengan dengan menggunakan Google Translate. Hasil yang telah didapatkan pada OCR kemudian di kirim ke server dengan teknologi web service SOAP. Web service melakukan proses otorisasi account google sehingga dapat mengirim data berserta parameter seperi data texk, api key, api http Refrensi dan ID bahasa. Hasil request di ambil kembali oleh web service dan di kirim ke smartphone kemudian ditampilkan di smartphone. KESIMPULAN DAN SARAN Kesimpulan dari penelitian ini adalah sistem ini dapat melakukan penerjemahan teks dengan dengan memoto dengan kamera teks yang akan di terjemahkan. Hasil akhir dari penelitian ini belum sempurna, oleh karenanya untuk meningkatkan hasil yang dicapai dapat dilakukan adalah Kekurangan sistem ini adalah proses translating masih bekerja secara online sehingga sistem sangat tergantung terhadap jaringan seluler. Kualitas gambar sangat di tunjang dari kemanpuan smartphone. Untuk peneliti selanjutnya dapat melakukan pengenalan karakter arab dan karakter tulisan tangan. UCAPAN TERIMA KASIH Penelitian ini dapat selesai berkat bantuan dan kerjasama beberapa pihak. Terima kasih kepada Prof.Dr.Ir.H.Muh.Tola,M.Eng dan Amil Ahmad Ilham,S.T.,MIT.,Ph.D sebagai pembimbing I dan pembimbing II, kepada Dr.Ilyas Palantei,S.T.,M.Eng dan Dr.Eng. Wardi.S.T.,M.Eng serta Merna Baharuddin,S.T.,M.Tel.Eng.,Ph.D sebagai penguji, serta kepada teman-teman Pasca Sarjana UNHAS Teknik Informatika Angkatan 2011. REFERENCES Fauziah, Wahyuddin M Iwan. (2009). Metode Jaringan Saraf Tiruan Penjejakan Balik Untuk Pengenalan Huruf Cetak pada Citra Digital. Jurnal Artificial, Vol.3 No.1 Januari 2009. ISSN 1978-9491. Fahrial Fauzi, Arnia Fitri. (2012). Analisis Kinerja Metode Binerisasi Pada Proses Pemisahan Text Dari Background Menggunakan Perangkat Lunak OCR. KITEKTRO. Vol.1 No.2 2012: 25-32. e-ISSN: 2252-703. Suryo Hartanto, Sugiharto Aris, Sukmawati NE. (2012). Optical Character Recognitionmenggunakan Algoritma Template Matching Correlation. Journal of Informatics and Technology, Vol 1, No 1. Raden SB, Irfan M. (2012). Perbandingan Algoritma Template Matching Dan Feature Extraction Pada Optical Character Recognition. Jurnal Komputer dan Informatika (KOMPUTA) Edisi. I Volume. 1. Anggoro, Sunu Puji. (2012). Rancang Bangun Aplikasi Chatting Translator Berbasiskan Java Menggunakan Application Programing Interface (Api) Google Translate. E-jurnal: Universitas Stikubank (UNISBANK). (http://eprints.unisbank.ac.id diakses pada 2 Desember 2012) Saputra, Bhagas Arga. (2010). Implementasi Google Translate API pada Mobile Phone menggunakan J2ME, E-jurnal: Institus Teknologi Sepuluh Nopember. (http://library.its.ac.id diakses pada 2 Desember 2012) Nuraini Novi Tri. (2012). Pembuatan Aplikasi Server Inline Translator Dengan Teknologi Web Service. E-jurnal: Institus Teknologi Sepuluh Nopember. (http://library.its.ac.id diakses pada 2 Desember 2012) Lampiran Tabel 1. Pengujian OCR recognition berdasarkan ukuran teks No. Panjang teks waktu 1 2 3 4 5 6 7 8 9 10 3 kata (1 baris) 1 baris 2 baris 3 baris 4 baris 5 baris 6 baris 7 baris 8 baris 9 baris 0:0:1:05 0:0:2:01 0:0:3:56 0:0:4:46 0:0:6:02 0:0:7:09 0:0:8:59 0:0:9:08 0:1:9:10 0:2:3:52 Jumlah karakter 12 34 70 110 143 175 211 246 271 304 Jumlah salah 0 3 9 10 12 16 18 20 24 24 Akurasi 100 % 91 87% 90% 91% 90% 91% 91% 91% 92% Tabel 2. Pengujian OCR berdasarkan kemiringan teks No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Sudut kemiringan teks 00 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 200 300 400 3400 3500 3550 3560 3570 3580 3590 Hasil Pengenalan Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Tidak Berhasil Tidak Berhasil Tidak Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Berhasil Akurasi (%) 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 50 % 30 % 50% 100% 100% 100% 100% 100% 100% Tabel 3. Pengujian OCR berdasarkan ukuran teks No. Panjang teks waktu 1 2 3 4 5 6 7 8 9 10 3 kata (1 baris) 1 baris 2 baris 3 baris 4 baris 5 baris 6 baris 7 baris 8 baris 9 baris 0:0:1:05 0:0:2:01 0:0:3:56 0:0:4:46 0:0:6:02 0:0:7:09 0:0:8:59 0:0:9:08 0:1:9:10 0:2:3:52 Jumlah karakter 12 34 70 110 143 175 211 246 271 304 Jumlah salah 0 3 9 10 12 16 18 20 24 24 Akurasi 100 % 91 87% 90% 91% 90% 91% 91% 91% 92% Tabel 4. Pengujian OCR berdasarkan warna No. 1 2 3 4 5 6 7 8 teks Hitam Kuning Putih Biru Orange Biru Orange Putih Warna background merah merah biru putih putih Hijau Merah Abu-abu Hasil Pengenalan Barhasil Barhasil Barhasil Barhasil Barhasil Tidak Berhasil Tidak Berhasil Tidak Berhasil Akurasi (%) 100% 100% 100% 100% 100% 30% 35% 10% Tabel 5. Pengujian OCR berdasarkan karakter teks No. 1 2 3 4 5 Jenis Teks Huruf Arab Jepang Cina Korea Hasil sukses gagal sukses sukses sukses