1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Saat ini, teknologi

advertisement
BAB 1
PENDAHULUAN
1.1
Latar Belakang
Saat ini, teknologi komputer telah berkembang dengan pesat dan telah
banyak alat yang diciptakan untuk mendukung penggunaan komputer. Salah satu
alat tersebut adalah scanner. Kebutuhan akan pemindai (scan) dokumen semakin
tinggi karena adanya kebutuhan dijitalisasi data dan penyimpanannya, pengiriman
fax menggunakan fax software, atau pengiriman data via email. Scanner adalah
suatu alat elektronik yang fungsinya mirip dengan mesin fotocopy. Hasil dari
mesin foto copy dapat kita lihat langsung pada kertas, sedangkan hasil dari
scanner ditampilkan pada layar monitor komputer terlebih dahulu kemudian dapat
diubah dan dimodifikasi sehingga tampilan dan hasilnya menjadi bagus yang
kemudian dapat disimpan sebagai dokumen dalam bentuk format gambar.
Dokumen dalam bentuk gambar tidak memungkinkan untuk dilakukan
proses penyuntingan seperti penambahan, penghapusan, atau perubahan karakter.
Dokumen gambar juga akan menimbulkan sedikit masalah dalam hal
penyimpanan, jika dokumen yang akan di simpan sangat banyak, maka kapasitas
tempat penyimpanannyapun harus banyak pula, karena dokumen dalam format
gambar memiliki ukuran file yang cukup besar. Hal ini tentunya menjadi sangat
tidak efisien mengingat kebutuhan akan ruang penyimpanan yang besar dalam
media penyimpanan. Oleh karena itu, dokumen gambar perlu diubah menjadi
dokumen teks dengan melakukan proses pengenalan karakter. Proses pengenalan
1
karakter ini disebut dengan character recognition. Pengenalan karakter-karakter
oleh mesin telah menerima animo penelitian yang besar di bidang pengenalan pola
dalam beberapa dekade. Dalam proses pengenalan karakter kita akan menghadapi
dua masalah : memecah suatu kalimat menjadi suatu karakter yang dapat berdiri
sendiri dan deteksi serta koreksi penyimpangan (gangguan dalam suatu dokumen
gambar). Kedua hal tersebut akan mengurangi keakuratan dalam proses character
recognition.
Pada tugas akhir ini, penulis akan mencoba meneliti bagaimana cara
pembacaan dokumen gambar dalam bentuk bitmap sampai diubah menjadi
dokumen teks (.doc)
juga sejauh mana pengaruh noise (gangguan) terhadap
keakuratan proses pengenalan karakter. Tema dan prinsip kerja perangkat lunak
yang akan dibuat oleh penulis sama dengan salah satu gadget keluaran raksasa
semi konduktor dunia (intel), gadget ini ditujukan untuk orang yang memiliki
kesulitan membaca, bisa juga bagi orang yang malas untuk membaca. Intel reader
adalah gadget yang memiliki fungsi untuk mengubah teks di buku menjadi audio
(suara) sehingga kita tidak perlu lagi membaca tulisan yang hurufnya sangat sulit
dibaca alias tulisannya kekecilan. Prinsip kerja gadget tersebut dikenal dengan
istilah OCR (Optical Character Recognition) atau pengenalan karakter.
Pengenalan karakter menawarkan keuntungan-keuntungan potensial dengan
menyediakan sebuah alat penghubung yang memfasilitasi interaksi manusia
dengan mesin. Beberapa aplikasi OCR melingkupi proses data otomatis,
mengecek verifikasi dan berbagai jenis aplikasi ilmiah, bisnis, serta perbankan.
OCR memberikan keuntungan berupa sedikitnya campur tangan manusia serta
2
lebih tingginya kecepatan dalam memproses teks dan masukan data, khususnya
jika data sudah tersedia langsung dalam bentuk yang dapat dibaca oleh mesin.
Prinsip kerja Intel Reader adalah mengubah teks yang ada di buku menjadi
audio (suara) sedangkan prinsip kerja perangkat lunak yang akan dibuat oleh
penulis adalah mengubah dokumen gambar yang berisi teks menjadi sebuah
dokumen teks digital sehingga dapat dilakukan proses penyuntingan seperti
penambahan, penghapusan, atau perubahan karakter dan lebih efisien dalam
media penyimpanan.
1.2
Rumusan Masalah
a. Bagaimana cara pembacaan dokumen dalam format bitmap hingga
diubah menjadi dokumen dalam format teks ?
b. Bagaimana pengaruh noise (gangguan) berupa guratan/coretan garis
terhadap keakuratan proses pengenalan karakter ?
1.3
Batasan Masalah
Batasan permasalahan yang diteliti meliputi :
a. Dokumen gambar yang akan dikenali tidak memiliki sudut kemiringan.
b. Dokumen gambar yang akan dikenali berformat bitmap (.bmp).
c. Metode pembelajaran dan testing bersifat offline.
d. Tidak dapat dihubungkan ke perangkat masukan (sebagai contoh
scanner).
3
1.4
Tujuan Penelitian
Sejalan dengan permasalahan yang dirumuskan, maka tujuan yang ingin
dicapai
pada penelitian ini adalah membangun perangkat lunak yang dapat
mengubah (konversi) dokumen gambar dalam bentuk bitmap menjadi dokumen
teks word sehingga dapat meningkatkan efisiensi media penyimpanan karena
mengubah suatu dokumen gambar yang memiliki kapasitas besar menjadi
dokumen teks yang memiliki kapasitas lebih kecil.
1.5
Manfaat Penelitian
Dengan adanya perangkat lunak ini diharapkan dapat dilakukan
penyuntingan seperti penambahan, penghapusan, atau perubahan karakter
terhadap dokumen gambar dalam bentuk bitmap.
4
1.6
Sistematika Penulisan
Sistematika penulisan skripsi ini adalah sebagai berikut.
BAB 1 PENDAHULUAN
Bab ini berisi alasan dilakukannya penelitian, rumusan masalah yang akan
diselesaikan, batasan masalah, tujuan dan manfaat penelitian, serta
sistematika penulisan penelitian.
BAB 2 TINJAUAN PUSTAKA
Bab ini menjelaskan teori-teori yang digunakan, yaitu konsep optical
character recognition, feature extraction, dan template matching.
BAB 3 METODOLOGI PENELITIAN
Bab ini menjelaskan langkah-langkah penyelesaian masalah yang terdiri
dari penjelasan lebih detail mengenai masalah yang diteliti, representasi
masalah dan model yang dikembangkan untuk menyelesaikan masalah
serta desain penelitian.
BAB 4 HASIL PENELITIAN DAN PEMBAHASAN
Bab ini berisi studi kasus yang digunakan, pembangunan perangkat lunak,
hasil penelitian, pengujian, dan pembahasan hasil.
BAB 5 PENUTUP
Bab ini berisi kesimpulan dari penilitian yang dilakukan serta saran untuk
penelitian selanjutnya.
5
Download