BAB 1 PENDAHULUAN 1.1 Latar Belakang Saat ini, teknologi komputer telah berkembang dengan pesat dan telah banyak alat yang diciptakan untuk mendukung penggunaan komputer. Salah satu alat tersebut adalah scanner. Kebutuhan akan pemindai (scan) dokumen semakin tinggi karena adanya kebutuhan dijitalisasi data dan penyimpanannya, pengiriman fax menggunakan fax software, atau pengiriman data via email. Scanner adalah suatu alat elektronik yang fungsinya mirip dengan mesin fotocopy. Hasil dari mesin foto copy dapat kita lihat langsung pada kertas, sedangkan hasil dari scanner ditampilkan pada layar monitor komputer terlebih dahulu kemudian dapat diubah dan dimodifikasi sehingga tampilan dan hasilnya menjadi bagus yang kemudian dapat disimpan sebagai dokumen dalam bentuk format gambar. Dokumen dalam bentuk gambar tidak memungkinkan untuk dilakukan proses penyuntingan seperti penambahan, penghapusan, atau perubahan karakter. Dokumen gambar juga akan menimbulkan sedikit masalah dalam hal penyimpanan, jika dokumen yang akan di simpan sangat banyak, maka kapasitas tempat penyimpanannyapun harus banyak pula, karena dokumen dalam format gambar memiliki ukuran file yang cukup besar. Hal ini tentunya menjadi sangat tidak efisien mengingat kebutuhan akan ruang penyimpanan yang besar dalam media penyimpanan. Oleh karena itu, dokumen gambar perlu diubah menjadi dokumen teks dengan melakukan proses pengenalan karakter. Proses pengenalan 1 karakter ini disebut dengan character recognition. Pengenalan karakter-karakter oleh mesin telah menerima animo penelitian yang besar di bidang pengenalan pola dalam beberapa dekade. Dalam proses pengenalan karakter kita akan menghadapi dua masalah : memecah suatu kalimat menjadi suatu karakter yang dapat berdiri sendiri dan deteksi serta koreksi penyimpangan (gangguan dalam suatu dokumen gambar). Kedua hal tersebut akan mengurangi keakuratan dalam proses character recognition. Pada tugas akhir ini, penulis akan mencoba meneliti bagaimana cara pembacaan dokumen gambar dalam bentuk bitmap sampai diubah menjadi dokumen teks (.doc) juga sejauh mana pengaruh noise (gangguan) terhadap keakuratan proses pengenalan karakter. Tema dan prinsip kerja perangkat lunak yang akan dibuat oleh penulis sama dengan salah satu gadget keluaran raksasa semi konduktor dunia (intel), gadget ini ditujukan untuk orang yang memiliki kesulitan membaca, bisa juga bagi orang yang malas untuk membaca. Intel reader adalah gadget yang memiliki fungsi untuk mengubah teks di buku menjadi audio (suara) sehingga kita tidak perlu lagi membaca tulisan yang hurufnya sangat sulit dibaca alias tulisannya kekecilan. Prinsip kerja gadget tersebut dikenal dengan istilah OCR (Optical Character Recognition) atau pengenalan karakter. Pengenalan karakter menawarkan keuntungan-keuntungan potensial dengan menyediakan sebuah alat penghubung yang memfasilitasi interaksi manusia dengan mesin. Beberapa aplikasi OCR melingkupi proses data otomatis, mengecek verifikasi dan berbagai jenis aplikasi ilmiah, bisnis, serta perbankan. OCR memberikan keuntungan berupa sedikitnya campur tangan manusia serta 2 lebih tingginya kecepatan dalam memproses teks dan masukan data, khususnya jika data sudah tersedia langsung dalam bentuk yang dapat dibaca oleh mesin. Prinsip kerja Intel Reader adalah mengubah teks yang ada di buku menjadi audio (suara) sedangkan prinsip kerja perangkat lunak yang akan dibuat oleh penulis adalah mengubah dokumen gambar yang berisi teks menjadi sebuah dokumen teks digital sehingga dapat dilakukan proses penyuntingan seperti penambahan, penghapusan, atau perubahan karakter dan lebih efisien dalam media penyimpanan. 1.2 Rumusan Masalah a. Bagaimana cara pembacaan dokumen dalam format bitmap hingga diubah menjadi dokumen dalam format teks ? b. Bagaimana pengaruh noise (gangguan) berupa guratan/coretan garis terhadap keakuratan proses pengenalan karakter ? 1.3 Batasan Masalah Batasan permasalahan yang diteliti meliputi : a. Dokumen gambar yang akan dikenali tidak memiliki sudut kemiringan. b. Dokumen gambar yang akan dikenali berformat bitmap (.bmp). c. Metode pembelajaran dan testing bersifat offline. d. Tidak dapat dihubungkan ke perangkat masukan (sebagai contoh scanner). 3 1.4 Tujuan Penelitian Sejalan dengan permasalahan yang dirumuskan, maka tujuan yang ingin dicapai pada penelitian ini adalah membangun perangkat lunak yang dapat mengubah (konversi) dokumen gambar dalam bentuk bitmap menjadi dokumen teks word sehingga dapat meningkatkan efisiensi media penyimpanan karena mengubah suatu dokumen gambar yang memiliki kapasitas besar menjadi dokumen teks yang memiliki kapasitas lebih kecil. 1.5 Manfaat Penelitian Dengan adanya perangkat lunak ini diharapkan dapat dilakukan penyuntingan seperti penambahan, penghapusan, atau perubahan karakter terhadap dokumen gambar dalam bentuk bitmap. 4 1.6 Sistematika Penulisan Sistematika penulisan skripsi ini adalah sebagai berikut. BAB 1 PENDAHULUAN Bab ini berisi alasan dilakukannya penelitian, rumusan masalah yang akan diselesaikan, batasan masalah, tujuan dan manfaat penelitian, serta sistematika penulisan penelitian. BAB 2 TINJAUAN PUSTAKA Bab ini menjelaskan teori-teori yang digunakan, yaitu konsep optical character recognition, feature extraction, dan template matching. BAB 3 METODOLOGI PENELITIAN Bab ini menjelaskan langkah-langkah penyelesaian masalah yang terdiri dari penjelasan lebih detail mengenai masalah yang diteliti, representasi masalah dan model yang dikembangkan untuk menyelesaikan masalah serta desain penelitian. BAB 4 HASIL PENELITIAN DAN PEMBAHASAN Bab ini berisi studi kasus yang digunakan, pembangunan perangkat lunak, hasil penelitian, pengujian, dan pembahasan hasil. BAB 5 PENUTUP Bab ini berisi kesimpulan dari penilitian yang dilakukan serta saran untuk penelitian selanjutnya. 5