BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

advertisement
 BAB 1
PENDAHULUAN
1.1 Latar Belakang Masalah
Pengembangan teknologi diharapkan menghasilkan berbagai hal yang berguna untuk
memenuhi kebutuhan masyarakat serta memberi kemudahan dan kenyamanan pada
pengguna ketika menggunakan komputer. Intelejensia Semu merupakan salah satu
cabang ilmu komputer yang terus dikembangkan. Salah satu cabang di dalam
Intelejensia Semu yaitu pengenalan pola, merupakan salah satu cabang yang banyak
diminati dan terus mengalami perkembangan, dan pengenalan karakter adalah satu dari
sekian banyak contoh pengenalan pola. Ada banyak pengenalan karakter, didalamnya
terdapat pengenal karakter secara online dan offline yang dibedakan oleh sifat masukkan
signal input. Device input khusus seperti grafik tablet tersebut membutuhkan peralatan
yang memungkinkan untuk mengambil input dari lintasan tulis. Sedangkan sistem
pengenalan tulisan tangan offline adalah perwakilan digitized input secara statis yaitu
tidak dapat membuat inputan secara runtime melainkan sudah mempunyai inputan yang
telah siap untuk diproses lebih lanjut dalam bentuk data digital.
Klasifikasi merupakan teknologi yang penting di dalam cabang ilmu AI, salah satu
metode yang umum adalah Neural Network, Fuzzy, KNN, dll. Salah satu metode yang
berkembang pesat saat ini adalah Support Vector Machines (SVM) yang akan dipakai
pada perancangan aplikasi ini. Sebagai salah satu metode pengenalan pola, usia SVM
terbilang masih relatif muda. Dahulu SVM hanya dapat mengklasifikasikan data ke
dalam dua kelas (klasifikasi biner). Namun, penelitian lebih lanjut mengembangkan
SVM sehingga bisa mengklasifikasikan data yang memiliki lebih dari dua kelas terus
dilakukan. Ada dua pilihan untuk mengimplementasikan multi kelas SVM yaitu dengan
menggabungkan beberapa SVM biner atau menggabungkan semua data yang terdiri dari
1
2
beberapa kelas kedalam bentuk optimasi. Dengan pemanfaatan Library Support Vector
Machine (LibSVM) dalam program klasifikasi yang dirancang akan membantu
penyelesaian masalah multi-kelas SVM karena penggunaannya mengefisiensikan multikelas klasifikasi. Dewasa ini SVM telah berhasil diaplikasikan dalam problem dunia
nyata (real-world problems) khususnya secara multi-kelas, dan secara umum
memberikan solusi yang lebih baik dibandingkan metode konvensional seperti misalnya
artificial neural network. Skripsi ini bermaksud menggunakan SVM sebagai classifier di
dalam pengenalan karakter tulis tangan dikarenakan SVM menjanjikan akurasi yang
lebih baik daripada classifier – classifier lainnya.
1.2 Ruang Lingkup
Ruang lingkup dibatasi pada:
1. Pada Handwriting Recognition ini kelas yang diklasifikasi adalah karakter huruf
dari a – z termasuk A – Z dan angka 0 – 9. Huruf yang akan dikenali adalah
huruf alphabet dari huruf ‘a’ sampai dengan huruf ‘z’ yaitu huruf alfabet kecil
dan ‘A’ sampai dengan huruf ‘Z’ yaitu huruf alfabet besar.
2. Data file gambar dalam komputer yang dapat dibaca dibatasi pada file dengan
extension “jpg” dan “bmp”.
3. Proses dalam aplikasi terdiri dari Training (Pelatihan), Validating (Validasi) dan
Recognizing (Pengenalan).
4. Output dari aplikasi adalah sebuah text file yang berisi karakter – karakter dari
hasil pengenalan SVM.
5. Antar huruf atau karakter diberikan jarak / spaces.
1.3 Tujuan dan manfaat
Penelitian ini dibuat dengan tujuan untuk melakukan eksplorasi SVM dalam
kegunaannya sebagai classifier. Eksplorasi dilakukan dengan mencoba kemungkinan
3
SVM digunakan sebagai classifier di dalam pengenalan karakter tulis tangan untuk
mencapai target akurasi yang baik, dan juga membandingkan dengan classifier lain.
Manfaat Tugas akhir ini dibuat :
• Menyediakan pengetahuan dasar teknik klasifikasi dan pengenalan pola dengan
SVM.
• Menyediakan pengetahuan klasifikasi multikelas dengan SVM.
• Sebagai referensi dan pustaka bagi penelitian yang melibatkan Multi Kelas
Support Vector Machine dan OCR.
1.4 Metodologi
Metode yang digunakan dalam penelitian ini antara lain :
a. Analisis masalah dan Studi literatur
Analisis masalah yang ada adalah pengklasifikasi data yang multikelas
klasifikasi untuk mengenali dan mengambil data dalam kelas yang banyak.
Studi literatur yang dilakukan adalah studi literatur tentang:
-
Metode – metode klasifikasi yang ada.
-
Teknik pengenalan dan pembacaan huruf.
-
Penggunaan SVM pada Visual C#.
b. Pembuatan kategori / kelas data
Kategori / kelas yang akan digunakan program untuk mempelajari variasi
huruf yang ada. Ada 62 kelas, yaitu terdiri dari 26 kelas yang berisi huruf a – z,
10 kelas yang berisi angka 0 – 9, dan 26 kelas yang berisi huruf besar A – Z.
c. Pengambilan sampel tulisan tangan
Pada tahap ini, dilakukan pengambilan sampel berbagai macam variasi
tulisan tangan. Sampel ini nantinya akan digunakan sebagai referensi dalam
proses pengenalan huruf. Dengan adanya variasi, tulisan tangan ini dapat
4
memberikan pemahaman yang lebih mendalam pada program untuk mengenali
suatu huruf.
d. Perencanaan dan pembuatan perangkat lunak
Untuk menghasilkan program aplikasi yang baik maka digunakan
perencanaan yang matang tentang sistem yang akan digunakan. Pembuatan
perangkat lunak akan dilakukan dengan menggunakan Microsoft Visual C#
2008.
e. Evaluasi dari pengujian perangkat lunak
Dilakukan pengujian terhadap program aplikasi yang telah dibuat.
Pengujian dilakukan untuk mengetahui tingkat akurasi dan pembacaan tulisan
tangan pada form yang disediakan.
1.5 Sistematika Penulisan
Untuk memberikan gambaran yang lebih jelas mengenai isi dari penelitian ini,
penulisan ini akan dibagi menjadi lima bab dengan sistematika sebagai berikut:
BAB I
PENDAHULUAN
Bab ini membahas awal penelitian ini dibuat, yaitu: latar belakang masalah,
ruang lingkup masalah, tujuan dan manfaat penelitian, metode penelitian, serta
sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini membahas teori-teori dasar yang digunakan dalam penelitian maupun
penulisan penelitian ini, antara lain teori mengenai Multi Class Support Vector
Machine, teori mengenai Support Vector Machines, LibSVM, dan teori kernel.
BAB III ANALISIS DAN PERANCANGAN SISTEM
Bab ini membahas secara umum perancangan program yang dibuat, meliputi
rancangan layar, dan modul-modul yang terkait. Di dalam bab ini terbagi menjadi
5
dua bagian besar, yaitu: Analisa dan Perancangan. Analisa berisi mengenai
permasalahan yang akan dibahas serta sejumlah alternatif pemecahan yang
diusulkan. Perancangan meliputi proses pengolahan karakter tulisan tangan serta
proses kerja pengenalan karakter. Pembuatan sistem pengenal karakter tulisan
tangan menggunakan Visual C# 2008 dengan tambahan pustaka LibSVM.
BAB IV IMPLEMENTASI DAN EVALUASI
Bab ini akan memberikan hasil implementasi dan evaluasi dari penelitian yang
telah dilakukan. Serta perbandingan dengan metode klasifikasi yang lain dengan
memperlihatkan perbedaan akurasi dan repeatability yang akan dicapai dengan
menggunakan dua metode yang dibandingkan, yaitu Support Vector Machine dan
Neural Network.
BAB V KESIMPULAN DAN SARAN
Bab ini merupakan bab terakhir dari seluruh rangkaian bab yang ada di
laporan skripsi ini, dalam bab ini akan dimuat kesimpulan dari hasil bahasan seluruh
bab serta saran-saran yang dapat bermanfaat dalam pengembangan selanjutnya. Bab
ini diharapkan akan memberikan pemahaman yang lebih mengenai Support Vector
Machine kepada para pembaca serta meningkatkan minat mereka untuk melakukan
penelitian lebih lanjut mengenai piranti pembacaan tulisan tangan dalam
pengoperasiannya.
Download