PENDAHULUAN Latar Belakang Dalam beberapa tahun terakhir, identifikasi seseorang berdasarkan biometrik telah berkembang dengan pesat di kalangan akademik dan industri. Metode pengenalan identitas seseorang yang banyak digunakan di antaranya berdasarkan nomor identitas unik (kunci fisik, kartu identitas dan lainnya) atau berdasarkan ingatan terhadap sesuatu (sandi rahasia dan lainnya). Metode tersebut banyak memiliki kekurangan di antaranya adalah kartu identitas dapat hilang dan sandi dapat lupa dari ingatan seseorang. Ada dua jenis biometrik di antaranya adalah physiological (iris mata, wajah dan sidik jari) dan behavioural (suara dan tulisan tangan) (Yong et al. 2000). Pengenalan iris mata adalah jenis biometrik berdasarkan fitur physiological. Iris memiliki tekstur yang unik dan cukup kompleks untuk digunakan dalam biometrik. Dibandingkan dengan metode biometrik lain seperti pengenalan wajah, pola iris lebih stabil dan dapat diandalkan. Iris mata seseorang juga memiliki pola yang konsisten, tidak seperti wajah yang relatif memiliki perubahan seiring dengan bertambah waktu. Penelitian mengenai pengenalan iris mata telah dilakukan oleh Daugman (2002) yang menggunakan Gabor Wavelets dua dimensi pada ekstrasi ciri serta Hamming distances sebagai algoritme pengujian. Masek (2003) melakukan penelitian serupa dengan menggunakan data dari Chinese Academy of Science-Institute of Automation (CASIA) dan Lion’s Eye Institute (LEI). Selain itu, penelitian Abidin (2011) menggunakan jaringan syaraf tiruan sebagai algoritme pelatihan dan pengujian terhadap data CASIA dan menggunakan dekomposisi wavelet sebagai ekstraksi ciri. Sistem pengenalan pola yang dikembangkan dalam penelitian ini terdiri atas empat tahap. Tahap pertama adalah proses segmentasi citra untuk mengambil citra iris mata saja lalu membuang bagian citra yang lainnya. Pada tahap kedua, proses normalisasi dilakukan dengan mengubah dimensi citra iris menjadi tetap seningga menghasilkan ekstraksi ciri yang lebih baik. Tahap selanjutnya adalah melakukan ekstraksi ciri terhadap citra yang sudah ternormalisasi sehingga dihasilkan template yang memiliki nilai biner dan dilanjutkan ke tahap terakhir yaitu melakukan pelatihan serta pengujian terhadap template tersebut. Pelatihan dan pengujian template citra dilakukan pada tiga subset yang berbeda, untuk kemudian dilakukan perhitungan terhadap akurasinya menggunakan 3-fold cross validation. Penggunaan algoritme Voting Feature Intervals versi ke-5 (VFI5) pada penelitian ini diharapkan dapat memberikan pengetahuan tingkat akurasi yang diberikan untuk kemudian dapat dibandingkan dengan hasil penelitian lainnya. Tujuan Tujuan dari penelitian ini adalah untuk mengetahui akurasi dari proses pengenalan citra iris mata menggunakan algoritme VFI5 pada citra mata kiri, kanan dan gabungan keduanya. Ruang Lingkup Penelitian ini memiliki batasan yaitu : data yang digunakan adalah data citra mata dari sepuluh orang berbeda yang berasal dari CASIA, bobot yang digunakan dalam pelatihan algoritme VFI5 adalah 1. Manfaat Manfaat dari penelitian ini diharapkan dapat memberikan informasi mengenai akurasi algoritme klasifikasi VFI5 terhadap pengenalan iris mata kiri, kanan dan gabungan vote keduanya dari individu yang berbeda. TINJAUAN PUSTAKA Representasi Citra Digital Citra didefinisikan sebagai suatu fungsi dua dimensi f(x,y), dengan x dan y merupakan koordinat spasial, dan f disebut sebagai kuantitas bilangan skalar positif yang memiliki maksud secara fisik ditentukan oleh sumber citra. Suatu citra digital yang diasumsikan dengan fungsi f(x,y) direpresentasikan dalam suatu fungsi koordinat berukuran M x N. Variabel M adalah Baris dan N adalah kolom sebagaimana ditunjukkan pada Gambar 1. Setiap elemen dari array matriks disebut image element, picture element, pixel, atau pel (Gonzales dan Woods 2002). Gambar 1 Fungsi koordinat sebagai representasi citra digital. 1 Iris Mata Iris mata adalah salah satu organ bagian dalam mata yang terletak di belakang kornea dan di depan lensa. Fungsi yang paling penting dari iris mata adalah mengatur ukuran pupil. Iris dibagi ke dalam dua wilayah: wilayah dalam yang dekat dengan pupil dan wilayah luar yang dekat dengan sclera. Daerah yang terdekat dengan pupil disebut collarette. Collarette terdapat antara 20-30 piksel pada citra berukuran 280 x 320 piksel (Shah & Ross 2006). Iris mata mulai terbentuk saat bulan ketiga bayi di dalam kandungan dan strukturnya mulai membentuk pola saat usia kandungan mencapai delapan bulan, walaupun perkembangan pigmen mata dapat terus berlanjut hingga usia satu tahun setelah kelahiran (Kronfeld 1962, diacu dalam Daugman 2002). Warna iris ditentukan terutama oleh kepadatan pigmen melanin pada lapisan luar dan stroma. Sebagai contoh warna iris yang biru dihasilkan oleh ketiadaan pigmen melanin sehingga cahaya yang memiliki panjang gelombang besar dapat menembus sedangkan panjang gelombang kecil diuraikan oleh stroma (Chedekel 1995, diacu dalam Daugman 2002). Gambar anatomi mata manusia dapat dilihat pada Gambar 2. kelas suatu permasalahan yang ditemukan (Güvenir et al. 1998). Kebutuhan yang paling penting dalam membentuk suatu sistem klasifikasi adalah akurasi prediksinya. Selain itu, lamanya waktu yang dibutuhkan selama proses pelatihan dan prediksi idealnya adalah pendek. Ketahanan sistem terhadap noise serta penanggulangan terhadap missing value juga harus diperhatikan dalam membangun sistem tersebut (Güvenir et al. 1998). Daugman’s Rubber Sheet Model Rubber sheet model bertujuan untuk melakukan normalisasi daerah collarette iris mata. Rubber sheet model disusun oleh Daugman dengan konsep setiap titik pada koordinat wilayah collarette akan dipetakan kembali ke dalam koordinat baru dengan dimensi r × θ dimana adalah r resolusi radial dan θ adalah resolusi angular. Ilustrasi pemetaan kembali ke dalam koordinat polar dapat dilihat pada Gambar 3. θ 0 r 1 x y Gambar 3 Ilustrasi Daugman’s rubber sheet model. Persaman pemetaan wilayah iris dari koordinat koordinat polar ( ) ke koordinat kartesian (x, y) adalah sebagai berikut: (1) (2) Gambar 2 Anatomi mata manusia. Segmentasi Segmentasi adalah pembagian citra menjadi beberapa wilayah atau objek. Tingkat pembagian wilayah tergantung kepada masalah yang akan diselesaikan, yaitu ketika objek yang dicari telah berhasil dikenali dan diisolasi (Gonzales et al. 2003) Klasifikasi Algoritme klasifikasi terdiri atas dua komponen yaitu pelatihan dan prediksi. Pada tahap pelatihan, dilakukan proses pembentukan model suatu permasalahan yang berasal dari data kejadian sebelumnya. Model tersebut kemudian digunakan untuk memprediksi jenis dengan dan adalah representasi koordinat kartesian dari koordinat polar. Variabel r adalah panjang sumbu polar dan adalah sudut polar. Rubber sheet model memperhitungkan pelebaran pupil dan ketidakkonsistenan ukuran pupil untuk menghasilkan sebuah hasil normalisasi dengan dimensi yang konstan (Masek 2003). Discrete Fourier Transform Fourier transform digunakan untuk menganalisis citra pada domain frekuensi. Dengan transformasi ini, intensitas piksel pada citra diperlakukan sebagai fungsi yang memiliki nilai amplitudo pada frekuensi tertentu. Fourier transform memberikan freksibilitas dalam desain dan implementasi pada banyak bidang seperti image enhancement, image restoration 2 dan image compression (Gonzales et al. 2003). Ketika Fourier transform digunakan pada sinyal yang diskret, maka digunakan discrete Fourier transform. Rumus dari DFT satu dimensi adalah: (3) dan inverse-nya adalah: (4) dengan adalah Fourier spectrum, adalah nilai piksel citra dan N adalah ukuran dari data yang akan ditransformasikan. Fast Fourier transform (FFT) adalah algoritme DFT yang memiliki kompleksitas lebih baik. DFT biasa akan memiliki kompleksitas sebesar sedangkan FFT memiliki kompleksitas sebesar . Log-Gabor Filter Gabor filter banyak digunakan untuk karakterisasi tekstur dari suatu citra (Mancas dan Gosselin 2006) dengan mencari representasi gabungan optimal dari sinyal pada domain spasial dan frekuensi. Dengan menggunakan Gabor filter, lokalisasi gabungan dibentuk baik pada domain spasial maupun frekuensi. Kelemahan dari Gabor filter adalah pada even symmetric filter yang memiliki komponen DC ketika bobotnya melebihi satu oktav (Field 1987, diacu dalam Masek 2003). Komponen DC adalah nilai hasil transformasi pada domain frekuensi awal (Gonzales et al. 2003). Namun, komponen DC yang bernilai nol dapat diperoleh pada bobot berapapun jika menggunakan skala logaritmik pada Gabor filter yang disebut dengan log-Gabor filter. Respon frekuensi pada log-Gabor filter memiliki rumus: (5) dengan adalah nilai frekuensi, adalah pusat frekuensi dan adalah bobot filter. K-Fold Cross Validation Cross-validation adalah teknik komputasi menggunakan seluruh contoh sebagai data pelatihan dan data tes secara berulang kali sebanyak K kali menggunakan data tes sebanyak 1/K bagian data keseluruhan (Stone 1974, diacu dalam Bengio dan Grandvalet 2003). Untuk setiap pengulangan, digunakan kombinasi data latih dan data tes yang berbeda dengan pengulangan sebelumnya namun dengan jumlah data yang sama. Voting Feature Intervals versi 5 Voting Feature Intervals (VFI) adalah algoritme klasifikasi non-incremental dan supervised yang dikembangkan oleh Demiroz dan Güvenir (1997). Algoritme tersebut digolongkan sebagai non-incremental karena semua instance pelatihan diproses secara bersama-sama. Di sisi lain, supervised digolongkan terhadap algoritme ini karena memiliki target output yang diinginkan yaitu berupa kelas-kelas. Algoritme VFI telah dikembangkan hingga versi ke-5 yang biasa disingkat menjadi VFI5. Algoritme VFI5 memiliki dua fase, yaitu fase pelatihan dan fase tes (Güvenir et al. 1998). 1. Pelatihan Pada fase pelatihan, dilakukan pencarian terhadap nilai EndPoints dari fitur f di setiap kelas c, yaitu berupa nilai maksimum dan minimum tiap kelas pada masing-masing fitur sehingga setiap kelas memiliki dua nilai EndPoints. Nilai EndPoints kemudian disimpan dalam bentuk array EndPoints[ f ] dan dilakukan sorting. Jika nilai fitur berupa linear, maka point intervals dibuat pada setiap nilai EndPoints sedangkan range intervals dibuat di antara nilai-nilai EndPoints dan tidak termasuk nilai EndPoints itu sendiri. Di sisi lain, jika fitur berupa nilai nominal, maka cukup point intervals saja yang dibuat. Setelah interval terbentuk, langkah selanjutnya adalah menghitung jumlah instances pelatihan i pada setiap kelas c dengan fitur f yang jatuh pada setiap interval yang bersangkutan yang direpresentasikan oleh interval_count[f, i, c]. Perhitungan terhadap setiap kelas c pada setiap interval i pada dimensi fitur f dilakukan pada prosedur count_instance. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada batas bawah atau batas atas maka jumlah kelas instance tersebut (ef) pada interval i ditambah 1. Jika interval i merupakan range interval dan nilai ef jatuh pada interval tersebut, maka jumlah kelas instance ef pada interval i ditambah 1. Jumlah vote kelas c untuk feature f pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi setiap kelas. Hasil normalisasi direpresentasikan dalam interval_ vote [f, i, c]. Nilai-nilai pada interval_ vote [f, i, 3 c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature yang sama adalah 1. Normalisasi ini bertujuan agar setiap fitur memiliki kekuatan voting yang sama pada proses klasifikasi yang tidak dipengaruhi ukuranya. untuk tahap pelatihan algoritme VFI5 dapat dilihat pada Gambar 4. classify(e); /*example to be classified */ begin for each class c vote[c] = 0 for each feature f for each class c feature_vote[f, c] = 0; /*vote feature f for class c */ train(TrainingSet); begin for each feature f for each class c EndPoints[f] = EndPoints [f] find_end_Points [TrainingSet, f, c]; sort(EndPoints[f]) if f is linear for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and the next endpoint p else /* f is nominal */ each distinct point in EndPoints[f] forms a point interval for each interval i on feature dimension f for each class c interval_count [f, i, c] = 0; count_instances(f, TrainingSet) for each interval i on feature dimension f for each class c interval _vote[f, I, c]=interval_count[f, i, c]/class_count[c] normalize interval_vote[f, i, c]; if ef value is known i = find_interval(f, ef) for each class c feature_vote[f, c] = interval_vote[f, i, c] vote[c] = vote[c]+ feature_vote[f, c]*weight[f] return the class c with highest vote[c]; end. Gambar 5 Pseudocode klasifikasi VFI5. METODE PENELITIAN Penelitian ini melalui beberapa tahapan proses untuk dapat mengenali iris mata setiap individu menggunakan algoritme VFI5. Tahapan proses tersebut dapat dilihat pada Gambar 6. end. Gambar 4 Pseudocode pelatihan VFI5. 2. Klasifikasi Tahap klasifikasi dimulai dengan inisiasi nilai vote setiap kelas menjadi 0. Nilai vote yaitu array yang menampung informasi nilai interval_vote tiap kelas c dari fitur f di interval i dimana nilai ef jatuh. Jika ef tidak diketahui, maka feature tersebut tidak disertakan dalam voting (memberi nilai vote 0 untuk masingmasing kelas). Jika nilai ef diketahui, dilakukan pencarian untuk setiap fitur f berupa nilai interval i di mana ef jatuh. Lalu nilai setiap kelas c dari fitur f yang direpresentasikan dengan feature_vote[f, c] dicari. Nilai tersebut didapat dengan melihat nilai dari interval_vote tempat i jatuh. Hasil dari nilai feature_vote kemudian ditambahkan untuk kemudian menjadi nilai vote untuk setiap kelas c. Nilai vote dari kelas c menunjukkan bahwa contoh e termasuk kedalam kelas c. Pseudocode dari tahap klasifikasi dapat dilihat pada Gambar 5. Gambar 6 Tahapan pengenalan iris mata. Data Data yang digunakan dalam penelitian ini berasal dari Chinese Academy of Sciences Institute of Automation (CASIA) versi 3. Tiap citra berdimensi 280×320 piksel dengan format JPEG skala keabuan 8 bit. Ada tiga subset data yang diberi label interval, lamp, dan twins. Data twins memuat data anak kembar yang diambil di luar ruangan (outdoor) sedangkan data 4