Pengenalan iris mata dengan algoritme voting feature interval versi

advertisement
PENDAHULUAN
Latar Belakang
Dalam beberapa tahun terakhir, identifikasi
seseorang
berdasarkan
biometrik
telah
berkembang dengan pesat di kalangan
akademik dan industri. Metode pengenalan
identitas seseorang yang banyak digunakan di
antaranya berdasarkan nomor identitas unik
(kunci fisik, kartu identitas dan lainnya) atau
berdasarkan ingatan terhadap sesuatu (sandi
rahasia dan lainnya). Metode tersebut banyak
memiliki kekurangan di antaranya adalah kartu
identitas dapat hilang dan sandi dapat lupa dari
ingatan seseorang. Ada dua jenis biometrik di
antaranya adalah physiological (iris mata, wajah
dan sidik jari) dan behavioural (suara dan
tulisan tangan) (Yong et al. 2000).
Pengenalan iris mata adalah jenis biometrik
berdasarkan fitur physiological. Iris memiliki
tekstur yang unik dan cukup kompleks untuk
digunakan dalam biometrik. Dibandingkan
dengan metode biometrik lain seperti
pengenalan wajah, pola iris lebih stabil dan
dapat diandalkan. Iris mata seseorang juga
memiliki pola yang konsisten, tidak seperti
wajah yang relatif memiliki perubahan seiring
dengan bertambah waktu.
Penelitian mengenai pengenalan iris mata
telah dilakukan oleh Daugman (2002) yang
menggunakan Gabor Wavelets dua dimensi
pada ekstrasi ciri serta Hamming distances
sebagai algoritme pengujian. Masek (2003)
melakukan
penelitian
serupa
dengan
menggunakan data dari Chinese Academy of
Science-Institute of Automation (CASIA) dan
Lion’s Eye Institute (LEI). Selain itu, penelitian
Abidin (2011) menggunakan jaringan syaraf
tiruan sebagai algoritme pelatihan dan
pengujian terhadap data CASIA dan
menggunakan dekomposisi wavelet sebagai
ekstraksi ciri.
Sistem pengenalan pola yang dikembangkan
dalam penelitian ini terdiri atas empat tahap.
Tahap pertama adalah proses segmentasi citra
untuk mengambil citra iris mata saja lalu
membuang bagian citra yang lainnya. Pada
tahap kedua, proses normalisasi dilakukan
dengan mengubah dimensi citra iris menjadi
tetap seningga menghasilkan ekstraksi ciri yang
lebih baik. Tahap selanjutnya adalah melakukan
ekstraksi ciri terhadap citra yang sudah
ternormalisasi sehingga dihasilkan template
yang memiliki nilai biner dan dilanjutkan ke
tahap terakhir yaitu melakukan pelatihan serta
pengujian terhadap template tersebut. Pelatihan
dan pengujian template citra dilakukan pada
tiga subset yang berbeda, untuk kemudian
dilakukan perhitungan terhadap akurasinya
menggunakan
3-fold
cross
validation.
Penggunaan algoritme Voting Feature Intervals
versi ke-5 (VFI5) pada penelitian ini diharapkan
dapat memberikan pengetahuan tingkat akurasi
yang diberikan untuk kemudian dapat
dibandingkan dengan hasil penelitian lainnya.
Tujuan
Tujuan dari penelitian ini adalah untuk
mengetahui akurasi dari proses pengenalan citra
iris mata menggunakan algoritme VFI5 pada
citra mata kiri, kanan dan gabungan keduanya.
Ruang Lingkup
Penelitian ini memiliki batasan yaitu :
data yang digunakan adalah data citra
mata dari sepuluh orang berbeda yang
berasal dari CASIA,
bobot yang digunakan dalam pelatihan
algoritme VFI5 adalah 1.
Manfaat
Manfaat dari penelitian ini diharapkan dapat
memberikan informasi mengenai akurasi
algoritme klasifikasi VFI5 terhadap pengenalan
iris mata kiri, kanan dan gabungan vote
keduanya dari individu yang berbeda.
TINJAUAN PUSTAKA
Representasi Citra Digital
Citra didefinisikan sebagai suatu fungsi dua
dimensi f(x,y), dengan x dan y merupakan
koordinat spasial, dan f disebut sebagai
kuantitas bilangan skalar positif yang memiliki
maksud secara fisik ditentukan oleh sumber
citra. Suatu citra digital yang diasumsikan
dengan fungsi f(x,y) direpresentasikan dalam
suatu fungsi koordinat berukuran M x N.
Variabel M adalah Baris dan N adalah kolom
sebagaimana ditunjukkan pada Gambar 1.
Setiap elemen dari array matriks disebut image
element, picture element, pixel, atau pel
(Gonzales dan Woods 2002).
Gambar 1 Fungsi koordinat sebagai representasi
citra digital.
1
Iris Mata
Iris mata adalah salah satu organ bagian
dalam mata yang terletak di belakang kornea
dan di depan lensa. Fungsi yang paling penting
dari iris mata adalah mengatur ukuran pupil. Iris
dibagi ke dalam dua wilayah: wilayah dalam
yang dekat dengan pupil dan wilayah luar yang
dekat dengan sclera. Daerah yang terdekat
dengan pupil disebut collarette. Collarette
terdapat antara 20-30 piksel pada citra
berukuran 280 x 320 piksel (Shah & Ross
2006).
Iris mata mulai terbentuk saat bulan ketiga
bayi di dalam kandungan dan strukturnya mulai
membentuk pola saat usia kandungan mencapai
delapan bulan, walaupun perkembangan pigmen
mata dapat terus berlanjut hingga usia satu
tahun setelah kelahiran (Kronfeld 1962, diacu
dalam Daugman 2002). Warna iris ditentukan
terutama oleh kepadatan pigmen melanin pada
lapisan luar dan stroma. Sebagai contoh warna
iris yang biru dihasilkan oleh ketiadaan pigmen
melanin sehingga cahaya yang memiliki
panjang gelombang besar dapat menembus
sedangkan panjang gelombang kecil diuraikan
oleh stroma (Chedekel 1995, diacu dalam
Daugman 2002). Gambar anatomi mata
manusia dapat dilihat pada Gambar 2.
kelas suatu permasalahan yang ditemukan
(Güvenir et al. 1998).
Kebutuhan yang paling penting dalam
membentuk suatu sistem klasifikasi adalah
akurasi prediksinya. Selain itu, lamanya waktu
yang dibutuhkan selama proses pelatihan dan
prediksi idealnya adalah pendek. Ketahanan
sistem terhadap noise serta penanggulangan
terhadap missing value juga harus diperhatikan
dalam membangun sistem tersebut (Güvenir et
al. 1998).
Daugman’s Rubber Sheet Model
Rubber sheet model bertujuan untuk
melakukan normalisasi daerah collarette iris
mata. Rubber sheet model disusun oleh
Daugman dengan konsep setiap titik pada
koordinat wilayah collarette akan dipetakan
kembali ke dalam koordinat baru dengan
dimensi r × θ dimana adalah r resolusi radial
dan θ adalah resolusi angular. Ilustrasi
pemetaan kembali ke dalam koordinat polar
dapat dilihat pada Gambar 3.
θ
0
r 1
x
y
Gambar 3
Ilustrasi Daugman’s rubber sheet
model.
Persaman pemetaan wilayah iris dari
koordinat koordinat polar (
) ke koordinat
kartesian (x, y) adalah sebagai berikut:
(1)
(2)
Gambar 2 Anatomi mata manusia.
Segmentasi
Segmentasi adalah pembagian citra menjadi
beberapa wilayah atau objek. Tingkat
pembagian wilayah tergantung kepada masalah
yang akan diselesaikan, yaitu ketika objek yang
dicari telah berhasil dikenali dan diisolasi
(Gonzales et al. 2003)
Klasifikasi
Algoritme klasifikasi terdiri atas dua
komponen yaitu pelatihan dan prediksi. Pada
tahap pelatihan, dilakukan proses pembentukan
model suatu permasalahan yang berasal dari
data kejadian sebelumnya. Model tersebut
kemudian digunakan untuk memprediksi jenis
dengan dan adalah representasi koordinat
kartesian dari koordinat polar. Variabel r adalah
panjang sumbu polar dan adalah sudut polar.
Rubber
sheet
model
memperhitungkan
pelebaran pupil dan ketidakkonsistenan ukuran
pupil untuk menghasilkan sebuah hasil
normalisasi dengan dimensi yang konstan
(Masek 2003).
Discrete Fourier Transform
Fourier
transform
digunakan
untuk
menganalisis citra pada domain frekuensi.
Dengan transformasi ini, intensitas piksel pada
citra diperlakukan sebagai fungsi yang memiliki
nilai amplitudo pada frekuensi tertentu. Fourier
transform memberikan freksibilitas dalam
desain dan implementasi pada banyak bidang
seperti image enhancement, image restoration
2
dan image compression (Gonzales et al. 2003).
Ketika Fourier transform digunakan pada
sinyal yang diskret, maka digunakan discrete
Fourier transform. Rumus dari DFT satu
dimensi adalah:
(3)
dan inverse-nya adalah:
(4)
dengan
adalah Fourier spectrum,
adalah nilai piksel citra dan N adalah ukuran
dari data yang akan ditransformasikan.
Fast Fourier transform (FFT) adalah
algoritme DFT yang memiliki kompleksitas
lebih baik. DFT biasa akan memiliki
kompleksitas sebesar
sedangkan FFT
memiliki kompleksitas sebesar
.
Log-Gabor Filter
Gabor filter banyak digunakan untuk
karakterisasi tekstur dari suatu citra (Mancas
dan
Gosselin
2006) dengan
mencari
representasi gabungan optimal dari sinyal pada
domain spasial dan frekuensi. Dengan
menggunakan Gabor filter, lokalisasi gabungan
dibentuk baik pada domain spasial maupun
frekuensi.
Kelemahan dari Gabor filter adalah pada
even symmetric filter yang memiliki komponen
DC ketika bobotnya melebihi satu oktav (Field
1987, diacu dalam Masek 2003). Komponen
DC adalah nilai hasil transformasi pada domain
frekuensi awal (Gonzales et al. 2003). Namun,
komponen DC yang bernilai nol dapat diperoleh
pada bobot berapapun jika menggunakan skala
logaritmik pada Gabor filter yang disebut
dengan log-Gabor filter. Respon frekuensi pada
log-Gabor filter memiliki rumus:
(5)
dengan adalah nilai frekuensi,
adalah pusat
frekuensi dan adalah bobot filter.
K-Fold Cross Validation
Cross-validation adalah teknik komputasi
menggunakan seluruh contoh sebagai data
pelatihan dan data tes secara berulang kali
sebanyak K kali menggunakan data tes
sebanyak 1/K bagian data keseluruhan (Stone
1974, diacu dalam Bengio dan Grandvalet
2003). Untuk setiap pengulangan, digunakan
kombinasi data latih dan data tes yang berbeda
dengan pengulangan sebelumnya namun dengan
jumlah data yang sama.
Voting Feature Intervals versi 5
Voting Feature Intervals (VFI) adalah
algoritme klasifikasi non-incremental dan
supervised yang dikembangkan oleh Demiroz
dan Güvenir (1997). Algoritme tersebut
digolongkan sebagai non-incremental karena
semua instance pelatihan diproses secara
bersama-sama. Di sisi lain, supervised
digolongkan terhadap algoritme ini karena
memiliki target output yang diinginkan yaitu
berupa kelas-kelas. Algoritme VFI telah
dikembangkan hingga versi ke-5 yang biasa
disingkat menjadi VFI5.
Algoritme VFI5 memiliki dua fase, yaitu
fase pelatihan dan fase tes (Güvenir et al. 1998).
1. Pelatihan
Pada fase pelatihan, dilakukan pencarian
terhadap nilai EndPoints dari fitur f di setiap
kelas c, yaitu berupa nilai maksimum dan
minimum tiap kelas pada masing-masing fitur
sehingga setiap kelas memiliki dua nilai
EndPoints. Nilai EndPoints kemudian disimpan
dalam bentuk array EndPoints[ f ] dan
dilakukan sorting. Jika nilai fitur berupa linear,
maka point intervals dibuat pada setiap nilai
EndPoints sedangkan range intervals dibuat di
antara nilai-nilai EndPoints dan tidak termasuk
nilai EndPoints itu sendiri. Di sisi lain, jika fitur
berupa nilai nominal, maka cukup point
intervals saja yang dibuat.
Setelah
interval
terbentuk,
langkah
selanjutnya
adalah
menghitung
jumlah
instances pelatihan i pada setiap kelas c dengan
fitur f yang jatuh pada setiap interval yang
bersangkutan yang direpresentasikan oleh
interval_count[f, i, c]. Perhitungan terhadap
setiap kelas c pada setiap interval i pada
dimensi fitur f dilakukan pada prosedur
count_instance. Jika interval i merupakan point
interval dan nilai ef sama dengan nilai pada
batas bawah atau batas atas maka jumlah kelas
instance tersebut (ef) pada interval i ditambah 1.
Jika interval i merupakan range interval dan
nilai ef jatuh pada interval tersebut, maka
jumlah kelas instance ef pada interval i
ditambah 1.
Jumlah vote kelas c untuk feature f pada
interval i dibagi dengan jumlah instance pada
kelas c (class_count[c]) untuk menghilangkan
perbedaan distribusi setiap kelas. Hasil
normalisasi direpresentasikan dalam interval_
vote [f, i, c]. Nilai-nilai pada interval_ vote [f, i,
3
c] dinormalisasi sehingga jumlah vote dari
beberapa kelas pada setiap feature yang sama
adalah 1. Normalisasi ini bertujuan agar setiap
fitur memiliki kekuatan voting yang sama pada
proses klasifikasi yang tidak dipengaruhi
ukuranya. untuk tahap pelatihan algoritme VFI5
dapat dilihat pada Gambar 4.
classify(e); /*example to be classified */
begin
for each class c
vote[c] = 0
for each feature f
for each class c
feature_vote[f, c] = 0; /*vote feature f for
class c */
train(TrainingSet);
begin
for each feature f
for each class c
EndPoints[f] = EndPoints [f]
find_end_Points [TrainingSet, f, c];
sort(EndPoints[f])
if f is linear
for each end point p in EndPoints[f]
form a point interval from end point p
form a range interval between p and the
next endpoint p
else /* f is nominal */
each distinct point in EndPoints[f] forms a
point interval
for each interval i on feature dimension f
for each class c
interval_count [f, i, c] = 0;
count_instances(f, TrainingSet)
for each interval i on feature dimension f
for each class c
interval _vote[f, I, c]=interval_count[f, i,
c]/class_count[c]
normalize interval_vote[f, i, c];
if ef value is known
i = find_interval(f, ef)
for each class c
feature_vote[f, c] = interval_vote[f, i, c]
vote[c] = vote[c]+ feature_vote[f, c]*weight[f]
return the class c with highest vote[c];
end.
Gambar 5 Pseudocode klasifikasi VFI5.
METODE PENELITIAN
Penelitian ini melalui beberapa tahapan
proses untuk dapat mengenali iris mata setiap
individu menggunakan algoritme VFI5.
Tahapan proses tersebut dapat dilihat pada
Gambar 6.
end.
Gambar 4 Pseudocode pelatihan VFI5.
2. Klasifikasi
Tahap klasifikasi dimulai dengan inisiasi
nilai vote setiap kelas menjadi 0. Nilai vote
yaitu array yang menampung informasi nilai
interval_vote tiap kelas c dari fitur f di interval i
dimana nilai ef jatuh. Jika ef tidak diketahui,
maka feature tersebut tidak disertakan dalam
voting (memberi nilai vote 0 untuk masingmasing kelas).
Jika nilai ef diketahui, dilakukan pencarian
untuk setiap fitur f berupa nilai interval i di
mana ef jatuh. Lalu nilai setiap kelas c dari fitur
f yang direpresentasikan dengan feature_vote[f,
c] dicari. Nilai tersebut didapat dengan melihat
nilai dari interval_vote tempat i jatuh. Hasil
dari nilai feature_vote kemudian ditambahkan
untuk kemudian menjadi nilai vote untuk setiap
kelas c. Nilai vote dari kelas c menunjukkan
bahwa contoh e termasuk kedalam kelas c.
Pseudocode dari tahap klasifikasi dapat dilihat
pada Gambar 5.
Gambar 6 Tahapan pengenalan iris mata.
Data
Data yang digunakan dalam penelitian ini
berasal dari Chinese Academy of Sciences
Institute of Automation (CASIA) versi 3. Tiap
citra berdimensi 280×320 piksel dengan format
JPEG skala keabuan 8 bit. Ada tiga subset data
yang diberi label interval, lamp, dan twins. Data
twins memuat data anak kembar yang diambil
di luar ruangan (outdoor) sedangkan data
4
Download