verifikasi wajah menggunakan subspace linear discriminant

advertisement
VERIFIKASI WAJAH MENGGUNAKAN
SUBSPACE LINEAR DISCRIMINANT
ANALYSIS SERTA JARINGAN SARAF TIRUAN
Allegro M.C. Horhoruw, Rieldy J. Leiwakabessy, Gregory
Alexander, Satrio Dewanto
Universitas Bina Nusantara, Jalan Syahdan No. 9, Jakarta, 11480, 021-534 5830
[email protected], [email protected], [email protected], [email protected]
ABSTRAK
Pengenalan wajah manusia secara otomatis oleh mesin masih merupakan masalah yang menantang.
Gangguan ekspresi wajah, orientasi serta pencahayaan memungkinkan terjadinya kesalahan dalam proses
mengenali sehingga terjadi kesalahan verifikasi. Dengan menggunakan gambar wajah yang
merepresentasikan setiap orang, sistem dirancang dengan menggunakan metode Subspace Linear
Discriminant Analysis terlebih dahulu yang sebelumnya telah di proses menggunakan Principal Component
Analysis. Sehingga didapatkan fitur yang mewakilkan gambar wajah tersebut dari Subspace Linear
Discriminat Analysis, yang kemudian diproses menggunakan jaringan saraf tiruan. Dari percobaan dengan
menggunakan variasi node pada hidden layer dan dengan menggunakan multi layer feed forward
backpropagation, didapatkan Arsitektur jaringan saraf tiruan yang paling optimal untuk sistem ini adalah
dengan 1 hidden layer berjumlah 8 node, yang memiliki neuron pada input layer sebanyak 4 dan pada output
layer memiliki 2 neuron. Jaringan tersebut menghasilkan rata-rata persentase keberhasilan verifikasi wajah
adalah 67%, dan rata-rata keberhasilan penolakan verifikasi wajah lain terhadap user yang ada sebesar
87%. Penambahan jumlah user atau orang akan berpengaruh terhadap perhitungan subspace LDA yang
berakibat pada masukan JST.
Kata Kunci: Verifikasi Wajah, Linear Discriminant Analysis, Jaringan Saraf Tiruan
Abstract
Human face recognition automatically by machine still a challenging problem. Facial expression, face
orientation, and illuminations disturbance allow for error in the face recognition process, so that the
verification error. With using face image which represents everyone, a system designed using Subspace
Linear Discriminant Analysis which previously has been process using Principal Component Analysis, thus
obtained feature that represent the face image in subspace LDA, and then processed using artificial neural
network. From the experiment using variety node at the hidden layer and using multi-layer feed forward
backpropagation, we obtained the most optimal architecture of artificial neural network for the system has 1
hidden layer with the number of node is 8, 4 neuron at input layer, and 2 neuron at output layer. That
network produces an average of face verification success by 67%, and an average of face rejection success by
87%. Increasing the number of user will influence the calculation of LDA subspace and the input of ANN.
Keywords: Face Verification, Linear Discriminant Analysis, Artificial Neural Network
Pendahuluan
Latar Belakang
Seorang manusia dapat mengenali manusia lainnya secara cepat, misal manusia bisa mengenali suara
ataupun wajah hanya dengan mendengar suara ataupun melihat wajah dengan sekilas. Bahkan dengan suara
langkah kaki saja seseorang sudah bisa mengenali siapa yang sedang berjalan. Bila kemampuan pengenalan
dari manusia ini diterapkan pada mesin, tentu saja akan banyak aplikasi yang dapat diciptakan. Jawad, Syed,
dan Farrukh (2008) mengatakan bahwa pengenalan manusia secara otomatis merupakan masalah yang
menantang dan telah menjadi banyak perhatian selama beberapa tahun terakhir ini karena banyak
diaplikasikan dalam berbagai bidang, seperti bidang industi, bidang militer, dan keamanan.
Salah satu cara agar mesin mengenali seorang manusia adalah dengan mendapatkan informasi dari
wajah manusia tersebut, dengan informasi wajahnya ini, bisa digunakan untuk berbagai aplikasi, seperti
sistem absensi otomatis. Akan tetapi, pengenalan wajah yang dilakukan oleh mesin tidak semudah yang
dilakukan oleh manusia. Radha (2011) mengatakan bahwa ada beberapa masalah utama yang dapat
mempengaruhi penampilan wajah sehingga menyebabkan gangguan pada mesin dalam mengenali wajah,
seperti penerangan cahaya, ekspresi wajah, dan luka pada wajah. Faktor-faktor gangguan inilah yang menjadi
tantangan untuk dicarikan penyelesaiannya oleh para peneliti, sehingga nantinya bidang penelitian ini akan
terus berkembang dan mesin akan mempunyai kemampuan yang mendekati manusia dalam mengenali wajah
manusia.
Agar sebuah mesin dapat mengambil informasi dari wajah manusia, maka mesin tersebut harus
mempunyai sensor citra sebagai penglihatannya. Salah satu sensor citra yang digunakan pada umumnya
adalah kamera. Dari kamera inilah informasi wajah manusia diubah ke dalam informasi gambar dua dimensi.
Jawad, Syed, dan Farrukh (2008) mengatakan bahwa kualitas dari sebuah gambar yang diambil juga
mempengaruhi mesin untuk mengenali wajah manusia. Akan tetapi bila menggunakan kamera yang
menghasilkan resolusi gambar yang terlalu besar, akan menyebabkan mesin membutuhkan waktu yang lebih
lama untuk mengenali wajah manusia, sehingga dibutuhkan image compression. G.M. Padmaja, P.Nirupama
(2012) mengatakan bahwa image compression merupakan suatu teknik dimana beberapa data dari suatu
gambar diambil, data yang diambil tersebut sudah merepresentasikan gambar aslinya sehingga tetap menjaga
informasi dari gambar tersebut. Hal ini digunakan supaya kecepatan mesin untuk mengenali wajah manusia
lebih cepat dan tingkat keakuratannya tetap terjaga.
Ada banyak metode agar sebuah mesin dapat mengenali wajah manusia dari informasi gambar yang
sudah ada. Namun demikian, dari semua metode yang sudah dilakukan belum dapat mengatasi dengan baik
gangguan yang sudah disebutkan sebelumnya. Mashor, Osman, dan Arshad (2006) mengatakan bahwa saat
ini jaringan syaraf tiruan menjadi pilihan yang populer untuk pengenalan objek dibandingkan dengan metode
pengenalan lainnya. Hal ini karena jaringan syaraf tiruan mempunyai kemampuan untuk tetap melanjutkan
proses sekalipun terdapat masalah pada masukkannya.
Beberapa penelitian sebelumnya seperti A Direct LDA Algorithm for High-Dimensional
Data – with Application to Face Recognition menggunakan algoritma direct LDA dilakukan pada gambar
wajah dari Olivetti-Oracle Research Lab (ORL). Dataset dari ORL terdiri dari 400 gambar wajah tampak
depan, yang merupakan 10 gambar wajah dari 40 individu yang berbeda, dengan variasi pose, pencahayaan,
ekpresi, serta aksesoris. Gambar dari setiap wajah berukuran 92 x 112 pixels, dengan level keabuan dari 0
sampai dengan 255.Percobaan dilakukan dengan memilih secara acak 5 gambar wajah setiap orang untuk
dilatih dan 5 gambar lainnya untuk di-testing. Adapun hasil dari percobaan tersebut diperoleh persentase
pengenalan sebesar 90,8% tanpa ada proses dimentionality reduction. Dengan adanya proses dimensionality
reduction rata-rata pengenalan menjadi 86,6%.
Rumusan Masalah
Fokus dalam penelitian ini adalah sebagai berikut:
1. Bagaimana sistem mampu mengenali wajah yang tersimpan pada data base?
2. Apakah jaringan syaraf tiruan dapat menyelesaikan proses pembelajaran gambar dan dapat
mengenali wajah dengan cepat?
Tujuan
Tujuan penelitian ini antara lain:
1. Mengenali objek berupa wajah manusia dengan orientasi wajah yang berbeda-beda terhadap kamera.
2. Membedakan wajah manusia berdasarkan gambar yang telah dikompresi.
3. Menguji efektifitas pengenalan wajah manusia dengan menggunakan kecerdasan buatan.
4. Mendapatkan system deteksi wajah yang cepat dan akurat.
Metode Penelitian
Rancangan sistem
Pre-Processing
LDA
Learning
Pre-Processing
LDA
Recognizing
Keterangan :
Data Flow
Gambar 1Blok Diagram Learning dan Recognzing
Sistem hanya terdiri dari sebuah PC dan sebuah kamera.Di sini kamera berfungsi sebagai sensor
gambar, yang akan mengambil gambar wajah seseorang yang akan di verifikasi. Kamera tersebut dikontrol
oleh PC, sehingga kamera baru akan mengambil gambar setelah ada instruksi dari PC, kemudian data yang
berupa gambar tersebut akan di kirimkan dari kamera ke PC.
Pada PC terdapat database yang berisikan nama dari pengguna yang sudah terdaftar dan data
biometrik dari wajahnya. Data biometrik wajah masing-masing pengguna terdiri dari berbagai ekspresi
wajahnya. Dalam hal ini kami membatasi ada 10 ekspresi wajah yang di simpan di dalam database. Akan
tetapi informasi biometrik wajah yang di simpan dalam database bukan merupakan gambar wajah yang
sebenarnya pada saat di ambil kamera, melainkan gambar wajah yang sudah dikompresi menggunakan teknik
Linear Discriminant Analysis (LDA) dan Principal Component Analysis (PCA). Hasil dari kompresi tersebut
merupakan representasi gambar dalam bentuk LDA subspace. Database tersebut akan dilatih menggunakan
jaringan syaraf tiruan.
Data dari database digunakan untuk memverifikasi data gambar yang diambil oleh kamera. Ketika
PC memerintahkan kamera untuk mengambil gambar, maka kamera akan mengambil gambar kemudian
mengirimkannya ke PC. Dari sini gambar dari kamera tersebut akan di kompresi dan didapatkan LDA
subspace-nya. LDA subspaceinilah yang akan menjadi masukkan ke dalam jaringan syaraf tiruan, akan
membandingkan LDA subspace dari gambar yang diambl dengan gambar yang ada pada database, sehingga
didapatkan hasil berupa identitas dari seseorang yang melakukan pengambilan gambar wajah tadi.
Linear Discriminant Analysis (LDA)
LDA merupakan algoritma pemrosesan gambar yang bertujuan untuk mengurangi dimensi dari
gambar yang diproses. Pengurangan dimensi gambar tersebut bertujuan untuk mengurangi beban komputasi
dari software yang digunakan, karena semakin besar dimensi gambar maka semakin besar pula beban
komputasi untuk memproses gambar tersebut.
LDA sendiri melihat perbandingan penyebaran data dalam sebuah kelas data, dalam hal ini jumlah
kelas sama dengan jumlah orang yang diambil untuk database, dan penyebaran data antar kelas. Penyebaran
data dalam kelas sendiri diwakili oleh matriks Scatter within Class (SW), yang diperoleh dengan cara
penjumlahan dari peluang kelas ke n dikali dengan matriks kovarian dari kelas tersebut sebanyak jumlah kelas
dari database. Dapat ditulis denganpersamaan sebagai berikut.
SW = ∑ Pn × cov n
n
Dimana covarian dari kelas ke n diperoleh dengan pseudo code sebagai berikut.
For i=1,i<=jumlah image dalam kelas ke n
cov n = (x n,i − µ n ) × (x n,i − µ n )
T
end
Dimana x merupakan matriks gambar pada database yang sudah diubah dimensinya dari 250x250
menjadi 62500x1 dan µn merupakan rata-rata dari kelas ke n, sehingga diperoleh kovarian kelas ke n memiliki
dimensi sebesar M x M, dimana M adalah jumlah pixels yaitu 62500x62500. Juga dapat disimpulkan dimensi
dari matriks Sw juga bernilai 62500x62500.
Setelah diperoleh matriks peyebaran data dalam kelas, dicari pula matriks penyebaran antar kelas
yang diperoleh dengan persamaan berikut.
S b = ∑ (µ n − µ ) × (µ n − µ )
T
n
Dimana µ merupakan rata-rata keseluruhan kelas yang memiliki dimensi 62500 x 1. Matriks Sb
sendiri mempunyai dimensi sebesar M x M dimana M adalah jumlah pixels yaitu 62500x62500.
WLDA =
Sb
Sw
W merupakan matriks berukuran M x M, dimana M merupakan jumlah pixels dari gambar yaitu
62500.
Proses Percobaan
Dalam penelitian ini, dilakukan pengambilan gambar terlebih dahulu dari 5 orang dengan 3 orang sebagai
user dan 2 lainnya sebagai non-user. Masing-maising orang diambil 10 gambar 250x250 piksel grayscale
yang kemudian gambar ini akan diambil subspace LDAnya dan di latih ke jaringan saraf tiruan.
Gambar 2 Tampilan Proses Pengambilan Database
Gambar 3 Contoh Gambar Pada Database
Setelah didapatkan seluruh gambar, seluruh gambar tersebut diproses LDA kemudian didapatkan subspace
LDA yang mewakili gambar tersebut. Kemudian hasil dari itu dijadikan sebagai masukkan dari jaringan saraf
tiruan yang sudah diberi target outputnya dan sudah diberikan parameter trainingnya. Percobaan dilakukan
dengan mencoba 1hidden layer jaringan saraf tiruan dengan mengubah-ubah jumlah neuron yang terdapat
pada hidden layer jaringan saraf tiruan tersebut.setelah dilatih, jaringan saraf tiruan ini kemudian di ujicoba
dengan 50 percobaan dengan 5 orang yang masing-masing 10 percobaan. Seperti database, 3 orang sebagai
user dan 2 orang lainnya sebagai non-user. Adapun proses ujicoba dan proses sistemnya digambarkan dengan
flowchart sebagai berikut:
Gambar 4 Proses Verifikasi Wajah
Gambar 5 Tampilan Graphical User Interface untuk Menampilkan Hasil
Setelah dilakukan 10 kali percobaan pada setiap node jaringan saraf tiruan, hasilnya kemudian dilihat dan
hasil yang terbaiklah yang di implementasikan kedalam sistem ini.
Hasil dan Bahasan
Percobaan Verifikasi Wajah User
Dari hasil percobaan dengan 10 kali percobaan pada node 2 sampai 10. Didapatkan bahwa percobaan terbaik
ada pada jaringan saraf tiruan dengan node pada hidden layer nya berjumlah 8. Pada percobaan ke 8 pada
node 8 didapat tingkat keberhasilan verifikasi wajah untuk User A adalah 50%, B 50% dan C 100%, dan rataratanya adalah 67%. Adapun grafiknya adalah sebagai berikut:
Gambar 6 Grafik Tingkat Keberhasilan Verifikasi Wajah dengan Jumlah Node 8
Percobaan Penolakan Verifikasi Wajah Lain Terhadap User yang Ada
Percobaan ini dilakukan untuk menguji tingkat keberhasilan penolakan verifikasi wajah lain terhadap User
yang ada. Masing-masing Username yaitu A,B, dan C di uji dengan 40 gambar yang berbeda dengan User
yang seharusnya. Username A di uji dengan 10 gambar User B, 10 gambar User C dan 20 gambar non-User.
Username B di uji dengan 10 gambar User A, 10 gambar User C dan 20 gambar non-User. Username C di uji
dengan 10 gambar User A, 10 gambar User B dan 20 gambar non-User, dan seperti percobaan sebelumnya,
dilakukan dengan variasi node dari 2 hingga 10 dan masing-masing node dilakukan 10 kali percobaan.
Dari hasil percobaan dapat dilihat bahwa setiap node memiliki rata-rata penolakan secara keseluruhan sekitar
83% ke atas. Namun dari percobaan ini kita dapat lihat bahwa jaringan saraf tiruan dengan node 8 pada
percobaan ke 8 tetap yang lebih baik, karena selain memiliki tingkat keberhasilan verifikasi wajah untuk User
A adalah 50%, B 50% dan C 100%, dan rata-rata tingkat keberhasilan adalah 67%, juga memiliki rata-rata
tingkat keberhasilan penolakan sebesar 87%. Adapun Grafiknya adalah sebagai berikut:
Gambar 7 Grafik Tingkat Keberhasilan Penolakan Verifikasi Wajah Lain Terhadap User yang Ada dengan
Jumlah node 8
Simpulan dan Saran
Simpulan
Dari hasil percobaan yang telah dilakukan dapat ditarik kesimpulan yaitu:
1. Arsitektur jaringan saraf tiruan yang paling optimal untuk di implementasikan kedalam sistem ini
adalah jaringan dengan input layer yang terdiri atas 4 neuron, 1 hidden layer dengan jumlah node 8,
output layer dengan 2 neuron dengan rata-rata persentase keberhasilan verifikasi wajah adalah 67%,
dan rata-rata keberhasilan penolakan verifikasi wajah lain terhadap user yang ada sebesar 87% dan
memiliki kecepatan rata-rata memprosesnya sebesar 0,11181 detik.
2. Bila terjadi penambahan user, maka arsitektur jaringan saraf tiruan perlu diganti kembali, hal ini di
sebabkan penambahan user berakibat pada penambahan jumlah kelas untuk LDA subspace yang
berujung pada penambahan neuron pada input layer. Akan tetapi metode ini dinilai kurang cocok
untuk database skala besar, karena ketika menggunakan ORL dataset hanya mendapatkan hasil
terbaik sebesar 13%.
Saran
Untuk mengembangkan sistem ini, ada beberapa hal yang dapat dilakukan peneliti selanjutnya, seperti:
1. Pemuktahiran pre-processing agar orientasi kemiringan wajah terhadap kamera dapat diatasi, dan
background pada saat pengambilan wajah tidak harus hitam
2. Pemuktahiran jaringan saraf tiruan dengan mencari metode training yang lebih baik lagi sehingga
dapat digunakan untuk database skala besar.
Refferensi
Balakrishnama, S., & Ganapathiraju, A. (1998). Linear discriminant analysis-a brief tutorial. Institute for
Signal and information Processing.
Chen, L. F., Liao, H. Y. M., Ko, M. T., Lin, J. C., & Yu, G. J. (2000). A new LDA-based face recognition
system which can solve the small sample size problem. Pattern recognition, 33(10), 1713-1726.
Hagan, M. T., Demuth, H. B., & Beale, M. H. (2002). Neural Network Design. North Western USA: PWSP.
Jolliffe, I. (2002). Principal component analysis. John Wiley & Sons, Ltd.
Le, T. H. (2011). Applying Artificial Neural Networks for Face Recognition. Advances in Artificial Neural
Systems.
Mekala, P., & Senor Zafer Erdogan, J. F. (2010). Automatic Object Recognition Using Combinational Neural
Networks in Surveillance Networks. 3rd International Conference on Computer and Electrical
Engineering (pp. 387-391). Hongkong: IEEE.
Nagi, J., Ahmed, S. K., & Nagi, F. (2008). A MATLAB based Face Recognition System using Image
Processing and Neural Networks. 4th International Colloquium on Signal Processing and its
Applications (pp. 83-88). Kuala Lumpur: Faculty of Electrical Engineering.
Padmaja, G. M., & Nirupama, P. (2012). Analysis of Various Image Compression Techniques. ARPN Journal
of Science and Technology, 371-376.
Radha, V. (2011). Neural Networks Based Face Recognition Using RBFN Classifier. World Congress on
Engineering and Computer Science. San Fransisco.
Richardson, M. (2009). Principal component analysis. URL: http://people. maths. ox. ac.
uk/richardsonm/SignalProcPCA. pdf (last access: 3.5. 2013). Aleš Hladnik Dr., Ass. Prof., Chair of
Information and Graphic Arts Technology, Faculty of Natural Sciences and Engineering, University
of Ljubljana, Slovenia ales. hladnik@ ntf. uni-lj. si.
Struc, V. (2012). The PHD face recognition toolbox. University of Ljubljana.
Watson, A. B. (1994). Image Compression Using the Discrete Cosine Transform. Mathematica Journal, 8188.
Yu, H., & Yang, J. (2001). A direct LDA algorithm for high-dimensional data—with application to face
recognition. Pattern recognition, 34(10), 2067-2070.
Riwayat Penulis
Allegro Maxdo Christyo Horhoruw lahir di kota Masohi pada 09 Desember 1993. Penulis menamatkan
pendidikan S1 di Universitas Bina Nusantara, Jakarta, Indonesia, dalam bidang Sistem Komputer (Computer
Engineering) pada tahun 2015.
Rieldy Johannis Leiwakabessy lahir di kota Ambon pada 12 Juli 1994. Penulis menamatkan pendidikan S1
di Universitas Bina Nusantara, Jakarta, Indonesia, dalam bidang Sistem Komputer (Computer Engineering)
pada tahun 2015.
Gregory Alexander lahir di kota Serang pada 09 Januari 1994. Penulis menamatkan pendidikan S1 di
Universitas Bina Nusantara, Jakarta, Indonesia, dalam bidang Sistem Komputer (Computer Engineering) pada
tahun 2015.
Download