klasifikasi kanker payudara dengan jaringan saraf tiruan

advertisement
Seminar Nasional Teknologi Informasi 2017
A17
KLASIFIKASI KANKER PAYUDARA DENGAN JARINGAN
SARAF TIRUAN LEVENBERG MARQUADT BERDASARKAN
CITRA MAMMOGRAPHY
Didi 1) Dwittra Anugrah Pratiwi 2) Erlina Angliati3) Fitriani4)
Annisa Dayumi5) Tri Wahyu Widyaningsih6)
1) 2) 3) 4) 5)
Teknik Informatika Universitas Tanri Abeng
Jl. Swadarma Raya 58, Ulujami, Pesanggrahan Jakarta Selatan 12250 Indonesia
email : 1) [email protected], 2) [email protected] 3) [email protected] 4)
[email protected] 5) [email protected] 6) [email protected]
ABSTRACT
1. Pendahuluan
At this moment, breast cancer so many suffered by
Indonesian people , not only in Indonesia even around the
world too. Breast cancer not only in woman it can be
infection a man too, it is because of spread of unhealthy
cell that can’t be controlled on part of breast and some of
genetic factor one of reason the breast cancer appear, to
avoid a breast be savage, it can be detected from
beginning by mammogram scan, but an output image from
mammogram sometime getting mistaken that make wrong
diagnose. In this step of research, at the first take
histogram value from each image like mean, deviation ,
entrophy, and curtosis, then second step, make some
classification by Levendberg Mardquadt Neural Network.
Levendberg Mardquadt Neural Network is algorithm of
Neural Network which often used to do some prediction
about a case with do some improvement of numeric
optimation. To do this research we took sixty of data
image mammogram from Database Image mammogram
breast cancer University Of South Florida[1], divided by
fifteen of normal breast image, fifteen of malignant breast
image, fifteen of beneign breast image, and fifteen of
testing image, to create
this neural network for
classification of breast by using MATLAB R2014. Purpose
of this research is to help medic differentiate normal,
beneign or malignant breast based on histogram value of
mammogram image so it help medic to differentiate
normal or abnormal breast based on range. Result of this
reserach is 93,33% accurate from fifteen of testing data
and fourty five training data.
Kanker payudara adalah suatu kondisi dimana sel yang
kehilangan pengendalian mekanisme dari yang secara
normal bisa menjadi pertumbuhan yang tidak normal serta
tidak terkendali pada jaringan payudara. Kanker payudara
umumnya menyerang kaum wanita dan kanker payudara
ini adalah salah satu jenis kanker yang juga menjadi
penyebab kematian terbesar kaum wanita di dunia,
meskipun sebenarnya kanker payudara tidak menutup
kemungkinan bisa menyerang kaum pria.Walaupun
kemungkinan itu sangat kecil sekali yaitu 1: 1000 itu bisa
terjadi. Banyak faktor yang menjadi penyebab bisa
terserang kanker payudara yaitu perkembangan jaringan sel
yang tidak terkontrol pada jaringan payudara, faktor
keturunan, Usia senja (>50 ), Masa menstruasi dan
reproduksi(<12 th dan >55 th).
Cara mengurangi terjadinya kanker payudara adalah
bisa dengan melakukan deteksi dini yaitu dengan cara
melakukan mammogram,Mammogram adalah sebuah alat
khusus yang menggunakan energi radiasi atau sinar X
untuk memantau perkembangan dalam jaringan di
payudara.Umumnya untuk mendeteksi sel kanker payudara
sebelum sel tersebut berkembang terlalu parah.Gambar
yang dihasilkan Mammogram digunakan bagian medis
untuk menganalisis dan mendiagnosa kanker payudara,
namun terkadang ada kesalahan yang sering terjadi pada
saat melakukan analisis atau diagnosa yang disebabkan
kelelahan dan hasil gambar dari mammogram yang kurang
baik. Maka banyak perkembangan berbagai penelitian
untuk membatu bagian medis melakukan analisis dan
diagnosa kanker payudara. Dalam penelitian ini untuk
memperbaiki kulitas citra gambar mammogram dengan
ekstrasi ciri statistik inputan nilai mean, standar deviasi,
entropi dan kurtosis dan metode jaringan syaraf tiruan
Keywords
Breast Cancer, Levendberg Mardquadt, Neural Network.
115
Seminar Nasional Teknologi Informasi 2017
A17
Leverdberg Marquerdt. Perbaikan kualitas citra dengan
ekstraksi ciri Levendberg Marquadt adalah algoritma
jaringan syaraf tiruan yang sering digunakan dalam
melakukan prediksi terhadap suatu kasus dengan
melakukan perbaikan dengan teknik optimasi numerik.
Metode Levendberg Marquadt juga merupakan metode
pembelajaran dari jaringan saraf tiruan. Algoritma ini
menghasilkan kinerja yang lebih baik karena latihan yang
berulang-ulang. Metode ini dipilih karena kemampuannya
untuk belajar dan menangani nilai tersembunyi yang
berada di dataset. Dataset adalah keseluruhan data training,
dengan kelebihan tersebut dapat mewujudkan sistem yang
konsisten bekerja dengan baik. Tujuan dari penelitian yang
dilakukan dalam menganalisis metode syaraf tiruan
Levendberg Marquadt dalam mendeteksi kanker payudara
untuk mengetahui jaringan normal,tumor dan kanker pada
payudara.
7. Jaringan saraf tiruan hasil pembelajaran tiruan
dapat dijalankan.
• Arsitektur jaringan syaraf tiruan dapat dibedakan
menjadi beberapa kategori yaitu[3]:
1. Jaringan lapisan tunggal (Single Layer)
Jaringan dengan lapisan tunggal hanya memiliki
satu lapisan dengan bobot-bobot terhubung.
Jaringan ini hanya menerima input kemudian secara
langsung akan mengolah menjadi output tanpa
harus melalui lapisan tersembunyi.
2. Jaringan dengan banyak lapisan (Multilayer)
Jaringan dengan banyak lapisan memiliki 1 atau
lebih lapisan yang terletak diantara lapisan input
dan lapisan output(memiliki 1 atau lebih lapisan
tersembunyi.
3. Jaringan dengan lapisan kompetitif (competitive
layer)
Jaringan kompetitive sering disebut feedback loop karena
unit output ada yang memberikan informasi terhadap unit
masukkan.
2. Tinjauan Pustaka/Penelitian Sebelumnya
• Jaringan syaraf tiruan terdiri dari beberapa lapisan
yaitu:
1. Lapisan Masukkan (Input Layer)
Lapisan ini merupakan tempat dimana seluruh
bobot awal dimasukkan yang selanjutnya diproses
untuk dikirimkan ke lapisan diatasnya.
2. Lapisan Tersembunyi (Hidden Layer)
Lapisan ini merupakan lapisan diantara lapisan
masukkan dan lapisan keluaran.
3. Lapisan Keluaran (Output Layer)
Lapisan ini merupakan lapisan akhir pada arsitektur
jaringan dimana nilai output dari jaringan yang
dihasilkan.
• Fungsi aktivasi jaringan syaraf tiruan
1. Fungsi Undak Biner (Hard Limit)
Jaringan dengan lapisan tunggal sering menggunakan
fungsi undak untuk mengkonversi input dari suatu
variabel yang bernilai kontinu ke suatu output biner.
2. Fungsi Bipolar
Hampir sama dengan fungsi undak biner,hanya saja
output yang dihasilkan berupa 1,0 atau -1.
3. Fungsi Linear (identitas)
Fungsi linear memiliki nilai output yang sama dengan
nilai input.
4. Fungsi Symetric Stuaring Linear
Fungsi ini memiliki output 0 jika inputnya kurang
dari -1.Sedangkan jika nilai input terletak antara -1
dan 1,maka outputnya akan bernialai sama dengan
nilai inputnya.
5. Fungsi Saturating Linear
2.1 Jaringan Saraf Tiruan (JST)
Jaringan saraf tiruan adalah paradigma pemrosesan
suatu informasi yang terinspirasi oleh sistem sel syaraf
biologi, sama sperti otak yang memproses suatu
informasi.Elemen mendasar dari paradigma tersebut adalah
struktur
yang
baru
dari
sistem
pemrosesan
informasi.Model saraf ditunjukkan dengan kemampuan
dalam emulasi, analisis, prediksi dan asosiasi Jaringan
saraf tiruan ditentukan oleh 3 hal yaitu arsitektur
jaringan,metode pelatihan dan fungsi aktivasi[2].
•
Karakteristik Jaringan Saraf Tiruan
1. Masukkan data dapat berupa nilai disktrit atau real
yang memiliki banyak dimensi.
2. Keluaran berupa vektor yang terdiri dari beberapa
nilai diskrit atau real.
3. Dapat mempelajari permasalahan secara black
box,dengan hanya mengetahui nilai masukkan serta
keluarannya saja
4. Mampu menangani pembelajaran terhadap data
yang memiliki derau (noise).
5. Bentuk dari fungsi target pembelajaran tidak
diketahui karena hanya berupa bobot-bobot nilai
amasukkan pada setiap neuron.
6. Karena harus mengubah banyak nilai bobot pada
proses pembelajaran, maka waktu pembelajaran
menjadi lama sehingga tidak cocok untuk masalahmasalah yang memerlukan waktu cepat dalam
pembelajaran.
116
Seminar Nasional Teknologi Informasi 2017
A17
Fungsi ini akan menghasilkan output 0 jika inputnya
kurang dari -1/2 dan akan bernilai 1 jika inputnya
lebih dari ½.Sedangkan jika nilai input terletak antara
-1/2 dan 1/2 ,maka outputnya akan bernilai sama
dengan nilai input ditambah ½.
6. Fungsi Sigmoid Biner
Digunakan untuk jaringan syaraf yang dilatih dengan
menggunakan metode backpropagation. Memiliki
nilai pada range 0 sampai 1.
7. Fungsi Sigmoid Bipolar
Output dari fungsi ini memilki range antara 1 sampai
-1.
unit pada lapisan yang ada diatasnya(lapisan
tersembunyi.
b. Tiap-tiap unit tersembunyi
(Zi,J=1,2,3,...,p)
menjumlahkan sinyal-sinyal input berbobot.
Gunakan fungsi aktivasi untuk menghitung sinyal
outputnya:
c. Tiap-tiap unit output(Yk,K=1,2,3...,m)
Menjumlahkan sinyal-sinyal output terbobot.
d. Tiap-tiap unit output, (yk k=1,2,3,...,m) menerima
target pola yang berhubungan pola input
pembelajaran, informasi erornya, kemudian hitung
koreksi bobot (yang nantinya akan digunakan untuk
memperbaiki nilai wjk ). Hitung juga koreksi bias (
yang nantinya akan digunakan untuk memperbaiki
nilai w0k ). Kirimkan δk ini ke unit – unit yang ada
di lapisan bawahnya
e. Tiap – tiap unit tersembunyi, ( Zj, j = 1,2,3,...,p)
menjumlahkan delta inputnya ( dari unit –unit yang
berada diatasnya). Kalikan nilai ini dengan turunan
dari fungsi aktivasinya untuk menghitung informasi
error. Kemudian hitung koreksi bobot (yang
nantinya akan digunakan untuk memperbaiki nilai
Vij), hitung juga koreksi bias(yang nantinya akan
digunakan untuk memperbaiki nilai V0j). Tiap-tiap
unit output(Yk ,K=1,2,3,...,m). Memperbaiki nilai
dan bobotnya (j=0,1,2,..,p), tiap-tiap unit
tersembunyi, memperbaiki bobot dan biasnya
4. Menghitung Nilai MSE
5. Menghitung error dan total error jaringan
6. Menghitung matriks Jacobian J(x) x merupakan
matriks yang berisi nilai bobot dan bias dari
keseluruhan jaringan. Matriks Jacobian berisi
turunan pertama error jaringan terhadap bobot dan
bias jaringan.
7. Setelah didapatkan nilai J(x) maka dapat dihitung
perubahan koreksi bobot dan biasnya dengan
rumus.
8. Setelah didapat nilai terhadap selajutnya adalah
pengoreksian bobot dengan rumus yang sama
seperti pada algoritma error back propagation.
9. Menghitung maju (feedforward) dengan bobot dan
bias yang baru.
10. Menghitung MSE jaringan dengan bobot dan bias
yang baru.Kemudian tes kondisi berhenti.
11. Jika epoch atau iterasi masih berlanjut maka akan
terdapat 2 kemungkinan kondisi
• Jika MSE naik
• Jika MSE turun
• Tipe-Tipe Jaringan Syaraf Tiruan
1. Feedforward
Sebuah jaringan yang sederhana mempunyai signal
yang bergerak dari input kemudian melewati lapisan
tersembunyi dan akhirnya mencapai unit output
(mempunyai struktur perilaku yang stabil)[3].
2. Feedback.
Suatu jaringan berulang(mempunyai koneksi
kembali dari output ke input) akan menimbulkan
ketidakstabilan dan akan menghasilkan dinamika
yang sangat kompleks.
2.2. Algoritma Jaringan Saraf Tiruan Levendberg
Marquardt
Algoritma
Levenberg
Marquardt
merupakan
pengembangan algoritma backpropagation standar pada
algoritma backpropagation, proses update bobot dan biasa
menggunakan negative gradient descent secara langsung
sedangkan algoritma Levenberg Marquardt menggunakan
pendekatan matrik Hesian (H) yang dapat dihitung dengan
rumus[4]. Berikut beberapa struktur algoritma Levenberg
Marquardt:
1. Inisialisasi bobot dan bias dengan bilangan
acak,epoch maksimum,dan minimal goal (performace
yang dihitung dengan MSE)
2. Menentukan parameter yang dibutuhlan antara lain:
• Parameter Levenberg Marquardt yang nilainya
harus lebih besar dari nol
• Parameter faktor Beta(simbol) yang digunakan
sebagai parameter yang dikalikan atau dibagikan
dengan parameter Levenberg Marquardt
3. Menghitung maju (feedforward) pada hidden dan
output layer seperti langkah-langkah pada algoritma
error back propagation.
Feedforward:
a. Tiap-tiap unit input (Xi,i=1,2,3........n) menerima
sinyal xi dan meneruskan sinyal tersebut kesemua
12. Kemudian melakukan kembali langkah 5 sampai
langkah 8.
117
Seminar Nasional Teknologi Informasi 2017
A17
2.3 Normalisasi Data
Normalisasi data merupakan sebuah teknik untuk
mengorganisasikan data kedalam tabel-tabel untuk
memenuhi kebutuhan pemakai dalam suatu organisasi.
Data data yang ada dilakukan normalisasi dengan membagi
nilai data tersebut dengan nilai range data(nilai data
maksimum – nilai data minimum). Adapun rumus untuk
melakukan normalisasi data adalah sebagai berikut
(Hidayat,2012),
4.
xn=
5.
Keterangan :
1. Xn
= Nilai data normal
2. X0 = Nilai data aktual
3. Xmin
=Nilai minimum data aktual keseluruhan
2.4 Fungsi Aktivasi
Melakukan tabulasi dan normalisasi nilai histogram
ini untuk menyederhanakan nilai histogram sehingga
mudah untuk diproses ketahap selanjutnya,tabulasi
dan normalisasi menggunakan Microsoft Excel 2013.
Merancang JST
Dalam perancangan JST ini berdasarkan nilai
histogram yang sudah dinormalisasi,sehingga mudah
untuk diproses di tahap ini,ditahap ini penulis
melakukan data latih dengan 45 data yang terdiri dari
15 data normal, 15 data tumor dan 15 data kanker,
dalam perancangan JST ini menggunakan MATLAB
R2014.
Pengujian data
Pengujian data ini untuk memastikan apakah
penelitian yang dilakukan berhasil atau tidak
berdasarkan data latih yang telah dilakukan, banyak
data uji 15 data yang terdiri dari 5 data normal, 5 data
tumor dan 5 data kanker, pengujian ini menggunakan
MATLAB R2014.
3.2 Hasil dan Pembahasan
Salah satu fungsi aktivasi pada neural network(Jaringan
Saraf Tiruan) adalah fungsi signoid biner. Fungsi signoid
biner memiliki nilai pada range 0 sampai 1.Oleh karena
itu,fungsi ini sering digunakan untuk jaringan saraf yang
membutuhkan nilai output yang terletak pada interval 0
sampai 1. Namun fungsi ini bisa juga digunakan oleh
jaringan saraf yang nilai outputnya 0 atau 1.
Data training yang digunakan pada uji coba sebanyak
60 data yaitu:
• 15 data mammogram normal
• 15 data mammogram tumor
• 15 data mammogram kanker
Data testing 15 data yang terdiri dari 5 data mammogram
normal, 5 mammogram tumor dan 15 data mammogram
kanker.Metode training yang digunakan adalah Levenberg
Marquardt.
3. Hasil Percobaan
3.1 Metodologi Penelitian
Data diambil dari MIAS (Mammographic Image
Analisis Society). Database ini berisi 60 citra mammogram
terdiri dari 3 kategori :normal,tumor,dan kanker.Tumor
dan kanker dikategorikan sebagai abnormal. Tahap- tahap
metode penelitian adalah sebagai berikut ini :
1. Pengumpulan data
Dalam melakukan pengumpulan data penulis
mengambil data dari MIAS(Mammographic Image
Anlisis Society) yang berupa gambar mammogram
dengan total jumlah 60 data yang terdiri dari 45 data
untuk data latih dan 15 data untuk data uji.
2. Pencari nilai histogram
Dalam melakukan pencari nilai histogram penulis
menggunakan
ekstraksi
ciri
citra
dengan
menggunakan 4 inputan nilai yaitu mean,standar
deviasi,entropy dan kurtosis.
3. Melakukan tabulasi dan normalisasi nilai histogram
a
b
c
Gambar 1. a) mammogram normal; b) mammogram tumor; c)
mammogrom kanker.
118
Seminar Nasional Teknologi Informasi 2017
A17
Gambar 5. Performance (plotperform)
Gambar 2. Grafik keluaran JST vs Target dengan nilai
MSE=0.025482
Gambar 6. Data uji tingkat keberhasilan
Hasil uji dari data latih mammogram yang ada dan
berdasarkan data uji yang ada tingkat keberhasilan dalam
pengklasifikasian kanker payudara 93,33% dari 60 data
mammogram dengan data uji 15 data, dan data normal
mammogram 15 data,15 data tumor mammogram kanker.
Hasil dari tes pengujian tingkat keberhasilan dari
penelitian yang penulis lakukan didapatkan hasil grafik
sebagai berikut:
4. Kesimpulan dan Saran
4.1 Kesimpulan
Kesimpulan yang dapat diambil bahwa algoritma saraf
tiruan Levenberg Marquardt bisa menghasilkan data
akurasi citra dengan tingkat keakurasian mencapai 93,33%.
Dan bisa diklasifikasikan untuk membantu bagian
medis,yang bisa membedakan jaringan payudara
normal,tumor dan kanker.
Gambar 3. Training State (plotttrainstate)
4.2 Saran
Gambar diatas adalah gambar training state dengan
gradient=6.27673-011,at epoch 41, Mu=1e-005,at epoch
41 dan Validation Check=0, at epoch 41.
Saran untuk penelitian ini belum bisa menyajikan
dalam bentuk data yang lebih banyak variasi.Penulis
menyarankan untuk bisa menyediakan data lebih banyak
lagi untuk data latih dan data uji sebagai acuan nilai
ektraksi nilai histogram pada citra mammogram.
REFERENSI
[1]
[2]
[3]
[4]
Gambar 4. Regression (plotregression) dengan Training R=0.9807.
119
http://marathon.csee.usf.edu/Mammography/database.hml
Yogeswaran Mohan, Sia Seng Chee, Donica Kan Pei Xin,
February 2017, “Artificial neural network for classification
of depressive and normal in EEG”, Kuala LumpurMalaysia.
Nur Afny C. Andryani, Vijanth S. Asirvadam, NH. Hamid,
December 2009, “Finite Difference Recursive Update on
Decomposed RBF Networks for System Identification with
Lost Packet”, Malacca-Malaysia.
Irmalia Suryani Faradisa, Dimas Okky Anggriawan, Tri
Arief Sardjono, January 2017, “Identification of
phonocardiogram signal based on STFT and Marquart
Lavenberg Backpropagation”, Lombok-Indonesia.
Download