Seminar Nasional Teknologi Informasi 2017 A17 KLASIFIKASI KANKER PAYUDARA DENGAN JARINGAN SARAF TIRUAN LEVENBERG MARQUADT BERDASARKAN CITRA MAMMOGRAPHY Didi 1) Dwittra Anugrah Pratiwi 2) Erlina Angliati3) Fitriani4) Annisa Dayumi5) Tri Wahyu Widyaningsih6) 1) 2) 3) 4) 5) Teknik Informatika Universitas Tanri Abeng Jl. Swadarma Raya 58, Ulujami, Pesanggrahan Jakarta Selatan 12250 Indonesia email : 1) [email protected], 2) [email protected] 3) [email protected] 4) [email protected] 5) [email protected] 6) [email protected] ABSTRACT 1. Pendahuluan At this moment, breast cancer so many suffered by Indonesian people , not only in Indonesia even around the world too. Breast cancer not only in woman it can be infection a man too, it is because of spread of unhealthy cell that can’t be controlled on part of breast and some of genetic factor one of reason the breast cancer appear, to avoid a breast be savage, it can be detected from beginning by mammogram scan, but an output image from mammogram sometime getting mistaken that make wrong diagnose. In this step of research, at the first take histogram value from each image like mean, deviation , entrophy, and curtosis, then second step, make some classification by Levendberg Mardquadt Neural Network. Levendberg Mardquadt Neural Network is algorithm of Neural Network which often used to do some prediction about a case with do some improvement of numeric optimation. To do this research we took sixty of data image mammogram from Database Image mammogram breast cancer University Of South Florida[1], divided by fifteen of normal breast image, fifteen of malignant breast image, fifteen of beneign breast image, and fifteen of testing image, to create this neural network for classification of breast by using MATLAB R2014. Purpose of this research is to help medic differentiate normal, beneign or malignant breast based on histogram value of mammogram image so it help medic to differentiate normal or abnormal breast based on range. Result of this reserach is 93,33% accurate from fifteen of testing data and fourty five training data. Kanker payudara adalah suatu kondisi dimana sel yang kehilangan pengendalian mekanisme dari yang secara normal bisa menjadi pertumbuhan yang tidak normal serta tidak terkendali pada jaringan payudara. Kanker payudara umumnya menyerang kaum wanita dan kanker payudara ini adalah salah satu jenis kanker yang juga menjadi penyebab kematian terbesar kaum wanita di dunia, meskipun sebenarnya kanker payudara tidak menutup kemungkinan bisa menyerang kaum pria.Walaupun kemungkinan itu sangat kecil sekali yaitu 1: 1000 itu bisa terjadi. Banyak faktor yang menjadi penyebab bisa terserang kanker payudara yaitu perkembangan jaringan sel yang tidak terkontrol pada jaringan payudara, faktor keturunan, Usia senja (>50 ), Masa menstruasi dan reproduksi(<12 th dan >55 th). Cara mengurangi terjadinya kanker payudara adalah bisa dengan melakukan deteksi dini yaitu dengan cara melakukan mammogram,Mammogram adalah sebuah alat khusus yang menggunakan energi radiasi atau sinar X untuk memantau perkembangan dalam jaringan di payudara.Umumnya untuk mendeteksi sel kanker payudara sebelum sel tersebut berkembang terlalu parah.Gambar yang dihasilkan Mammogram digunakan bagian medis untuk menganalisis dan mendiagnosa kanker payudara, namun terkadang ada kesalahan yang sering terjadi pada saat melakukan analisis atau diagnosa yang disebabkan kelelahan dan hasil gambar dari mammogram yang kurang baik. Maka banyak perkembangan berbagai penelitian untuk membatu bagian medis melakukan analisis dan diagnosa kanker payudara. Dalam penelitian ini untuk memperbaiki kulitas citra gambar mammogram dengan ekstrasi ciri statistik inputan nilai mean, standar deviasi, entropi dan kurtosis dan metode jaringan syaraf tiruan Keywords Breast Cancer, Levendberg Mardquadt, Neural Network. 115 Seminar Nasional Teknologi Informasi 2017 A17 Leverdberg Marquerdt. Perbaikan kualitas citra dengan ekstraksi ciri Levendberg Marquadt adalah algoritma jaringan syaraf tiruan yang sering digunakan dalam melakukan prediksi terhadap suatu kasus dengan melakukan perbaikan dengan teknik optimasi numerik. Metode Levendberg Marquadt juga merupakan metode pembelajaran dari jaringan saraf tiruan. Algoritma ini menghasilkan kinerja yang lebih baik karena latihan yang berulang-ulang. Metode ini dipilih karena kemampuannya untuk belajar dan menangani nilai tersembunyi yang berada di dataset. Dataset adalah keseluruhan data training, dengan kelebihan tersebut dapat mewujudkan sistem yang konsisten bekerja dengan baik. Tujuan dari penelitian yang dilakukan dalam menganalisis metode syaraf tiruan Levendberg Marquadt dalam mendeteksi kanker payudara untuk mengetahui jaringan normal,tumor dan kanker pada payudara. 7. Jaringan saraf tiruan hasil pembelajaran tiruan dapat dijalankan. • Arsitektur jaringan syaraf tiruan dapat dibedakan menjadi beberapa kategori yaitu[3]: 1. Jaringan lapisan tunggal (Single Layer) Jaringan dengan lapisan tunggal hanya memiliki satu lapisan dengan bobot-bobot terhubung. Jaringan ini hanya menerima input kemudian secara langsung akan mengolah menjadi output tanpa harus melalui lapisan tersembunyi. 2. Jaringan dengan banyak lapisan (Multilayer) Jaringan dengan banyak lapisan memiliki 1 atau lebih lapisan yang terletak diantara lapisan input dan lapisan output(memiliki 1 atau lebih lapisan tersembunyi. 3. Jaringan dengan lapisan kompetitif (competitive layer) Jaringan kompetitive sering disebut feedback loop karena unit output ada yang memberikan informasi terhadap unit masukkan. 2. Tinjauan Pustaka/Penelitian Sebelumnya • Jaringan syaraf tiruan terdiri dari beberapa lapisan yaitu: 1. Lapisan Masukkan (Input Layer) Lapisan ini merupakan tempat dimana seluruh bobot awal dimasukkan yang selanjutnya diproses untuk dikirimkan ke lapisan diatasnya. 2. Lapisan Tersembunyi (Hidden Layer) Lapisan ini merupakan lapisan diantara lapisan masukkan dan lapisan keluaran. 3. Lapisan Keluaran (Output Layer) Lapisan ini merupakan lapisan akhir pada arsitektur jaringan dimana nilai output dari jaringan yang dihasilkan. • Fungsi aktivasi jaringan syaraf tiruan 1. Fungsi Undak Biner (Hard Limit) Jaringan dengan lapisan tunggal sering menggunakan fungsi undak untuk mengkonversi input dari suatu variabel yang bernilai kontinu ke suatu output biner. 2. Fungsi Bipolar Hampir sama dengan fungsi undak biner,hanya saja output yang dihasilkan berupa 1,0 atau -1. 3. Fungsi Linear (identitas) Fungsi linear memiliki nilai output yang sama dengan nilai input. 4. Fungsi Symetric Stuaring Linear Fungsi ini memiliki output 0 jika inputnya kurang dari -1.Sedangkan jika nilai input terletak antara -1 dan 1,maka outputnya akan bernialai sama dengan nilai inputnya. 5. Fungsi Saturating Linear 2.1 Jaringan Saraf Tiruan (JST) Jaringan saraf tiruan adalah paradigma pemrosesan suatu informasi yang terinspirasi oleh sistem sel syaraf biologi, sama sperti otak yang memproses suatu informasi.Elemen mendasar dari paradigma tersebut adalah struktur yang baru dari sistem pemrosesan informasi.Model saraf ditunjukkan dengan kemampuan dalam emulasi, analisis, prediksi dan asosiasi Jaringan saraf tiruan ditentukan oleh 3 hal yaitu arsitektur jaringan,metode pelatihan dan fungsi aktivasi[2]. • Karakteristik Jaringan Saraf Tiruan 1. Masukkan data dapat berupa nilai disktrit atau real yang memiliki banyak dimensi. 2. Keluaran berupa vektor yang terdiri dari beberapa nilai diskrit atau real. 3. Dapat mempelajari permasalahan secara black box,dengan hanya mengetahui nilai masukkan serta keluarannya saja 4. Mampu menangani pembelajaran terhadap data yang memiliki derau (noise). 5. Bentuk dari fungsi target pembelajaran tidak diketahui karena hanya berupa bobot-bobot nilai amasukkan pada setiap neuron. 6. Karena harus mengubah banyak nilai bobot pada proses pembelajaran, maka waktu pembelajaran menjadi lama sehingga tidak cocok untuk masalahmasalah yang memerlukan waktu cepat dalam pembelajaran. 116 Seminar Nasional Teknologi Informasi 2017 A17 Fungsi ini akan menghasilkan output 0 jika inputnya kurang dari -1/2 dan akan bernilai 1 jika inputnya lebih dari ½.Sedangkan jika nilai input terletak antara -1/2 dan 1/2 ,maka outputnya akan bernilai sama dengan nilai input ditambah ½. 6. Fungsi Sigmoid Biner Digunakan untuk jaringan syaraf yang dilatih dengan menggunakan metode backpropagation. Memiliki nilai pada range 0 sampai 1. 7. Fungsi Sigmoid Bipolar Output dari fungsi ini memilki range antara 1 sampai -1. unit pada lapisan yang ada diatasnya(lapisan tersembunyi. b. Tiap-tiap unit tersembunyi (Zi,J=1,2,3,...,p) menjumlahkan sinyal-sinyal input berbobot. Gunakan fungsi aktivasi untuk menghitung sinyal outputnya: c. Tiap-tiap unit output(Yk,K=1,2,3...,m) Menjumlahkan sinyal-sinyal output terbobot. d. Tiap-tiap unit output, (yk k=1,2,3,...,m) menerima target pola yang berhubungan pola input pembelajaran, informasi erornya, kemudian hitung koreksi bobot (yang nantinya akan digunakan untuk memperbaiki nilai wjk ). Hitung juga koreksi bias ( yang nantinya akan digunakan untuk memperbaiki nilai w0k ). Kirimkan δk ini ke unit – unit yang ada di lapisan bawahnya e. Tiap – tiap unit tersembunyi, ( Zj, j = 1,2,3,...,p) menjumlahkan delta inputnya ( dari unit –unit yang berada diatasnya). Kalikan nilai ini dengan turunan dari fungsi aktivasinya untuk menghitung informasi error. Kemudian hitung koreksi bobot (yang nantinya akan digunakan untuk memperbaiki nilai Vij), hitung juga koreksi bias(yang nantinya akan digunakan untuk memperbaiki nilai V0j). Tiap-tiap unit output(Yk ,K=1,2,3,...,m). Memperbaiki nilai dan bobotnya (j=0,1,2,..,p), tiap-tiap unit tersembunyi, memperbaiki bobot dan biasnya 4. Menghitung Nilai MSE 5. Menghitung error dan total error jaringan 6. Menghitung matriks Jacobian J(x) x merupakan matriks yang berisi nilai bobot dan bias dari keseluruhan jaringan. Matriks Jacobian berisi turunan pertama error jaringan terhadap bobot dan bias jaringan. 7. Setelah didapatkan nilai J(x) maka dapat dihitung perubahan koreksi bobot dan biasnya dengan rumus. 8. Setelah didapat nilai terhadap selajutnya adalah pengoreksian bobot dengan rumus yang sama seperti pada algoritma error back propagation. 9. Menghitung maju (feedforward) dengan bobot dan bias yang baru. 10. Menghitung MSE jaringan dengan bobot dan bias yang baru.Kemudian tes kondisi berhenti. 11. Jika epoch atau iterasi masih berlanjut maka akan terdapat 2 kemungkinan kondisi • Jika MSE naik • Jika MSE turun • Tipe-Tipe Jaringan Syaraf Tiruan 1. Feedforward Sebuah jaringan yang sederhana mempunyai signal yang bergerak dari input kemudian melewati lapisan tersembunyi dan akhirnya mencapai unit output (mempunyai struktur perilaku yang stabil)[3]. 2. Feedback. Suatu jaringan berulang(mempunyai koneksi kembali dari output ke input) akan menimbulkan ketidakstabilan dan akan menghasilkan dinamika yang sangat kompleks. 2.2. Algoritma Jaringan Saraf Tiruan Levendberg Marquardt Algoritma Levenberg Marquardt merupakan pengembangan algoritma backpropagation standar pada algoritma backpropagation, proses update bobot dan biasa menggunakan negative gradient descent secara langsung sedangkan algoritma Levenberg Marquardt menggunakan pendekatan matrik Hesian (H) yang dapat dihitung dengan rumus[4]. Berikut beberapa struktur algoritma Levenberg Marquardt: 1. Inisialisasi bobot dan bias dengan bilangan acak,epoch maksimum,dan minimal goal (performace yang dihitung dengan MSE) 2. Menentukan parameter yang dibutuhlan antara lain: • Parameter Levenberg Marquardt yang nilainya harus lebih besar dari nol • Parameter faktor Beta(simbol) yang digunakan sebagai parameter yang dikalikan atau dibagikan dengan parameter Levenberg Marquardt 3. Menghitung maju (feedforward) pada hidden dan output layer seperti langkah-langkah pada algoritma error back propagation. Feedforward: a. Tiap-tiap unit input (Xi,i=1,2,3........n) menerima sinyal xi dan meneruskan sinyal tersebut kesemua 12. Kemudian melakukan kembali langkah 5 sampai langkah 8. 117 Seminar Nasional Teknologi Informasi 2017 A17 2.3 Normalisasi Data Normalisasi data merupakan sebuah teknik untuk mengorganisasikan data kedalam tabel-tabel untuk memenuhi kebutuhan pemakai dalam suatu organisasi. Data data yang ada dilakukan normalisasi dengan membagi nilai data tersebut dengan nilai range data(nilai data maksimum – nilai data minimum). Adapun rumus untuk melakukan normalisasi data adalah sebagai berikut (Hidayat,2012), 4. xn= 5. Keterangan : 1. Xn = Nilai data normal 2. X0 = Nilai data aktual 3. Xmin =Nilai minimum data aktual keseluruhan 2.4 Fungsi Aktivasi Melakukan tabulasi dan normalisasi nilai histogram ini untuk menyederhanakan nilai histogram sehingga mudah untuk diproses ketahap selanjutnya,tabulasi dan normalisasi menggunakan Microsoft Excel 2013. Merancang JST Dalam perancangan JST ini berdasarkan nilai histogram yang sudah dinormalisasi,sehingga mudah untuk diproses di tahap ini,ditahap ini penulis melakukan data latih dengan 45 data yang terdiri dari 15 data normal, 15 data tumor dan 15 data kanker, dalam perancangan JST ini menggunakan MATLAB R2014. Pengujian data Pengujian data ini untuk memastikan apakah penelitian yang dilakukan berhasil atau tidak berdasarkan data latih yang telah dilakukan, banyak data uji 15 data yang terdiri dari 5 data normal, 5 data tumor dan 5 data kanker, pengujian ini menggunakan MATLAB R2014. 3.2 Hasil dan Pembahasan Salah satu fungsi aktivasi pada neural network(Jaringan Saraf Tiruan) adalah fungsi signoid biner. Fungsi signoid biner memiliki nilai pada range 0 sampai 1.Oleh karena itu,fungsi ini sering digunakan untuk jaringan saraf yang membutuhkan nilai output yang terletak pada interval 0 sampai 1. Namun fungsi ini bisa juga digunakan oleh jaringan saraf yang nilai outputnya 0 atau 1. Data training yang digunakan pada uji coba sebanyak 60 data yaitu: • 15 data mammogram normal • 15 data mammogram tumor • 15 data mammogram kanker Data testing 15 data yang terdiri dari 5 data mammogram normal, 5 mammogram tumor dan 15 data mammogram kanker.Metode training yang digunakan adalah Levenberg Marquardt. 3. Hasil Percobaan 3.1 Metodologi Penelitian Data diambil dari MIAS (Mammographic Image Analisis Society). Database ini berisi 60 citra mammogram terdiri dari 3 kategori :normal,tumor,dan kanker.Tumor dan kanker dikategorikan sebagai abnormal. Tahap- tahap metode penelitian adalah sebagai berikut ini : 1. Pengumpulan data Dalam melakukan pengumpulan data penulis mengambil data dari MIAS(Mammographic Image Anlisis Society) yang berupa gambar mammogram dengan total jumlah 60 data yang terdiri dari 45 data untuk data latih dan 15 data untuk data uji. 2. Pencari nilai histogram Dalam melakukan pencari nilai histogram penulis menggunakan ekstraksi ciri citra dengan menggunakan 4 inputan nilai yaitu mean,standar deviasi,entropy dan kurtosis. 3. Melakukan tabulasi dan normalisasi nilai histogram a b c Gambar 1. a) mammogram normal; b) mammogram tumor; c) mammogrom kanker. 118 Seminar Nasional Teknologi Informasi 2017 A17 Gambar 5. Performance (plotperform) Gambar 2. Grafik keluaran JST vs Target dengan nilai MSE=0.025482 Gambar 6. Data uji tingkat keberhasilan Hasil uji dari data latih mammogram yang ada dan berdasarkan data uji yang ada tingkat keberhasilan dalam pengklasifikasian kanker payudara 93,33% dari 60 data mammogram dengan data uji 15 data, dan data normal mammogram 15 data,15 data tumor mammogram kanker. Hasil dari tes pengujian tingkat keberhasilan dari penelitian yang penulis lakukan didapatkan hasil grafik sebagai berikut: 4. Kesimpulan dan Saran 4.1 Kesimpulan Kesimpulan yang dapat diambil bahwa algoritma saraf tiruan Levenberg Marquardt bisa menghasilkan data akurasi citra dengan tingkat keakurasian mencapai 93,33%. Dan bisa diklasifikasikan untuk membantu bagian medis,yang bisa membedakan jaringan payudara normal,tumor dan kanker. Gambar 3. Training State (plotttrainstate) 4.2 Saran Gambar diatas adalah gambar training state dengan gradient=6.27673-011,at epoch 41, Mu=1e-005,at epoch 41 dan Validation Check=0, at epoch 41. Saran untuk penelitian ini belum bisa menyajikan dalam bentuk data yang lebih banyak variasi.Penulis menyarankan untuk bisa menyediakan data lebih banyak lagi untuk data latih dan data uji sebagai acuan nilai ektraksi nilai histogram pada citra mammogram. REFERENSI [1] [2] [3] [4] Gambar 4. Regression (plotregression) dengan Training R=0.9807. 119 http://marathon.csee.usf.edu/Mammography/database.hml Yogeswaran Mohan, Sia Seng Chee, Donica Kan Pei Xin, February 2017, “Artificial neural network for classification of depressive and normal in EEG”, Kuala LumpurMalaysia. Nur Afny C. Andryani, Vijanth S. Asirvadam, NH. Hamid, December 2009, “Finite Difference Recursive Update on Decomposed RBF Networks for System Identification with Lost Packet”, Malacca-Malaysia. Irmalia Suryani Faradisa, Dimas Okky Anggriawan, Tri Arief Sardjono, January 2017, “Identification of phonocardiogram signal based on STFT and Marquart Lavenberg Backpropagation”, Lombok-Indonesia.