penerapan metode clustering untuk mengdiagnosa jenis penyakit

advertisement
PENERAPAN METODE CLUSTERING UNTUK
MENGDIAGNOSA JENIS PENYAKIT GAGAL JANTUNG
Fithry Tahel
Jurusan Sistem InformasiFakultas Teknik Universitas Potensi Utama
Jl. K.L.Yos Sudarso Km 6,5 No. 3A Tanjung Mulia Medan Sumatera Utara 20241 Indonesia
[email protected]
Abstract
Clustering is a grouping of activities in a wide variety of data recording, observation, or to
approach the data of an object with another object that has a certain similarity. Cluster is
kumpulani rows of data that have similarities and inequality to record into another cluster.
Heart disease is the number one killer disease in the world. The cause was a wide variety, one
of which is an unhealthy lifestyle and foods that contain high cholesterol. Cardiovascular
disease is the number one cause of death in America. 4.8 million Americans suffer from
cardiovascular disease. According to the American Heart Association, men have one of three
likely to suffer major penyakitkardiovaskuler before the age of 60 years. The results of various
tests conducted using 100 the data showed that the expert system disease determination of heart
failure with the clustering method is capable of producing an average accuracy of 83%
Keywords :Clustering, expert system, jantung
Abstrak
Clustering adalah sebuah kegiatan dalam mengelompokan berbagai macam rekaman
data, observasi, atau melakukan pendekatan data dari sebuah objek dengan objek lain yang
memiliki kesamaan tertentu. Cluster merupakan kumpulani baris data yang memiliki kesamaan
dan ketidaksamaan untuk merekam kedalam cluster lain. (Johan Oscar Ong, 2013).
Penyakit jantung merupakan penyakit mematikan nomor satu di dunia. Penyebabnya
pun berbagai macam, salah satunya adalah pola hidup yang tidak sehat dan makanan yang
banyak mengandung kolesterol tinggi. Penyakit kardiovaskuler merupakan penyebab kematian
nomor satu di Amerika. 4,8 juta orang Amerika menderita penyakit kardiovasculer. Menurut
American Heart Association, laki-laki memiliki satu dari tiga kemungkinan untuk menderita
penyakitkardiovaskuler utama sebelum usia 60 tahun. Dari berbagai hasil ujicoba yang
dilakukan dengan menggunakan 100 data didapatkan hasil bahwa sistem pakar penentuan
penyakit gagal jantung dengan metode clustering mampu menghasilkan akurasi ratarata sebesar
83%
Kata Kunci :Clustering, system pakar, jantung
1.
PENDAHULUAN
Penyakit kardiovaskuler merupakan penyebab kematian nomor satu di Amerika. 4,8
juta orang Amerika menderita penyakit kardiovasculer. Selama ini teradapat suatu pemahaman
bahwa penyakit kardiovaskuler terjadi pada laki-laki. Akan tetapi kenyataannya di Amerika,
penyakit kardiovaskuler merupakan penyakit nomor satu dan mematikan pada laki-laki maupun
perempuan.
Perbedaan utama antara kedua gener adalah usia penyakit yang dialami. Menurut American
Heart
Received June1st,2012; Revised June25th, 2012; Accepted July 10th, 2012
Association, laki-laki memiliki satu dari tiga kemungkinan untuk menderita penyakit
kardiovaskuler utama sebelum usia 60 tahun.
Adanya estrogen sebelum awitan menopause diangggap merupakan faktor pelindung
utama unutk menghindari terkena penyakit , jantung koroner dan penyakit stroke pada saat
ini.Decompensasi cordis merupakan salah satu penyakit dari kardiovaskuler. Untuk menentukan
penyakit decompensasi cordis terdapat berbagai inputan yaitu berupa gejala – gejala yang
dialami pasien sehingga diberikan metode yang sesuai dan mudah dipahami. Metode clustering
adalah metode yang dapat menerima inputan dalam bentuk apapun dan kecepatan dalam
memproses suatu data,jadi pada setiap data baru akan dilakukan probabilitas dengan setiap class
yang ada, hasil akhirnya dilihat nilai yang paling tinggi, sehingga algoritma ini dirasa cukup
baik untuk menentukan probabilitas dalam menentukan hasil dari penelitian ini.
2.
TINJAUAN PUSTAKA
2.1. Kecerdasan Buatan
Menurut Muhammad Dahria (2008), Kecerdasan Buatan (Artificial Intelligence) merupakan
salah satu bagian ilmu computer yang mempelajari bagaimana membuat mesin (komputer)
dapat melakukan pekerjaan seperti dan sebaik yang dilakukan manusia bahkan bias lebih baik
yang dilakukan pada manusia.
Manusia cerdas (pandai) dalam menyelesaikan permasalahan karena manusia
mempunyai pengetahuan dan pengalaman. Pengetahuan diperoleh dari belajar. Semakin banyak
bekal pengetahuan yang dimiliki tentu akan lebih mampu menyelesaikan permasalahan. Tapi
bekal pengetahuan saja tidak cukup, manusia juga memiliki akal untuk melakukan penalaran,
mengambil kesimpulan berdasarkan pengetahuan dan pengalaman yang dimiliki.
2.2. Sistem Pakar
Sistem pakar merupakan cabang dari Artificial intelligent (AI). Implementasi sistem
pakar banyak digunakan untuk kepentingan komersial karena sistem pakar dipandang sebagai
cara penyimpanan pengetahuan pakar dalam bidang tertentu ke dalam program sehingga
komputer dapatmemberikan keputusan dan melakukan penalaran secara cerdas.[3].
Kecerdasan buatan sebagaimana telah diketahui, saat ini merupakan suatu inovasi baru
dalam bidang ilmu pengetahuan. Kecerdasan buatan atau Artificial Intelligence merupakan
salah satu bagian ilmu komputer yang membuat agar mesin (komputer) dapat melakukan
pekerjaan seperti dan sebaik yang dilakukan oleh manusia.Teknologi kecerdasan buatan
dipelajari dalam bidang-bidang, seperti: robotika, penglihatan komputer (computervision),
jaringan saraf tiruan (artificial neuralsystem), pengolahan bahasa alami (natural language
processing), pengenalan suara (speech recognition) dan sistem pakar (expert system).[2]
2.3. Clustering
Menurut Joanna Ardhyanti Mita Nugraha dan Yupie Kusumawati menyatakan
Clustering adalah mengelompokkan item data ke dalam sejumlah kecil grup sedemikian
sehingga masing-masing grup mempunyai sesuatu persamaan yang esensial. Pengklusteran
merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas
objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki
kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster
lain.
Clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu.
Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui
Title of manuscript is short and clear, implies research results (First Author)
itu. Karena itu clustering sering digolongkan sebagai metode unsupervised learning. Prinsip
dari clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan
kesamaan antar kelas atau cluster. Clustering dapat dilakukan pada data yan memiliki beberapa
atribut yang dipetakan sebagai ruang multidimensi.
K-means clustering merupakan salah satu metode data clustering non-hirarki yang
mengelompokan data dalam bentuk satu atau lebih cluster/kelompok. Data-data yang memiliki
karakteristik yang sama dikelompokan dalam satu cluster/kelompok dan data yang memiliki
karakteristik yang berbeda dikelompokan dengan cluster/kelompok yang lain sehingga data
yang berada dalam satu cluster/kelompok memiliki tingkat variasi yang kecil (Agusta, 2007).
Menurut D.T Larose (2007), langkah-langkah melakukan clustering dengan metode KMeans adalah sebagai berikut:
1. Tentukan Jumlah Cluster Yang Ingin Dibentuk Dari Sebuah Data Set
2. Tentukan lokasi tengah atau centroid cluster secara acak
3. Untuk setiap baris data, temukan cluster yang paling dekat dengan pusat cluster.
4. Untuk setiap cluster, temukan centroid cluster dan perbaharui lokasi masing-masing pusat
cluster untuk mendapatkan nilai centroid yang baru
5. Ulangi langkah ke-3 sampai langkah ke-5 sampai ditemui cluster yang konvergen sebagai
akhir dari clustering.
Rumus untuk menghitung jarak diantara dua titik dengan Euclidean
distancespacemenggunakan rumus:
π‘‘πΈπ‘π‘™π‘’π‘‘π‘’π‘Žπ‘› (x,y) = √∑(π‘₯𝑖 − 𝑦1 )2 ……………………… (1)
Dimana:
x dan y : representasi nilai atribut dari dua record.
Sedangkan untuk membangkitkan centroid baru dapat menggunakan rumus
pembangkitan centroid berikut ini:
C=
∑π‘š
𝑛
………………………………………………… (2)
Dimana:
C : Centroid Data
m : Anggota Data Yang Termasuk
Kedalam Centroid Tertentu
n : Jumlah Data Yang Menjadi
Anggota Centroid Tertentu
4. Kesimpulan
Dengan menggunakan clustering, dapat diidentifikasi daerah yang padat, pola-pola distribusi
secara keseluruhan dan keterkaitan yang menarik antara atribut-atribut data. Dalam data mining
usaha difokuskan pada metode-metode penemuan untuk cluster pada basisdata berukuran besar
secara efektif dan efisien. Banyaknya pendekatan clustering menyulitkan dalam menentukan
ukuran kualitas yang universal. Namun, beberapa hal yang perlu diperhatikan adalah input
parameter yang tidak menyulitkan user, cluster hasil yang dapat dianalisa, dan skalabilitas
terhadap penambahan ukuran dimensi dan record dataset. Secara garis besar ada beberapa
kategori algoritma clustering yang dikenal yaitu: a. Metode Partisi, dimana pemakai harus
menentukan jumlah k partisi yang diinginkan lalu setiap data dites untuk dimasukkan pada salah
satu partisi sehingga tidak ada data yang overlap dan satu data hanya memiliki satu cluster.
Contohnya: algoritma K-Means. b. Metode Hierarki, yang menghasilkan cluster yang bersarang
artinya suatu data dapat memiliki cluster lebih dari satu. Metode ini terbagi menjadi dua yaitu
Title of manuscript is short and clear, implies research results (First Author)
buttom-up yang menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yang
memecah cluster besar menjadi cluster yang lebih kecil.
3.
METODE PENELITIAN
Metodologi penelitian akan sangat membantu penulis dalam proses penyelesaian
masalah. penelitian ini memiliki beberapa tahapan dalam pelaksanaan kegiatan yaitu definisi
masalah, analisa masalah, menentukan tujuan, mempelajari literatur, mengumpulkan data,
analisa perhitungan theorema bayes, perancangan interface, pengolahan data, implementasi,
pengujian dan kesimpulan.
1. Mendefinisikan Masalah
Proses pertama yang dilakukan dalam melakukan suatu penelitian adalah
mendefinisikan masalah. Dalam tahap ini peneliti menentukan masalah yang akan
diteliti serta menjabarkan dengan lebih luas lagi mengenai masalah tersebut. Pada
penelitian yang akan dilakukan, peneliti memilih masalah tentang penyakit Gagal
Jantung
2. Menganalisa Masalah
Pada tahap ini peneliti mengkaji lebih dalam tentang masalah yang diteliti yaitu
mengenai penyakit Gagal Jantung. Pada tahap ini peneliti harus sudah memahami
semua hal tentang masalah yang dihadapi.
3. Menentukan Tujuan
Berdasarkan pemahaman dari permasalahan yang telah di analisa, langkah berikutnya
adalah menentukan tujuan yang akan dicapai dalam penelitian ini. Tujuan yang ingin
dicapai dalam penelitian ini adalah terciptanya suatu aplikasi yang dapat memberikan
informasi mengenai gejala-gejala penyakit yang diakibatkan oleh dan bagaimana cara
untuk mengatasinya.
4. Mempelajari Literatur
Pada proses ini, peneliti melengkapi perbendaharaan kaidah, konsep, teori-teori yang
mendukung dalam penyelesaian masalah dalam penelitian ini. Peneliti jugamempelajari
buku-buku dan jurnal-jurnal, yang berhubungan denga penelitian ini maupun refrensi
yang lain. Tahap ini bertujuan untuk memberikan wawasan yang luas kepada peneliti
tentang masalah yang akan diteliti..
5. Mengumpulkan Data
Pada tahap ini dilakukan pengumpulan data yang mendukung penelitian.
Pemngumpulan data dapat dilakukan dengan beberapa metode, yaitu :
a. Metode Lapangan
Metode ini dilakukan dengan peninjauan langsung ke lapangan dimana penelitian
akan dilakukan.
b. Metode Pustaka
Metode ini dilakukan dengan mempelajari buku-buku atapun karya ilmiah lain yang
berhubungan dengan masalah yang akan diteliti.
6. Kesimpulan
Setelah dilakukan pengujian terhadap sistem maka dapat ditarik kesimpulan, apakah
aplikasi yang dibangun sudah sesuai dengan tujuan yang ingin dicapai.
4.
PEMBAHASAN DAN HASIL
Title of manuscript is short and clear, implies research results (First Author)
4.1 Perancangan Sistem
Perancangan sistem pada bagian ini meliputi garis besar perancangan sistem pakar
penentuan penyakit jantung.
4.2.SkenarioUjiCoba
Metode 3-fold cross validation membagi sebuah himpunancontoh secara acak menjadi 3
subset yang saling bebas. Dilakukan pengulangan sebanyak 3-kali untuk pelatihan dan
pengujian. Pada setiap ulangan, disisakan satu subset untuk pengujian dan subset lainnya
untuk pelatihan. Tingkat akurasi dihitung dengan membagi jumlah keseluruhan klasifikasi
yang benar denganjumlah semua instance pada data awal .
5. SARAN
Diharapkan penelitian selajutnya untuk dapat mengembangkan penelitian ini, sehingga
sistem pakar yang dibangun tidak hanya dapat diterapkan untuk mengdiagnosa penyakit gagal
jantung.
UCAPAN TERIMA KASIH
Penulis mengucapkan terima kasih kepada seluruh jajaran Universitas Potensi Utama
Medandan Seluruh kerabat penulis yang telah memberi dukungan terhadap penelitian ini.
DAFTAR PUSTAKA
Title of manuscript is short and clear, implies research results (First Author)
[1]Krisnahara E.Sistem Diagnosa Penyakit Jantung Menggunakan Fuzzy Logic. Jurusan
Manajemen Informatika Dan Teknik Komputer STIKOM Surabaya, 2009.
[2]Ayodya L., Ryadi. Penyakit Jantung Koroner. Dia Rakyat. Jakarta, 2010.
Title of manuscript is short and clear, implies research results (First Author)
Download