PENERAPAN METODE CLUSTERING UNTUK MENGDIAGNOSA JENIS PENYAKIT GAGAL JANTUNG Fithry Tahel Jurusan Sistem InformasiFakultas Teknik Universitas Potensi Utama Jl. K.L.Yos Sudarso Km 6,5 No. 3A Tanjung Mulia Medan Sumatera Utara 20241 Indonesia [email protected] Abstract Clustering is a grouping of activities in a wide variety of data recording, observation, or to approach the data of an object with another object that has a certain similarity. Cluster is kumpulani rows of data that have similarities and inequality to record into another cluster. Heart disease is the number one killer disease in the world. The cause was a wide variety, one of which is an unhealthy lifestyle and foods that contain high cholesterol. Cardiovascular disease is the number one cause of death in America. 4.8 million Americans suffer from cardiovascular disease. According to the American Heart Association, men have one of three likely to suffer major penyakitkardiovaskuler before the age of 60 years. The results of various tests conducted using 100 the data showed that the expert system disease determination of heart failure with the clustering method is capable of producing an average accuracy of 83% Keywords :Clustering, expert system, jantung Abstrak Clustering adalah sebuah kegiatan dalam mengelompokan berbagai macam rekaman data, observasi, atau melakukan pendekatan data dari sebuah objek dengan objek lain yang memiliki kesamaan tertentu. Cluster merupakan kumpulani baris data yang memiliki kesamaan dan ketidaksamaan untuk merekam kedalam cluster lain. (Johan Oscar Ong, 2013). Penyakit jantung merupakan penyakit mematikan nomor satu di dunia. Penyebabnya pun berbagai macam, salah satunya adalah pola hidup yang tidak sehat dan makanan yang banyak mengandung kolesterol tinggi. Penyakit kardiovaskuler merupakan penyebab kematian nomor satu di Amerika. 4,8 juta orang Amerika menderita penyakit kardiovasculer. Menurut American Heart Association, laki-laki memiliki satu dari tiga kemungkinan untuk menderita penyakitkardiovaskuler utama sebelum usia 60 tahun. Dari berbagai hasil ujicoba yang dilakukan dengan menggunakan 100 data didapatkan hasil bahwa sistem pakar penentuan penyakit gagal jantung dengan metode clustering mampu menghasilkan akurasi ratarata sebesar 83% Kata Kunci :Clustering, system pakar, jantung 1. PENDAHULUAN Penyakit kardiovaskuler merupakan penyebab kematian nomor satu di Amerika. 4,8 juta orang Amerika menderita penyakit kardiovasculer. Selama ini teradapat suatu pemahaman bahwa penyakit kardiovaskuler terjadi pada laki-laki. Akan tetapi kenyataannya di Amerika, penyakit kardiovaskuler merupakan penyakit nomor satu dan mematikan pada laki-laki maupun perempuan. Perbedaan utama antara kedua gener adalah usia penyakit yang dialami. Menurut American Heart Received June1st,2012; Revised June25th, 2012; Accepted July 10th, 2012 Association, laki-laki memiliki satu dari tiga kemungkinan untuk menderita penyakit kardiovaskuler utama sebelum usia 60 tahun. Adanya estrogen sebelum awitan menopause diangggap merupakan faktor pelindung utama unutk menghindari terkena penyakit , jantung koroner dan penyakit stroke pada saat ini.Decompensasi cordis merupakan salah satu penyakit dari kardiovaskuler. Untuk menentukan penyakit decompensasi cordis terdapat berbagai inputan yaitu berupa gejala – gejala yang dialami pasien sehingga diberikan metode yang sesuai dan mudah dipahami. Metode clustering adalah metode yang dapat menerima inputan dalam bentuk apapun dan kecepatan dalam memproses suatu data,jadi pada setiap data baru akan dilakukan probabilitas dengan setiap class yang ada, hasil akhirnya dilihat nilai yang paling tinggi, sehingga algoritma ini dirasa cukup baik untuk menentukan probabilitas dalam menentukan hasil dari penelitian ini. 2. TINJAUAN PUSTAKA 2.1. Kecerdasan Buatan Menurut Muhammad Dahria (2008), Kecerdasan Buatan (Artificial Intelligence) merupakan salah satu bagian ilmu computer yang mempelajari bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan sebaik yang dilakukan manusia bahkan bias lebih baik yang dilakukan pada manusia. Manusia cerdas (pandai) dalam menyelesaikan permasalahan karena manusia mempunyai pengetahuan dan pengalaman. Pengetahuan diperoleh dari belajar. Semakin banyak bekal pengetahuan yang dimiliki tentu akan lebih mampu menyelesaikan permasalahan. Tapi bekal pengetahuan saja tidak cukup, manusia juga memiliki akal untuk melakukan penalaran, mengambil kesimpulan berdasarkan pengetahuan dan pengalaman yang dimiliki. 2.2. Sistem Pakar Sistem pakar merupakan cabang dari Artificial intelligent (AI). Implementasi sistem pakar banyak digunakan untuk kepentingan komersial karena sistem pakar dipandang sebagai cara penyimpanan pengetahuan pakar dalam bidang tertentu ke dalam program sehingga komputer dapatmemberikan keputusan dan melakukan penalaran secara cerdas.[3]. Kecerdasan buatan sebagaimana telah diketahui, saat ini merupakan suatu inovasi baru dalam bidang ilmu pengetahuan. Kecerdasan buatan atau Artificial Intelligence merupakan salah satu bagian ilmu komputer yang membuat agar mesin (komputer) dapat melakukan pekerjaan seperti dan sebaik yang dilakukan oleh manusia.Teknologi kecerdasan buatan dipelajari dalam bidang-bidang, seperti: robotika, penglihatan komputer (computervision), jaringan saraf tiruan (artificial neuralsystem), pengolahan bahasa alami (natural language processing), pengenalan suara (speech recognition) dan sistem pakar (expert system).[2] 2.3. Clustering Menurut Joanna Ardhyanti Mita Nugraha dan Yupie Kusumawati menyatakan Clustering adalah mengelompokkan item data ke dalam sejumlah kecil grup sedemikian sehingga masing-masing grup mempunyai sesuatu persamaan yang esensial. Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain. Clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui Title of manuscript is short and clear, implies research results (First Author) itu. Karena itu clustering sering digolongkan sebagai metode unsupervised learning. Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas atau cluster. Clustering dapat dilakukan pada data yan memiliki beberapa atribut yang dipetakan sebagai ruang multidimensi. K-means clustering merupakan salah satu metode data clustering non-hirarki yang mengelompokan data dalam bentuk satu atau lebih cluster/kelompok. Data-data yang memiliki karakteristik yang sama dikelompokan dalam satu cluster/kelompok dan data yang memiliki karakteristik yang berbeda dikelompokan dengan cluster/kelompok yang lain sehingga data yang berada dalam satu cluster/kelompok memiliki tingkat variasi yang kecil (Agusta, 2007). Menurut D.T Larose (2007), langkah-langkah melakukan clustering dengan metode KMeans adalah sebagai berikut: 1. Tentukan Jumlah Cluster Yang Ingin Dibentuk Dari Sebuah Data Set 2. Tentukan lokasi tengah atau centroid cluster secara acak 3. Untuk setiap baris data, temukan cluster yang paling dekat dengan pusat cluster. 4. Untuk setiap cluster, temukan centroid cluster dan perbaharui lokasi masing-masing pusat cluster untuk mendapatkan nilai centroid yang baru 5. Ulangi langkah ke-3 sampai langkah ke-5 sampai ditemui cluster yang konvergen sebagai akhir dari clustering. Rumus untuk menghitung jarak diantara dua titik dengan Euclidean distancespacemenggunakan rumus: ππΈπππ’ππππ (x,y) = √∑(π₯π − π¦1 )2 ……………………… (1) Dimana: x dan y : representasi nilai atribut dari dua record. Sedangkan untuk membangkitkan centroid baru dapat menggunakan rumus pembangkitan centroid berikut ini: C= ∑π π ………………………………………………… (2) Dimana: C : Centroid Data m : Anggota Data Yang Termasuk Kedalam Centroid Tertentu n : Jumlah Data Yang Menjadi Anggota Centroid Tertentu 4. Kesimpulan Dengan menggunakan clustering, dapat diidentifikasi daerah yang padat, pola-pola distribusi secara keseluruhan dan keterkaitan yang menarik antara atribut-atribut data. Dalam data mining usaha difokuskan pada metode-metode penemuan untuk cluster pada basisdata berukuran besar secara efektif dan efisien. Banyaknya pendekatan clustering menyulitkan dalam menentukan ukuran kualitas yang universal. Namun, beberapa hal yang perlu diperhatikan adalah input parameter yang tidak menyulitkan user, cluster hasil yang dapat dianalisa, dan skalabilitas terhadap penambahan ukuran dimensi dan record dataset. Secara garis besar ada beberapa kategori algoritma clustering yang dikenal yaitu: a. Metode Partisi, dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data dites untuk dimasukkan pada salah satu partisi sehingga tidak ada data yang overlap dan satu data hanya memiliki satu cluster. Contohnya: algoritma K-Means. b. Metode Hierarki, yang menghasilkan cluster yang bersarang artinya suatu data dapat memiliki cluster lebih dari satu. Metode ini terbagi menjadi dua yaitu Title of manuscript is short and clear, implies research results (First Author) buttom-up yang menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yang memecah cluster besar menjadi cluster yang lebih kecil. 3. METODE PENELITIAN Metodologi penelitian akan sangat membantu penulis dalam proses penyelesaian masalah. penelitian ini memiliki beberapa tahapan dalam pelaksanaan kegiatan yaitu definisi masalah, analisa masalah, menentukan tujuan, mempelajari literatur, mengumpulkan data, analisa perhitungan theorema bayes, perancangan interface, pengolahan data, implementasi, pengujian dan kesimpulan. 1. Mendefinisikan Masalah Proses pertama yang dilakukan dalam melakukan suatu penelitian adalah mendefinisikan masalah. Dalam tahap ini peneliti menentukan masalah yang akan diteliti serta menjabarkan dengan lebih luas lagi mengenai masalah tersebut. Pada penelitian yang akan dilakukan, peneliti memilih masalah tentang penyakit Gagal Jantung 2. Menganalisa Masalah Pada tahap ini peneliti mengkaji lebih dalam tentang masalah yang diteliti yaitu mengenai penyakit Gagal Jantung. Pada tahap ini peneliti harus sudah memahami semua hal tentang masalah yang dihadapi. 3. Menentukan Tujuan Berdasarkan pemahaman dari permasalahan yang telah di analisa, langkah berikutnya adalah menentukan tujuan yang akan dicapai dalam penelitian ini. Tujuan yang ingin dicapai dalam penelitian ini adalah terciptanya suatu aplikasi yang dapat memberikan informasi mengenai gejala-gejala penyakit yang diakibatkan oleh dan bagaimana cara untuk mengatasinya. 4. Mempelajari Literatur Pada proses ini, peneliti melengkapi perbendaharaan kaidah, konsep, teori-teori yang mendukung dalam penyelesaian masalah dalam penelitian ini. Peneliti jugamempelajari buku-buku dan jurnal-jurnal, yang berhubungan denga penelitian ini maupun refrensi yang lain. Tahap ini bertujuan untuk memberikan wawasan yang luas kepada peneliti tentang masalah yang akan diteliti.. 5. Mengumpulkan Data Pada tahap ini dilakukan pengumpulan data yang mendukung penelitian. Pemngumpulan data dapat dilakukan dengan beberapa metode, yaitu : a. Metode Lapangan Metode ini dilakukan dengan peninjauan langsung ke lapangan dimana penelitian akan dilakukan. b. Metode Pustaka Metode ini dilakukan dengan mempelajari buku-buku atapun karya ilmiah lain yang berhubungan dengan masalah yang akan diteliti. 6. Kesimpulan Setelah dilakukan pengujian terhadap sistem maka dapat ditarik kesimpulan, apakah aplikasi yang dibangun sudah sesuai dengan tujuan yang ingin dicapai. 4. PEMBAHASAN DAN HASIL Title of manuscript is short and clear, implies research results (First Author) 4.1 Perancangan Sistem Perancangan sistem pada bagian ini meliputi garis besar perancangan sistem pakar penentuan penyakit jantung. 4.2.SkenarioUjiCoba Metode 3-fold cross validation membagi sebuah himpunancontoh secara acak menjadi 3 subset yang saling bebas. Dilakukan pengulangan sebanyak 3-kali untuk pelatihan dan pengujian. Pada setiap ulangan, disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan. Tingkat akurasi dihitung dengan membagi jumlah keseluruhan klasifikasi yang benar denganjumlah semua instance pada data awal . 5. SARAN Diharapkan penelitian selajutnya untuk dapat mengembangkan penelitian ini, sehingga sistem pakar yang dibangun tidak hanya dapat diterapkan untuk mengdiagnosa penyakit gagal jantung. UCAPAN TERIMA KASIH Penulis mengucapkan terima kasih kepada seluruh jajaran Universitas Potensi Utama Medandan Seluruh kerabat penulis yang telah memberi dukungan terhadap penelitian ini. DAFTAR PUSTAKA Title of manuscript is short and clear, implies research results (First Author) [1]Krisnahara E.Sistem Diagnosa Penyakit Jantung Menggunakan Fuzzy Logic. Jurusan Manajemen Informatika Dan Teknik Komputer STIKOM Surabaya, 2009. [2]Ayodya L., Ryadi. Penyakit Jantung Koroner. Dia Rakyat. Jakarta, 2010. Title of manuscript is short and clear, implies research results (First Author)