Prosiding Seminar Nasional Teknologi dan Teknopreneur (SNTT) 2013 FASTIKOM UNSIQ Wonosobo, 18 Juni 2013 ISSN: 2338-3887 ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG KORONER Adi Suwondo 1) Dian Asmarajati 2) Heri Surahman 3) Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer Universitas Sains Al-Quran Jawa Tengah di Wonosobo 1,2,3) Jl. Raya Kalibeber Km.03 Mojotengah, Wonosobo Telepon (0286) 3326102 E-mail: [email protected] 1) E-mail: [email protected] 2) E-mail: [email protected] 3) ABSTRACT The pattern of symptoms of coronary heart disease (CHD) are so numerous and varied, so that predition of the disease is still less accrurate. Many methods used in this case, one of them data mining. Data mining is a method of extracting or “mining” knowledge from large amounts of data. Techniques use in data mining is based AdaBoost algorithm C4.5. Adaboost based C4.5 algorithm will be used to classify the pattern of symptoms of coronary haerat disease with the addition of aboosting method to obtain higher accuracy value. C4.5 uses anormalization to get te information (entropy difference) and the results of the election is used to separate the attributes of the data. Attributes that have the highest normalized information is one that is used to make decisions. While AdaBoost is a boosting algorithm that is used to bulid the strength of the classification as a linier combination. Therefore in this study will try to predict coronary heart disease (CHD) with 195 general chek-up of data taken from the Avisena Wonosobo laboratory database. The framework used in this study is Rapid Miner Keywords : Coronary Heart Disease (CHD), Datamining, C4.5, AdaBoost, Rapid Miner PENDAHULUAN Faktor risiko penyakit kardiovaskular sekarang sudah signifikan dalam semua populasi [2]. Di Indonesia telah terjadi pergeseran kejadian penyakit jantung dan pembuluh darah dari urutan ke-10 pada tahun 1980 menjadi urutan ke13 pada tahun 1986 [1]. Sedangkan sebagai penyebab kematian tetap menduduki peringkat ke-3. Pada penelitian ini mengambil data pasien general chek up dari laboratorium Avisena dari tahun 2010 hingga 2011, teknik yang digunakan adalah decision tree dengan menambahkan metode boosting didalamnya yakni adaboost [6]. Adaboost digunakan dengan alasan metode ini dapat mingkatkan ketelitian dalam proses klasifikasi dan prediksi dengan cara membangkitkan kombinasi dari suatu model, dengan memilih model yang memiliki nilai bobot paling besar. Berdasarkan latar belakang yang telah diuraikan di atas, dapat dirumuskan bahwa Prediksi penyakit jantung koroner dengan algoritma C4.5 belum menunjukkan nilai akurasi tinggi. Sedangkan pertanyaan penelitian (question research) pada penelitian ini adalah Bagaimana penerapan Adaboost pada algoritma C4.5 dapat meningkatkan akurasi pada prediksi penyakit jantung koroner?. Tujuan penelitian ini adalah untuk menerapkan AdaBoost pada Algoritma C4.5 untuk meningkatkan akurasi prediksi penyakit jantung koroner” Manfaat dari penelitian ini adalah manfaat praktis dari penelitian ini adalah staff medis dapat menggunakan model yang telah dikembangkan untuk memprediksi penyakit jantung koroner pada pasien, serta manfaat teoritis hasil penelitian ini adalah penerapan Adaboost pada algoritma C4.5 dalam pemodelan yang berkaitan dengan klasifikasi faktor risiko penyakit jantung koroner, dan manfaat kebijakan penelitian ini diharapkan dapat digunakan pada lembaga laboratorium Avisena Wonosobo. Kontribusi yang diharapkan dapat diberikan dari penelitian ini adalah dengan penerapan Adaboost pada algoritma C4.5 akan meningkatkan prediksi penyakit jantung koroner berdasarkan faktor risiko dengan lebih akurat. LANDASAN TEORI 1. Data Mining Secara sederhana, data mining merupakan penggalian atau "pertambangan" pengetahuan dari sejumlah besar data [7]. Data mining merupakan bagian dari proses Knowledge Discovery from Data (KDD). 1