algoritma c4.5 berbasis adaboost untuk prediksi penyakit jantung

advertisement
Prosiding Seminar Nasional Teknologi dan Teknopreneur (SNTT) 2013
FASTIKOM UNSIQ Wonosobo, 18 Juni 2013
ISSN: 2338-3887
ALGORITMA C4.5 BERBASIS ADABOOST UNTUK
PREDIKSI PENYAKIT JANTUNG KORONER
Adi Suwondo 1)
Dian Asmarajati 2)
Heri Surahman 3)
Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer
Universitas Sains Al-Quran Jawa Tengah di Wonosobo 1,2,3)
Jl. Raya Kalibeber Km.03 Mojotengah, Wonosobo
Telepon (0286) 3326102
E-mail: [email protected] 1)
E-mail: [email protected] 2)
E-mail: [email protected] 3)
ABSTRACT
The pattern of symptoms of coronary heart disease (CHD) are so numerous and varied, so
that predition of the disease is still less accrurate. Many methods used in this case, one of them
data mining. Data mining is a method of extracting or “mining” knowledge from large amounts
of data. Techniques use in data mining is based AdaBoost algorithm C4.5. Adaboost based C4.5
algorithm will be used to classify the pattern of symptoms of coronary haerat disease with the
addition of aboosting method to obtain higher accuracy value. C4.5 uses anormalization to get
te information (entropy difference) and the results of the election is used to separate the
attributes of the data. Attributes that have the highest normalized information is one that is used
to make decisions. While AdaBoost is a boosting algorithm that is used to bulid the strength of
the classification as a linier combination.
Therefore in this study will try to predict coronary heart disease (CHD) with 195 general
chek-up of data taken from the Avisena Wonosobo laboratory database. The framework used in
this study is Rapid Miner
Keywords : Coronary Heart Disease (CHD), Datamining, C4.5, AdaBoost, Rapid Miner
PENDAHULUAN
Faktor risiko penyakit kardiovaskular sekarang sudah signifikan dalam semua populasi [2]. Di Indonesia telah
terjadi pergeseran kejadian penyakit jantung dan pembuluh darah dari urutan ke-10 pada tahun 1980 menjadi urutan ke13 pada tahun 1986 [1]. Sedangkan sebagai penyebab kematian tetap menduduki peringkat ke-3.
Pada penelitian ini mengambil data pasien general chek up dari laboratorium Avisena dari tahun 2010 hingga
2011, teknik yang digunakan adalah decision tree dengan menambahkan metode boosting didalamnya yakni adaboost
[6]. Adaboost digunakan dengan alasan metode ini dapat mingkatkan ketelitian dalam proses klasifikasi dan prediksi
dengan cara membangkitkan kombinasi dari suatu model, dengan memilih model yang memiliki nilai bobot paling
besar.
Berdasarkan latar belakang yang telah diuraikan di atas, dapat dirumuskan bahwa Prediksi penyakit jantung
koroner dengan algoritma C4.5 belum menunjukkan nilai akurasi tinggi. Sedangkan pertanyaan penelitian (question
research) pada penelitian ini adalah Bagaimana penerapan Adaboost pada algoritma C4.5 dapat meningkatkan akurasi
pada prediksi penyakit jantung koroner?. Tujuan penelitian ini adalah untuk menerapkan AdaBoost pada Algoritma
C4.5 untuk meningkatkan akurasi prediksi penyakit jantung koroner” Manfaat dari penelitian ini adalah manfaat praktis
dari penelitian ini adalah staff medis dapat menggunakan model yang telah dikembangkan untuk memprediksi penyakit
jantung koroner pada pasien, serta manfaat teoritis hasil penelitian ini adalah penerapan Adaboost pada algoritma C4.5
dalam pemodelan yang berkaitan dengan klasifikasi faktor risiko penyakit jantung koroner, dan manfaat kebijakan
penelitian ini diharapkan dapat digunakan pada lembaga laboratorium Avisena Wonosobo. Kontribusi yang diharapkan
dapat diberikan dari penelitian ini adalah dengan penerapan Adaboost pada algoritma C4.5 akan meningkatkan prediksi
penyakit jantung koroner berdasarkan faktor risiko dengan lebih akurat.
LANDASAN TEORI
1.
Data Mining
Secara sederhana, data mining merupakan penggalian atau "pertambangan" pengetahuan dari sejumlah besar
data [7]. Data mining merupakan bagian dari proses Knowledge Discovery from Data (KDD).
1
Download