Naive Bayes Classifier Pada Rancangan Aplikasi Analisis Faktor

advertisement
Naive Bayes Classifier Pada Rancangan Aplikasi
Analisis Faktor Risiko Penyakit Jantung Orang
Dewasa Berdasarkan Lab Kimia Darah Dengan :
Pengamatan PadaMayapada Hospital
Alowisius Yoga Amelga1, Marco Maureece M.2, Mulyadi Salim3, Eka Miranda4
1,2,3,4
School of Information System
Jln. K.H Syahdan 9, Kemanggisan, Palmerah, Jakarta Barat
[email protected], [email protected], [email protected],
[email protected]
ABSTRAK
Penyakit jantung menjadi teror yang menakutkan karena tidak bisa dilihat secara kasat mata dan
dapat datang secara tiba – tiba. Ada beberapa faktor resiko yang menyebabkan terjadinya
penyakit jantung seperti penyakit – penyakit dalam, pola hidup, faktor keturunan dan lain
sebagainya. Tujuan penelitian ini adalah membuat sebuah rancangan aplikasi analisis yang akan
digunakan oleh petugas medis. Aplikasi analisis ini berkaitan dengan beresiko atau tidaknya
pasien terhadap penyakit jantung yang didukung dengan eksplorasi dan ekstrasi semua data yang
diperlukan, serta mewujudkanya kedalam sebuah rancangan aplikasi data mining. Metodologi
penelitian yang dilakukan: Metodologi Fundamental, mengaitkan beberapa teori yang relevan
terkait dengan bidang kesehatan yaitu medical research dan bidang penambangan data yaitu Data
Mining Classification : Naive Bayes Classifier dan Teknikal, melakukan perhitungan dan
pengolahan data yang didapat dari analisis fundamental dengan menggunakan Data Mining
Classification : Naive Bayes Classifier, melalui tahapan – tahapan yang mengacu pada CRISPDM. Hasil dari penelitian ini adalah aplikasi analisis yang digunakan oleh petugas medis untuk
menyediakan informasi yang relevan dan terintegrasi mengenai analisis faktor resiko penyakit
jantung yang dapat bermanfaat bagi pasien dalam merubah paradigma tentang penyakit jantung
pasien sedangkan manfaat bagi lembaga kesehatan adalah dapat memudahkan lembaga
kesehatan mengetahui ketepatan dalam mengukur faktor resiko penyekit jantung.
Kata Kunci : aplikasi analisis faktor resiko penyakit jantung, naïve bayes, data mining
Heart Disease becomes a frightening terror because it couldn’t be seen physically and suddenly
could come. There are some factors that cause a heart disease, like internal disease, life style,
genetic factor, etc. The purpose of research is to create a design of analysis application that can
be used by medical officers. This analysis application is related to those patients who might be
risked or not risked to heart disease which is supported with exploration and extraction of
necessary data, and also to implement it to design of data mining application. Research methods
applied were: Fundamental Method, relating some relevant theories to health sector which are
medical research and Data Mining Classification: Naive Bayes Classifier and also Technical,
doing calculation and processing the data which is acquired from fundamental analysis with Data
Mining Classification: Naive Bayes Classifier through phases of CRISP-DM. The research
results are this analysis application can be used by medical officers to provide relevant and
integrated information about analysis of heart disease risk factor that can be useful to patients to
change their paradigm about heart disease, while the benefit to health sector is to ease health
sector getting the knowledge about the precision of heart disease risk factor measurement.
Keywords : analysis application of heart disease risk factor, naïve bayes, data mining
PENDAHULUAN
Dewasa ini menganalisis seorang pasien secara tepat dan memberikan perawatan yang efektif
menjadi satu tantangan tersendiri bagi rumah sakit. Dan untuk memperoleh perawatan yang
efektif dan tepat, suatu sistem informasi atau sistem pendukung keputusan dapat dikembangkan
untuk menjawab tantangan tersebut. Tidak sedikit pula rumah sakit yang sudah menggunakan
sistem informasi untuk mengatur jasa kesehatan mereka dan data pasien. Setiap riwayat penyakit
dan seluruh data perawatan serta fasilitas yang digunakan oleh pasien juga disimpan ke dalam
suatu catatan medis baik itu secara sistem atau manual. Seluruh data ini sebenarnya bertujuan
untuk menjadi bahan evaluasi setiap lembaga kesehatan untuk meningkatkan performa setiap
lembaga kesehatan dan semua sumber daya yang ada didalamnya tetapi di Mayapada Hospital
semua catatan medis itu tidak digunakan sebagaimana mestinya. Sayangnya, data seperti ini
jarang digunakan untuk mendukung pengambilan keputusan klinis sehingga ada banyak
informasi tersembunyi dari data tersebut yang belum ditelusuri (Ishtake S.H & Sanap S.A.,
2013). Maka dari itu sistem pengambilan keputusan yang mendukung analisis untuk dokter yang
naif dan dokter yang berpengalaman pun bisa menjadi suatu penuntun untuk pengambilan
keputusan klinis (Anbarasi, Anupriya, & Inyengar, 2010).
Ditambah lagi dengan hadirnya penyakit jantung yang menjadi penyakit mematikan karena tidak
dapat dilihat secara kasat mata dan dapat datang secara tiba – tiba (Ishtake S.H & Sanap S.A.,
2013). Maka pada skripsi ini akan dibahas tentang bagaimana caranya menghasilkan analisis
faktor resiko untuk penyakit jantung pada orang dewasa dari riwayat lab kimia darah pasien yang
pernah terdaftar di RS. Mayapada Tangerang melalui lab kimia darah pasien yang sudah dicatat
kedalam catatan medis. Skripsi ini bertujuan untuk membantu menunjang pengambilan
keputusan sedini mungkin bagi pasien agar mereka lebih mantap mempersiapkan psikologi akan
kemungkinan medis yang dihadapi diri mereka dan perencanaan untuk keuangan mereka karena
biaya perawatan bagi penderita jantung yang tidak sedikit. Selain untuk membantu menunjang
pengambilan keputusan sedini mungkin bagi pasien, analisis awal melalui lab kimia darah juga
berguna bagi manajemen untuk mempersiapkan sumber daya rumah sakit terkait pelayanan bagi
pasien jantung orang dewasa jadi hasil analisis lab kimia darah dapat dimanfaatkan untuk
keperluan manajemen meningkatkan kemampuan daya saing rumah sakit .
Penganalisaan ini akan dilakukan dengan menggabungkan konsep penambangan data (Data
Mining) dengan menggunakan teknik klasifikasi : naïve bayes dimana data perolehan yang
menjadi sumber utama yaitu lab kimia darah pasien untuk menghasilkan sebuah persentase
kedekatan kondisi pasien sekarang terhadap penyakit jantung pada orang dewasa. Skripsi ini
ingin mengangkat bahwa keberhasilan analisis faktor resiko terhadap penyakit jantung melalui
lab kimia darah adalah salah satu kunci keberhasilan dalam mempersiapkan diri si pasien dan
juga sebagai prediksi rumah sakit agar mampu meningkatkan sumber daya di klinik jantung.
METODE PENELITIAN
Metodologi yang digunakan dalam penyusunan penelitian ini dibagi menjadi 2 bagian,
yaitu metode fundamental dan metode teknikal.
1. Metode analisis fundamental adalah mengaitkan beberapa teori yang relevan terkait
dengan bidang kesehatan yaitu medical research dan bidang penambangan data yaitu
Data Mining Classification : Naive Bayes Classifier yang dilakukan melalui tahap :
a. Survei atas sistem layanan medis yang berjalan dengan cara:
- Interview / Wawancara
Merupakan percakapan antara dua orang atau lebih dan terjadi antara narasumber
dan pewawancara. Tujuan dari wawancara adalah untuk mendapatkan informasi
dimana pewawancara memberikan pertanyaan untuk dijawab oleh narasumber.
- Observasi
Observasi yang berarti pengamatan bertujuan untuk mendapatkan informasi
tentang suatu masalah, sehingga diperoleh pemahaman atau pembuktian terhadap
informasi / keterangan yang diperoleh sebelumnya.
b. Analisis sistem layanan medis yang berjalan
c. Survei atas medical research Rumah Sakit yang pernah dilakukan
d. Analisis pemecahan masalah
2. Metode analisis teknikal yaitu melakukan perhitungan dan pengolahan data yang didapat
dari analisis fundamental dengan menggunakan Data Mining Classification : Naive Bayes
Classifier, melalui tahapan – tahapan yang mengacu pada CRISP-DM.
HASIL DAN BAHASAN
Aplikasi data mining yang telah dibuat oleh penulis mengambil data dari lab kimia darah. Dari
lab kimia darah tersebut didapatlah 37 atribut :
1.
Hos. Number
2.
Birthdate
3.
Sex
4.
Request #
5.
Coll. date
6.
Location
7.
Doctor Code
8.
GLU 70-110 mg/dl (Glukosa)
9.
GLU2J 100-140 mg/dl ( Glukosa 2 Jam)
10.
CHOL < 200 mg/dl ( Cholesterol)
11.
TRIG < 200 mg/ dl>(Trigliserit)
12.
HDL > 65 mg/dl ()
13.
LDL < 100 mg/dl ()
14.
UREA 15-39 mg/dl(Ureum Fungsi Ginjal)
15.
CREA 0.6-1.3 mg/dl (Creatine Fungsi Ginjal)
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
UA 2.6 – 6.2 mg/dl ( Urit Acid Asam Urat)
TP
?Troponin
ALB 3.4 – 5.0 g/dl (Albumin)
GLOB 2.8 – 3.2 g/dl (Globulin)
TBIL
DBIL
SGOT
SGPT
GGT
ALKF
HBA1C
CK
21 – 215 U/L
CKMB < 25 U/L
LDH < 200 U/L
TROPK
TROPT Tropomin I (Normal -) (Tidak Normal +)
NA 135 – 153 (Natrium)
K
3.5 – 5.3 (Kalium)
CL
98 – 109 mEq/L Clorit
CA
8.4 – 10.3 (Calsium)
MG 1.8 – 2.4 mg/dl (Magnesium)
AMIL (Amilase)
LIPAS (Lipase)
Namun dari 38 atribut ini hanya 16 atribut yang digunakan karena dianggap mempunyai
keterkaitan dengan beresiko atau tidaknya pasien terhadap penyakit jantung. Dari 16 atribut
tersebut 14 diantaranya terdiri dari data penyakit dalam yang terkait dengan jantung. Berikut
adalah penyakit dalam tersebut beserta atribut di dalam penyakit tersebut adalah fungsi ginjal
(UREA, CREA, UA), fungsi diabetes (Glukosa, Glukosa2J), fungsi lemak (Chol, LDL, HDL,
Trigliceride) dan fungsi jantung (CK, CKMB, TROPT, TROPK, LDH). 2 atribut lainnya yang
menjadi bahan analisa adalah umur dan jenis kelamin.
Setelah atribut – atribut siap, dimulailah proses data mining. Proses data mining yang
akan dilakukan adalah dengan menggunakan teknik klasifikasi : naïve bayes. Hasil output dari
proses data mining ini terbagi menjadi 4 kelas yaitu Kelas Normal, Kelas Beresiko Level 1, Kelas
Beresiko Level 2 dan Kelas Beresiko Level 3.
Gambar 1 Form Add New Single Patient
Gambar 2 Form Add New Single Patient (Lanjutan)
Attribut Charateristic
Attribut characteristic ini menunjukkan kondisi atribut dari masing masing target
class sehingga dari attribute characteristic ini dapat dilihat kondisi pasien seperti
apa yang beresiko terhadap penyakit jantung dari masing – masing level class
target. Berikut ini adalah deskripsi attribute characteristic dari masing – masing
kelas:
1.
Normal
Gambar 3 Chart Class Normal
Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia =
>50 Tahun, Gender = Male, UREA= Normal, CREA = Normal, UA = Normal,
CHOL = Normal, TRIG = Normal, LDL = Normal, GLU2J = Normal, CK =
Normal.
2.
Class Level 1
Gambar 4 Chart Class Level 1
Atribut dan nilai atribut yang dominan dalam kelas Level 1 adalah: Usia =
>50 Tahun, Gender = Male, UREA= Level 1, CREA = Level 1, UA = Level 1,
CHOL = Level 1, TRIG = Level 1, HDL = Level 1, LDL = Level 1, GLU =
Level 1, GLU2J = Level 1, CK = Level 1.
3.
Class Level 2
Gambar 5 Chart Class Level 2
Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia =
>50 Tahun, Gender = Male, UREA= Level 2, CREA = Level 2, UA = Level 2,
CHOL = Level 2, TRIG = Level 2, HDL = Level 2, LDL = Level 2, GLU =
Level 2, GLU2J = Level 2, CKMB = Level 2, LDH = Level 2.
4.
Class Level 3
Gambar 6 Chart Class Level 3
Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia =
>50 Tahun, Gender = Male, UREA= Level 3, CREA = Level 3, UA =
Level 3, CHOL = Level 3, TRIG = Level 3, HDL = Level 3, LDL = Level
3, GLU2J = Level 3, CK = Level 3, CKMB = Level 3, LDH = Level 3,
TROPT = Level 3.
SIMPULAN DAN SARAN
Setelah menganalisis sistem dan permasalahan yang terjadi pada Mayapada
Hospital, maka dapat disimpulkan bahwa :
1. Data mining dapat memanfaatkan data riwayat pasien rumah sakit untuk dilakukan
suatu penelitian yang menghasilkan analisis faktor resiko penyakit jantung. Analisa
mengenai faktor resiko penyakit jantung yang dianalisa terdiri atas: Umur, Gender,
Fungsi Ginjal (UREA, CREA, UA), Fungsi Diabetes (Glukosa, Glukosa2J), Fungsi
Lemak (HDL, LDL, Trigliceride, Cholesterol), Fungsi Jantung (CK, CKMB, TROPK,
LDH, TROPT).
2. Dari hasil analisa dihasilkan 4 target class untuk mengetahui apakah seorang pasien
beresiko atau tidak untuk terkena penyakit jantung, yaitu: Kelas Normal, Kelas Level
1, Kelas Level 2 dan Kelas Level 3.
3. Informasi hasil analisis faktor resiko penyakit jantung mendukung ketepatan dalam
menganalisis faktor resiko penyakit jantung dengan tingkat akurasi yang dihasilkan
oleh sistem untuk menghasilkan informasi sebesar 85.90 % sehingga informasi yang
dihasilkan bisa dikatakan cukup akurat dengan akurasi yang mendekati 100 %.
Dari hasil penelitian yang dilakukan, maka dapat diberikan beberapa saran untuk
pengembangan data mining dalam bidang kesehatan, yaitu:
1. Melakukan analisis dengan teknik klasifikasi yang lainnya seperti decision tree, rule
base classification, dan lain – lain dan membandingkan teknik klasifikasi mana yang
memiliki tingkat akurasi yang paling valid.
2. Penelitian dapat dilakukan dengan menggunakan data lain yang terkait dengan analisis
penyakit jantung, yaitu data EKG, pemeriksaan enzim jantung, Treadmill dan gejala
nyeri dada.
REFERENSI
Anbarasi, M., Anupriya, E., & Inyengar, N. S. (2010). Enhanced Prediction of Heart Disease with
Feature Subset Selection using Genetic. International Journal of Engineering Science and
Technology , 10.
S.H, M., & Sanap S.A., P. (2013). Intelligent Heart Disease Prediction System Using Data Mining
Techinques. International J. of Healthcare & Biomedical Research , 94-101.
RIWAYAT PENULIS
Nama : Alowisius Yoga Amelga
Tempat / Tanggal Lahir : 4 Mei 1991
Pendidikan : S1
Universitas : Bina Nusantara
Jurusan : Sistem Informasi
Pekerjaan : Pelajar
Nama : Marco Maureece Maribondang
Tempat / Tanggal Lahir : Tangerang, 17 Mei 1992
Pendidikan : S1
Universitas : Bina Nusantara
Jurusan : Sistem Informasi
Pekerjaan : Pelajar
Nama : Mulyadi Salim
Tempat / Tanggal Lahir : Jakarta, 12 Mei 1992
Pendidikan : S1
Universitas : Bina Nusantara
Jurusan : Sistem Informasi
Pekerjaan : Pelajar
Download