Naive Bayes Classifier Pada Rancangan Aplikasi Analisis Faktor Risiko Penyakit Jantung Orang Dewasa Berdasarkan Lab Kimia Darah Dengan : Pengamatan PadaMayapada Hospital Alowisius Yoga Amelga1, Marco Maureece M.2, Mulyadi Salim3, Eka Miranda4 1,2,3,4 School of Information System Jln. K.H Syahdan 9, Kemanggisan, Palmerah, Jakarta Barat [email protected], [email protected], [email protected], [email protected] ABSTRAK Penyakit jantung menjadi teror yang menakutkan karena tidak bisa dilihat secara kasat mata dan dapat datang secara tiba – tiba. Ada beberapa faktor resiko yang menyebabkan terjadinya penyakit jantung seperti penyakit – penyakit dalam, pola hidup, faktor keturunan dan lain sebagainya. Tujuan penelitian ini adalah membuat sebuah rancangan aplikasi analisis yang akan digunakan oleh petugas medis. Aplikasi analisis ini berkaitan dengan beresiko atau tidaknya pasien terhadap penyakit jantung yang didukung dengan eksplorasi dan ekstrasi semua data yang diperlukan, serta mewujudkanya kedalam sebuah rancangan aplikasi data mining. Metodologi penelitian yang dilakukan: Metodologi Fundamental, mengaitkan beberapa teori yang relevan terkait dengan bidang kesehatan yaitu medical research dan bidang penambangan data yaitu Data Mining Classification : Naive Bayes Classifier dan Teknikal, melakukan perhitungan dan pengolahan data yang didapat dari analisis fundamental dengan menggunakan Data Mining Classification : Naive Bayes Classifier, melalui tahapan – tahapan yang mengacu pada CRISPDM. Hasil dari penelitian ini adalah aplikasi analisis yang digunakan oleh petugas medis untuk menyediakan informasi yang relevan dan terintegrasi mengenai analisis faktor resiko penyakit jantung yang dapat bermanfaat bagi pasien dalam merubah paradigma tentang penyakit jantung pasien sedangkan manfaat bagi lembaga kesehatan adalah dapat memudahkan lembaga kesehatan mengetahui ketepatan dalam mengukur faktor resiko penyekit jantung. Kata Kunci : aplikasi analisis faktor resiko penyakit jantung, naïve bayes, data mining Heart Disease becomes a frightening terror because it couldn’t be seen physically and suddenly could come. There are some factors that cause a heart disease, like internal disease, life style, genetic factor, etc. The purpose of research is to create a design of analysis application that can be used by medical officers. This analysis application is related to those patients who might be risked or not risked to heart disease which is supported with exploration and extraction of necessary data, and also to implement it to design of data mining application. Research methods applied were: Fundamental Method, relating some relevant theories to health sector which are medical research and Data Mining Classification: Naive Bayes Classifier and also Technical, doing calculation and processing the data which is acquired from fundamental analysis with Data Mining Classification: Naive Bayes Classifier through phases of CRISP-DM. The research results are this analysis application can be used by medical officers to provide relevant and integrated information about analysis of heart disease risk factor that can be useful to patients to change their paradigm about heart disease, while the benefit to health sector is to ease health sector getting the knowledge about the precision of heart disease risk factor measurement. Keywords : analysis application of heart disease risk factor, naïve bayes, data mining PENDAHULUAN Dewasa ini menganalisis seorang pasien secara tepat dan memberikan perawatan yang efektif menjadi satu tantangan tersendiri bagi rumah sakit. Dan untuk memperoleh perawatan yang efektif dan tepat, suatu sistem informasi atau sistem pendukung keputusan dapat dikembangkan untuk menjawab tantangan tersebut. Tidak sedikit pula rumah sakit yang sudah menggunakan sistem informasi untuk mengatur jasa kesehatan mereka dan data pasien. Setiap riwayat penyakit dan seluruh data perawatan serta fasilitas yang digunakan oleh pasien juga disimpan ke dalam suatu catatan medis baik itu secara sistem atau manual. Seluruh data ini sebenarnya bertujuan untuk menjadi bahan evaluasi setiap lembaga kesehatan untuk meningkatkan performa setiap lembaga kesehatan dan semua sumber daya yang ada didalamnya tetapi di Mayapada Hospital semua catatan medis itu tidak digunakan sebagaimana mestinya. Sayangnya, data seperti ini jarang digunakan untuk mendukung pengambilan keputusan klinis sehingga ada banyak informasi tersembunyi dari data tersebut yang belum ditelusuri (Ishtake S.H & Sanap S.A., 2013). Maka dari itu sistem pengambilan keputusan yang mendukung analisis untuk dokter yang naif dan dokter yang berpengalaman pun bisa menjadi suatu penuntun untuk pengambilan keputusan klinis (Anbarasi, Anupriya, & Inyengar, 2010). Ditambah lagi dengan hadirnya penyakit jantung yang menjadi penyakit mematikan karena tidak dapat dilihat secara kasat mata dan dapat datang secara tiba – tiba (Ishtake S.H & Sanap S.A., 2013). Maka pada skripsi ini akan dibahas tentang bagaimana caranya menghasilkan analisis faktor resiko untuk penyakit jantung pada orang dewasa dari riwayat lab kimia darah pasien yang pernah terdaftar di RS. Mayapada Tangerang melalui lab kimia darah pasien yang sudah dicatat kedalam catatan medis. Skripsi ini bertujuan untuk membantu menunjang pengambilan keputusan sedini mungkin bagi pasien agar mereka lebih mantap mempersiapkan psikologi akan kemungkinan medis yang dihadapi diri mereka dan perencanaan untuk keuangan mereka karena biaya perawatan bagi penderita jantung yang tidak sedikit. Selain untuk membantu menunjang pengambilan keputusan sedini mungkin bagi pasien, analisis awal melalui lab kimia darah juga berguna bagi manajemen untuk mempersiapkan sumber daya rumah sakit terkait pelayanan bagi pasien jantung orang dewasa jadi hasil analisis lab kimia darah dapat dimanfaatkan untuk keperluan manajemen meningkatkan kemampuan daya saing rumah sakit . Penganalisaan ini akan dilakukan dengan menggabungkan konsep penambangan data (Data Mining) dengan menggunakan teknik klasifikasi : naïve bayes dimana data perolehan yang menjadi sumber utama yaitu lab kimia darah pasien untuk menghasilkan sebuah persentase kedekatan kondisi pasien sekarang terhadap penyakit jantung pada orang dewasa. Skripsi ini ingin mengangkat bahwa keberhasilan analisis faktor resiko terhadap penyakit jantung melalui lab kimia darah adalah salah satu kunci keberhasilan dalam mempersiapkan diri si pasien dan juga sebagai prediksi rumah sakit agar mampu meningkatkan sumber daya di klinik jantung. METODE PENELITIAN Metodologi yang digunakan dalam penyusunan penelitian ini dibagi menjadi 2 bagian, yaitu metode fundamental dan metode teknikal. 1. Metode analisis fundamental adalah mengaitkan beberapa teori yang relevan terkait dengan bidang kesehatan yaitu medical research dan bidang penambangan data yaitu Data Mining Classification : Naive Bayes Classifier yang dilakukan melalui tahap : a. Survei atas sistem layanan medis yang berjalan dengan cara: - Interview / Wawancara Merupakan percakapan antara dua orang atau lebih dan terjadi antara narasumber dan pewawancara. Tujuan dari wawancara adalah untuk mendapatkan informasi dimana pewawancara memberikan pertanyaan untuk dijawab oleh narasumber. - Observasi Observasi yang berarti pengamatan bertujuan untuk mendapatkan informasi tentang suatu masalah, sehingga diperoleh pemahaman atau pembuktian terhadap informasi / keterangan yang diperoleh sebelumnya. b. Analisis sistem layanan medis yang berjalan c. Survei atas medical research Rumah Sakit yang pernah dilakukan d. Analisis pemecahan masalah 2. Metode analisis teknikal yaitu melakukan perhitungan dan pengolahan data yang didapat dari analisis fundamental dengan menggunakan Data Mining Classification : Naive Bayes Classifier, melalui tahapan – tahapan yang mengacu pada CRISP-DM. HASIL DAN BAHASAN Aplikasi data mining yang telah dibuat oleh penulis mengambil data dari lab kimia darah. Dari lab kimia darah tersebut didapatlah 37 atribut : 1. Hos. Number 2. Birthdate 3. Sex 4. Request # 5. Coll. date 6. Location 7. Doctor Code 8. GLU 70-110 mg/dl (Glukosa) 9. GLU2J 100-140 mg/dl ( Glukosa 2 Jam) 10. CHOL < 200 mg/dl ( Cholesterol) 11. TRIG < 200 mg/ dl>(Trigliserit) 12. HDL > 65 mg/dl () 13. LDL < 100 mg/dl () 14. UREA 15-39 mg/dl(Ureum Fungsi Ginjal) 15. CREA 0.6-1.3 mg/dl (Creatine Fungsi Ginjal) 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. UA 2.6 – 6.2 mg/dl ( Urit Acid Asam Urat) TP ?Troponin ALB 3.4 – 5.0 g/dl (Albumin) GLOB 2.8 – 3.2 g/dl (Globulin) TBIL DBIL SGOT SGPT GGT ALKF HBA1C CK 21 – 215 U/L CKMB < 25 U/L LDH < 200 U/L TROPK TROPT Tropomin I (Normal -) (Tidak Normal +) NA 135 – 153 (Natrium) K 3.5 – 5.3 (Kalium) CL 98 – 109 mEq/L Clorit CA 8.4 – 10.3 (Calsium) MG 1.8 – 2.4 mg/dl (Magnesium) AMIL (Amilase) LIPAS (Lipase) Namun dari 38 atribut ini hanya 16 atribut yang digunakan karena dianggap mempunyai keterkaitan dengan beresiko atau tidaknya pasien terhadap penyakit jantung. Dari 16 atribut tersebut 14 diantaranya terdiri dari data penyakit dalam yang terkait dengan jantung. Berikut adalah penyakit dalam tersebut beserta atribut di dalam penyakit tersebut adalah fungsi ginjal (UREA, CREA, UA), fungsi diabetes (Glukosa, Glukosa2J), fungsi lemak (Chol, LDL, HDL, Trigliceride) dan fungsi jantung (CK, CKMB, TROPT, TROPK, LDH). 2 atribut lainnya yang menjadi bahan analisa adalah umur dan jenis kelamin. Setelah atribut – atribut siap, dimulailah proses data mining. Proses data mining yang akan dilakukan adalah dengan menggunakan teknik klasifikasi : naïve bayes. Hasil output dari proses data mining ini terbagi menjadi 4 kelas yaitu Kelas Normal, Kelas Beresiko Level 1, Kelas Beresiko Level 2 dan Kelas Beresiko Level 3. Gambar 1 Form Add New Single Patient Gambar 2 Form Add New Single Patient (Lanjutan) Attribut Charateristic Attribut characteristic ini menunjukkan kondisi atribut dari masing masing target class sehingga dari attribute characteristic ini dapat dilihat kondisi pasien seperti apa yang beresiko terhadap penyakit jantung dari masing – masing level class target. Berikut ini adalah deskripsi attribute characteristic dari masing – masing kelas: 1. Normal Gambar 3 Chart Class Normal Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia = >50 Tahun, Gender = Male, UREA= Normal, CREA = Normal, UA = Normal, CHOL = Normal, TRIG = Normal, LDL = Normal, GLU2J = Normal, CK = Normal. 2. Class Level 1 Gambar 4 Chart Class Level 1 Atribut dan nilai atribut yang dominan dalam kelas Level 1 adalah: Usia = >50 Tahun, Gender = Male, UREA= Level 1, CREA = Level 1, UA = Level 1, CHOL = Level 1, TRIG = Level 1, HDL = Level 1, LDL = Level 1, GLU = Level 1, GLU2J = Level 1, CK = Level 1. 3. Class Level 2 Gambar 5 Chart Class Level 2 Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia = >50 Tahun, Gender = Male, UREA= Level 2, CREA = Level 2, UA = Level 2, CHOL = Level 2, TRIG = Level 2, HDL = Level 2, LDL = Level 2, GLU = Level 2, GLU2J = Level 2, CKMB = Level 2, LDH = Level 2. 4. Class Level 3 Gambar 6 Chart Class Level 3 Atribut dan nilai atribut yang dominan dalam kelas Normal adalah: Usia = >50 Tahun, Gender = Male, UREA= Level 3, CREA = Level 3, UA = Level 3, CHOL = Level 3, TRIG = Level 3, HDL = Level 3, LDL = Level 3, GLU2J = Level 3, CK = Level 3, CKMB = Level 3, LDH = Level 3, TROPT = Level 3. SIMPULAN DAN SARAN Setelah menganalisis sistem dan permasalahan yang terjadi pada Mayapada Hospital, maka dapat disimpulkan bahwa : 1. Data mining dapat memanfaatkan data riwayat pasien rumah sakit untuk dilakukan suatu penelitian yang menghasilkan analisis faktor resiko penyakit jantung. Analisa mengenai faktor resiko penyakit jantung yang dianalisa terdiri atas: Umur, Gender, Fungsi Ginjal (UREA, CREA, UA), Fungsi Diabetes (Glukosa, Glukosa2J), Fungsi Lemak (HDL, LDL, Trigliceride, Cholesterol), Fungsi Jantung (CK, CKMB, TROPK, LDH, TROPT). 2. Dari hasil analisa dihasilkan 4 target class untuk mengetahui apakah seorang pasien beresiko atau tidak untuk terkena penyakit jantung, yaitu: Kelas Normal, Kelas Level 1, Kelas Level 2 dan Kelas Level 3. 3. Informasi hasil analisis faktor resiko penyakit jantung mendukung ketepatan dalam menganalisis faktor resiko penyakit jantung dengan tingkat akurasi yang dihasilkan oleh sistem untuk menghasilkan informasi sebesar 85.90 % sehingga informasi yang dihasilkan bisa dikatakan cukup akurat dengan akurasi yang mendekati 100 %. Dari hasil penelitian yang dilakukan, maka dapat diberikan beberapa saran untuk pengembangan data mining dalam bidang kesehatan, yaitu: 1. Melakukan analisis dengan teknik klasifikasi yang lainnya seperti decision tree, rule base classification, dan lain – lain dan membandingkan teknik klasifikasi mana yang memiliki tingkat akurasi yang paling valid. 2. Penelitian dapat dilakukan dengan menggunakan data lain yang terkait dengan analisis penyakit jantung, yaitu data EKG, pemeriksaan enzim jantung, Treadmill dan gejala nyeri dada. REFERENSI Anbarasi, M., Anupriya, E., & Inyengar, N. S. (2010). Enhanced Prediction of Heart Disease with Feature Subset Selection using Genetic. International Journal of Engineering Science and Technology , 10. S.H, M., & Sanap S.A., P. (2013). Intelligent Heart Disease Prediction System Using Data Mining Techinques. International J. of Healthcare & Biomedical Research , 94-101. RIWAYAT PENULIS Nama : Alowisius Yoga Amelga Tempat / Tanggal Lahir : 4 Mei 1991 Pendidikan : S1 Universitas : Bina Nusantara Jurusan : Sistem Informasi Pekerjaan : Pelajar Nama : Marco Maureece Maribondang Tempat / Tanggal Lahir : Tangerang, 17 Mei 1992 Pendidikan : S1 Universitas : Bina Nusantara Jurusan : Sistem Informasi Pekerjaan : Pelajar Nama : Mulyadi Salim Tempat / Tanggal Lahir : Jakarta, 12 Mei 1992 Pendidikan : S1 Universitas : Bina Nusantara Jurusan : Sistem Informasi Pekerjaan : Pelajar