Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner METODE REGRESI LOGISTIK ABSTRAK UNTUK MENGANALISIS FAKTOR RISIKO PENYAKIT JANTUNG Penyakit jantung koroner (PJK) adalah KORONER suatu kelainan yang disebabkan oleh penyempitan Astri Atti* atau penghambatan pembuluh arteri. PJK dipengaruhi oleh beberapa faktor di antaranya hipertensi, hiperkolesterol, ABSTRACT diabetes mellitus, merokok, obesitas, kurang olah raga, Coronary heart disease (CHD) is an riwayat keluarga, stress, umur, dan bahkan anomaly that caused by constriction of jenis kelamin. Metode regresi logistik artery. by merupakan metode yang dapat digunakan hypercholesterol, hypertension, diabetes untuk mengungkapakan asosiasi antara mellitus, smoking, obesity, sport less, peubah respon dan peubah penjelas untuk genetic, stress, age, and even sex. Logistic data-data regression method was used for describing menggunakan 827 responden terdiri atas association between dependent variable 52% penderita PJK dan 48% bukan and independent variables to categorical penderita PJK. Tujuan penelitian ini yaitu, data. There are 827 respondents consist of untuk menelusuri faktor risiko 52% CHD patient and 48% non CHD mempengaruhi PJK dengan menggunakan patient. The goal of this research are to metode regresi logistik, serta mementukan investigate risk factor that influences CHD hasil klasifikasinya. Hasil metode regresi by logistic regression method, also to logistik menunjukkan bahwa faktor yang determine result of classification it. The mempengaruhi PJK adalah hiperkolesterol, result of logistic regression method shows diabetes, Indeks Massa Tubuh (IMT) dan that CHD status are influenced by umur dengan total kesalahan klasifikasi hypercholesterol, diabetes, body mass sebesar 32,8%. index Kata Kunci : regresi logistik, penyakit CHD (BMI) is and influenced age with total misclassification rate is about 32,8%. kategorik. Penelitian ini yang jantung koroner, kesalahan klasifikasi Keywords : logistic regression, coronary heart disease, misclassification 1331 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Badan Kesehatan Dunia (WHO), mencatat mengungkapkan lebih dari 7 juta orang meninggal akibat hubungan antara dua kelompok peubah, penyakit jantung koroner di seluruh dunia yaitu peubah respon dengan sekelompok pada tahun 2002. Angka ini diperkirakan peubah penjelas termasuk untuk data-data akan meningkat hingga 11 juta orang pada kategorik. Penerapan tahun 2020. Badan Kesehatan Dunia statistika banyak memperkirakan bahwa penyakit jantung penelitian berbagai disiplin ilmu seperti koroner dan stroke pada tahun 2020 akan pertanian, menjadi kesehatan/kedokteran. penyebab terbanyak kasus keterkaitan atau metode analisis digunakan dalam sosial, dan Regresi logistik kematian di seluruh dunia, seiring dengan adalah salah satu dari metode analisis perubahan masyarakat statistika yang ada. Penelitian ini bertujuan (Fitriani 2007). Pada tahun 2000 kasus untuk menelusuri faktor risiko yang secara penyakit jantung koroner di Rumah Sakit nyata Medistra menggunakan metode regresi logistik serta pola hidup sebanyak 1173 kasus, tahun mempengaruhi menentukan tahun 2002 jumlah kasus PJK sebanyak tersebut. 1213 kasus. Selanjutnya, data penyakit MATERI DAN METODE jantung koroner di Rumah Sakit Dr. Data yang digunakan dalam penelitian ini Wahidin 2004 adalah data sekunder dari hasil penelitian sebanyak 336 kasus, tahun 2005 sebanyak yang dilakukan di Rumah Sakit Umum Dr. 311 kasus dan tahun 2006 sebanyak 332 Wahidin Sudirohusodo Makassar tahun kasus (Data morbiditas rekam medik rawat 2004-2007 oleh Kamar (2004) dan Fitriani inap dalam Fitriani (2007). Menurut (2007) terhadap pasien yang dirawat di Palilati (2003), berbagai faktor dapat rumah sakit tersebut yang datang berobat menjadi ke penyebab tahun penyakit jantung poliklinik klasifikasi dengan 2001 terdapat 1158 kasus, sedangkan Sudirohusodo hasil PJK penyakit dalam metode yang hipertensi, dinyatakan menderita penyakit jantung mellitus, koroner (PJK) dan yang tidak menderita merokok, obesitas, kurang olah raga, PJK dengan jumlah pasien sebanyak 827 riwayat keluarga, stres, umur dan bahkan orang. Peubah yang diamati adalah pasien jenis kelamin.Permasalahan yang kadang yang menderita penyakit jantung koroner dihadapi para peneliti dalam bidang (y=1) dan yang tidak (y=0) menurut kartu kesehatan maupun dalam bidang penelitian rekam medik pasien. lain yaitu bagaimana seorang peneliti bisa Peubah-peubah penjelasnya adalah: koroner di hiperkolesterol, antaranya diabetes 1332 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Peubah penjelas Hipertensi Kate gori D1 D2 Ya 1 Tidak 0 Ya 1 Tidak 0 Ya 1 Tidak 0 IMT (Indeks Massa Kurus 1 0 Tubuh) Normal 0 0 Hiperkolesterol Diabetes D3 D4 Pembanding Tabel 1 Pengkodean peubah penjelas kategorik 1333 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Gemuk 0 1 < 40 0 0 0 0 40-49 1 0 0 0 50-59 0 1 0 0 60-69 0 0 1 0 > 69 0 0 0 1 Laki-laki 1 Perempua 0 Umur Jenis kelamin n Keterangan : D : Peubah dummy : Sebagai pembanding Metode Regresi Logistik Menurut Hosmer & Lemeshow (2000), Analisis regresi logistik adalah analisis hasil pengamatan yang memiliki p peubah yang digunakan untuk melihat hubungan penjelas yang ditunjukkan oleh vektor x’= antara peubah respon berupa data kualitatif (X1,X2,…,Xp) yang berpasangan dengan dengan peubah-peubah penjelas yang peubah respon Y yang bernilai 1 dan 0, di berupa data maupun data mana y=1 kualitatif menyatakan bahwa respon kuantitatif. Peubah respon dalam regresi memiliki kriteria yang ditentukan dan y=0 logistik dapat dalam bentuk dikotom tidak memiliki kriteria yang ditentukan (biner) maupun polikotom (ordinal atau merupakan regresi logistik peubah respon nominal). biner. Fungsi regresi logistik antara π(x) dan x adalah : x exp g(x) ......... (1) 1 exp g(x) Fungsi regresi di atas berbentuk curvilinear sehingga untuk membuatnya menjadi fungsi linier dilakukan transformasi logit sebagai berikut (Agresti 1990) : (x) logit [(x)] ln g(x) 1 (x) dimana g(x) 0 1X1 2 X 2 ... p X p .. (2) merupakan logit (Hosmer & Lemeshow 2000). 1332 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Pengujian kesesuaian model dilakukan nyata pada nilai α yang ditentukan maka secara simultan dengan menggunakan peubah tersebut dikeluarkan dari model statistik parsial dan jika nyata maka akan tetap berada menggunakan statistik uji Wald. Pemilihan dalam model (Gonzales 2003). Menurut peubah penjelas menggunakan metode Hosmer dan Lemeshow (2000), rasio odds backward elimination, diawali dengan dilambangkan semua peubah dimasukkan ke dalam diinterpretasikan sebagai model kemudian peubah akan diuji satu y=1 persatu. Jika ditemukan peubah yang tidak dibandingkan pada x=0. uji-G dan secara pada sebagai x=1 ψ=exp(βi) dan kecenderungan sebesar ψ kali Selang kepercayaan (1-α)100% bagi rasio odds adalah : exp[ˆ i Z1 / 2ŜE(ˆ i )] .....(3) sedangkan selang kepercayaan (1-α)100% bagi π(x) yaitu : e ĝ ( x ) Z1 / 2ŜE[ ĝ ( x )] 1 e ĝ ( x ) Z1 / 2ŜE[ ĝ ( x )] .......(4) dimana : ŜEĝ(x) Vâr ĝ(x) .......... (5) p dan p p Vâr[ĝ(x)] x 2j Vâr(ˆ j ) 2x j x k Côv(ˆ j , ˆ k ) ... (6) j0 j0 k j1 Ketepatan dan Kesalahan Klasifikasi amatan. Untuk memperoleh ketepatan Menurut Hosmer dan Lemeshow (2000) klasifikasi (correct classification) terhadap salah satu ukuran kebaikan model dalam amatan harus menentukan nilai cutpoint regresi logistik adalah jika memiliki (c) dan dibandingkan dengan peluang peluang salah klasifikasi yang minimal. dugaan π(x). Jika π(x) lebih besar atau Ketepatan dan kesalahan klasifikasi dari sama model termasuk pada respon y = 1 dan selain itu dapat mengunakan diketahui tabel dengan klasifikasi dengan c maka nilai dugaan y = 0. (classification table). Tabel klasifikasi Ketepatan untuk peubah respon dikotom terdiri atas classification) terbagi atas dua yaitu dua kolom nilai dugaan dan dua baris nilai specificity dan sensitivity. Specificity atau 1331 klasifikasi (correct Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner ketepatan klasifikasi dalam menduga kesalahan kejadian bahwa respon tidak memiliki klasifikasi dalam menduga kejadian secara keseluruhan. kriteria yang ditentukan (y=0) dinyatakan sebagai persentase dari dugaan terkoreksi HASIL DAN PEMBAHASAN atau nilai dugaan yang sama dengan nilai Hasil metode regresi logistik amatan pada kategori nilai amatan y=0. Model yang dihasilkan dengan melibatkan Pengertian yang sama juga berlaku untuk semua peubah penjelas dapat dilihat pada mengevaluasi ketepatan klasifikasi dalam Tabel menduga kejadian bahwa respon memiliki menunjukkan bahwa model nyata pada α = kriteria yang ditentukan (y=1) atau disebut 5%. Hal ini dapat dilihat dari statistik-G juga sensitivity, sedangkan total correct sebesar 147,400 dengan nilai-p sebesar classification yaitu ketepatan klasifikasi 0,000. Berdasarkan uji Wald terlihat dalam secara bahwa peubah hipertensi, IMT(kurus) dan keseluruhan. Selain ketepatan klasifikasi jenis kelamin tidak nyata pada model dapat pula diketahui besarnya kesalahan sehingga klasifikasi terhadap menduga kejadian (misclassification rate). 2. Pengujian akan secara simultan dilakukan pereduksian peubah-peubah tersebut. Kesalahan klasifikasi dalam menduga Pereduksian model kejadian respon terdiri atas kesalahan metode backward positif dan kesalahan negatif. Kesalahan Berdasarkan Tabel 2, diperoleh tiga tahap positif pereduksian yaitu tahap pertama dengan dinyatakan sebagai persentase dilakukan dengan elimination. besarnya kesalahan ketika respon diduga menghilangkan IMT(kurus) yang memiliki kriteria yang ditentukan (y=1) mempunyai nilai-p terbesar, tahap kedua tapi amatan sebenarnya bernilai y=0 dan dengan menghilangkan peubah hipertensi sebaliknya kesalahan negatif dinyatakan dan tahap ketiga dengan menghilangkan sebagai persentase besarnya kesalahan peubah jenis kelamin. ketika respon diduga tidak memiliki Tahap ketiga adalah tahap terakhir yang kriteria yang ditentukan (y=0) namun merupakan model terbaik yang diperoleh amatan sebenarnya bernilai y=1. Total dari hasil pereduksian. misclassification rate diartikan sebagai Tabel 2 Hasil analisis regresi logistik model penuh Peubah Penjelas Intersep βi -2,091 SE 0,330 Wald -6,336 1332 Ni Rasio SK 95% untuk lai-p Odds Rasio Odds 0,000 0,000 - - Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Hipertensi -0,163 0,159 -1,025 0,306 0,850 0,623 1,160 Hiperkolesterol 1,380 0,159 8,679 0,000* 3,975 2,910 5,430 Diabetes 0,461 0,171 2,696 0,007* 1,586 1,134 2,216 IMT(Gemuk) 0,780 0,168 4,643 0,000* 2,182 1,570 3,033 IMT(Kurus) -0,014 0,604 -0,023 0,982 0,986 0,302 3,219 Umur(>69) 1,101 0,387 2,845 0,004* 3,007 1,409 6,416 Umur(60-69) 0,953 0,325 2,932 0,003* 2,593 1,371 4,905 Umur(50-59) 0,995 0,315 3,159 0,002* 2,703 1,457 5,016 Umur(40-49) 0,897 0,322 2,786 0,005* 2,453 1,305 4,611 Jenis Kelamin -0,222 0,154 -1,442 0,150 0,801 0,593 1,084 Statistik-G = 147,400 * Nyata pada α = 5% Nilai-p = 0,000 Tabel 3 Hasil analisis regresi logistik model Backward Elimination (tahap III) Peubah Nilai- Rasio SK 95% untuk p Odds Rasio Odds βi SE Intersep -2,203 0,323 -6,820 0,000 0,000 - - Hiperkolesterol 1,392 0,158 8,755 0,000* 4,024 2,949 5,490 Diabetes 0,435 0,170 2,559 0,011* 1,544 1,106 2,156 IMT 0,781 0,165 0,000* 2,183 1,580 3,017 0,007* 2,782 1,315 5,885 0,007* 2,364 1,265 4,418 Penjelas (Gemuk) Umur 4,733 1,023 0,382 (>69) Umur (60-69) Wald 2,678 0,860 0,319 2,696 1332 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Umur 0,929 0,312 (50-59) 0,003* 2,531 1,373 4,666 0,009* 2,314 1,238 4,327 2,978 Umur 0,839 0,319 (40-49) 2,630 * Nyata pada α = 5% Statistik-G = 144,142 Nilai-p = 0,000 Dari hasil model reduksi (Tabel 3) 4,666 kali, dan pasien yang berumur 40-49 diperoleh nilai statistik-G sebesar 144,142 tahun berisiko antara 1,238 kali sampai dengan nilai-p sebesar 0,000 yang berarti 4,327 kali untuk menderita PJK. Semua secara bahwa kategori umur dibandingkan dengan umur model nyata pada α = 5%. Hasil uji Wald <40 tahun. Untuk menduga peluang juga menunjukkan bahwa peubah PJK seseorang akan terkena PJK diperlukan dipengaruhi oleh faktor hiperkolesterol, matriks diabetes, Umur(>69), dianalisis dengan menggunakan persamaan Umur(60-69), Umur(50-59) dan Umur(40- (2), persamaan (4), persamaan (5) dan 49) pada α = 5%. nilai persamaan (6) maka diperoleh nilai selang selang kepercayaan 95% bagi rasio odds kepercayaan (SK) 95% bagi π(x). SK menunjukkan penderita tersebut menyatakan nilai dugaan peluang hiperkolesterol dibandingkan yang tidak terkena PJK (untuk 15 kombinasi kategori) hiperkolesterol berisiko paling rendah berdasarkan peubah penjelas yang nyata 2,949 kali dan paling tinggi 5,49 kali untuk (Tabel 4). Berdasarkan kasus yang terjadi menderita PJK. Penderita diabetes berisiko di antara 1,106 kali sampai 2,156 kali untuk Makassar dapat diduga bahwa seseorang menderita PJK dibandingkan yang bukan yang menderita hiperkolesterol, diabetes, penderita diabetes. Untuk pasien yang berbadan gemuk dan berusia di atas 69 tergolong gemuk, risiko terkena PJK tahun, berpeluang antara 69,64% sampai dibandingkan yang tidak gemuk sebesar 88,35% untuk menderita PJK. Sedangkan 1,58 kali sampai 3,017 kali. Pasien yang yang tidak menderita hiperkolesterol dan berumur >69 tahun berisiko antara 1,315 tidak diabetes dengan berat badan yang kali sampai 5,885 kali untuk terkena PJK, tergolong sedangkan yang berumur 60-69 tahun mempunyai umur di bawah 40 tahun akan berisiko antara 1,265 kali sampai 4,418 berpeluang sangat kecil untuk menderita kali. Untuk umur 50-59 tahun berisiko PJK yaitu antara 5,54% sampai 17,22%. simultan menunjukkan IMT(gemuk), Berdasarkan bahwa paling rendah 1,373 kali dan paling tinggi 1333 RSU kovarian Dr. dugaan. Wahidin kurus atau Setelah Sudirohusodo normal dan Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner Untuk kombinasi kategori yang lain dapat dilihat pada Tabel 4. Tabel 4 Dugaan peluang terkena PJK berdasarkan peubah penjelas yang nyata No Hiper Diabetes kolesterol IMT Umur ̂( x ) SK 95% bagi π(x) Bawah Atas 1 Ya Tidak Gemuk 60-69 0,6964 0,6183 0,7646 2 Ya Tidak Tidak gemuk <40 0,3077 0,1873 0,4615 3 Ya Ya Tidak gemuk <40 0,4071 0,2559 0,5782 4 Ya Ya Tidak gemuk 40-49 0,6137 0,4987 0,7174 5 Ya Ya Gemuk >69 0,8066 0,6964 0,8835 6 Ya Tidak Gemuk <40 0,4925 0,3536 0,6325 7 Ya Ya Gemuk 60-69 0,7799 0,7004 0,8430 8 Ya Tidak Tidak gemuk >69 0,5528 0,4134 0,6843 9 Tidak Tidak Tidak gemuk 40-49 0,2036 0,1428 0,2818 10 Tidak Ya Gemuk 40-49 0,4631 0,3551 0,5747 11 Tidak Ya Tidak gemuk 60-69 0,2874 0,2075 0,3833 12 Tidak Tidak Tidak gemuk 60-69 0,2070 0,1464 0,2843 13 Tidak Ya Tidak gemuk <40 0,1458 0,0814 0,2474 14 Tidak Ya Gemuk >69 0,5090 0,3620 0,6544 15 Tidak Tidak Tidak gemuk <40 0,0995 0,0554 0,1722 Tabel 5 Klasifikasi metode regresi logistik Dugaan Amatan (PJK) Logistik Total (%) Correct classification Ya Tidak Ya 321 109 430 74,7 Tidak 162 235 397 59,2 Total 483 344 827 67,2 (%) Misclassification rate 33,5 31,7 32,8 Tabel 5 menunjukkan bahwa dengan diperoleh nilai sensitivity sebesar 74,7% menggunakan nilai cutpoint sebesar 0,5 dan nilai specificity sebesar 59,2% dengan maka berdasarkan metode regresi logistik nilai kesalahan positif dan kesalahan 1332 Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner negatif masing-masing sebesar 33,5% dan 31,7%. Sedangkan nilai total correct classification adalah sebesar 67,2%. Nilai total misclassification rate untuk metode regresi logistik sebesar 32,8%. SIMPULAN Hasil yang diperoleh dari metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi seseorang menderita PJK adalah hiperkolesterol, diabetes, IMT dan umur. Berdasarkan nilai rasio odds, diketahui bahwa penderita hiperkolesterol lebih berisiko terkena PJK dibandingkan yang tidak hiperkolesterol, begitu pula pada penderita diabetes dibandingkan yang tidak diabetes. Pasien yang mempunyai IMT gemuk lebih berisiko terkena PJK dibandingkan yang tidak gemuk, dan pasien yang umurnya >=40 tahun juga lebih berisiko terkena PJK dibandingkan yang berumur <40. Berdasarkan hasil klasifikasi metode regresi logistik, diperoleh nilai sensitivity sebesar 74,7% dan nilai Besarnya specificity nilai sebesar 59,2%. misclassification rate adalah sebesar 32,8%. 1332 DAFTAR PUSTAKA Agresti A. 1990. “Categorical Data Analysis”. New York: John Wiley & Sons. Bustan MN. 1997. “Epidemologi Penyakit Tidak Menular”. Jakarta: Rineka Cipta. Fitriani. 2007. “Analisis Faktor Risiko Kejadian Penyakit Jantung Koroner di Rumah Sakit Dr.Wahidin Sudirohusodo Makassar”. [Tesis]. Makassar: Program Pascasarjana, UNHAS. Gonzales MP. 2003. “A Model for Profiling Radio Station Listeners using Logistic Regression, CART and CHAID for a given data set”. University of the Philippines. Hosmer DW, Lemeshow S. 2000. “Applied Logistic Regression”. New York: John Wiley & Sons. Kamar N. 2004. “Beberapa Faktor yang Berhubungan dengan Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar”. [Skripsi]. Makassar: Program Sarjana, UNHAS. Palilati H. 2003. “Beberapa Faktor Risiko Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar”. [Skripsi]. Sarjana, UNHAS. * Staf Pengajar Jurusan Matematika, Fakultas Sains dan Teknik-Undana 1330 Makassar: Program