Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009 PEMODELAN REGRESI POISSON UNTUK MENGETAHUI FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TENGAH Yayuk Listiani1, Purhadi2 Mahasiswa Jurusan Statistika ITS. 2Dosen Jurusan Statistika ITS 1 ABSTRAK Regresi Poisson adalah salah satu regresi nonlinier. Regresi Poisson sering kali digunakan untuk menganalisis data diskrit. Pada makalah ini Regresi Poisson di aplikasikan untuk pemodelan faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Tengah. Dan hasilnya terdapat empat faktor yang mempengaruhi angka kematian bayi di Jawa Tengah yaitu rata-rata usia perkawinan pertama, rata-rata jumlah pengeluaran rumah tangga, persentase daerah yang berstatus desa dan rata-rata lama pemberian ASI eksklusif pada bayi. Keywords: Angka Kematian Bayi, Regresi Poisson 1. PENDAHULUAN Salah satu alat untuk menilai keberhasilan program pembangunan kesehatan yang telah dilaksanakan selama ini adalah dengan melihat perkembangan angka kematian dari tahun ketahun, baik angka kematian bayi, balita, ibu maternal, kecacatan maupun kesakitan. Angka kematian bayi adalah indikator yang sensitif terhadap ketersediaan pemanfaatan dan kualitas pelayanan kesehatan terlebih-lebih terhadap pelayanan perinatal. Angka kematian bayi baru lahir di Indonesia masih lebih tinggi bila dibandingkan dengan Negara ASEAN lainnya kecuali Myanmar dan Kamboja. Walaupun selama beberapa dekade terakhir, Indonesia berhasil menurunkan angka kematian bayi dan balita secara signifikan yaitu pada 1960, angka kematian bayi (IMR) di Indonesia masih mencapai 128 per 1.000 kelahiran hidup. Angka itu turun menjadi 68 per 1.000 kelahiran hidup pada 1989. Pada 1990-an angka kematian bayi terus menurun. Pada 1992, AKB 57 per 1.000 kelahiran hidup, lalu menjadi 46 per 1.000 kelahiran hidup pada 1995. Pada 1990-an, rata-rata penurunan 5% per tahun, sedikit lebih tinggi daripada periode 1980-an sebesar 4% per tahun. Pada 2000, angka kematian bayi menjadi 35 per 1.000 kelahiran hidup dan turun lagi menjadi 25 pada 2006, namun jika dibandingkan dengan negaranegara anggota ASEAN masih 4,6 kali lebih tinggi daripada Malaysia, 1,3 kali lebih tinggi daripada Filipina, dan 1,8 kali lebih tinggi daripada Thailand. Tiga penyebab utama kematian bayi menurut Survei Kesehatan Rumah Tangga (SKRT) 1995 adalah infeksi saluran pernafasan akut (ISPA), komplikasi perinatal, dan diare. Gabungan ketiga penyebab ini memberi andil bagi 75 persen kematian bayi. Pada 2001 pola penyebab kematian bayi ini tidak banyak berubah dari periode sebelumnya, yaitu karena sebab-sebab perinatal, kemudian diikuti oleh infeksi saluran pernafasan akut (ISPA), diare, tetanus neotarum, saluran cerna, dan penyakit saraf. Selain disebabkan oleh hal tersebut, angka kematian bayi juga dipengaruhi dari karakteristik ibu dan faktor lingkungan. Karakteristik ibu yang menjadi berpengaruh terhadap angka kematian bayi adalah usia ibu saat perkawinan. Survei Demografi dan Kesehatan Indonesia menemukan kematian balita yang tinggi terjadi pada mereka yang melahirkan pada usia kurang dari 20 tahun. Selain itu pendidikan ibu juga mempengaruhi 1 angka kematian bayi. Menurut Budi Utomo (1984), tinggi rendahnya tingkat pendidikan ibu erat kaitannya dengan tingkat pengertian terhadap perawatan kesehatan, higiene, perlunya pemeriksaan kehamilan. Sehingga kematian balita yang rendah dijumpai pada golongan wanita yang mempunyai pendidikan yang tinggi. Sedangkan faktor lingkungan yang mempengaruhi angka kematian bayi adalah jumlah sarana kesehatan, jumlah tenaga medis, persentase persalinan yang dilakukan dengan bantuan medis, rata-rata jumlah pengeluaran rumah tangga, persentase daerah berstatus desa, persentase rumah tangga yang memiliki air bersih, dan persentase penduduk miskin. IMR pada penduduk termiskin pada 1995 hampir dua kali lebih tinggi daripada penduduk terkaya. Walaupun perbedaan ini mengecil, IMR pada 2001 untuk penduduk miskin masih 1,5 kali lebih tinggi dibanding penduduk terkaya. Dengan masih besarnya jumlah penduduk miskin di Indonesia, yaitu sekitar 37,34 juta jiwa atau 17,4 persen pada 2003, perlindungan dan pelayanan kesehatan anak pada kelompok penduduk itu merupakan tantangan berat yang masih harus dihadapi. Selain perlunya intervensi yang cost-effective, kerja sama lintas sektor bagi upaya penanggulangan kemiskinan akan sangat berperan dalam peningkatan derajat kesehatan ibu dan anak secara umum. Oleh karena itu, perlindungan dan pelayanan kesehatan bagi bayi dan balita dari keluarga miskin menjadi sangat penting, karena kondisi kesehatan dan gizi anak-anak itu secara umum jauh lebih rendah. Beberapa penelitian sebelumnya juga telah menghasilkan banyak faktor terutama social-ekonomi yang menyebabkan kematian bayi. Gwatkin (2000) mengindikasikan bahwa perbedaan angka kematian bayi (IMR) di Indonesia berhubungan dengan kondisi sosial ekonomi yang diukur dengan tingkat kekayaan dan rasio penduduk miskin. 2. REGRESI POISSON Pada pembahasan ini akan dijelaskan tentang angka kematian bayi, distribusi poisson, model regresi poisson, penaksiran parameter menggunakan metode Maximum Likelihood Estimator (MLE) dan pengujian signifikansi parameter model regresi poisson. 2.1 Angka Kematian Bayi Kematian bayi adalah kematian yang terjadi antara saat setelah bayi lahir sampai bayi belum berusia tepat satu tahun. Banyak faktor yang dikaitkan dengan kematian bayi. Secara garis besar, dari sisi penyebabnya, kematian bayi ada dua macam yaitu endogen dan eksogen. Kematian bayi endogen atau yang umum disebut dengan kematian neonatal; adalah kematian bayi yang terjadi pada bulan pertama setelah dilahirkan, dan umumnya disebabkan oleh faktor-faktor yang dibawa anak sejak lahir, yang diperoleh dari orang tuanya pada saat konsepsi atau didapat selama kehamilan. Kematian bayi eksogen atau kematian post neo-natal, adalah kematian bayi yang terjadi setelah usia satu bulan sampai menjelang usia satu tahun yang disebabkan oleh faktor-faktor yang bertalian dengan pengaruh lingkungan luar. Kematian bayi disebabkan oleh beberapa faktor yaitu: jumlah sarana kesehatan, jumlah tenaga medis, persalinan yang dilakukan dengan bantuan non medis (dukun bayi), rata-rata usia perkawinan pertama, jumlah pemeriksaan yang dilakukan oleh ibu pada saat hamil, lama sekolah wanita berstatus kawin, dan persentase daerah yang berstatus desa, dan lain-lain. 2.2 Distribusi Poisson Distribusi Poisson diberi nama sesuai dengan penemunya yaitu Siemon D. Poisson. Distibusi ini merupakan distribusi probabilitas untuk variabel diskrit acak yang mempunyai nilai 0,1, 2, 3 dst. Suryadi (2003) mengatakan percobaan Poisson adalah percobaan yang menghasilkan peubah acak X yang bernilai numerik, yaitu banyaknya sukses selama selang waktu tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu 2 meter, satu kilometer persegi dan lain-lain. Sedangkan menurut Cameron dan Trivedi (1998) suatu variable random x yang bertipe diskrit akan mengikuti distribusi poisson jika mempunyai parameter µ sebagai rata-rata jumlah kejadian dan t sebagai selang waktu kejadian. Maka variable random x tersebut akan mempunyai fungsi densitas yaitu: f (x) et t x x! , x = 0,1,2,3,…;µ > 0 =0 , untuk x yang lain (1) Dimana μ menyatakan rata-rata banyaknya sukses yang terjadi dalam selang waktu atau daerah tertentu tersebut dan e = 2,71828... 2.3 Regresi Poisson Analisis regresi merupakan metode statistika yang populer digunakan untuk menyatakan hubungan antara peubah tak bebas Y dengan peubah-peubah bebas X. Dari uraian tersebut maka regresi poisson adalah salah satu regresi yang dapat menggambarkan hubungan antara variabel respon (y) dimana variabel respon berdistribusi poisson dengan variabel bebas (x). Variabel y merupakan variabel respon (dependen) yang menyatakan jumlah kejadian (banyaknya sukses) yang terjadi dalam selang waktu tertentu. Sedangkan variabel x merupakan variabel prediktor yang saling independen antara satu sama lain (Cameron dan Trivedi, 1998). Regresi poisson adalah regresi nonlinier dari distribusi poisson. Model regresi poisson menyatakan mean variabel random sebagai fungsi variabelvariabel prediktor. Misalkan terdapat data yang diambil dari bentuk sebagai berikut: y1 x11 x21 y2 x12 x22 yn x1n x21 xk1 xk2 xkn yi adalah observasi ke-i dari variabel respon Y, dan xji adalah nilai variabel predictor X j ( j 1,2,, k) . Maka model regresi poisson dapat dinyatakan dengan dengan persamaan: yi i i (i = 1,2,3,…..,n) (2) Dimana i adalah rata-rata jumlah kejadian (banyaknya sukses) yang terjadi dalam selang waktu ti . Bila menggunakan distribusi poisson dan mengasumsikan i tidak berubah data point yang satu ke data point yang lain secara independent maka i dapat dimodelkan sebagai fungsi dari k variable predictor (Myers,1990). Sehingga akan diperoleh persamaan: eti xi , ti xi , yi f ( yi ) yi! i = 1,2,…,n (3) Variable yi merupakan variable respon berdistribusi poisson dan nilai harapan yi atau E(yi) adalah tiµ(xi,β) sehingga: E(yi) = i = tiµ(xi,β) Sehingga persamaan (2.4) akan menjadi: 3 (4) yi t i xi , i (5) Dimana µ(xi,β) adalah mean poisson dan merupakan fungsi dari variabel prediktor. Sedangkan β adalah vektor dari parameter yang diestimasi. Fungsi µ(xi,β) dapat dipilih menurut pola dari data yang diperoleh dan selalu berharga positif. Salah satu fungsi yang exi dimana xi' adalah fungsi linier (Myers,1990). Fungsi linier variabel prediktor ( xi' ) nantinya akan menghubungkan variabel' dapat digunakan dalam µ(xi,β) adalah variabel prediktor pada mean distribusi ini dalam generalized linear model disebut fungsi penghubung (link function). Model distribusi Poisson ini merupakan kasus khusus dari model linear umum, suatu model yang diperkenalkan oleh Nelder dan Weddweburn (1972) dalam McCullagh dan Nelder (1989). Fungsi linier tersebut digunakan pada model η=Xβdengan X adalah matriks model (kadang-kadang disebut juga matriks rancangan) yang berisi nilai-nilai variabel prediktor untuk n buah pengamatan, dan adalah vektor dari parameter-parameter di dalam model sehingga fungsi hubungan untuk model regresi poisson mempunyai logaritma sebagai berikut: ln E(y xi) = ln(µ) = η = 0 1x1 k xk (6) µ = exp ( 0 1x1 k xk ) (7) 2.3.1 Estimasi Parameter Regresi Poisson dengan MLE (Maximum Likelihood Ratio) Metode MLE adalah salah satu metode penaksiran parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Sebagaimana diketahui bahwa estimasi parameter melalui metode MLE adalah melakukan turunan parsial fungsi ln-likelihood terhadap parameter yang akan diestimasi. Berdasarkan persamaan (2.5) maka bentuk umum fungsi likelihood untuk regresi poisson adalah: f ( y , ) n L (yi,β) = i i1 etixi , ti xi , yi yi ! i1 n = ti xi , n yi i 1 e ti xi , i1 = n (8) y ! n i i1 Langkah selanjutnya adalah melakukan turunan parsial fungsi ln-likelihood pada persamaan (2.10) terhadap parameter yang akan diestimasi. Fungsi ln-likelihood pada persamaan (2.10) adalah sebagai berikut: Ln L(yi,β)= yi ln(ti xi , ti xi , ln(yi!) n n n i1 i1 i1 Jika tiµ(xi,β) = exp ( xi' ) maka persamaan (2.11) akan menjadi: yi ln exp xi' exp xi' ln(yi!) n ln L (yi,β) = i1 4 n i1 n i1 (9) y x expx lny ! n = i1 i ' i ' i i (10) Kemudian persamaan (2.12) diturunkan terhadap β disamakan dengan nol dan diselesaikan dengan metode iterasi numerik yaitu Newton-Raphson. Algoritma metode Newton-Raphson dapat dituliskan sebagai berikut : 1. Menentukan nilai taksiran awal parameter β̂ (0). Penentuan nilai awal ini biasanya diperoleh dengan metode Ordinary Least Square (OLS), yaitu : βˆ(0) (X ' X)1 X 'Y 2. Membentuk vektor gradien g, ln L(β) ln L(β) ln L(β) gT ((m) )(k1)x1 , ,, 1 k (m) 0 k adalah banyaknya parameter yang ditaksir. 3. Membentuk matriks Hessian H: 2 ln L(β) 2 ln L(β) 2 ln L(β) 2 01 0k 0 2 2 ln L ( β ) ln L(β) 1k H((m) )(k1)x(k1) 12 2 ln L(β) simetris k2 (m) Matriks Hessian ini disebut juga matriks informasi. 4. Memasukkan nilai βˆ(0) kedalam elemen-elemen vektor g dan matriks H, sehingga diperoleh vektor g(βˆ(0) ) dan matriks H(βˆ(0) ) . 5. Mulai dari m = 0 dilakukan iterasi pada persamaan : (m+1) = (m) – H-1(m) g(m) Nilai (m) merupakan sekumpulan penaksir parameter yang konvergen pada iterasi kem. 6. Jika belum didapatkan penaksir parameter yang konvergen, maka dilanjutkan kembali langkah 5 hingga iterasi ke m = m + 1. 2.3.2 Pengujian Signifikansi Parameter Pengujian signifikansi parameter dalam model regresi poisson bertujuan untuk mengetahui apakah parameter tersebut telah menunjukkan hubungan yang tepat antara variabel prediktor dengan variabel respon dan mengetahui apakah parameter tersebut berpengaruh signifikan terhadap model. Untuk menguji kelayakan model regresi Poisson, terlebih dahulu ditentukan dua buah fungsi likelihood yang berhubungan dengan model ˆ ) yaitu nilai regresi yang diperoleh. Fungsi-fungsi likelihood yang dimaksud adalah L( maksimum likelihood untuk model lengkap dengan melibatkan variabel prediktor dan L(ˆ ) , yaitu nilai maksimum likelihood untuk model sederhana tanpa melibatkan variabel prediktor. Salah satu metode yang digunakan untuk menentukan statistik uji dalam 5 pengujian parameter model regresi Poisson adalah dengan menggunakan metode Maximum Likelihood Ratio Test (MLRT). Dengan hipotesis: H0 : 1 2 k 0 H1 : paling tidak ada satu βj ≠ 0, j = 0,1,2,…,k Menurut Greene (2000) statistik uji yang digunakan pada metode ini adalah: G2 = 2 ln L(ˆ) 2ln ˆ L() ˆ ) ln L(ˆ) G2 = 2 ln L( G2 = (11) Keputusan: 2 v2, dengan kata lain paling tidak ada satu βj yang tidak sama Tolak H0 jika Ghitung dengan 0. Dengan v adalah banyaknya parameter model dibawah populasi dikurangi dengan banyaknya parameter dibawah H0. 2.4 Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari hasil Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2007 yang dilakukan oleh BPS (Badan Pusat Statistika). Pada penelitian ini menggunakan data IMR (angka kematian bayi) pada tahun 2007 untuk dan Jawa Timur. Variabel penelitian yang digunakan dalam menganalisis model penentuan angka kematian bayi terdiri variabel dependen (Y) dan variabel independen (X) adalah sebagai berikut : Tabel 1. Variabel Penelitian No. Nama Variabel Tipe Variabel (1) (2) (3) 1 Y = Jumlah kematian bayi pada tiap kabupaten/kota Kontinu 2 X1 = Persentase persalinan yang dilakukan dengan bantuan non medis (dukun bayi) pada tiap kabupaten/kota Kontinu 3 X2 = Rata-rata usia perkawinan pertama pada tiap kabupaten/kota Kontinu 4 X3 = Rata-rata lama sekolah wanita berstatus kawin pada tiap kabupaten/kota Kontinu 5 X4 = Rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) pada tiap kabupaten/kota Kontinu 6 X5 = Persentase daerah yang berstatus desa pada tiap kabupaten/kota Kontinu 7 X6 = Rata-rata lama pemberian ASI eksklusif pada tiap kabupaten/kota Kontinu 8 X7 = Persentase rumah tangga yang memiliki air bersih pada tiap kabupaten/kota Kontinu 6 9 2.5 X8 = Persentase penduduk miskin pada tiap kabupaten/kota Kontinu Analisis dan Pembahasan Parameter Tabel 2. Estimasi Parameter Variabel Prediktor Df Estimate Standart Error Chi-Square Pr > Chisq Intercept 1 6.3661 5.0870 1.57 0.2108 x1 1 -0.0147 0.0188 0.61 0.4348 x2 1 -0.1120 0.2996 0.14 0.7084* x3 1 -0.2045 0.2929 0.49 0.4850 x4 1 0.0000 0.0000 0.38 0.5392* x5 1 0.0013 0.0097 0.02 0.8924* x6 1 -0.0504 0.1097 0.21 0.6457* x7 1 -0.0141 0.0144 0.95 0.3285 x8 1 0.0183 *signifikan pada α = 0.05 0.0248 0.54 0.4609 Dari tabel di atas dapat diketahui bahwa terdapat 4 variabel yang signifikan berpengaruh terhadap model yaitu x2, x4, x5 dan x6. Hal tersebut menunjukkan bahwa faktor yang mempengaruhi jumlah kematian bayi di Jawa Tengah adalah rata-rata usia perkawinan pertama, rata-rata jumlah pengeluaran rumah tangga, persentase daerah yang berstatus desa dan rata-rata lama pemberian ASI eksklusif pada bayi. Langkah selanjutnya adalah mengestimasi parameter untur variabel yang signifkan terhadap model saja. Tabel 3. Estimasi Parameter Variabel Prediktor yang Signifikan Parameter Df Estimate Standart Error Chi-Square Pr > Chisq Intercept 1 6.3309 4.0712 2.42 0.1199 x2 1 -0.1388 0.2112 0.43 0.5109 x4 1 -0.0000 0.0000 0.09 0.7662 x5 1 0.0013 0.0089 0.02 0.8882 x6 1 -0.0639 0.1051 0.37 0.5431 Dari tabel di atas diketahui nilai koefisien parameter untuk tiap variabel. Karena nilai koefisien x4 adalah 0.00, maka diperoleh model regresi poisson untuk faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Tengah yaitu: ˆ exp(0 2 x2 5 x5 6 x6 ) ˆ exp(6.3309 0.1388x2 0.0013x5 0.0639x6 DAFTAR PUSTAKA 7 Arriaga, A.E. (1979). Infant and Child Mortality in Selected Asian Countries. In Proceding od The Meeting on Socio-economic Determinants of Consequences of Mortality, Mexico City. Badan Penelitian dan Pengembangan Kesehatan. (1995). Survei Kesehatan Rumah Tangga 1995. Jakarta: Departemen Kesehatan RI. Badan Pusat Statistik. (2001). Estimasi Fertilitas, Mortalitas dan Migrasi Hasil Sensus Penduduk Tahun 2000. Jakarta :Badan Pusat Statistik. Cameron, A.C., dan Trivedi, P.K. (1998). Regression Analysis of Count Data. United Kingdom: Cambridge University Press. Cameron, A.C., dan Windmeijer,F.A.G. (1996). R2 Measures for Count Data Regression Models with Applications to Health-care Utilization. Business Econom and Statistic. 14, 209-220 Djaja, S. (2003). Penyakit Penyebab Kematian Bayi Baru Lahir (Neonatal) dan Sistem Pelayanan Kesehatan yang Berkaitan di Indonesia. Bandung : Institut Teknologi Bandung. Draper, N.R., dan Smith, H. (1992). Analisis Regresi Terapan, Edisi Kedua, Alih Bahasa : Bambang Sumantri. Jakarta: PT Gramedia Pustaka Utama. Humas Universitas Indonesia.(2004) Angka Kematian Bayi di Indonesia Tetap Tinggi. Harian terbit, Kamis, 29 Januari (p.8:6-8). Jakarta. Kleinbaum, D.E. (1988). Applied Regression Analysis and Other Multivariate Methods. USA : PWS-KENT Publishing Company. Mantra, I.B. (1985). Pengantar Studi Demografi. Yogyakarta: Nurcahaya. Montgomery , Peck and Vining. (2001). Introduction to Linear Regression Analysis Third Edition. John Wiley and Son Inc. Myers, R.H. (1990). Classical and Modern Regression with Aplication, Second Edition. Boston: PWS-KENT Publishing Company. Patriani, A.A. (1995). Karakteristik Keluarga yang Berhubungan dengan Kematian Bayi di Desa Tertinggal Propinsi Jawa Barat, Jawa Tengah dan Sumatera Selatan Tahun 1999. Thesis Fakultas Kesehatan Masyarakat – Universitas Indonesia, Depok. Tidak dipublikasikan. Santiyasa, I.W. (2001). Hubungan faktor sosio-demografi serta perilku pra dan pasca persalinan dengan kematian balita. Thesis Fakultas MIPA Unud. Tidak dipublikasikan. Utomo, B. (1984). Kematian Bayi dan Anak di Indonesia: Beberapa Implikasi Kebijakan, Dalam Laporan Seminar dalam Lokakarya Strategi Penelitian dan Strategi Program untuk Intensifikasi Penurunan Mortalitas Bayi dan Anak di Indonesia. 25-29 Mei, p.51-60. Universitas Indonesia. Jakarta. Waldhor, T., Haidinger, G., Schober, E. (1998). Comparison of R2 Measures of Poisson regression by Simulation. Epidemiol and Bioststist. 3, 209-215. Walpole, R.E. (1995). Pengantar Statistika. Jakarta: PT. Gramedia Pustaka Utama. 8