PEMODELAN REGRESI POISSON UNTUK MENGETAHUI FAKTOR

advertisement
Seminar Nasional Statistika IX
Institut Teknologi Sepuluh Nopember, 7 November 2009
PEMODELAN REGRESI POISSON UNTUK MENGETAHUI
FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN
BAYI DI JAWA TENGAH
Yayuk Listiani1, Purhadi2
Mahasiswa Jurusan Statistika ITS. 2Dosen Jurusan Statistika ITS
1
ABSTRAK
Regresi Poisson adalah salah satu regresi nonlinier. Regresi Poisson sering kali digunakan
untuk menganalisis data diskrit. Pada makalah ini Regresi Poisson di aplikasikan untuk
pemodelan faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Tengah. Dan
hasilnya terdapat empat faktor yang mempengaruhi angka kematian bayi di Jawa Tengah yaitu
rata-rata usia perkawinan pertama, rata-rata jumlah pengeluaran rumah tangga, persentase
daerah yang berstatus desa dan rata-rata lama pemberian ASI eksklusif pada bayi.
Keywords: Angka Kematian Bayi, Regresi Poisson
1. PENDAHULUAN
Salah satu alat untuk menilai keberhasilan program pembangunan kesehatan yang
telah dilaksanakan selama ini adalah dengan melihat perkembangan angka kematian dari
tahun ketahun, baik angka kematian bayi, balita, ibu maternal, kecacatan maupun
kesakitan. Angka kematian bayi adalah indikator yang sensitif terhadap ketersediaan
pemanfaatan dan kualitas pelayanan kesehatan terlebih-lebih terhadap pelayanan perinatal.
Angka kematian bayi baru lahir di Indonesia masih lebih tinggi bila dibandingkan
dengan Negara ASEAN lainnya kecuali Myanmar dan Kamboja. Walaupun selama
beberapa dekade terakhir, Indonesia berhasil menurunkan angka kematian bayi dan balita
secara signifikan yaitu pada 1960, angka kematian bayi (IMR) di Indonesia masih
mencapai 128 per 1.000 kelahiran hidup. Angka itu turun menjadi 68 per 1.000 kelahiran
hidup pada 1989. Pada 1990-an angka kematian bayi terus menurun. Pada 1992, AKB 57
per 1.000 kelahiran hidup, lalu menjadi 46 per 1.000 kelahiran hidup pada 1995. Pada
1990-an, rata-rata penurunan 5% per tahun, sedikit lebih tinggi daripada periode 1980-an
sebesar 4% per tahun. Pada 2000, angka kematian bayi menjadi 35 per 1.000 kelahiran
hidup dan turun lagi menjadi 25 pada 2006, namun jika dibandingkan dengan negaranegara anggota ASEAN masih 4,6 kali lebih tinggi daripada Malaysia, 1,3 kali lebih tinggi
daripada Filipina, dan 1,8 kali lebih tinggi daripada Thailand.
Tiga penyebab utama kematian bayi menurut Survei Kesehatan Rumah Tangga
(SKRT) 1995 adalah infeksi saluran pernafasan akut (ISPA), komplikasi perinatal, dan
diare. Gabungan ketiga penyebab ini memberi andil bagi 75 persen kematian bayi. Pada
2001 pola penyebab kematian bayi ini tidak banyak berubah dari periode sebelumnya,
yaitu karena sebab-sebab perinatal, kemudian diikuti oleh infeksi saluran pernafasan akut
(ISPA), diare, tetanus neotarum, saluran cerna, dan penyakit saraf.
Selain disebabkan oleh hal tersebut, angka kematian bayi juga dipengaruhi dari
karakteristik ibu dan faktor lingkungan. Karakteristik ibu yang menjadi berpengaruh
terhadap angka kematian bayi adalah usia ibu saat perkawinan. Survei Demografi dan
Kesehatan Indonesia menemukan kematian balita yang tinggi terjadi pada mereka yang
melahirkan pada usia kurang dari 20 tahun. Selain itu pendidikan ibu juga mempengaruhi
1
angka kematian bayi. Menurut Budi Utomo (1984), tinggi rendahnya tingkat pendidikan
ibu erat kaitannya dengan tingkat pengertian terhadap perawatan kesehatan, higiene,
perlunya pemeriksaan kehamilan. Sehingga kematian balita yang rendah dijumpai pada
golongan wanita yang mempunyai pendidikan yang tinggi. Sedangkan faktor lingkungan
yang mempengaruhi angka kematian bayi adalah jumlah sarana kesehatan, jumlah tenaga
medis, persentase persalinan yang dilakukan dengan bantuan medis, rata-rata jumlah
pengeluaran rumah tangga, persentase daerah berstatus desa, persentase rumah tangga yang
memiliki air bersih, dan persentase penduduk miskin.
IMR pada penduduk termiskin pada 1995 hampir dua kali lebih tinggi daripada
penduduk terkaya. Walaupun perbedaan ini mengecil, IMR pada 2001 untuk penduduk
miskin masih 1,5 kali lebih tinggi dibanding penduduk terkaya. Dengan masih besarnya
jumlah penduduk miskin di Indonesia, yaitu sekitar 37,34 juta jiwa atau 17,4 persen pada
2003, perlindungan dan pelayanan kesehatan anak pada kelompok penduduk itu
merupakan tantangan berat yang masih harus dihadapi. Selain perlunya intervensi yang
cost-effective, kerja sama lintas sektor bagi upaya penanggulangan kemiskinan akan sangat
berperan dalam peningkatan derajat kesehatan ibu dan anak secara umum. Oleh karena itu,
perlindungan dan pelayanan kesehatan bagi bayi dan balita dari keluarga miskin menjadi
sangat penting, karena kondisi kesehatan dan gizi anak-anak itu secara umum jauh lebih
rendah. Beberapa penelitian sebelumnya juga telah menghasilkan banyak faktor terutama
social-ekonomi yang menyebabkan kematian bayi. Gwatkin (2000) mengindikasikan
bahwa perbedaan angka kematian bayi (IMR) di Indonesia berhubungan dengan kondisi
sosial ekonomi yang diukur dengan tingkat kekayaan dan rasio penduduk miskin.
2. REGRESI POISSON
Pada pembahasan ini akan dijelaskan tentang angka kematian bayi, distribusi
poisson, model regresi poisson, penaksiran parameter menggunakan metode Maximum
Likelihood Estimator (MLE) dan pengujian signifikansi parameter model regresi poisson.
2.1 Angka Kematian Bayi
Kematian bayi adalah kematian yang terjadi antara saat setelah bayi lahir sampai
bayi belum berusia tepat satu tahun. Banyak faktor yang dikaitkan dengan kematian bayi.
Secara garis besar, dari sisi penyebabnya, kematian bayi ada dua macam yaitu endogen dan
eksogen. Kematian bayi endogen atau yang umum disebut dengan kematian neonatal;
adalah kematian bayi yang terjadi pada bulan pertama setelah dilahirkan, dan umumnya
disebabkan oleh faktor-faktor yang dibawa anak sejak lahir, yang diperoleh dari orang
tuanya pada saat konsepsi atau didapat selama kehamilan. Kematian bayi eksogen atau
kematian post neo-natal, adalah kematian bayi yang terjadi setelah usia satu bulan sampai
menjelang usia satu tahun yang disebabkan oleh faktor-faktor yang bertalian dengan
pengaruh lingkungan luar. Kematian bayi disebabkan oleh beberapa faktor yaitu: jumlah
sarana kesehatan, jumlah tenaga medis, persalinan yang dilakukan dengan bantuan non
medis (dukun bayi), rata-rata usia perkawinan pertama, jumlah pemeriksaan yang
dilakukan oleh ibu pada saat hamil, lama sekolah wanita berstatus kawin, dan persentase
daerah yang berstatus desa, dan lain-lain.
2.2 Distribusi Poisson
Distribusi Poisson diberi nama sesuai dengan penemunya yaitu Siemon D. Poisson.
Distibusi ini merupakan distribusi probabilitas untuk variabel diskrit acak yang mempunyai
nilai 0,1, 2, 3 dst. Suryadi (2003) mengatakan percobaan Poisson adalah percobaan yang
menghasilkan peubah acak X yang bernilai numerik, yaitu banyaknya sukses selama selang
waktu tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik,
semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu
2
meter, satu kilometer persegi dan lain-lain. Sedangkan menurut Cameron dan Trivedi
(1998) suatu variable random x yang bertipe diskrit akan mengikuti distribusi poisson jika
mempunyai parameter µ sebagai rata-rata jumlah kejadian dan t sebagai selang waktu
kejadian. Maka variable random x tersebut akan mempunyai fungsi densitas yaitu:
f (x) 
et t x
x!
, x = 0,1,2,3,…;µ > 0
=0
, untuk x yang lain
(1)
Dimana μ menyatakan rata-rata banyaknya sukses yang terjadi dalam selang waktu atau
daerah tertentu tersebut dan e = 2,71828...
2.3 Regresi Poisson
Analisis regresi merupakan metode statistika yang populer digunakan untuk
menyatakan hubungan antara peubah tak bebas Y dengan peubah-peubah bebas X. Dari
uraian tersebut maka regresi poisson adalah salah satu regresi yang dapat menggambarkan
hubungan antara variabel respon (y) dimana variabel respon berdistribusi poisson dengan
variabel bebas (x). Variabel y merupakan variabel respon (dependen) yang menyatakan
jumlah kejadian (banyaknya sukses) yang terjadi dalam selang waktu tertentu. Sedangkan
variabel x merupakan variabel prediktor yang saling independen antara satu sama lain
(Cameron dan Trivedi, 1998). Regresi poisson adalah regresi nonlinier dari distribusi
poisson.
Model regresi poisson menyatakan mean variabel random sebagai fungsi variabelvariabel prediktor. Misalkan terdapat data yang diambil dari bentuk sebagai berikut:
y1 x11 x21
y2 x12 x22
  
yn x1n x21




xk1
xk2

xkn
yi adalah observasi ke-i dari variabel respon Y, dan xji adalah nilai variabel
predictor X j ( j 1,2,, k) . Maka model regresi poisson dapat dinyatakan dengan
dengan
persamaan:
yi  i  i
(i = 1,2,3,…..,n)
(2)
Dimana i adalah rata-rata jumlah kejadian (banyaknya sukses) yang terjadi dalam selang
waktu ti . Bila menggunakan distribusi poisson dan mengasumsikan i tidak berubah data
point yang satu ke data point yang lain secara independent maka i dapat dimodelkan
sebagai fungsi dari k variable predictor (Myers,1990). Sehingga akan diperoleh persamaan:
eti xi , ti xi ,  yi
f ( yi ) 
yi!
i = 1,2,…,n
(3)
Variable yi merupakan variable respon berdistribusi poisson dan nilai harapan yi atau E(yi)
adalah tiµ(xi,β) sehingga:
E(yi) =
i
= tiµ(xi,β)
Sehingga persamaan (2.4) akan menjadi:
3
(4)
yi  t i xi ,    i
(5)
Dimana µ(xi,β) adalah mean poisson dan merupakan fungsi dari variabel prediktor.
Sedangkan β adalah vektor dari parameter yang diestimasi. Fungsi µ(xi,β) dapat dipilih
menurut pola dari data yang diperoleh dan selalu berharga positif. Salah satu fungsi yang
exi  dimana xi'  adalah fungsi linier (Myers,1990).
Fungsi linier variabel prediktor ( xi'  ) nantinya akan menghubungkan variabel'
dapat digunakan dalam µ(xi,β) adalah
variabel prediktor pada mean distribusi ini dalam generalized linear model disebut fungsi
penghubung (link function). Model distribusi Poisson ini merupakan kasus khusus dari
model linear umum, suatu model yang diperkenalkan oleh Nelder dan Weddweburn (1972)
dalam McCullagh dan Nelder (1989). Fungsi linier tersebut digunakan pada model
η=Xβdengan X adalah matriks model (kadang-kadang disebut juga matriks rancangan)
yang berisi nilai-nilai variabel prediktor untuk n buah pengamatan, dan  adalah vektor
dari parameter-parameter di dalam model sehingga fungsi hubungan untuk model regresi
poisson mempunyai logaritma sebagai berikut:
ln E(y xi) = ln(µ) = η = 0  1x1  k xk
(6)
µ = exp ( 0  1x1  k xk )
(7)
2.3.1 Estimasi Parameter Regresi Poisson dengan MLE (Maximum Likelihood Ratio)
Metode MLE adalah salah satu metode penaksiran parameter yang dapat digunakan
untuk menaksir parameter suatu model yang diketahui distribusinya. Sebagaimana
diketahui bahwa estimasi parameter melalui metode MLE adalah melakukan turunan
parsial fungsi ln-likelihood terhadap parameter yang akan diestimasi. Berdasarkan
persamaan (2.5) maka bentuk umum fungsi likelihood untuk regresi poisson adalah:
 f ( y , )
n
L (yi,β) =
i
i1
etixi , ti xi ,  yi 



yi !

i1 

n
=
ti xi ,  n


yi 
i 1
e
ti xi ,  
 i1

=

n
(8)
y !
n
i
i1
Langkah selanjutnya adalah melakukan turunan parsial fungsi ln-likelihood pada
persamaan (2.10) terhadap parameter yang akan diestimasi. Fungsi ln-likelihood pada
persamaan (2.10) adalah sebagai berikut:
Ln L(yi,β)=
yi ln(ti xi , ti xi , ln(yi!)
n
n
n
i1
i1
i1
Jika tiµ(xi,β) = exp ( xi'  ) maka persamaan (2.11) akan menjadi:
  
 
yi ln exp xi'  exp xi'  ln(yi!)
n
ln L (yi,β) =
i1
4
n
i1
n
i1
(9)
y x expx lny !
n
=
i1
i
'
i
'
i
i
(10)
Kemudian persamaan (2.12) diturunkan terhadap β disamakan dengan nol dan
diselesaikan dengan metode iterasi numerik yaitu Newton-Raphson. Algoritma metode
Newton-Raphson dapat dituliskan sebagai berikut :
1. Menentukan nilai taksiran awal parameter β̂ (0). Penentuan nilai awal ini biasanya
diperoleh dengan metode Ordinary Least Square (OLS), yaitu :
βˆ(0)  (X ' X)1 X 'Y
2. Membentuk vektor gradien g,
 ln L(β) ln L(β) ln L(β) 
gT ((m) )(k1)x1  
,
,,
1
k (m)
 0
k adalah banyaknya parameter yang ditaksir.
3. Membentuk matriks Hessian H:
 2 ln L(β) 2 ln L(β)
2 ln L(β) 

  2
01
0k 
0

2
2


ln
L
(
β
)

ln L(β) 


1k 
H((m) )(k1)x(k1)  
12






2

 ln L(β) 
 simetris

k2 (m)

Matriks Hessian ini disebut juga matriks informasi.
4. Memasukkan nilai βˆ(0) kedalam elemen-elemen vektor g dan matriks H, sehingga
diperoleh vektor g(βˆ(0) ) dan matriks H(βˆ(0) ) .
5. Mulai dari m = 0 dilakukan iterasi pada persamaan :
(m+1) = (m) – H-1(m) g(m)
Nilai  (m) merupakan sekumpulan penaksir parameter yang konvergen pada iterasi kem.
6. Jika belum didapatkan penaksir parameter yang konvergen, maka dilanjutkan kembali
langkah 5 hingga iterasi ke m = m + 1.
2.3.2 Pengujian Signifikansi Parameter
Pengujian signifikansi parameter dalam model regresi poisson bertujuan untuk
mengetahui apakah parameter tersebut telah menunjukkan hubungan yang tepat antara
variabel prediktor dengan variabel respon dan mengetahui apakah parameter tersebut
berpengaruh signifikan terhadap model. Untuk menguji kelayakan model regresi Poisson,
terlebih dahulu ditentukan dua buah fungsi likelihood yang berhubungan dengan model
ˆ ) yaitu nilai
regresi yang diperoleh. Fungsi-fungsi likelihood yang dimaksud adalah L(
maksimum likelihood untuk model lengkap dengan melibatkan variabel prediktor dan
L(ˆ ) , yaitu nilai maksimum likelihood untuk model sederhana tanpa melibatkan variabel
prediktor. Salah satu metode yang digunakan untuk menentukan statistik uji dalam
5
pengujian parameter model regresi Poisson adalah dengan menggunakan metode Maximum
Likelihood Ratio Test (MLRT). Dengan hipotesis:
H0 : 1  2  k  0
H1 : paling tidak ada satu βj ≠ 0, j = 0,1,2,…,k
Menurut Greene (2000) statistik uji yang digunakan pada metode ini adalah:
G2 = 2 ln 
  L(ˆ) 
 2ln ˆ 
  L() 
ˆ ) ln L(ˆ)
G2 = 2 ln L(
G2 =


(11)
Keputusan:
2
 v2, dengan kata lain paling tidak ada satu βj yang tidak sama
Tolak H0 jika Ghitung
dengan 0. Dengan v adalah banyaknya parameter model dibawah populasi dikurangi
dengan banyaknya parameter dibawah H0.
2.4 Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari
hasil Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2007 yang dilakukan oleh BPS
(Badan Pusat Statistika). Pada penelitian ini menggunakan data IMR (angka kematian bayi)
pada tahun 2007 untuk dan Jawa Timur. Variabel penelitian yang digunakan dalam
menganalisis model penentuan angka kematian bayi terdiri variabel dependen (Y) dan
variabel independen (X) adalah sebagai berikut :
Tabel 1. Variabel Penelitian
No.
Nama Variabel
Tipe Variabel
(1)
(2)
(3)
1
Y =
Jumlah kematian bayi pada tiap kabupaten/kota
Kontinu
2
X1 =
Persentase persalinan yang dilakukan dengan bantuan
non medis (dukun bayi) pada tiap kabupaten/kota
Kontinu
3
X2 =
Rata-rata usia perkawinan pertama pada tiap
kabupaten/kota
Kontinu
4
X3 =
Rata-rata lama sekolah wanita berstatus kawin pada
tiap kabupaten/kota
Kontinu
5
X4 =
Rata-rata jumlah pengeluaran rumah tangga (dalam
rupiah) pada tiap kabupaten/kota
Kontinu
6
X5 =
Persentase daerah yang berstatus desa pada tiap
kabupaten/kota
Kontinu
7
X6 =
Rata-rata lama pemberian ASI eksklusif pada tiap
kabupaten/kota
Kontinu
8
X7 =
Persentase rumah tangga yang memiliki air bersih pada
tiap kabupaten/kota
Kontinu
6
9
2.5
X8 =
Persentase penduduk miskin pada tiap kabupaten/kota
Kontinu
Analisis dan Pembahasan
Parameter
Tabel 2. Estimasi Parameter Variabel Prediktor
Df
Estimate Standart Error Chi-Square
Pr > Chisq
Intercept
1
6.3661
5.0870
1.57
0.2108
x1
1
-0.0147
0.0188
0.61
0.4348
x2
1
-0.1120
0.2996
0.14
0.7084*
x3
1
-0.2045
0.2929
0.49
0.4850
x4
1
0.0000
0.0000
0.38
0.5392*
x5
1
0.0013
0.0097
0.02
0.8924*
x6
1
-0.0504
0.1097
0.21
0.6457*
x7
1
-0.0141
0.0144
0.95
0.3285
x8
1
0.0183
*signifikan pada α = 0.05
0.0248
0.54
0.4609
Dari tabel di atas dapat diketahui bahwa terdapat 4 variabel yang signifikan
berpengaruh terhadap model yaitu x2, x4, x5 dan x6. Hal tersebut menunjukkan bahwa
faktor yang mempengaruhi jumlah kematian bayi di Jawa Tengah adalah rata-rata usia
perkawinan pertama, rata-rata jumlah pengeluaran rumah tangga, persentase daerah yang
berstatus desa dan rata-rata lama pemberian ASI eksklusif pada bayi. Langkah selanjutnya
adalah mengestimasi parameter untur variabel yang signifkan terhadap model saja.
Tabel 3. Estimasi Parameter Variabel Prediktor yang Signifikan
Parameter Df
Estimate Standart Error Chi-Square Pr > Chisq
Intercept
1
6.3309
4.0712
2.42
0.1199
x2
1
-0.1388
0.2112
0.43
0.5109
x4
1
-0.0000
0.0000
0.09
0.7662
x5
1
0.0013
0.0089
0.02
0.8882
x6
1
-0.0639
0.1051
0.37
0.5431
Dari tabel di atas diketahui nilai koefisien parameter untuk tiap variabel. Karena nilai
koefisien x4 adalah 0.00, maka diperoleh model regresi poisson untuk faktor-faktor yang
mempengaruhi angka kematian bayi di Jawa Tengah yaitu:
ˆ  exp(0  2 x2  5 x5  6 x6 )
ˆ  exp(6.3309 0.1388x2  0.0013x5  0.0639x6
DAFTAR PUSTAKA
7
Arriaga, A.E. (1979). Infant and Child Mortality in Selected Asian Countries. In Proceding
od The Meeting on Socio-economic Determinants of Consequences of Mortality,
Mexico City.
Badan Penelitian dan Pengembangan Kesehatan. (1995). Survei Kesehatan Rumah Tangga
1995. Jakarta: Departemen Kesehatan RI.
Badan Pusat Statistik. (2001). Estimasi Fertilitas, Mortalitas dan Migrasi Hasil Sensus
Penduduk Tahun 2000. Jakarta :Badan Pusat Statistik.
Cameron, A.C., dan Trivedi, P.K. (1998). Regression Analysis of Count Data. United
Kingdom: Cambridge University Press.
Cameron, A.C., dan Windmeijer,F.A.G. (1996). R2 Measures for Count Data Regression
Models with Applications to Health-care Utilization. Business Econom and Statistic.
14, 209-220
Djaja, S. (2003). Penyakit Penyebab Kematian Bayi Baru Lahir (Neonatal) dan Sistem
Pelayanan Kesehatan yang Berkaitan di Indonesia. Bandung : Institut Teknologi
Bandung.
Draper, N.R., dan Smith, H. (1992). Analisis Regresi Terapan, Edisi Kedua, Alih Bahasa :
Bambang Sumantri. Jakarta: PT Gramedia Pustaka Utama.
Humas Universitas Indonesia.(2004) Angka Kematian Bayi di Indonesia Tetap Tinggi.
Harian terbit, Kamis, 29 Januari (p.8:6-8). Jakarta.
Kleinbaum, D.E. (1988). Applied Regression Analysis and Other Multivariate Methods.
USA : PWS-KENT Publishing Company.
Mantra, I.B. (1985). Pengantar Studi Demografi. Yogyakarta: Nurcahaya.
Montgomery , Peck and Vining. (2001). Introduction to Linear Regression Analysis Third
Edition. John Wiley and Son Inc.
Myers, R.H. (1990). Classical and Modern Regression with Aplication, Second Edition.
Boston: PWS-KENT Publishing Company.
Patriani, A.A. (1995). Karakteristik Keluarga yang Berhubungan dengan Kematian Bayi di
Desa Tertinggal Propinsi Jawa Barat, Jawa Tengah dan Sumatera Selatan Tahun
1999. Thesis Fakultas Kesehatan Masyarakat – Universitas Indonesia, Depok. Tidak
dipublikasikan.
Santiyasa, I.W. (2001). Hubungan faktor sosio-demografi serta perilku pra dan pasca
persalinan dengan kematian balita. Thesis Fakultas MIPA Unud. Tidak
dipublikasikan.
Utomo, B. (1984). Kematian Bayi dan Anak di Indonesia: Beberapa Implikasi Kebijakan,
Dalam Laporan Seminar dalam Lokakarya Strategi Penelitian dan Strategi Program
untuk Intensifikasi Penurunan Mortalitas Bayi dan Anak di Indonesia. 25-29 Mei,
p.51-60. Universitas Indonesia. Jakarta.
Waldhor, T., Haidinger, G., Schober, E. (1998). Comparison of R2 Measures of Poisson
regression by Simulation. Epidemiol and Bioststist. 3, 209-215.
Walpole, R.E. (1995). Pengantar Statistika. Jakarta: PT. Gramedia Pustaka Utama.
8
Download