Oleh Veni Freista H. (1308100054) Dosen Pembimbing Dr.rer.pol. Heri Kuswanto JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2011 Pendahuluan Tinjauan Pustaka Metodologi Penelitian Analisis dan Pembahasan Kesimpulan dan Saran LATAR BELAKANG Angka Kematian Bayi (AKB) sebagai Indikator Kesehatan Beberapa penelitian telah dilakukan menggunakan regresi Milenium Development Goals (MDGs) Ardiyanti (2010) Rani (2011) Basilia (2003) Model tunggal Bayesian Model Averaging (BMA) untuk Model yang tidak pasti Faktor pemeriksaan kehamilan, pelayanan kesehatan, tersedianya posyandu, pendidikan ibu, dan penolong persalinan. AKB Jawa Timur menurun namun tergolong tinggi Persentase persalinan dengan bantuan non medis Faktor utama: jumlah sarana kesehatan, jumlah tenaga medis, dan %persalinan dengan bantuan non medis Faktor lain :rata-rata jumlah pengeluaran RT,rata-rata pemberian ASI eksklusif, % rumah tangga yang memiliki air bersih, dan %penduduk miskin LATAR BELAKANG Raftery, dkk (1998) Penelitian sebelumnya tentang aplikasi BMA Prinsip dasar BMA adalah memprediksi model terbaik berdasarkan ratarata terboboti dari seluruh model terbaiknya Volinsky (1997), Hoeting, dkk (1999), Liang, dkk (2001), Madigan (1994), Mubwandarikwa, dkk (2005), Montgomery dan Nyhan (2010), Viallefont, dkk (2001) Hasil dari estimasi mencakup semua sehingga bisa mendapatkan hasil estimasi yang lebih baik (Madigan dan Raftery 1994) BMA memberikan keakuratan hasil prediksi yang lebih tinggi daripada regresi linier Bayesian Model Averaging (BMA) BMA belum pernah digunakan untuk memodelkan kasus di Indonesia RUMUSAN MASALAH 1 2 3 Bagaimana hasil prediksi Bayesian Model Averaging terhadap faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Timur? Bagaimana hasil prediksi Regresi linier berganda terhadap faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Timur? Bgaimana perbandingan hasil prediksi antara BMA dan Regresi? TUJUAN PENELITIAN memprediksi faktor yang bepengaruh secara signifikan terhadap angka kematian bayi di Jawa Timur dengan metode bayesian model averaging (BMA) dan regresi linier serta mengetahui perbandingan hasil prediksinya MANFAAT PENELITIAN 1 • memprediksi faktor-faktor yang berpengaruh secara signifikan terhadap angka kematian bayi yang tergolong tinggi di Jawa Timur dengan harapan bisa memberikan hasil yang lebih akurat daripada regresi linier 2 • referensi mengenai metode statistik baru dalam pemilihan model. BATASAN MASALAH Data yang digunakan dikhususkan pada data cross section dan tidak melibatkan efek spasial (lokasi daerah) BAYESIAN MODEL AVERAGING (BMA) Pemilihan model tunggal cenderung mengabaikan ketidakpastian model sehingga bisa menyebabkan hasil estimasi yang kurang tepat. Bayesian model averaging (BMA) adalah salah satu metode untuk menyelesaikan ketidakpastian model dengan merata-ratakan probabilitas posterior dari semua model yang mungkin. Model BMA dibentuk dari persamaan regresi berikut Misalkan terdapat p variabel prediktor, maka jumlah model yang terbentuk sebanyak q = 2p model. Jika adalah model yang mungkin terbentuk dan adalah nilai yang akan diprediksi maka probabilitas posterior jika diketahui Y adalah rata-rata dari distribusi posterior jika diketahui model diboboti oleh probabilitas model posterior Persamaan BMA prior dimana dan likelihood prior Pemilihan Model BMA Penentuan model diterima atau tidak dengan metode occam’s window dengan nilai c adalah 20. Nilai c tersebut setara dengan alfa 0.05 untuk p value (Jeffreys, 1961). Model dikeluarkan dari persamaan BMA jika probabilitas model posterior lebih besar dari nilai c. Kriteria signifikasi parameter: Pr[β1≠0|D] < 50% maka X1 tidak signifikan Jika diantara 50%-75% maka ada bukti yang lemah untuk menyatakan X1 sebagai faktor penyebab, jika diantara 75%-95% maka ada bukti yang cukup kuat, antara 95%-99% menunjukkan bahwa terdapat bukti yang kuat, jika lebih dari 99% maka bukti yang ada sangat kuat REGRESI LINIER BERGANDA Model regresi berganda adalah sebagai berikut dengan Ŷ = nilai penduga bagi variabel Y b0, b1, . . ., bk = dugaan bagi parameter konstanta β0, β1, . . ., βk e = error Pengujian Parameter Model Regresi 1. Uji Serentak H 0 : β1 = β 2 = β 3 = β p = 0 H1: minimal ada satu βi ≠ 0, i=1,2,…p Statistik uji Jika FHitung > Fα(v1,v2) maka H0 ditolak 2. Uji Individu H 0 : βi = 0 H1: βi ≠ 0 Statistik uji H0 ditolak apabila thitung > ttabel yaitu t(α/2,n-p-1) Uji Asumsi Regresi Uji Normalitas Kolmogorov Smirnov H0 H1 : Residual berdistribusi normal : Residual tidak berdistribusi normal Statistik uji H0 diterima apabila nilai D lebih kecil dari Dtabel Uji Linieritas dengan metode grafik Pengujian Multikolinearitas diindikasikan dengan nilai VIF. Pengujian Heterokedastisitas uji Gletser Dilakukan untuk mengetahui ada tidaknya hubungan antara residual (error) dengan variabel bebasnya. Pengujian Autokorelasi (hub.linier antar error) H0 : 0 H1 : 0 Statistik uji n d e t 2 t et 1 n e t 1 2 2 t 1. Jika d < dl, berarti terdapat autokorelasi positif 2. Jika d > (4 – dl), berarti terdapat autokorelasi negatif 3. Jika du < d < (4 – dl), berarti tidak terdapat autokorelasi 4. Jika dl < d < du atau (4 – du), berarti tidak dapat disimpulkan Kesalahan Prediksi digunakan untuk mengetahui tingkat keakuratan dari hasil yang diperoleh. Kesalahan prediksi bisa diketahui melalui selang kepercayaan untuk dugaan nilai y. Angka Kematian Bayi (AKB) Kematian bayi adalah kematian yang terjadi saat bayi lahir sampai sebelum mencapai usia satu tahun. Dari sisi penyebabnya Kematian endogen: terjadi pada bulan pertama setelah bayi dilahirkan, umumnya disebabkan oleh faktor bawaan Kematian Eksogen: terjadi antara usia satu bulan sampai satu tahun, umumnya disebabkan oleh faktor yang berkaitan dengan pengaruh lingkungan Dinas Kesehatan Sosio ekonomi tempat tinggal, pendidikan ibu dan indeks kesejahteraan ibu. Biologis jenis kelamin anak, usia ibu, paritas dan interval kelahiran. Faktor lain berat waktu lahir, pemeriksaan antenatal dan penolong persalinan juga dipertimbangkan berpengaruh terhadap angka kematian bayi yang tinggi tersebut, yang untuk tahap lanjutan perlu dilakukan studi lebih dalam. METODOLOGI PENELITIAN Data Sekunder Dinas Kesehatan Jawa Timur TAHUN 2009 METODOLOGI PENELITIAN Variabel penelitian 1. Jumlah kematian bayi per 1000 kelahiran hidup (Y) 2.Prosentase sarana kesehatan (RS dan puskesmas) (X1) 3. Prosentase tenaga kesehatan (X2) Tenaga kesehatan meliputi medis, perawat, bidan, farmasi, kesehatan masyarakat, gizi, keterapian fisik, dan teknisi medis. 4. Prosentase posyandu (X3) 5. Prosentase kelahiran ditolong non medis (X4) 6. Prosentase bayi yang tidak diberi ASI eksklusif (X5) ASI eksklusif adalah pemberian ASI saja tanpa makanan dan minuman lain sampai bayi berusia 6 bulan. 7. Prosentase ibu yang tidak melakukan kunjungan bayi (X6) kunjungan anak usia kurang dari satu tahun (29 hari-11 bulan) untuk mendapatkan pelayanan 8. Prosentase ibu hamil risti (X7) Ibu hamil risti adalah ibu hamil dengan keadaan penyimpangan dari normal yang secara langsung menyebabkan kesakitan dan kematian bagi ibu maupun bayinya. 9. Prosentase berat badan lahir rendah (kurang dari 2500 gram) (X8) 10. Prosentase rumah tidak sehat (X9) bangunan rumah tinggal yang memenuhi syarat kesehatan yaitu memilik jamban sehat, tempat pembuangan sampahu, sarana air bersih, sarana pembuangan air limbah, ventilasi baik, kepadatan hunian rumah sesuai dan lantai rumah tidak dari tanah. 11.Prosentase penduduk miskin (X10) Langkah Penelitian Statistika Deskriptif Membagi data menjadi data training sebanyak 30 data dan data testing sebanyak 8 data Meregresikan data training Y dan X Estimasi parameter data training Uji asumsi Membuat model prediksi BMA Memilih model terbaik Menghitung kesalahan prediksi dengan data testing Menghitung kesalahan prediksi dengan data testing Membandingkan hasil BMA dan regresi linier Kesimpulan ANALISIS DAN PEMBAHASAN Deskripsi Angka Kematian Bayi di Jawa Timur 39.6 36.65 35.32 32.93 32.2 31.41 31.28 23 2004 2005 2006 2007 2008 2009 AKB JawaTimur per 1000 kelahiran hidup 2010 target MDGs 0 Pacitan Ponorogo Trenggalek Tulungagung Blitar Kediri Malang Lumajang Jember Banyuwangi Bondowoso Situbondo Probolinggo Pasuruan Sidoarjo Mojokerto Jombang Nganjuk Madiun Magetan Ngawi Bojonegoro Tuban Lamongan Gresik Bangkalan Sampang Pamekasan Sumenep Kediri (Kota) Blitar (Kota) Malang (Kota) Probolinggo (Kota) Pasuruan (Kota) Mojokerto (Kota) Madiun (Kota) Surabaya (Kota) Batu (Kota) jumlah kematian bayi Jumlah kematian bayi tiap kabupaten/kota 350 300 250 200 150 100 50 Faktor-Faktor yang Mempengaruhi Kematian Bayi Bayesian Model Averaging Hipotesis yang digunakan adalah sebagai berikut. H0: i 0 H1 : i 0 dengan i=1,2,…,10 Variabel Prediktor Konstan Rasio jumlah sarana kesehatan Rasio jumlah tenaga kesehatan Rasio jumlah posyandu % kelahiran ditolong non medis % bayi yang tidak diberi ASI eksklusif % ibu yang tidak melakukan kunjungan bayi % ibu hamil risti % berat badan lahir rendah % rumah tidak sehat Rasio jumlah penduduk miskin Variabel signifikan Posterior probabilities (%) EV SD 100 100 59.5 18.5 21.6 10.9 196.4 -37750 -308.3 -69.43 -0.4028 0.02529 61.4285 5570.03 331.19 233.26 1.15 0.13 100 2.233 0.62 42.2 100 67.1 9 -1.283 35.87 -0.4245 -0.01334 1.98 6.99 0.39 0.2 Lima Model Terbaik BMA Variabel Model 1 Model 2 Model 3 Model 4 Model 5 Intercept 187.1 236.9 145.4 164.4 219.2 X1 -36480.0 -38030.0 -34160.0 -39480.0 -41010.0 X2 -540.5 -517.6 -541.0 * * X3 233.26 * * * * X4 1.15 * * * * X5 0.1348 * * * * X6 2.328 2.022 2.44 2.262 1.935 X7 * -2.751 * * -2.966 X8 33.28 37.3 36.42 33.06 37.4 X9 -0.5971 -0.6902 * -0.5977 -0.6981 X10 * * * * * R2 0.823 0.839 0.792 0.792 0.811 Post prob. 0.127 0.099 0.062 0.060 0.046 Berdasarkan probabilitas posterior diatas maka model Bayesian Model Averaging Kesalahan Prediksi BMA CI Pengamatan Y bawah Y Keterangan Y atas Y1 25.82255 139.1822 120 Masuk Y2 140.5658 253.9255 311 Tidak masuk Y3 21.64318 135.0028 213 Tidak masuk Y4 137.8012 251.1608 123 Tidak masuk Y5 75.9335 189.2932 118 Masuk Y6 26.32289 139.6826 76 Masuk Y7 66.00323 179.3629 93 Masuk Y8 -78.8976 34.46202 49 Tidak masuk Kesalahan prediksi 50% Regresi Linier Berganda Model regresi berganda 𝑦 = 257 − 38412𝑋1 − 405𝑋2 − 289𝑋3 − 0.78𝑋4 + 0.218𝑋5 + 2𝑋6 − 3.24𝑋7 + 39.3𝑋8 − 0.663𝑋9 + 0.091𝑋10 Uji Serentak H 0: i 0 H1 : Minimal ada satu i 0 dengan i=1,2,…,10 Ftabel=2,38 Sumber SS F P Value Regresi 111387 10.60 0.000 Eror 19966 Total 131353 Uji Individu H0: i 0 H1 : i 0 signifikan dengan i=1,2,…,10 Variabel Prediktor Koefisien Konstan 257.29 Rasio jumlah sarana -38412 kesehatan Rasio jumlah tenaga -404.6 kesehatan Rasio jumlah posyandu -288.7 % kelahiran ditolong -0.778 non medis % bayi tidak diberi ASI 0.2179 eksklusif % ibu tidak melakukan 1.9960 kunjungan bayi % ibu hamil risti -3.240 % berat badan lahir 39.317 rendah % rumah tidak sehat -0.6634 Rasio jumlah penduduk 0.0913 miskin R2 84.8 % SE 81.69 5931 Pvalue 0.005 0.000 337.5 0.245 464.3 1.889 0.541 0.685 0.3600 0.552 0.6507 0.006 2.177 7.523 0.153 0.000 0.4252 0.6685 0.135 0.893 Uji Asumsi Uji Normalitas H0: Residual berdistribusi normal H1 : Residual tidak berdistribusi normal KS= 0.130 < Dtabel=0.242 P value > 0.15 Terima H0 Uji Linieritas H0: Model linier H1 : Model tidak linier Titik-titik pengamatan memiliki korelasi yang rendah namun masih cenderung mengikuti garis sehingga model linier Uji Multikolineritas Variabel Prediktor VIF Rasio jumlah sarana kesehatan 1.9 Konstan Rasio jumlah tenaga kesehatan Rasio jumlah posyandu 1.7 1.6 % kelahiran ditolong non medis 2.4 % bayi yang tidak diberi ASI eksklusif % ibu yang tidak melakukan kunjungan bayi 1.4 % ibu hamil risti % berat badan lahir rendah (BBLR) % rumah tidak sehat Rasio jumlah penduduk miskin 1.6 1.8 1.9 2.4 2.1 Nilai VIF semua variabel < 10 sehingga tidak ada multikolinearitas Uji Autokorelasi H0 : 0 H1 : 0 nilai Durbin-Watson sebesar 2.46460 dengan nilai D tabel yaitu Dl sebesar 0.712 dan Du sebesar 2.363. Nilai Du < D < (4-Dl) yang berarti tidak terdapat autokorelasi. Uji Heteroskedastisitas Sumber Regresi Error Total SS 1812.8 2218.4 4031.2 F 1.55 P Value 0.196 P Value > 0.05 sehingga tidak terjadi gejala heteroskedastisitas Kesalahan Prediksi CI Pengamatan Y bawah Y atas Y Keterangan Y1 25.33672 132.8122 120 Masuk Y2 135.3236 242.799 311 Tidak masuk Y3 5.418861 112.8943 213 Tidak masuk Y4 133.4973 240.9727 123 Tidak masuk Y5 80.85981 188.3353 118 Masuk Y6 11.29726 118.7727 76 Masuk Y7 73.85866 181.3341 93 Masuk Y8 -89.7974 17.67804 49 Tidak masuk Kesalahan prediksi 50% Perbandingan Bayesian Model Averaging dan Regresi Linier Nilai Signifikasi Parameter dan Standar Error dengan BMA dan Regresi BMA Variabel Regresi Probabilitas posterior (%) SE Pvalue SE Rasio jumlah sarana kesehatan 100* 5570.03 0.000* 5931 Rasio jumlah tenaga kesehatan 59.5* 331.19 0.245 337.5 Rasio jumlah posyandu 18.5 233.26 0.541 464.3 % kelahiran ditolong non medis % bayi yang tidak diberi ASI eksklusif 21.6 1.15 0.685 1.889 10.9 0.13 0.552 0.3600 % ibu yang tidak melakukan kunjungan bayi 100* 0.62 0.006* 0.6507 % ibu hamil risti 42.2 1.98 0.153 2.177 % BBLR 100* 6.99 0.000* 7.523 % rumah tidak sehat 67.1* 0.39 0.135 0.4252 9 0.2 0.893 0.6685 Rasio jumlah penduduk miskin Catatan: * menunjukkan variabel yang signifikan Standart error BMA lebih kecil daripada regresi Kesalahan Prediksi BMA Regresi Kesalahan prediksi 50% 50% Memberikan hasil yang sama yaitu dengan kesalahan prediksi sebesar 50% Kesimpulan Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur menggunakan BMA adalah rasio jumlah sarana kesehatan, prosentase ibu yang tidak melakukan kunjungan bayi, prosentase berat badan lahir rendah (BBLR), rasio jumlah tenaga kesehatan, dan prosentase rumah tidak sehat Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur menggunakan Regresi berganda adalah rasio jumlah sarana kesehatan, prosentase ibu yang tidak melakukan kunjungan bayi, dan prosentase berat badan lahir rendah (BBLR) Standart error dari setiap parameter BMA lebih kecil daripada regresi pada semua variabel prediktornya. Hal ini menunjukkan bahwa BMA memberikan estimasi parameter β yang lebih efisien daripada regresi. Namun jika dilihat dari kesalahan prediksinya, BMA dan regresi memberikan hasil yang sama yaitu masing-masing sebesar 50%. Saran • • Menambah variabel prediktor mengenai sosial ekonomi agar bisa memberikan hasil yang lebih jelas mengenai faktor-faktor yang mempengaruhi jumlah kematian bayi. Menambah data testing agar bisa mengetahui lebih jelas perbedaan hasil prediksi antara metode BMA dan regresi. Data testing yang sedikit bisa menyebabkan peluang yang besar untuk memberikan hasil yang sama dalam menghitung kesalahan prediksi. DAFTAR PUSTAKA Ardiyanti, S.T. 2010. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Badan Pusat Statistik.(2009). Survei Sosial Ekonomi Nasional Propinsi Jawa Timur. Surabaya. Brown,P.J., Vannucci, M., Fearn,T.(2002). Bayesian Model Averaging With Selection Of Regressors. J. R. Statist. Soc. B Part 3, pp. 519–536. Dinas Kesehatan.(2009). Profil Kesehatan Propinsi Jawa Timur. Surabaya. Draper N and Smith H, (1992). Analisis Regresi Terapan Edisi 2: Penerbit PT Gramedia Pustaka Utama, Jakarta. Hoeting, J, Madigan, D, Raftery, A.E, and Volinsky, C.T. (1999). Bayesian Model Averaging: A Tutorial. Statistical Science 14:382–401. Liang, F. M, Troung, Y, and Wong, W. H. (2001). Automatic Bayesian Model Averaging for Linear Regression and Applications in Bayesian Curve Fitting. Statistical Science, 11(4):1005-1029. Madigan, D, Raftery, A. E.(1994). Model Selection and Accounting for Model Uncertainty in Graphical Models Using Occam’s Window. Journal of the American Statistical Association,Vol.89, No.428,1535-1546. Montgomery, J. and Nyhan, B.(2010). Bayesian Model Averaging: Theoretical developments and Practical Applications. Society for Political Methodology working paper. Raftery, A. E, Madigan, D, and Hoeting, J. (1997). Bayesian Model Averaging for Linear Regression Models. Journal of the American Statistical Association. 92. Rani, D.S. 2011. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression Semiparametric di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Volinsky, C. T. (1997). Bayesian Model Averaging for Censored Survival Models. Ph.D. Dissertation, Univ. Washington, Seattle. Viallefont, V, Raftery, A.E, Richardson, S. (2001). Variable Selection and Bayesian Model Averaging in Case-Control Studies. Statistical in Medicine.