proposal tugas akhir analisis faktor-faktor yang

advertisement
Oleh
Veni Freista H. (1308100054)
Dosen Pembimbing
Dr.rer.pol. Heri Kuswanto
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA
2011
Pendahuluan
Tinjauan Pustaka
Metodologi Penelitian
Analisis dan Pembahasan
Kesimpulan dan Saran
LATAR BELAKANG
Angka Kematian Bayi
(AKB) sebagai
Indikator Kesehatan
Beberapa penelitian
telah dilakukan
menggunakan
regresi
Milenium
Development
Goals (MDGs)
Ardiyanti (2010)
Rani (2011)
Basilia (2003)
Model tunggal
Bayesian Model
Averaging (BMA)
untuk Model yang
tidak pasti
Faktor pemeriksaan
kehamilan, pelayanan
kesehatan, tersedianya
posyandu, pendidikan ibu,
dan penolong persalinan.
AKB Jawa Timur
menurun namun
tergolong tinggi
Persentase persalinan
dengan bantuan non
medis
Faktor utama: jumlah sarana
kesehatan, jumlah tenaga medis,
dan %persalinan dengan bantuan
non medis
Faktor lain :rata-rata jumlah
pengeluaran RT,rata-rata pemberian
ASI eksklusif, % rumah tangga yang
memiliki air bersih, dan
%penduduk miskin
LATAR BELAKANG
Raftery, dkk
(1998)
Penelitian sebelumnya
tentang aplikasi BMA
Prinsip dasar BMA adalah
memprediksi model
terbaik berdasarkan ratarata terboboti dari seluruh
model terbaiknya
Volinsky (1997), Hoeting, dkk
(1999), Liang, dkk (2001),
Madigan (1994),
Mubwandarikwa, dkk (2005),
Montgomery dan Nyhan
(2010), Viallefont, dkk (2001)
Hasil dari estimasi mencakup
semua sehingga bisa
mendapatkan hasil estimasi
yang lebih baik (Madigan dan
Raftery 1994)
BMA memberikan
keakuratan hasil prediksi
yang lebih tinggi
daripada regresi linier
Bayesian Model
Averaging (BMA)
BMA belum pernah
digunakan untuk
memodelkan kasus di
Indonesia
RUMUSAN MASALAH
1
2
3
Bagaimana hasil prediksi
Bayesian Model Averaging
terhadap faktor-faktor yang
mempengaruhi angka kematian
bayi di Jawa Timur?
Bagaimana hasil prediksi Regresi linier
berganda terhadap faktor-faktor yang
mempengaruhi angka kematian bayi di
Jawa Timur?
Bgaimana perbandingan hasil prediksi
antara BMA dan Regresi?
TUJUAN PENELITIAN
memprediksi faktor
yang bepengaruh secara
signifikan terhadap
angka kematian bayi di
Jawa Timur dengan
metode bayesian model
averaging (BMA) dan
regresi linier serta
mengetahui
perbandingan hasil
prediksinya
MANFAAT PENELITIAN
1
• memprediksi faktor-faktor yang
berpengaruh secara signifikan
terhadap angka kematian bayi yang
tergolong tinggi di Jawa Timur
dengan harapan bisa memberikan
hasil yang lebih akurat daripada
regresi linier
2
• referensi mengenai metode statistik
baru dalam pemilihan model.
BATASAN MASALAH
Data yang digunakan dikhususkan pada data
cross section dan tidak melibatkan efek
spasial (lokasi daerah)
BAYESIAN MODEL AVERAGING (BMA)
Pemilihan model tunggal cenderung mengabaikan
ketidakpastian model sehingga bisa menyebabkan hasil
estimasi yang kurang tepat. Bayesian model averaging
(BMA) adalah salah satu metode untuk menyelesaikan
ketidakpastian
model
dengan
merata-ratakan
probabilitas posterior dari semua model yang mungkin.
Model BMA dibentuk dari persamaan regresi berikut
Misalkan terdapat p variabel prediktor, maka jumlah model yang terbentuk
sebanyak q = 2p model. Jika
adalah model yang mungkin
terbentuk dan
adalah nilai yang akan diprediksi maka probabilitas
posterior jika diketahui Y adalah rata-rata dari distribusi posterior jika
diketahui model diboboti oleh probabilitas model posterior
Persamaan BMA
prior
dimana
dan
likelihood
prior
Pemilihan Model BMA
Penentuan model diterima atau tidak dengan metode occam’s window
dengan nilai c adalah 20. Nilai c tersebut setara dengan alfa 0.05 untuk p value
(Jeffreys, 1961). Model dikeluarkan dari persamaan BMA jika probabilitas
model posterior lebih besar dari nilai c.
Kriteria signifikasi parameter:
Pr[β1≠0|D] < 50% maka X1 tidak signifikan
Jika diantara 50%-75% maka ada bukti yang lemah untuk menyatakan X1
sebagai faktor penyebab,
jika diantara 75%-95% maka ada bukti yang cukup kuat, antara 95%-99%
menunjukkan bahwa terdapat bukti yang kuat,
jika lebih dari 99% maka bukti yang ada sangat kuat
REGRESI LINIER BERGANDA
Model regresi berganda adalah sebagai berikut
dengan
Ŷ = nilai penduga bagi variabel Y
b0, b1, . . ., bk = dugaan bagi parameter konstanta β0, β1,
. . ., βk
e = error
Pengujian Parameter Model Regresi
1. Uji Serentak
H 0 : β1 = β 2 = β 3 = β p = 0
H1: minimal ada satu βi ≠ 0, i=1,2,…p
Statistik uji
Jika FHitung > Fα(v1,v2) maka H0 ditolak
2. Uji Individu
H 0 : βi = 0
H1: βi ≠ 0
Statistik uji
H0 ditolak apabila thitung > ttabel yaitu t(α/2,n-p-1)
Uji Asumsi Regresi
 Uji Normalitas  Kolmogorov Smirnov
H0
H1
: Residual berdistribusi normal
: Residual tidak berdistribusi normal
Statistik uji
H0 diterima apabila nilai D lebih kecil dari Dtabel
 Uji Linieritas  dengan metode grafik
 Pengujian Multikolinearitas  diindikasikan dengan nilai VIF.
 Pengujian Heterokedastisitas  uji Gletser
Dilakukan untuk mengetahui ada tidaknya hubungan antara residual
(error) dengan variabel bebasnya.
 Pengujian Autokorelasi (hub.linier antar error)
H0 :   0
H1 :   0
Statistik uji
n
d 
 e
t 2
t
 et 1 
n
e
t 1
2
2
t
1. Jika d < dl, berarti terdapat autokorelasi positif
2. Jika d > (4 – dl), berarti terdapat autokorelasi
negatif
3. Jika du < d < (4 – dl), berarti tidak terdapat
autokorelasi
4. Jika dl < d < du atau (4 – du), berarti tidak dapat
disimpulkan
Kesalahan Prediksi
digunakan untuk mengetahui tingkat keakuratan dari
hasil yang diperoleh. Kesalahan prediksi bisa diketahui
melalui selang kepercayaan untuk dugaan nilai y.
Angka Kematian Bayi (AKB)
Kematian bayi adalah kematian yang terjadi saat bayi lahir
sampai sebelum mencapai usia satu tahun.
Dari sisi
penyebabnya
Kematian endogen: terjadi pada bulan pertama
setelah bayi dilahirkan, umumnya disebabkan oleh
faktor bawaan
Kematian Eksogen: terjadi antara usia satu bulan
sampai satu tahun, umumnya disebabkan oleh
faktor yang berkaitan dengan pengaruh lingkungan
Dinas
Kesehatan
Sosio
ekonomi
tempat tinggal, pendidikan ibu
dan indeks kesejahteraan ibu.
Biologis
jenis kelamin anak, usia ibu,
paritas dan interval kelahiran.
Faktor lain
berat waktu lahir, pemeriksaan antenatal
dan penolong persalinan juga
dipertimbangkan berpengaruh terhadap
angka kematian bayi yang tinggi tersebut,
yang untuk tahap lanjutan perlu dilakukan
studi lebih dalam.
METODOLOGI PENELITIAN
Data
Sekunder
Dinas Kesehatan
Jawa Timur
TAHUN 2009
METODOLOGI PENELITIAN
Variabel penelitian
1. Jumlah kematian bayi per 1000
kelahiran hidup (Y)
2.Prosentase sarana kesehatan (RS dan
puskesmas) (X1)
3. Prosentase tenaga kesehatan (X2)
Tenaga kesehatan meliputi medis,
perawat, bidan, farmasi, kesehatan
masyarakat, gizi, keterapian fisik, dan
teknisi medis.
4. Prosentase posyandu (X3)
5. Prosentase kelahiran ditolong non
medis (X4)
6. Prosentase bayi yang tidak diberi ASI
eksklusif (X5)
ASI eksklusif adalah pemberian ASI
saja tanpa makanan dan minuman lain
sampai bayi berusia 6 bulan.
7. Prosentase ibu yang tidak melakukan
kunjungan bayi (X6)
kunjungan anak usia kurang dari satu
tahun (29 hari-11 bulan) untuk
mendapatkan pelayanan
8. Prosentase ibu hamil risti (X7)
Ibu hamil risti adalah ibu hamil dengan
keadaan penyimpangan dari normal yang
secara langsung menyebabkan kesakitan
dan kematian bagi ibu maupun bayinya.
9. Prosentase berat badan lahir rendah
(kurang dari 2500 gram) (X8)
10. Prosentase rumah tidak sehat (X9)
bangunan rumah tinggal yang memenuhi
syarat kesehatan yaitu memilik jamban
sehat, tempat pembuangan sampahu,
sarana air bersih, sarana pembuangan air
limbah, ventilasi baik, kepadatan hunian
rumah sesuai dan lantai rumah tidak dari
tanah.
11.Prosentase penduduk miskin (X10)
Langkah Penelitian
Statistika Deskriptif
Membagi data menjadi data training sebanyak 30
data dan data testing sebanyak 8 data
Meregresikan data
training Y dan X
Estimasi parameter data training
Uji asumsi
Membuat model prediksi BMA
Memilih model terbaik
Menghitung kesalahan prediksi
dengan data testing
Menghitung kesalahan
prediksi dengan data testing
Membandingkan hasil
BMA dan regresi linier
Kesimpulan
ANALISIS DAN PEMBAHASAN
Deskripsi Angka Kematian Bayi di Jawa
Timur
39.6
36.65
35.32
32.93
32.2
31.41
31.28
23
2004
2005
2006
2007
2008
2009
AKB JawaTimur per 1000 kelahiran hidup
2010
target
MDGs
0
Pacitan
Ponorogo
Trenggalek
Tulungagung
Blitar
Kediri
Malang
Lumajang
Jember
Banyuwangi
Bondowoso
Situbondo
Probolinggo
Pasuruan
Sidoarjo
Mojokerto
Jombang
Nganjuk
Madiun
Magetan
Ngawi
Bojonegoro
Tuban
Lamongan
Gresik
Bangkalan
Sampang
Pamekasan
Sumenep
Kediri (Kota)
Blitar (Kota)
Malang (Kota)
Probolinggo (Kota)
Pasuruan (Kota)
Mojokerto (Kota)
Madiun (Kota)
Surabaya (Kota)
Batu (Kota)
jumlah kematian bayi
Jumlah kematian bayi tiap kabupaten/kota
350
300
250
200
150
100
50
Faktor-Faktor yang Mempengaruhi Kematian Bayi
Bayesian Model Averaging
Hipotesis yang digunakan adalah sebagai berikut.
H0:  i  0
H1 : i  0 dengan i=1,2,…,10
Variabel Prediktor
Konstan
Rasio jumlah sarana kesehatan
Rasio jumlah tenaga kesehatan
Rasio jumlah posyandu
% kelahiran ditolong non medis
% bayi yang tidak diberi ASI eksklusif
% ibu yang tidak melakukan kunjungan
bayi
% ibu hamil risti
% berat badan lahir rendah
% rumah tidak sehat
Rasio jumlah penduduk miskin
Variabel signifikan
Posterior
probabilities (%)
EV
SD
100
100
59.5
18.5
21.6
10.9
196.4
-37750
-308.3
-69.43
-0.4028
0.02529
61.4285
5570.03
331.19
233.26
1.15
0.13
100
2.233
0.62
42.2
100
67.1
9
-1.283
35.87
-0.4245
-0.01334
1.98
6.99
0.39
0.2
Lima Model Terbaik BMA
Variabel
Model 1
Model 2
Model 3
Model 4
Model 5
Intercept
187.1
236.9
145.4
164.4
219.2
X1
-36480.0
-38030.0
-34160.0
-39480.0
-41010.0
X2
-540.5
-517.6
-541.0
*
*
X3
233.26
*
*
*
*
X4
1.15
*
*
*
*
X5
0.1348
*
*
*
*
X6
2.328
2.022
2.44
2.262
1.935
X7
*
-2.751
*
*
-2.966
X8
33.28
37.3
36.42
33.06
37.4
X9
-0.5971
-0.6902
*
-0.5977
-0.6981
X10
*
*
*
*
*
R2
0.823
0.839
0.792
0.792
0.811
Post prob.
0.127
0.099
0.062
0.060
0.046
Berdasarkan probabilitas posterior diatas maka model Bayesian
Model Averaging
Kesalahan Prediksi BMA
CI
Pengamatan
Y bawah
Y
Keterangan
Y atas
Y1
25.82255
139.1822
120
Masuk
Y2
140.5658
253.9255
311
Tidak masuk
Y3
21.64318
135.0028
213
Tidak masuk
Y4
137.8012
251.1608
123
Tidak masuk
Y5
75.9335
189.2932
118
Masuk
Y6
26.32289
139.6826
76
Masuk
Y7
66.00323
179.3629
93
Masuk
Y8
-78.8976
34.46202
49
Tidak masuk
Kesalahan prediksi
50%
Regresi Linier Berganda
Model regresi berganda
𝑦 = 257 − 38412𝑋1 − 405𝑋2 − 289𝑋3 − 0.78𝑋4 + 0.218𝑋5 + 2𝑋6 − 3.24𝑋7 + 39.3𝑋8 − 0.663𝑋9 + 0.091𝑋10
Uji Serentak
H 0:  i  0
H1 : Minimal ada satu i  0 dengan i=1,2,…,10
Ftabel=2,38
Sumber
SS
F
P Value
Regresi
111387
10.60
0.000
Eror
19966
Total
131353
Uji Individu
H0: i  0
H1 : i  0
signifikan
dengan i=1,2,…,10
Variabel Prediktor
Koefisien
Konstan
257.29
Rasio jumlah sarana
-38412
kesehatan
Rasio jumlah tenaga
-404.6
kesehatan
Rasio jumlah posyandu
-288.7
% kelahiran ditolong
-0.778
non medis
% bayi tidak diberi ASI
0.2179
eksklusif
% ibu tidak melakukan
1.9960
kunjungan bayi
% ibu hamil risti
-3.240
% berat badan lahir
39.317
rendah
% rumah tidak sehat
-0.6634
Rasio jumlah penduduk
0.0913
miskin
R2
84.8 %
SE
81.69
5931
Pvalue
0.005
0.000
337.5
0.245
464.3
1.889
0.541
0.685
0.3600
0.552
0.6507
0.006
2.177
7.523
0.153
0.000
0.4252
0.6685
0.135
0.893
Uji Asumsi
Uji Normalitas
H0: Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
KS= 0.130 < Dtabel=0.242
P value > 0.15
Terima H0
Uji Linieritas
H0: Model linier
H1 : Model tidak linier
Titik-titik pengamatan
memiliki korelasi yang
rendah namun masih
cenderung mengikuti
garis sehingga model
linier
Uji Multikolineritas
Variabel Prediktor
VIF
Rasio jumlah sarana kesehatan
1.9
Konstan
Rasio jumlah tenaga kesehatan
Rasio jumlah posyandu
1.7
1.6
% kelahiran ditolong non medis
2.4
% bayi yang tidak diberi ASI eksklusif
% ibu yang tidak melakukan kunjungan
bayi
1.4
% ibu hamil risti
% berat badan lahir rendah (BBLR)
% rumah tidak sehat
Rasio jumlah penduduk miskin
1.6
1.8
1.9
2.4
2.1
Nilai VIF semua variabel < 10 sehingga
tidak ada multikolinearitas
Uji Autokorelasi
H0 :   0
H1 :   0
nilai Durbin-Watson sebesar 2.46460 dengan nilai D tabel yaitu Dl sebesar
0.712 dan Du sebesar 2.363. Nilai Du < D < (4-Dl) yang berarti tidak
terdapat autokorelasi.
Uji Heteroskedastisitas
Sumber
Regresi
Error
Total
SS
1812.8
2218.4
4031.2
F
1.55
P Value
0.196
P Value > 0.05 sehingga tidak
terjadi gejala heteroskedastisitas
Kesalahan Prediksi
CI
Pengamatan
Y bawah
Y atas
Y
Keterangan
Y1
25.33672
132.8122
120
Masuk
Y2
135.3236
242.799
311
Tidak masuk
Y3
5.418861
112.8943
213
Tidak masuk
Y4
133.4973
240.9727
123
Tidak masuk
Y5
80.85981
188.3353
118
Masuk
Y6
11.29726
118.7727
76
Masuk
Y7
73.85866
181.3341
93
Masuk
Y8
-89.7974
17.67804
49
Tidak masuk
Kesalahan prediksi
50%
Perbandingan Bayesian Model Averaging dan Regresi Linier
Nilai Signifikasi Parameter dan Standar Error dengan BMA dan Regresi
BMA
Variabel
Regresi
Probabilitas
posterior (%)
SE
Pvalue
SE
Rasio jumlah sarana kesehatan
100*
5570.03
0.000*
5931
Rasio jumlah tenaga kesehatan
59.5*
331.19
0.245
337.5
Rasio jumlah posyandu
18.5
233.26
0.541
464.3
% kelahiran ditolong non medis
% bayi yang tidak diberi ASI
eksklusif
21.6
1.15
0.685
1.889
10.9
0.13
0.552
0.3600
% ibu yang tidak melakukan
kunjungan bayi
100*
0.62
0.006*
0.6507
% ibu hamil risti
42.2
1.98
0.153
2.177
% BBLR
100*
6.99
0.000*
7.523
% rumah tidak sehat
67.1*
0.39
0.135
0.4252
9
0.2
0.893
0.6685
Rasio jumlah penduduk miskin
Catatan: * menunjukkan variabel yang signifikan
Standart error
BMA lebih
kecil daripada
regresi
Kesalahan Prediksi
BMA
Regresi
Kesalahan
prediksi
50%
50%
Memberikan hasil yang sama yaitu
dengan kesalahan prediksi sebesar 50%
Kesimpulan
Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur menggunakan
BMA adalah rasio jumlah sarana kesehatan, prosentase ibu yang tidak melakukan
kunjungan bayi, prosentase berat badan lahir rendah (BBLR), rasio jumlah tenaga
kesehatan, dan prosentase rumah tidak sehat
Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur
menggunakan Regresi berganda adalah rasio jumlah sarana kesehatan, prosentase
ibu yang tidak melakukan kunjungan bayi, dan prosentase berat badan lahir rendah
(BBLR)
Standart error dari setiap parameter BMA lebih kecil daripada regresi pada semua
variabel prediktornya. Hal ini menunjukkan bahwa BMA memberikan estimasi
parameter β yang lebih efisien daripada regresi. Namun jika dilihat dari kesalahan
prediksinya, BMA dan regresi memberikan hasil yang sama yaitu masing-masing
sebesar 50%.
Saran
•
•
Menambah variabel prediktor mengenai sosial ekonomi
agar bisa memberikan hasil yang lebih jelas mengenai
faktor-faktor yang mempengaruhi jumlah kematian
bayi.
Menambah data testing agar bisa mengetahui lebih jelas
perbedaan hasil prediksi antara metode BMA dan
regresi. Data testing yang sedikit bisa menyebabkan
peluang yang besar untuk memberikan hasil yang sama
dalam menghitung kesalahan prediksi.
DAFTAR PUSTAKA













Ardiyanti, S.T. 2010. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression
di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember.
Badan Pusat Statistik.(2009). Survei Sosial Ekonomi Nasional Propinsi Jawa Timur. Surabaya.
Brown,P.J., Vannucci, M., Fearn,T.(2002). Bayesian Model Averaging With Selection Of Regressors. J. R. Statist. Soc. B
Part 3, pp. 519–536.
Dinas Kesehatan.(2009). Profil Kesehatan Propinsi Jawa Timur. Surabaya.
Draper N and Smith H, (1992). Analisis Regresi Terapan Edisi 2: Penerbit PT Gramedia Pustaka Utama, Jakarta.
Hoeting, J, Madigan, D, Raftery, A.E, and Volinsky, C.T. (1999). Bayesian Model Averaging: A Tutorial. Statistical
Science 14:382–401.
Liang, F. M, Troung, Y, and Wong, W. H. (2001). Automatic Bayesian Model Averaging for Linear Regression and
Applications in Bayesian Curve Fitting. Statistical Science, 11(4):1005-1029.
Madigan, D, Raftery, A. E.(1994). Model Selection and Accounting for Model Uncertainty in Graphical Models Using
Occam’s Window. Journal of the American Statistical Association,Vol.89, No.428,1535-1546.
Montgomery, J. and Nyhan, B.(2010). Bayesian Model Averaging: Theoretical developments and Practical Applications.
Society for Political Methodology working paper.
Raftery, A. E, Madigan, D, and Hoeting, J. (1997). Bayesian Model Averaging for Linear Regression Models. Journal of
the American Statistical Association. 92.
Rani, D.S. 2011. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression
Semiparametric di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember.
Volinsky, C. T. (1997). Bayesian Model Averaging for Censored Survival Models. Ph.D. Dissertation, Univ. Washington,
Seattle.
Viallefont, V, Raftery, A.E, Richardson, S. (2001). Variable Selection and Bayesian Model Averaging in Case-Control
Studies. Statistical in Medicine.
Download