pemodelan geographically weighted regression

advertisement
PEMODELAN GEOGRAPHICALLY WEIGHTED REGRESSION DENGAN
PEMBOBOT FIXED BISQUARE KERNEL PADA DATA SPASIAL
(STUDI KASUS BALITA GIZI BURUK DI PROVINSI JAWA TIMUR TAHUN 2008)
Yoeniarti Shara, Henny Pramoedyo, Maria Bernadetha Mitakda
Jurusan Matematika, F.MIPA, Universitas Brawijaya
Email: [email protected]
Abstrak. Geographically Weighted Regression (GWR) adalah metode regresi linier yang diberi bobot lokasi.
Data spasial memiliki referensi ruang kebumian (koordinat geografis). Salah satu metode pendugaan parameter
model GWR menggunakan metode pendugaan berbobot berupa titik koordinat lokasi yaitu Weighted Least Square
(WLS). Penelitian ini bertujuan untuk memodelkan dan menguji parameter pada data Kejadian Balita Gizi Buruk
Provinsi Jawa Timur tahun 2008 dengan pembobot Fixed Bisquare Kernel. WLS menghasilkan penduga parameter
yang berbeda di setiap lokasi yang menyebabkan perbedaan model antar lokasi. Kejadian Balita Gizi Buruk
disebabkan oleh pengabaian pemeriksaan neonatus (bayi berusia 0 -28hari), pelayanan imunisasi dan banyaknya
rumah tangga miskin di Provinsi Jawa Timur tahun 2008.
Kata kunci : Spasial, GWR, Fixed Bisquare,WLS, Kejadian Ba lita Gizi Buruk
1. PENDAHULUAN
Data spasial memiliki referensi ruang kebumian (koordinat geografis). Metode regresi linier
tidak cocok untuk memodelkan data spasial karena metode ini mengabaikan pengaruh lokasi. Salah
satu metode untuk memodelkan data spasial adalah Geographically Weighted Regression (GWR).
Model GWR dikembangkan dari model regresi global berdasarkan regresi non parametrik (Mei,
2005). Pendugaan parameter model GWR menggunakan Least Square yang diberi pembobot berupa
titik koordinat lokasi. Jenis pembobot yang digunakan fungsi Fixed Bisquare Kernel. Salah satu kasus
yang dipengaruhi oleh faktor lokasi adalah kejadian balita gizi buruk di Provinsi Jawa Timur. Angka
kejadian balita gizi buruk di Jawa Timur tahun 2008 sudah mendekati target pemerintah tetapi
berdasarkan SUSENAS dan RISKESDAS tahun 2008 balita gizi buruk masih banyak di Kabupaten/
Kota. Hal ini menunjukkan bahwa terdapat keragaman spasial di setiap lokasi sehingga model GWR
dapat diterapkan dalam kasus ini. Beberapa faktor penyebab balita gizi buruk adalah bayi mendapat
vitamin A, ibu hamil mendapat tablet Fe, pemeriksaan neonatus, pemeriksaan kehamilan, akses air
bersih, pelayanan penyuluhan, pelayanan imunisasi dan rumah tangga miskin.
Penelitian ini bertujuan untuk memodelkan data kejadian balita gizi buruk di Provinsi Jawa
Timur tahun 2008 dengan pembobot Fixed Bisquare Kernel dan menguji parameter model GWR.
2. TINJAUAN PUSTAKA
Fotheringham (2002) mendefinisikan Geographically Weighted Regression (GWR) sebagai
metode regresi yang menghasilkan penduga parameter untuk memprediksi respon setiap lokasi, yaitu:
(
)
∑
(
)
)
di mana (
) adalah koefisien regresi peubah prediktor ke-j untuk setiap lokasi (
), (
adalah longitude dan latitude untuk lokasi ke-i dan adalah peubah acak pengamatan ke-i. Terdapat
dua asumsi yang melandasi metode GWR yaitu kenormalan sisaan dan multikolinieritas lokal.
Asumsi kenormalan sisaan menggunakan uji Kolmogorov-Smirnov dengan berlandaskan
hipotesis:
sisaan menyebar normal lawan
sisaan tidak menyebar normal
Jika
benar maka statistik uji:
| ( )
( )|
di mana ( ) adalah fungsi kumulatif sebaran normal sisaan, ( ) adalah fungsi kumulatif teoritis
sisaan dan ( ) adalah fungsi peluang kumulatif pengamatan dari ukuran penarikan contoh acak (i/n).
H0 ditolak jika | |
(
) dan dapat dikatakan bahwa sisaan tidak menyebar normal.
Asumsi multikolinieritas lokal menggunakan kriteria
(
(
)
mana multikolinieritas lokal terdeteksi jika nilai
sebagai berikut (Fotheringham, Brundson dan Charlthon, 2002):
(
di mana
(
)
(
)(Varians Inflation Factor) di
. Nilai
(
) dinyatakan
)
) adalah koefisien determinasi antara Xj dengan prediktor lain pada lokasi ke-i.
Pengujian keheterogenan spasial dilakukan dengan uji Breusch-Pagan (BP) dengan kriteria
keputusan adalah tolak H0 jika BP > (
) sehingga dapat disimpulkan terdapat heterogenitas
spasial. Jika H0 benar maka statistik uji:
( )
(
)
( )[
(
dengan elemen vektor f adalah
]
(
)
), galat least square untuk observasi ke-i ( ), vektor galat
], matriks pembobot wij (W), dan matriks
(e),
merupakan ragam galat , T adalah [
berdimensi n x (p + 1) berisi vektor yang telah terstandardisasi untuk setiap lokasi (Z).
Pendugaan parameter model GWR menggunakan metode Least Square yang diberi pembobot
(Weighted Least Square) berupa titik koordinat lokasi. Pendugaan parameter dilakukan dengan cara
matriks yaitu:
̂(
[
)
) ]
(
(
)
di mana
adalah matriks prediktor berdimensi n x (p+1), adalah matriks respon berdimensi n x 1,
̂(
) adalah vektor penduga parameter GWR peubah prediktor ke-j untuk setiap lokasi ke-i.
Pembobot berfungsi untuk memberikan hasil pendugaan parameter yang berbeda pada setiap lokasi.
Matriks pembobot lokasi ke-i diperoleh dari jenis fungsi pembobot. Fixed Bisquare Kernel digunakan
karena titik-titik pada data tersebar secara beraturan. Pembobot Fixed Bisquare Kernel adalah (Leung,
Mei dan Zhang, 2000):
{(
dengan
(
) )
adalah jarak Euclidean antar lokasi (
)
)
√(
(
)
dan bandwidth (h) adalah lingkaran radius bandwidth dari titik pusat lokasi. Salah satu metode untuk
menentukan bandwidth optimum adalah cross validation (CV), secara matematis dapat ditulis
(Fotheringham, Brundson dan Charlthon, 2002):
( )
∑(
̂ ( ))
) dihilangkan dari
di mana ̂ ( ) adalah penduga (fitting value) di mana pengamatan lokasi (
proses pendugaan. Pengujian signifikansi parameter model GWR pada setiap lokasi dilakukan dengan
menguji parameter secara simultan dan parsial. Pengujian parameter secara simultan menggunakan
kriteria tolak H0 jika statistik uji >
. Jika H0 benar maka statistik uji:
(
)
(
(
di mana
(
)
(
) (
) ,
) ⁄[
]
)
⁄
(
(
)
(
)
) ,
(
)
,
((
) (
182
)) dan
(
)
(
[
[
(
(
) ]
) ]
(
(
)
) ) . Pengujian parameter secara parsial dilakukan
[
(
) ]
(
)
dengan kriteria tolak H0 jika statitik uji | |
).
( ⁄
̂(
̂√
Jika H0 benar maka statistik uji:
)
(
)
Pengujian kesesuaian model dilakukan dengan menghitung koefisien determinasi (R2) model GWR
dengan persamaan matematis sebagai berikut:
(
)
∑
(
̂)
∑
(
̅)
Koefisien determinasi dapat menggambarkan besarnya keragaman peubah respon yang dapat
dijelaskan oleh peubah prediktor pada setiap lokasi.
3. METODOLOGI PENELITIAN
3.1 Sumber Data
Penelitian ini menggunakan data sekunder yang diperoleh dari RISKESDAS dan SUSENAS
tahun 2008 yang bersumber dari Puslitbang Sistem dan Kebijakan Kesehatan, Badan Litbang
Departemen Kesehatan Republik Indonesia.
3.2 Metode Analisis
Tahapan analisis pada penelitian ini adalah: (1) Pengujian asumsi model GWR; (2) Pengujian
pengaruh spasial; (3) Menghitung jarak Euclidean antar titik lokasi; (4) Menentukan bandwidth
optimum; (5) Menghitung matriks pembobot dengan memasukkan jarak Euclidean dan bandwidth
optimum; (6) Pendugaan parameter dengan menggunakan WLS; (7) Pengujian parameter model GWR
secara simultan dan parsial; (8) Pengujian kesesuaian model GWR menggunakan koefisien
determinasi.
4. HASIL DAN PEMBAHASAN
Terdapat dua asumsi yang harus dipenuhi yaitu kenormalan sisaan dan multikolinieritas.
Pengujian asumsi kenormalan menggunakan metode Kolmogorov-Smirnov (KS). Nilai KS-Z (0.637) <
(1.281) sehingga belum cukup bukti untuk menolak H0, berarti asumsi kenormalan sisaan
terpenuhi. Kriteria pengujian multikolinieritas menggunakan VIF di mana nilai VIF >10 menyatakan
keberadaan multikolinieritas.
Tabel 1. Nilai VIF Setiap Peubah Prediktor
Peubah Prediktor
X1
Bayi mendapat vitamin A
X2
Ibu hamil mendapat tablet Fe
X3
Pemeriksaan neonatus
X4
Pemeriksaan kehamilan
X5
Akses air bersih
X6
Pelayanan penyuluhan
X7
Pelayanan imunisasi
X8
Rumah tangga miskin
VIF
1.777
1.359
1.564
1.427
1.701
1.606
1.142
2.641
Asumsi multikolinieritas tidak terpenuhi karena VIF semua peubah prediktor bernilai kurang
dari 10 (VIF < 10). Dapat disimpulkan tidak terdapat ketergantungan antar prediktor.
Pengujian pengaruh spasial (keheterogenan spasial) menggunakan statistik uji Breusch-Pagan
(BP). Tolak H0 karena 95.309 (BP) > 14.68 ( (
) ), dapat disimpulkan bahwa terdapat
keheterogenan spasial atau keragaman antar lokasi setiap peubah pada data kejadian balita gizi buruk.
183
Berdasarkan hasil pengujian data kejadian balita gizi buruk memenuhi asumsi kenormalan sisaan dan
tidak terdapat ketergantungan antar peubah serta terdapat keheterogenan spasial sehingga metode
GWR tepat digunakan untuk memodelkan data tersebut.
Penentuan bandwidth (h) optimum dengan kriteria Cross Validation (CV) diperoleh h senilai
1.959 dengan nilai CV minimum 5.479. Nilai h dan jarak antar lokasi akan digunakan dalam
pembentukan matriks pembobot. Berikut ini adalah matriks pembobot untuk Kota Malang:
(
[
)
(
[
)
(
(
)
)]
]
Pengujian parameter secara simultan dilakukan dengan uji F. H0 ditolak karena nilai statistik uji
F (2.351537) > titik kritis (1.94) sehingga dapat disimpulkan bahwa pemberian pembobot berpengaruh
terhadap pendugaan parameter pada data kejadian balita gizi buruk Jawa Timur tahun 2008. Pengujian
parameter dilakukan secara parsial berlandaskan hipotesis:
(
)
(
)
Tabel 3. Pengujian Parameter Secara Parsial
Parameter Penduga
Salah Baku p-value
β0
6.67397
6.2479
0.2942
β1
-0.01
0.0447
0.8243
β2
-0.018
0.0515
0.7252
β3
-0.0603
0.0328
0.0766*
β4
0.0073
0.0124
0.5617
β5
-0.0241
0.032
0.4579
β6
-0.0491
0.0312
0.1270
β7
0.0582
0.0248
0.0262*
β8
0.1625
0.0534
0.0049*
*nyata pada α = 10%
Berdasarkan Tabel 3 diperoleh model GWR di Kota Malang adalah:
̂
Dari model GWR dapat dikatakan persentase balita gizi buruk menurun 0.0603% jika persentase
pemeriksaan neonatus meningkat 1% dengan syarat peubah lain konstan. Kasus balita gizi buruk naik
0.0582% jika persentase peningkatan pelayanan imunisasi naik 1% dan persentase kasus balita gizi
buruk meningkat 0.1625% jika persentase rumah tangga miskin meningkat 1% dengan syarat peubah
lain konstan. Nilai koefisien determinasi (R2) pada model GWR sebesar 79.8%, berarti besar pengaruh
peubah prediktor terhadap keragaman persentase kasus balita gizi buruk sebesar 79.8% dan 20.2%
adalah besar pengaruh faktor lain yang tidak dijelaskan pada model GWR.
5. KESIMPULAN
Model GWR yang diduga dengan Weighted Least Square menghasilkan parameter yang
berbeda di setiap lokasi sehingga setiap lokasi mempunyai model yang berbeda. Faktor-faktor yang
mempengaruhi kejadian balita gizi buruk di Provinsi Jawa Timur tahun 2008 adalah pemeriksaan
neonatus (%), pelayanan imunisasi (%) dan rumah tangga miskin (%).
DAFTAR PUSTAKA
Drapper, N.R. and Smith, H., (1992), Analisis Regresi Terapan (Terjemahan B. Sumantri), Edisi
Kedua, PT Gramedia Pustaka Utama, Jakarta.
Fotheringham, A.S., Brundson, C. and Charlthon, M., (2002), Geographically Weighted Regression:
The Ananlysis of Spatially Varying Relationships, UK.
Leung, Y., Mei, C.L., and Zhang, W.X., (2000), Statistic Tests for Spatial Non-Stationarity Based on
the Geographically Weighted Regression Model, Environment and Planning A, 32, hal. 9-32.
Mei, C.I., (2005), Geographically Weighted Regression Technique for Spatial Data Analysis, School
of Science Xi’an Jiaotong University.
184
Download