PEMODELAN REGRESI MULTILEVEL DENGAN

advertisement
PEMODELAN REGRESI MULTILEVEL DENGAN KORELASI ERROR
SPASIAL
(Studi Kasus: Data Kejadian Demam Berdarah di Jawa Timur)
Tiara Rizki Arina Putri
Jurusan Matematika, F.MIPA, Universitas Brawijaya
Email: [email protected]
Abstrak. Regresi Multilevel digunakan untuk menggambarkan hubungan peubah respon dengan peubah prediktor yang
memiliki struktur hirarkhi. Teknik regresi multilevel kemudian berkembang dengan mempertimbangkan efek spasial pada
data. Model Regresi Multilevel dan Model Regresi Multilevel dengan Korelasi Error Spasial diterapkan pada data Kejadian
Demam Berdarah di Kabupaten dan Kota di Jawa Timur tahun 2011-2012, Sarana Kesehatan, Tenaga Kesehatan,
Kemiskinan, Rumah Tangga Berperilaku Hidup Sehat, Curah Hujan, Suhu, dan Ketinggian Tempat. Model terbaik adalah
model regresi multilevel dengan korelasi error spasial. Selisih banyaknya penderita Demam Berdarah antara daerah Dataran
Tinggi dan Dataran rendah adalah 356 orang. Kenaikan 100 satuan curah hujan di Kabupaten dan Kota di Dataran rendah,
akan menaikkan rata-rata 465 orang penderita penderita demam berdarah setiap tahunnya dengan syarat peubah prediktor lain
di level 1 dan level 2 tetap.
Kata Kunci: Regresi Multilevel, Spasial, SEM, Demam Berdarah, Jawa Timur
1. PENDAHULUAN
Penyakit Demam Berdarah Dengue (DBD) merupakan penyakit menular yang disebabkan oleh
virus dengue dan ditularkan melalui gigitan nyamuk sebagai vektor pembawanya. DBD sering muncul
sebagai kejadian luar biasa (KLB) dengan angka kematian relatif tinggi. Pola berjangkitnya infeksi
virus Dengue dipengaruhi oleh iklim. Pada suhu yang panas (28-32°C) nyamuk Aedes akan tetap
bertahan hidup untuk jangka waktu lama. Hasil penelitian Erdkhadifa (2012) menyatakan bahwa
terdapat pengaruh antara ketinggian tempat dan curah hujan terhadap kematian demam berdarah di
Jawa Timur. Oleh karena itu, peneliti ingin menerapkan analisis regresi multilevel spasial pada data
kejadian demam berdarah di Jawa Timur dengan mempertimbangkan perbedaan kondisi lingkungan
pada Kabupaten dan Kota di Jawa Timur.
Analisis Regresi Multilevel adalah analisis regresi yang mempertimbangkan hirarkhi pada data.
Hirarkhi pada data berupa level atau tingkatan tertentu dan terdapat kemiripan sifat antar kelompok
yang diteliti. Dalam model analisis regresi multilevel, peubah respon individu diukur pada level
terendah (level 1) dan terdapat satu atau lebih peubah prediktor. Pada dasarnya, pada model regresi
multilevel spasial adalah sama seperti model regresi multilevel, namun yang membedakan adalah
koefisien regresi multilevel spasial diboboti spasial.
2. TINJAUAN PUSTAKA
2.1 Model Regresi Multilevel
Model regresi multilevel yang paling sederhana adalah model regresi dengan dua level. Level 1
terdiri atas j-grup dan dan nj individu dalam setiap grup dengan 1 peubah prediktor. Pada umumnya,
model regresi mencakup lebih dari satu peubah prediktor pada level terendah demikian pula pada level
yang lebih tinggi. Model regresi multilevel untuk level 1 pada setiap unit level 2 (Hox dan Maas,
2005):
dimana i = 1,2,...,nj, j = 1,2,...,s, Yij = respon individu ke-i pada kelompok ke-j,
= intersep
kelompok ke-j,
= koefisien regresi kelompok ke-j. nj = banyaknya individu dalam kelompok ke-j,
s= banyaknya kelompok. Koefisien regresi
memiliki indeks j untuk setiap kelompok, yang
mengindikasikan bahwa koefisien regresi bervariasi antar grup. Keragaman koefisien regresi
dimodelkan oleh peubah prediktor dan sisaan acak pada level kelompok sebagai berikut:
Dengan mensubstitusikan kedua persamaan di atas akan dihasilkan model regresi dua level :
321
2.2 Pendugaan Parameter model regresi multilevel
Pada metode regresi klasik, diasumsikan bahwa terdapat hanya model satu level dengan hanya
satu koefisien residual dan residual tidak berkorelasi antarindividu. Presedur dalam mengestimasi
koefisien model tersebut tidak dapat diaplikasikan kepada model multilevel dan perlu untuk
menentukan cara alternatif. salah satu cara adalah menggunakan Iterative General Least Square
(IGLS). Metode IGLS menggunakan estimasi maximum likelihood. Goldstein (1989) mengusulkan
menggunakan metode kuadrat terkecil umum (Generalized Least Square) untuk menduga parameter
tetap pada. penduga parameter Generalized Least Square adalah sebagai berikut:
̂
̂
,
2.3 Model Regresi Multilevel dengan korelasi error spasial
Peubah prediktor dalam penelitian ini mungkin berkorelasi spasial antarunit penelitian.
Meskipun model umum multilevel yang digunakan adalah model intersep random. Model intersep
random dengan autokorelasi spasial adalah sebagai berikut
∑
,
2.4 Indeks Moran I
Indeks Moran I adalah suatu metode yang paling sering digunakan untuk mengetahui efek
autokorelasi spasial. Rumus perhitungan indeks Moran I adalah (Yasin dan Saputra, 2013):
∑
∑
̅ (
̅)
∑ ∑
∑
̅
di mana: N adalah banyaknya observasi ̅ adalah rata-rata peubah yang diamati; Xi adalah nilai peubah
yang diamati pada lokasi ke-i; Xj adalah nilai peubah yang diamati pada lokasi ke-j; wij adalah
pembobot spasial.
2.5 Koefisien Determinasi
Perhitungan koefisien determinasi model regresi multilevel adalah sebagai berikut:
̂
̂
̂
̂
di mana ̂ = penduga ragam galat pada level 1 dengan p peubah prediktor, ̂ = penduga ragam
galat pada level 1 tanpa peubah prediktor,
= penduga ragam galat pada level 2 dengan p peubah
̂
prediktor dan
= penduga ragam galat pada level 2 tanpa peubah prediktor.
2.6 Koefisien Korelasi Intraklas (ICC)
Nilai ICC menunjukkan korelasi atau hubungan dari masing-masing unit pada level 2. Cara
menghitung nilai ICC adalah sebagai berikut:
dan nilai ICC untuk model regresi multilevel spasial
dimana
∑
adalah matriks pembobot spasial.
3. HASIL DAN PEMBAHASAN
3.1 Uji Signifikansi parameter model regresi multilevel
Untuk mengetahui peubah-peubah yang mempengaruhi banyaknya kejadian Demam Berdarah
di Jawa Timur, perlu dilakukan uji signifikansi penduga parameter.
322
Tabel 1. Hasil Pengujian Parameter Model Regresi Multilevel
Koefisien
SE
t-hit
Nilai-p
Intersep
327.842
41.331
7.932
<0.001
Curah Hujan
2.034
0.154
6.714
<0.001
Suhu
7.139
35.817
0.199
0.84
Ketinggian
-0.335
0.329
-1.017
0.317
Jenis Dataran
339.139
280.233
1.120
0.235
Sarana
-4.175
1.670
-2.500
0.021
Tenaga
-0.203
0.062
-3.261
0.003
PBHS
-5.803
1.785
-3.251
0.003
Penduduk
35.724
17.383
2.055
0.048
Miskin
Dari Tabel 1 dapat dilihat bahwa pada α=0.05, peubah yang berpengaruh nyata terhadap peubah
banyaknya penderita demam berdarah di Jawa Timur pada level 2 adalah Curah Hujan, peubah
ketinggian tempat tidak berpengaruh nyata pada α=0.05. Pada level 1, peubah yang berpengaruh nyata
terhadap banyaknya penderita Demam berdarah adalah peubah Sarana Kesehatan, tenaga kesehatan,
persentase Rumah Tangga berperilaku hidup bersih dan sehat, persentase penduduk miskin.
3.2 Indeks Moran I
Hasil perhitungan nilai koefisien Indeks Moran I diperoleh sebesar 0.7994, didapatkan statistik
uji Z sebesar 5.9808 dengan nilai-p 0.001 sehingga dapat disimpulkan terdapat autokorelasi spasial
(keeratan hubungan) antar daerah penelitian.
3.3 Uji Signifikansi Parameter Model Regresi Multilevel dengan Korelasi Error Spasial
Tabel 2. Pengujian Parameter Model Regresi Multilevel Spasial
Koefisien SE
t-hit
Nilai-p
Intersep
325.720
46.692
6.976
<0.001
Curah Hujan
0.094
0.039
2.428
0.021
Suhu
12.131
23.102
0.525
0.603
Ketinggian
-0.344
0.432
-0.796
0.432
Jenis Dataran
356.140
313.826
1.135
0.265
Sarana
-3.212
1.460
-2.200
0.035
Tenaga
-0.204
0.054
-3.766
<0.001
PBHS
-5.803
1.608
-3.609
<0.001
Penduduk
37.011
17.599
-2.103
0.037
Miskin
ρ
(koefisien
0.177
error spasial)
Dari Tabel 2 dapat dilihat bahwa pada α=0.05, peubah yang berpengaruh nyata terhadap peubah
banyaknya penderita demam berdarah di Jawa Timur pada level 2 adalah Curah Hujan. Pada level 1,
peubah yang berpengaruh nyata terhadap banyaknya penderita Demam berdarah adalah peubah Sarana
Kesehatan, tenaga kesehatan, persentase Rumah Tangga berperilaku hidup bersih dan sehat, dan
persentase penduduk miskin.
3.4 Koefisien Korelasi Interklas (ICC)
dan ICC model spasial
.
Nilai ICC sebesar 0.632 berarti bahwa korelasi Kabupaten dan Kota pada kondisi lingkungan yang
sama sebesar 0.632. Kabupaten atau kota yang memiliki kondisi lingkungan yang hampir sama (samasama di Dataran Rendah atau sama-sama di dataran tinggi) memiliki koefisien korelasi yang cukup
erat. Dari nilai ini, mengindikasikan bahwa terdapat korelasi spasial antarlokasi pengamatan. Nilai
ICC sebesar 0.0569 bahwa korelasi Kabupaten dan Kota pada kondisi lingkungan yang sama adalah
sebesar 0.0569. Nilai ini sangat kecil, hampir dikatakan tidak terdapat korelasi antarlokasi
pengamatan. Nilai ICC model regresi multilevel spasial sangat kecil bukan mengindikasikan tidak
323
terdapat korelasi spasial, tetapi mungkin korelasi spasial antarlokasi pengamatan sudah dirangkum
pada koefisien error spasial, sehingga nilai ICC semakin kecil.
2.3 Koefisien Determinasi
Berdasarkan perhitungan statistik uji Deviance, diperoleh statistik uji sebesar 3.976 dengan
nilai-p 0.04 sehingga dapat disimpulkan menggunakan model regresi multilevel spasial sebagai model
yang lebih sesuai untuk menggambarkan banyaknya penderita demam berdarah di Kabupaten dan
Kota di Jawa Timur. Model Regresi Multilevel Spasial yang terbentuk adalah
∑
4. KESIMPULAN
Pada analisis regresi multilevel dilakukan perhitungan nilai indeks Moran I sebesar 0.7994 dan
nilai ini signifikan yang artinya terdapat keeratan hubungan antar daerah penelitian dengan daerah lain
yang berdekatan. Berdasarkan uji parsial pada model regresi multilevel spasial, dapat diketahui bahwa
peubah-peubah yang berpengaruh terhadap banyaknya penderita demam berdarah di Jawa Timur
adalah peubah curah hujan pada level 2, sedangkan pada level 1 adalah peubah sarana kesehatan,
tenaga kesehatan, persentase rumah tangga berperilaku hidup bersih dan sehat, dan persentase
penduduk miskin.
DAFTAR PUSTAKA
Corrado, L., dan Fingleton, B., (2013), Multilevel Modelling With Spatial Effects, Discussion Papers
In Economics, 11 (5).
Erdkhadifa, R., (2012), Perbandingan Geographically Weighted Poisson Regression dan
Geographically Weighted Poisson Regression Semiparametric, Skripsi, Surabaya, Institut
Teknologi Sepuluh November.
Goldstein, H., (2003), Multilevel Statistical Models, Arnold Publishers, London.
Hox, J.J., dan Maas, C.J.M., (2005), Multilevel Analysis, Encyclopedia of Social Measurement,
2(2005).
Yasin, H., dan Saputra, R., (2013), Pemetaan Penyakit Demam Berdarah Dengue Dengan Analisis
Pola Spasial di Kabupaten Pekalongan, Media Statistika, 6(1), hal.27-36
324
Download