Pembobot Jarak dan Titik Potong Optimum dalam

advertisement
1
PENDAHULUAN
TINJAUAN PUSTAKA
Latar Belakang
Pemodelan regresi logistik dengan basis
daerah memerlukan pendekatan untuk
mengakomodir keragaman spasial yang ada.
Pratama (2008) menggunakan pembobotan
dari hasil variogram untuk memodelkan
keragaman spasial dan Thaib (2008)
menggunakan matriks contiguity untuk
menggambarkan hubungan antar desa dengan
prinsip kebertetanggaan (neighbourhood).
Pratama (2008) dan Thaib (2008) melakukan
pemodelan regresi logistik spasial terhadap
status kemiskinan desa. Kedua penelitian
tersebut menyimpulkan bahwa pendugaan
kemiskinan suatu desa dengan menggunakan
regresi logistik spasial akan menghasilkan
pendugaan yang lebih baik dibandingkan
dengan regresi logistik klasik.
Penggunaan
matriks
jarak
untuk
menunjukkan kedekatan antar desa yang
dilakukan oleh Pratama (2008) lebih luas
digunakan jika dibandingkan dengan prinsip
kebertetanggaan yang digunakan oleh Thaib
(2008). Pratama (2008) menggunakan
pembobot spasial pada jarak desa yang berradius 27.5 km. Namun model yang
dihasilkan hanya memiliki ketepatan prediksi
sekitar 60%.
Ketepatan pendugaan dalam analisis
regresi logistik spasial dipengaruhi oleh
pemilihan titik potong yang digunakan untuk
membedakan dugaan peubah respons yang
dihasilkan. Faktor yang ditenggarai mampu
memperbaiki model Pratama (2008) adalah
mendefinisikan ulang jarak desa dan
pemilihan titik potong klasifikasi. Oleh
karena itu, dalam penelitian ini dilakukan
simulasi berbagai kemungkinan jarak dan
penggunaan berbagai titik potong untuk
memperbaiki pendugaan status kemiskinan
desa.
Variogram
Variogram merupakan fungsi dalam
menggambarkan kekontinuan spasial yang
umum digunakan dalam ilmu Geostatistik.
(Isaaks dan Srivastava, 1989). Variogram
menggambarkan keragaman antar daerah
berdasarkan jaraknya. Variogram memiliki
beberapa model, diantaranya
Tujuan
Penelitian ini bertujuan untuk:
1. Mengidentifikasi pengaruh kedekatan
radius jarak sebagai pembobot spasial
dalam pendugaan status kemiskinan di
beberapa desa di Jawa Barat.
2. Menduga radius jarak dan titik potong
optimum yang mampu menghasilkan
ketepatan prediksi tertinggi dalam
pendugaan status kemiskinan di beberapa
desa di Jawa Barat.
1. Model Spherical
γ(h)=
0,
h=0 3 h 1 h
c0 +cs
c0 +cs , h≥a 2 a 2 a
3
2. Model Exponential
0,
3
γ(h)=
c0 +cs 1- exp h
3. Model Gaussian
γ(h)=c0 +cs 1- exp -
3h2
a2
,
, 0<h≤a
h=0
, h≠0
h≠0
4. Model Power
0,
h=0
γ(h)=
dengan 0<λ<2
λ
c0 +ph , h ≠0
dimana a merupakan range, h merupakan
jarak antar pengamatan, p merupakan
kemiringan kurva, co merupakan intersep, dan
+ c merupakan sill. Sill merupakan titik
tertinggi yang dicapai oleh variogram
range
merupakan
jarak
sedangkan
pengamatan saat mencapai sill.
Regresi Logistik Spasial
Regresi logistik spasial merupakan regresi
logistik yang memasukkan pengaruh spasial
ke dalam model logistik untuk mengatasi
adanya hubungan spasial. Augustin et al.
(1996)
dalam
Fernandez
(2003)
menggunakan model dalam bentuk
π(x)
g(x)=log
+βΨ
1-π(x)
dengan
∑k w y
Ψ= j=1 ij i ki
∑j=1 wij
dimana
merupakan bentuk autokovarian
dan merupakan rataan terboboti dari jumlah
kejadian diantara ki tetangganya. Pembobot
dari lokasi ke-j adalah wij = 1/hij dimana hij
merupakan jarak euklid antara i dan j dan yi
merupakan dugaan ada atau tidaknya suatu
kejadian.
Model lain yang bisa dibentuk untuk
mengatasi adanya hubungan spasial adalah:
2
y=Xβ+Zyβ+ε
Z merupakan sebuah matriks bobot spasial.
Dalam pencariannya, matriks pembobot
spasial ini memerlukan informasi variogram
yang merupakan ukuran keragaman spasial.
Matriks pembobot spasial (Z) yang telah
diperoleh dikalikan dengan vektor y yang
selanjutnya akan dianggap sebuah peubah
penjelas baru (w) dan akan digunakan dalam
analisis regresi logistik. Secara umum proses
pendugaan pengujian hipotesis, penarikan
kesimpulan, serta interpretasi mengikuti
kaidah dalam regresi logistik klasik.
C statistic
Ukuran kebaikan model dalam regresi
logistik dapat dilihat dari nilai c statistic. C
statistic merupakan area di bawah kurva
Receiver Operating Characteristic (ROC).
Apabila beberapa model dipaskan dengan
data yang sama maka model yang dipilih
sebagai model terbaik diasosiasikan dengan c
statistic yang tertinggi. (Lee dan Ingersol,
2002)
c = (nc + 0.5(t – nc – nd))/t
Dimana:
c
= c statistic
nc
= jumlah pasangan konkordan
t
= total pasangan dengan respon yang
berbeda
nd
= jumlah pasangan diskordan
t-nc-nd = jumlah pasangan tie
Titik Potong
Dugaan yang dihasilkan dalam regresi
logistik
berbentuk
nilai
peluang.
Pengkategorian dugaan memerlukan titik
potong. Jika dugaan peluang melebihi titik
potong maka dugaan dikategorikan terjadi.
Jika dugaan peluang kurang dari atau sama
dengan titik potong maka dikategorikan tidak
terjadi. (Hosmer dan Lemeshow, 2000)
Correct Classification Rate (CCR)
Ketepatan pendugaan yang dihasilkan
dalam analisis regresi logistik dapat dilihat
dari nilai Correct Classification Rate (CCR).
CCR merupakan persentase kebenaran
(kesesuaian) nilai pengamatan dengan
dugaannya.
CCR=
banyaknya dugaan yang benar
x100%
banyaknya pengamatan
Semakin besar presentase CCR yang
dihasilkan maka tingkat akurasi yang
dihasilkan semakin tinggi. (Hosmer dan
Lemeshow, 2000)
Metode Permukaan Respons
Metode Permukaan Respons merupakan
kumpulan dari teknik matematika dan
statistika yang berguna untuk memodelkan
dan menganalisis suatu permasalahan dimana
peubah respons dipengaruhi oleh beberapa
peubah penjelas dan bertujuan untuk
mengoptimalkan peubah responsnya. Model
yang sering digunakan dalam Metode
Permukaan Respons adalah
1. Jika peubah repons baik dimodelkan
dengan fungsi linier dari peubah penjelas,
fungsi pendekatannya adalah model orde
pertama( first-order model)
y= β0 +β1 x1 +…+βk xk +ε
2. Jika ada lengkungan dalam sistem, maka
polinomial atau derajat lebih tinggi harus
digunakan, seperti model orde kedua
(second-order model)
y = β0 + ∑ki=1 βi xi + ∑ki=1 βi xi2 +
∑ ∑i<j βij xi xj +
Pendugaan parameter yang dilakukan Metode
Respons Permukaan menggunakan Metode
Kuadrat Terkecil. (Montgomery, 2001)
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini
menggunakan data yang sama seperti
Pratama (2008) yaitu menggunakan data
Potensi Desa (PODES) tahun 2006. Wilayah
yang digunakan hanya beberapa kabupaten
dan kota di Jawa Barat (Tabel 1).
Status kemiskinan desa ditentukan dari
persentase keluarga miskin di masing-masing
desa terhadap persentase kemiskinan desa
keseluruhan. Persentase keluarga miskin
suatu desa diperoleh dari perbandingan antara
jumlah keluarga miskin di desa itu dengan
jumlah keluarga miskin secara keseluruhan.
Pratama (2008) mendapatkan hasil bahwa
persentase keluarga miskin di beberapa kota
dan kabupaten Jawa Barat adalah 36%. Jika
persentase keluarga miskin suatu desa kurang
dari atau sama dengan 36% maka status
kemiskinan desa itu dikategorikan tidak
miskin. Jika suatu desa memiliki persentase
kemiskinan lebih dari 36% maka status
kemiskinan desa itu dikategorikan miskin.
Download