1 PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang Pemodelan regresi logistik dengan basis daerah memerlukan pendekatan untuk mengakomodir keragaman spasial yang ada. Pratama (2008) menggunakan pembobotan dari hasil variogram untuk memodelkan keragaman spasial dan Thaib (2008) menggunakan matriks contiguity untuk menggambarkan hubungan antar desa dengan prinsip kebertetanggaan (neighbourhood). Pratama (2008) dan Thaib (2008) melakukan pemodelan regresi logistik spasial terhadap status kemiskinan desa. Kedua penelitian tersebut menyimpulkan bahwa pendugaan kemiskinan suatu desa dengan menggunakan regresi logistik spasial akan menghasilkan pendugaan yang lebih baik dibandingkan dengan regresi logistik klasik. Penggunaan matriks jarak untuk menunjukkan kedekatan antar desa yang dilakukan oleh Pratama (2008) lebih luas digunakan jika dibandingkan dengan prinsip kebertetanggaan yang digunakan oleh Thaib (2008). Pratama (2008) menggunakan pembobot spasial pada jarak desa yang berradius 27.5 km. Namun model yang dihasilkan hanya memiliki ketepatan prediksi sekitar 60%. Ketepatan pendugaan dalam analisis regresi logistik spasial dipengaruhi oleh pemilihan titik potong yang digunakan untuk membedakan dugaan peubah respons yang dihasilkan. Faktor yang ditenggarai mampu memperbaiki model Pratama (2008) adalah mendefinisikan ulang jarak desa dan pemilihan titik potong klasifikasi. Oleh karena itu, dalam penelitian ini dilakukan simulasi berbagai kemungkinan jarak dan penggunaan berbagai titik potong untuk memperbaiki pendugaan status kemiskinan desa. Variogram Variogram merupakan fungsi dalam menggambarkan kekontinuan spasial yang umum digunakan dalam ilmu Geostatistik. (Isaaks dan Srivastava, 1989). Variogram menggambarkan keragaman antar daerah berdasarkan jaraknya. Variogram memiliki beberapa model, diantaranya Tujuan Penelitian ini bertujuan untuk: 1. Mengidentifikasi pengaruh kedekatan radius jarak sebagai pembobot spasial dalam pendugaan status kemiskinan di beberapa desa di Jawa Barat. 2. Menduga radius jarak dan titik potong optimum yang mampu menghasilkan ketepatan prediksi tertinggi dalam pendugaan status kemiskinan di beberapa desa di Jawa Barat. 1. Model Spherical γ(h)= 0, h=0 3 h 1 h c0 +cs c0 +cs , h≥a 2 a 2 a 3 2. Model Exponential 0, 3 γ(h)= c0 +cs 1- exp h 3. Model Gaussian γ(h)=c0 +cs 1- exp - 3h2 a2 , , 0<h≤a h=0 , h≠0 h≠0 4. Model Power 0, h=0 γ(h)= dengan 0<λ<2 λ c0 +ph , h ≠0 dimana a merupakan range, h merupakan jarak antar pengamatan, p merupakan kemiringan kurva, co merupakan intersep, dan + c merupakan sill. Sill merupakan titik tertinggi yang dicapai oleh variogram range merupakan jarak sedangkan pengamatan saat mencapai sill. Regresi Logistik Spasial Regresi logistik spasial merupakan regresi logistik yang memasukkan pengaruh spasial ke dalam model logistik untuk mengatasi adanya hubungan spasial. Augustin et al. (1996) dalam Fernandez (2003) menggunakan model dalam bentuk π(x) g(x)=log +βΨ 1-π(x) dengan ∑k w y Ψ= j=1 ij i ki ∑j=1 wij dimana merupakan bentuk autokovarian dan merupakan rataan terboboti dari jumlah kejadian diantara ki tetangganya. Pembobot dari lokasi ke-j adalah wij = 1/hij dimana hij merupakan jarak euklid antara i dan j dan yi merupakan dugaan ada atau tidaknya suatu kejadian. Model lain yang bisa dibentuk untuk mengatasi adanya hubungan spasial adalah: 2 y=Xβ+Zyβ+ε Z merupakan sebuah matriks bobot spasial. Dalam pencariannya, matriks pembobot spasial ini memerlukan informasi variogram yang merupakan ukuran keragaman spasial. Matriks pembobot spasial (Z) yang telah diperoleh dikalikan dengan vektor y yang selanjutnya akan dianggap sebuah peubah penjelas baru (w) dan akan digunakan dalam analisis regresi logistik. Secara umum proses pendugaan pengujian hipotesis, penarikan kesimpulan, serta interpretasi mengikuti kaidah dalam regresi logistik klasik. C statistic Ukuran kebaikan model dalam regresi logistik dapat dilihat dari nilai c statistic. C statistic merupakan area di bawah kurva Receiver Operating Characteristic (ROC). Apabila beberapa model dipaskan dengan data yang sama maka model yang dipilih sebagai model terbaik diasosiasikan dengan c statistic yang tertinggi. (Lee dan Ingersol, 2002) c = (nc + 0.5(t – nc – nd))/t Dimana: c = c statistic nc = jumlah pasangan konkordan t = total pasangan dengan respon yang berbeda nd = jumlah pasangan diskordan t-nc-nd = jumlah pasangan tie Titik Potong Dugaan yang dihasilkan dalam regresi logistik berbentuk nilai peluang. Pengkategorian dugaan memerlukan titik potong. Jika dugaan peluang melebihi titik potong maka dugaan dikategorikan terjadi. Jika dugaan peluang kurang dari atau sama dengan titik potong maka dikategorikan tidak terjadi. (Hosmer dan Lemeshow, 2000) Correct Classification Rate (CCR) Ketepatan pendugaan yang dihasilkan dalam analisis regresi logistik dapat dilihat dari nilai Correct Classification Rate (CCR). CCR merupakan persentase kebenaran (kesesuaian) nilai pengamatan dengan dugaannya. CCR= banyaknya dugaan yang benar x100% banyaknya pengamatan Semakin besar presentase CCR yang dihasilkan maka tingkat akurasi yang dihasilkan semakin tinggi. (Hosmer dan Lemeshow, 2000) Metode Permukaan Respons Metode Permukaan Respons merupakan kumpulan dari teknik matematika dan statistika yang berguna untuk memodelkan dan menganalisis suatu permasalahan dimana peubah respons dipengaruhi oleh beberapa peubah penjelas dan bertujuan untuk mengoptimalkan peubah responsnya. Model yang sering digunakan dalam Metode Permukaan Respons adalah 1. Jika peubah repons baik dimodelkan dengan fungsi linier dari peubah penjelas, fungsi pendekatannya adalah model orde pertama( first-order model) y= β0 +β1 x1 +…+βk xk +ε 2. Jika ada lengkungan dalam sistem, maka polinomial atau derajat lebih tinggi harus digunakan, seperti model orde kedua (second-order model) y = β0 + ∑ki=1 βi xi + ∑ki=1 βi xi2 + ∑ ∑i<j βij xi xj + Pendugaan parameter yang dilakukan Metode Respons Permukaan menggunakan Metode Kuadrat Terkecil. (Montgomery, 2001) BAHAN DAN METODE Bahan Data yang digunakan dalam penelitian ini menggunakan data yang sama seperti Pratama (2008) yaitu menggunakan data Potensi Desa (PODES) tahun 2006. Wilayah yang digunakan hanya beberapa kabupaten dan kota di Jawa Barat (Tabel 1). Status kemiskinan desa ditentukan dari persentase keluarga miskin di masing-masing desa terhadap persentase kemiskinan desa keseluruhan. Persentase keluarga miskin suatu desa diperoleh dari perbandingan antara jumlah keluarga miskin di desa itu dengan jumlah keluarga miskin secara keseluruhan. Pratama (2008) mendapatkan hasil bahwa persentase keluarga miskin di beberapa kota dan kabupaten Jawa Barat adalah 36%. Jika persentase keluarga miskin suatu desa kurang dari atau sama dengan 36% maka status kemiskinan desa itu dikategorikan tidak miskin. Jika suatu desa memiliki persentase kemiskinan lebih dari 36% maka status kemiskinan desa itu dikategorikan miskin.