Penerapan Penduga Huber M Dalam General

advertisement
PENDAHULUAN
TINJAUAN PUSTAKA
Latar Belakang
Otonomi daerah di Indonesia membuat
pemerintah daerah memiliki wewenang lebih
dalam mengatur dan memajukan daerahnya.
Wewenang dan upaya dalam meningkatkan
kemajuan daerah memerlukan informasi yang
akurat mengenai daerah itu sendiri. Salah satu
sumber informasi yang dapat digunakan
adalah Survei Sosial Ekonomi Nasional
(SUSENAS). Statistik yang dihasilkan
SUSENAS sebagai salah satu sumber
informasi daerah pada skala desa/ kelurahan
memiliki presisi rendah. Hal ini disebabkan
karena pendugaan dilakukan dengan objek
survei berukuran kecil. Metode khusus yang
dikembangkan untuk meningkatkan presisi
pendugaan pada area kecil disebut Pendugaan
Area Kecil (Small Area Estimation, SAE).
Salah satu metode pendugaan yang ada
dalam SAE adalah General Regression
(GREG). Metode GREG termasuk dalam
design based estimator. Karakteristik metode
ini adalah menggunakan metode kuadrat
terkecil dalam menduga koefisien regresinya.
Metode klasik ini sangat tergantung pada
asumsi yang seringkali tidak dipenuhi dalam
praktiknya dimana data sering diasumsikan
menyebar normal. Ketika terdapat pencilan
dalam data, metode kuadrat terkecil seringkali
memiliki performa yang rendah. Berdasarkan
penelitian Wulandari (2008), perlu pengkajian
lebih lanjut tentang GREG dengan regresi
kekar (Robust Regression) sebagai dugaan
koefisien regresinya. Regresi kekar diperlukan
untuk memberikan metode alternatif yang
sama baiknya dengan metode kuadrat terkecil,
tetapi tidak terlalu dipengaruhi oleh pencilan
atau hal lain dalam asumsi model.
Regresi kekar mempunyai banyak metode
yang telah dikembangkan. Penduga kekar
yang dikaji dalam skripsi ini adalah penduga
Huber M (Huber M Estimator). Penduga M
(M-Estimator) merupakan penduga yang
meminimumkan fungsi objektif dalam data.
Metode ini banyak digunakan dalam
praktiknya dibandingkan metode lainnya.
Small Area Estimation (SAE)
Suatu area disebut kecil apabila contoh
yang diambil dari area tersebut tidak
mencukupi untuk melakukan pendugaan
langsung dengan hasil dugaan yang akurat
(Rao 2003). Metode SAE mengatasi masalah
tersebut dengan memberikan pendugaan yang
sesuai dari suatu peubah yang dikaji pada area
tertentu yang contohnya tidak cukup bagus
untuk memberikan pendugaan langsung
dengan presisi yang memuaskan (Best et al.
2007).
Tujuan
1. Membandingkan antara GREG penduga
Huber M dan GREG metode kuadrat
terkecil pada data yang mengandung
pencilan.
2. Menerapkan metode GREG pada SAE
dengan metode Huber M sebagai penduga
koefisien regresinya.
y i = X iT β + ε i ................................(2)
Direct Estimator
Penduga langsung (direct estimator)
merupakan penduga berbasis rancangan
(design based estimator) dan hanya dapat
digunakan jika semua area dalam suatu
populasi digunakan sebagai contoh. Bentuk
dari penduganya adalah sebagai berikut :
Yˆi DIRECT =
1
∑ wijk
j , k∈s i
dengan bobot
∑w
j , k∈s i
ijk
yijk ......(1)
wijk merupakan kebalikan
(inverse) dari peluang pengambilan contoh
yaitu
wijk =
1
∑ p(s)
dan
notasi
i
{ j , k∈si }
merupakan indeks untuk setiap area kecil.
Notasi j merupakan indeks untuk setiap blok
sensus dan notasi k merupakan indeks untuk
setiap rumah tangga. Salah satu penduga
berbasis
rancangan
adalah
General
Regression estimator (Rao 2003).
GREG merupakan metode pendugaan
parameter yang memungkinkan untuk
menggunakan beberapa informasi tambahan
dan dirancang untuk meningkatkan presisi dan
akurasi dengan menggunakan informasi
tambahan xi yang berkorelasi dengan yi.
Metode ini dapat digunakan untuk menduga
total populasi, nilai tengah populasi ataupun
proporsi populasi. Metode GREG pada
penelitian ini didasarkan atas model linier,
yaitu :
Metode GREG termasuk dalam kelompok
pendugaan berbasis rancangan karena pada
metode ini tidak dapat menduga area yang
tidak tersurvei. Model GREG adalah sebagai
berikut :
1
Yˆi GREG =
Nˆ ij

1
wijk yijk +  Xi −
∑

ˆ
N
j∈ s i
ij

T

wijk x ijk  βˆ
∑

j ∈s i

= Yˆi DIRECT + ( X i − Xˆ i ) T βˆ …….…(3)
dengan :
-
X i = (X i ,1 ,..., X i , p ) adalah vektor dari
T
nilai tengah p populasi
-
-
Nˆ ij =
wijk =
∑w
j , k ∈si
ijk
1
∑ p(s)
{ j , k∈si }
-
-
1
Xˆ i =
ˆ
N ij
∑w
j∈si
1
Yˆi DIRECT =
Nˆ
ijk
∑w
ij j∈si
-
β̂
x ijk = Yˆi ( x ) .........(4)
ijk
xijk
= Yˆi ( y ) ..(5)
merupakan penduga koefisien
dengan metode kuadrat terkecil.
penduga Huber M (M-GREG)
menduga koefisien regresi pada
dengan metode Huber M.
disebabkan karena lebih mudah dipahami,
dan lebih aman dibandingkan metode kuadrat
terkecil.
Penduga M meminimumkan fungsi deviasi
antara pengamatan dengan dugaan (fungsi
objektif), yang lebih umum jika dibandingkan
dengan metode kuadrat terkecil. Kasus khusus
dalam penduga M adalah rataan dan median.
Penduga M untuk paramater lokasi
µ berdasarkan generalisasi dari prinsip
kuadrat terkecil (Bartnett & Lewis 1994).
Andaikan, dalam model dasar, dengan contoh
berasal dari peubah acak kontinu dengan
sebaran kumulatif F(x) dan fungsi kepekatan
f(x). Prinsip untuk menduga µ dari Tr =
Tr(x1,...,xr) dipilih untuk meminimumkan
r
∑ ρ(x
j =1
− Tr ) .............................(6)
j
atau dengan menyelesaikan persamaan
r
regresi
GREG
berarti
GREG
Regresi Kekar (Robust Regression)
Prosedur statistik yang bersifat kekar
ditujukan untuk mengakomodasi adanya
keanehan data dan sekaligus meniadakan
pengaruhnya terhadap analisis tanpa terlebih
dahulu mengadakan identifikasi data yang
aneh. Prosedur ini lebih bersifat otomatis
dalam
menanggulangi
keanehan
data
(Aunuddin 1989). Pencilan
dalam
sekumpulan data hasil pengamatan adalah
sebuah pengamatan yang muncul dan nilainya
tidak konsisten dengan nilai data yang lainnya
(Bartnett & Lewis 1994). Menurut Aunuddin
(1989), pencilan dapat dilihat sebagai
pengamatan dengan sisaan yang cukup besar
(mutlak standardized residual >2).
Dua hal yang diperlukan dalam penduga
kekar adalah resisten dan efisien. Suatu
penduga dikatakan resisten terhadap pencilan
jika sebagian kecil dari contoh tidak dapat
memberikan efek yang terlalu besar terhadap
pendugaan. Penduga memiliki efisiensi yang
baik pada berbagai sebaran jika ragamnya
mendekati ragam minimum untuk setiap
sebaran.
Beberapa pendekatan telah dikembangkan
pada regresi kekar, yaitu dengan penduga R
(R-estimators), penduga L (L-estimators) dan
penduga M (M estimators). Penduga M lebih
sering
mendominasi
pada
praktiknya
∑ Ψ( x
j =1
j
− Tr ) = 0 ...................(7)
dimana
ρ (. ) = - log f(. )
Ψ ( x, θ ) = (∂ / ∂θ ) ρ ( x; θ )
∑w
∀j
Tr =
j
xj
∑w
∀j
j
Untuk memperoleh regresi penduga M
diperoleh dengan meminimumkan
a
a
j =1
j =1
∑ ρ ( y j − ∑ x j β ) .........................(8)
dengan menurunkan persamaan (8) maka
diperoleh persamaan
a
a
∑ Ψ( y − ∑ x β
j
j =1
j =1
j
) x j = 0 ...........(9)
j=1,...,a
Penduga
M
pada
prinsipnya
mendefinisikan pada masalah pemilihan
fungsi Ψ yang memenuhi prinsip efisiensi
dan kekekaran. Efisiensi pada fungsi F berarti
mendapatkan
masalah
lokasi
dengan
mengambil
Ψ proporsional dari loglikelihood yang dijelaskan oleh kepekatan
− ( f ' / f )( x) . Kekekaran
diperoleh dengan memilih Ψ yang sesuai
F: Ψ (x)
=
dan dibatasi, untuk mengurangi pengaruh
dari proporsi kecil
pengamatan. Kedua
prinsip tersebut dapat terjadi jika fungsi
Ψ adalah fungsi terbatasi dan kontinu.
Penduga Huber M adalah salah satu
penduga M yang diperkenalkan oleh Huber
pada tahun 1964. Fungsi ρ (.) dan Ψ (.)
dari penduga Huber M adalah
x 2 / 2 , |x| ≤ k
ρ (x) =
k | x | − k 2 / 2 , |x| > k ..............(10)
atau
-k, x<-k
Ψk (x) =
x, − k ≤ x ≤ k
+k , +k< x ………….……(11)
dengan nilai k yang besar menandakan pada
suatu pendugaan yang efisien. Nilai k tuning
constant, yang ketika nilainya semakin kecil
menghasilkan dugaan yang lebih tahan
terhadap pencilan namun menghasilkan
efisiensi yang lebih rendah ketika sisaan
mempunyai sebaran normal.
Fungsi ρ (.) dan Ψ (.) dari penduga
Huber M digambarkan
(Maronna et al 2006)
sebagai
berikut
algoritma pendugaan Huber M di software
SAS 9.1.
Iterative Reweighted Least Squares
(IRLS)
Algoritma dasar untuk menghitung regresi
penduga M adalah IRLS. Dugaan IRLS
didapatkan dari prosedur iterasi. Dalam setiap
iterasi, bobot untuk pengamatan digunakan
dalam menduga persamaan regresi. Bobot
tersebut diperoleh dari menerapkan fungsi
pembobot penduga M untuk setiap sisaan.
Bobot awal berdasarkan sisaan awal dari
inisialisasi pendugaan (SAS 9.1 Help and
Documentation).
Terminologi IRLS berdasarkan Staudte
dan Sheater (1990) sebagai berikut :
B 0 dari β .
j
( j)
2. Hitung sisaan r = Y − XB
pada
1. Pilih inisialisasi
setiap dugaan ke-j kemudian hitung bobot
yang akan digunakan untuk pendugaan
selanjutnya.
3. Gunakan bobot yang diperoleh pada tahap
( j +1)
2 untuk mendapatkan B
sampai tidak
lebih dari akurasi yang diinginkan.
BAHAN DAN METODE
Penelitian ini menggunakan data simulasi
dan aplikasi. Simulasi dilakukan dengan cara:
1. Membangkitkan data X populasi sebanyak
36.
2. Membangkitkan data xij sebanyak 576,
Gambar 1
Fungsi
ρ (.)
dan
Ψ (.) dari
penduga Huber M.
Penduga Huber M juga mempunyai fungsi
bobot. Fungsi ini dapat dilihat pada Gambar 2.
dengan
X populasi sebanyak 36.
vi sebanyak 36.
4. Membangkitkan data eij sebanyak 576.
3. Membangkitkan data
5. Menghitung nilai
Yij dengan cara.
Yij = xij β + vi + eij
Gambar 2
Fungsi pembobot dari penduga
Huber M.
Penghitungan pendugaan Huber M
menggunakan
berbagai algoritma, salah
satunya adalah Iterative Reweighted Least
Squares. Algoritma ini yang menjadi dasar
β ditetapkan sebesar 2,5.
6. Menduga Yi.
7. Memberikan proporsi pencilan pada Yi ,
yaitu tanpa pencilan, pencilan 2,5%,
pencilan 5%, pencilan 10%, pencilan 20%.
Simulasi tersebut dilanjutkan dengan kajian
analisis sebagai berikut :
1. Meregresikan
antara
Yi
dengan
X populasidengan metode kuadrat terkecil.
dengan
2. Meregresikan
antara
Yi
X populasidengan metode penduga Huber M.
3. Menghitung YGREG dengan dugaan β
metode kuadrat terkecil.
Download