Prediksi tak bias linier terbaik empirik dalam pendugaan area kecil

advertisement
PENDAHULUAN
Latar Belakang
Persoalan
capaian
pembangunan
manusia telah menjadi perhatian para
penyelenggara pemerintahan. Berbagai
ukuran pembangunan manusia dibuat,
namun tidak semuanya dapat digunakan
sebagai ukuran standar yang dapat
dibandingkan antar wilayah atau antar
negara. Oleh karena itu Perserikatan BangsaBangsa (PBB) menetapkan suatu ukuran
standar pembangunan manusia yaitu Indeks
Pembangunan Manusia (IPM). Indeks ini
dibentuk berdasarkan dimensi angka harapan
hidup, dimensi pengetahuan dan dimensi
hidup layak. Sebagian besar IPM dihitung
pada tingkat kota/kabupaten.
Pendugaan area kecil sangat dibutuhkan
untuk mendapatkan informasi-informasi
pada area kecil, misalnya pada lingkup
kabupaten/kota,
kecamatan,
bahkan
kelurahan/desa. Informasi tersebut menjadi
sangat
penting
seiring
dengan
berkembangnya era otonomi daerah di
Indonesia, sehingga dapat digunakan sebagai
acuan menyusun sistem perencanaan,
pemantauan dan kebijakan daerah lainnya
tanpa harus mengeluarkan biaya besar untuk
mengumpulkan data sendiri. Metode yang
terus dikembangkan untuk menduga statistik
area kecil adalah pendugaan area kecil.
Pendugaan secara langsung pada area
kecil akan menghasilkan nilai ragam yang
besar jika contoh yang diambil berasal dari
survei yang dirancang untuk skala
besar/nasional. Hal ini disebabkan oleh
ukuran contoh yang terambil pada area
tersebut kecil. Salah satu solusi yang
digunakan adalah melakukan pendugaan
tidak langsung dengan cara menambahkan
peubah-peubah pendukung dalam menduga
parameter. Peubah pendukung tersebut
berupa informasi dari area lain yang serupa,
survei terdahulu pada area yang sama, atau
peubah lain yang berhubungan dengan
peubah yang ingin diduga.
Pendugaan tidak langsung untuk area
kecil dalam penelitian ini diterapkan untuk
kasus pendugaan IPM tingkat kecamatan di
Kabupaten Bogor. Metode yang digunakan
untuk menduga IPM adalah metode Prediksi
Tak Bias Linier Terbaik Empirik (EBLUP).
Evaluasi hasil pendugaan tidak langsung
dapat diketahui dengan membandingkan
nilai MSE (Mean Squared Error) penduga
langsung dengan nilai MSE penduga tidak
langsung.
Tujuan
Tujuan dari penelitian ini adalah
mendapatkan nilai dugaan IPM tingkat
kecamatan
di
Kabupaten
Bogor
menggunakan metode Prediksi Tak Bias
Linier Terbaik Empirik (EBLUP).
TINJAUAN PUSTAKA
Indeks Pembangunan Manusia
Indeks Pembangunan Manusia (IPM)
mengukur capaian pembangunan manusia
berbasis sejumlah komponen dasar kualitas
hidup. IPM dihitung berdasarkan data yang
dapat
menggambarkan
komponenkomponen yaitu angka harapan hidup yang
mewakili bidang kesehatan, angka melek
huruf, dan rata-rata lama sekolah mengukur
capaian pembangunan di bidang pendidikan
dan kemampuan daya beli masyarakat
terhadap sejumlah kebutuhan pokok yang
dilihat dari rata-rata besarnya pengeluaran
per kapita sebagai pendekatan pendapatan
yang mewakili capaian pembangunan untuk
hidup layak. (BPS 2007)
Sebelum perhitungan IPM, setiap
komponen harus dihitung indeksnya.
Formula yang digunakan sebagai berikut :
πΌπ‘›π‘‘π‘’π‘˜π‘  𝑋𝑖𝑗 =
𝑋 𝑖𝑗 −𝑋 π‘šπ‘–π‘›
𝑋 π‘šπ‘Žπ‘˜π‘  −𝑋 π‘šπ‘–π‘›
dimana 𝑋𝑖𝑗 adalah indikator komponen
pembangunan manusia ke-i, i = 1,2,3 di
kecamatan ke-j, j = 1,2,3. π‘‹π‘šπ‘–π‘› adalah nilai
minimum 𝑋𝑖𝑗 dan π‘‹π‘šπ‘Žπ‘˜π‘  adalah nilai
maksimum 𝑋𝑖𝑗 .
Selanjutnya nilai IPM dapat dihitung
sebagai berikut :
IPM =
(π‘–π‘›π‘‘π‘’π‘˜π‘  𝑋 1𝑗 + π‘–π‘›π‘‘π‘’π‘˜π‘  𝑋 2𝑗 + π‘–π‘›π‘‘π‘’π‘˜π‘  𝑋 3𝑗 )
3
dimana 𝑋1𝑗 adalah Indeks Angka Harapan
Hidup, 𝑋2𝑗 adalah Indeks Pendidikan, dan
𝑋3𝑗 adalah Indeks Standar Hidup Layak.
Angka Harapan Hidup
Angka Harapan Hidup (AHH) adalah
rata-rata perkiraan banyak tahun yang dapat
ditempuh oleh seseorang selama hidup.
AHH dihitung menggunakan pendekatan tak
langsung. Ada dua jenis data yang
digunakan dalam perhitungan AHH yaitu
Angka Lahir Hidup (ALH) dan Anak Masih
Hidup (AMH). Paket program Mortpack
digunakan
untuk
menghitung
AHH
berdasarkan input ALH dan AMH.
Selanjutnya, dipilih metode Trussel dengan
model West yang sesuai dengan histori
kependudukan dan kondisi Indonesia dan
negara-negara
Asia
Tenggara
pada
umumnya.
Besarnya nilai maksimum dan nilai
minimum untuk masing-masing komponen
ini merupakan besaran yang telah disepakati
oleh semua negara anggota UNDP (175
negara di dunia). Pada komponen AHH,
angka tertinggi sebagai batas atas untuk
perhitungan indeks adalah 85 tahun
sedangkan angka terendahnya adalah 25
tahun. (Publikasi BPS 2007)
Tingkat Pendidikan
Untuk
mengukur
komponen
pengetahuan penduduk digunakan dua
indikator, yaitu rata-rata lama sekolah dan
angka melek huruf. Rata-rata lama sekolah
menggambarkan jumlah tahun yang
digunakan oleh penduduk usia 15 tahun ke
atas dalam menjalani pendidikan formal,
sedangkan melek huruf adalah persentase
penduduk usia 15 tahun ke atas yang dapat
membaca dan menulis huruf latin dan atau
huruf lainnya. Kedua indikator tersebut
digabung setelah masing-masing diberikan
bobot. Rata-rata lama sekolah diberi bobot
sepertiga dan angka melek huruf diberi
bobot dua pertiga.
Ada dua batasan dipakai untuk
perhitungan indeks pendidikan sesuai
kesepakatan beberapa negara. Batas
maksimum untuk angka melek huruf adalah
100, sedangkan batas minimum 0. Hal ini
menggambarkan kondisi 100 persen atau
semua masyarakat bisa membaca dan
menulis, dan nilai 0 mencerminkan kondisi
sebaliknya. Sementara batas maksimum
untuk rata-rata lama sekolah adalah 15 tahun
dan batas minimum sebesar 0 tahun. Batas
maksimum 15 tahun mengindikasikan
tingkat pendidikan maksimum setara lulus
Sekolah Menengah Atas. (BPS 2007)
Standar Hidup Layak
Tingkat
standar
hidup
layak
menggambarkan tingkat kesejahteraan yang
dinikmati oleh penduduk akibat kemajuan
ekonomi. Perhitungan didekati dengan
menggunakan pengeluaran riil per kapita
yang telah disesuaikan. Perlu dilakukan
penyesuaian sebagai berikut:
1. menghitung pengeluaran per kapita setiap
kecamatan dari data modul SUSENAS
(Y).
2. menaikkan nilai Y sebesar 20% (=Y1),
karena diperkirakan berdasarkan studi
bahwa data dari SUSENAS lebih rendah
sekitar 20%.
3. menghitung nilai riil Y1 dengan
mendeflasi Y1 dengan Indeks Harga
Konsumen (IHK) (=Y2).
Y2 =
π’€πŸ
𝑰𝑯𝑲
* 100
4. menghitung nilai daya beli- Purchasing
Power Parity (PPP) –untuk tiap daerah
yang merupakan harga suatu kelompok
barang, relatif terhadap harga kelompok
barang yang sama di daerah yang
ditetapkan sebagai standar, yaitu Jakarta
Selatan.
PPP =
𝒋 𝑬(π’Š,𝒋)
𝒋 𝑷(πŸ—,𝒋) 𝑸(π’Š,𝒋)
dimana 𝐸(𝑖,𝑗 ) adalah pengeluaran untuk
komoditi i kecamatan j, 𝑃(9,𝑗 ) adalah harga
komoditi i di Jakarata Selatan, dan
𝑄(𝑖,𝑗 ) adalah volume komoditi i (unit) yang
dikonsumsi di kecamatan j.
5. membagi Y2 dengan PPP untuk
memperoleh nilai rupiah yang sudah
disetarakan antar daerah (=Y3).
6. mengurangi
nilai
Y3
dengan
menggunakan formula Atkinson untuk
mendapatkan estimasi daya beli (=Y4).
Langkah ini ditempuh berdasarkan prinsip
penurunan
manfaat
marginal
dari
pendapatan, sedangkan formula Atkinson
yang digunakan untuk menyesuaikan nilai
Y3 adalah:
𝐢𝑖 *
= 𝐢 𝑖 , Jika 𝐢 𝑖 < Z
1
= 𝑍 + 2(𝐢𝑖 − 𝑍)2 , Jika Z<𝐢 𝑖 <2Z
1
1
= 𝑍 + 2(𝑍)2 + 3(𝐢 𝑖 − 2𝑍)3 ,
Jika 2Z<𝐢 𝑖 <3Z
1
1
1
= 𝑍 + 2(𝑍)2 + 3(𝑍)3 + 4(𝐢(𝑖) − 3𝑍)4 ,
Jika 3Z<𝐢 𝑖 <4Z
dimana:
𝐢 𝑖 : PPP dari nilai riil pengeluaran per
kapita
Z
: batas tingkat pengeluaran yaitu
sebesar Rp. 549.500 per kapita per
tahun atau Rp. 1.500 per kapita
per hari.
Perhitungan indeks daya beli dilakukan
berdasarkan 27 komoditi kebutuhan pokok
yang disajikan pada Lampiran 1. Batas
maksimum perhitungan daya beli adalah
sebesar Rp 732.720,- sementara sampai
dengan tahun 1996 batas minimumnya
adalah Rp 300.000,-. Pada tahun 2002
mengikuti kondisi pasca krisis ekonomi
batas minimum diubah dan disepakati
menjadi Rp 360.000,-. (BPS 2007)
Pendugaan Area Kecil
Suatu area disebut kecil apabila contoh
yang diambil pada area tersebut tidak
mencukupi untuk melakukan pendugaan
langsung dengan hasil dugaan yang akurat
(Rao 2003). Pendugaan area kecil
merupakan suatu metode yang digunakan
untuk menduga parameter pada area kecil
dengan memanfaatkan informasi dari luar
area, dari dalam area itu sendiri, dan dari
luar survei (Longford 2005).
Pendugaan area kecil menjadi sangat
penting dalam analisis data survei karena
adanya peningkatan permintaan untuk
menghasilkan dugaan parameter yang cukup
akurat dengan ukuran contoh kecil.
Terdapat dua masalah pokok dalam
pendugaan area kecil. Masalah pertama
adalah bagaimana menghasilkan suatu
dugaan parameter yang cukup baik untuk
ukuran contoh kecil pada suatu domain.
Kedua, bagaimana menduga Mean Square
Error (MSE) dari dugaan parameter
tersebut. Kedua masalah pokok tersebut
dapat diatasi dengan cara meminjam
informasi dari dalam area, luar area maupun
dari luar survei.
Pendugaan parameter pada suatu
domain dalam SAE dapat dilakukan dengan
menggunakan pendugaan langsung dan
pendugaan
tidak
langsung.
Proses
pendugaan langsung merupakan pendugaan
pada suatu domain berdasarkan data contoh
dari domain tersebut. Pendekatan yang
digunakan pada proses pendugaan ini adalah
pendekatan berbasis rancangan. Proses
pendugaan tidak langsung merupakan
pendugaan pada suatu domain dengan cara
menghubungkan informasi pada area
tersebut dengan area lain melalui model
yang tepat. Hal ini berarti bahwa dugaan
tersebut mencakup data dari domain lain.
Model Area Kecil
Dalam pendugaan area kecil terdapat
dua jenis model dasar yang digunakan, yaitu
model berbasis area dan model berbasis unit
(Rao 2003).
1. Model berbasis area
Merupakan model yang didasarkan
pada ketersediaan data pendukung yang
hanya ada untuk level area tertentu,
misalkan
π‘₯𝑖 =(π‘₯1𝑖 ,...,π‘₯𝑝𝑖 )𝑇
dengan
parameter yang akan diduga adalah Ө𝑖
yang diasumsikan mempunyai hubungan
dengan data pendukung π‘₯𝑖 . Data
pendukung tersebut digunakan untuk
membangun model Ө𝑖 = π‘₯𝑖𝑇 𝛽 + 𝑏𝑖 𝑣𝑖
dengan i=1,...,m dan 𝑣𝑖 ~ 𝑁(0, 𝐴)
sebagai pengaruh acak yang diasumsikan
menyebar normal. Kesimpulan mengenai
Ө𝑖 ,
dapat
diketahui
dengan
mengasumsikan bahwa model penduga
langsung yi telah tersedia, yaitu:
𝑦𝑖 = Ө𝑖 + 𝑒𝑖 , dengan i=1,...,m dan galat
𝑒𝑖 ~N(0, 𝐷) dengan πœŽπ‘’π‘–2 diketahui.
Kemudian kedua model tersebut
digabung sehingga didapatkan model
campuran
𝑦𝑖 = π‘₯𝑖𝑇 𝛽 + 𝑏𝑖 𝑣𝑖 + 𝑒𝑖 ,
dengan i=1,...,m dan bi diketahui bernilai
positif
konstan.
Model
tersebut
merupakan bentuk khusus dari model
linier campuran yang terdiri dari
pengaruh tetap yaitu β dan pengaruh
acak yaitu 𝑣𝑖 .
2. Model berbasis unit
Merupakan suatu model dimana datadata
pendukung
yang
tersedia
bersesuaian secara individu dengan data
respon,
misal
π‘₯𝑖𝑗 =
(π‘₯𝑖𝑗 1 , … , π‘₯𝑖𝑗𝑝 )𝑇 ,sehingga
didapatkan
suatu model regresi tersarang 𝑦𝑖𝑗 =
π‘₯𝑖𝑗𝑇 𝛽 + 𝑏𝑖 𝑣𝑖 + 𝑒𝑖𝑗 , dengan i=1,...,m;
j=1,...𝑁𝑖 , 𝑣𝑖 ~ 𝑁(0, 𝐴) dan 𝑒𝑖 ~N(0, 𝐷).
Penelitian ini menggunakan model berbasis
area karena data pendukungnya hanya ada
pada level area tertentu yaitu pada level
kecamatan.
Metode Prediksi Tak Bias Terbaik Linier
Empirik (EBLUP)
Prediksi Tak Bias Terbaik Linier
(BLUP) merupakan suatu pendugaan
parameter yang meminimumkan MSE
diantara kelas-kelas pendugaan parameter
linier tak bias lainnya. BLUP dihasilkan
dengan asumsi bahwa komponen ragam
telah diketahui. Namun dalam prakteknya,
komponen ragam tidak diketahui. Oleh
karena itu, diperlukan pendugaan terhadap
komponen ragam tersebut melalui data
contoh. Metode EBLUP mensubtitusi
komponen ragam yang tidak diketahui ini
dengan penduganya.
Model dasar dalam pengembangan
pendugaan area kecil didasarkan pada
bentuk model linier campuran sebagai
berikut:
BLUP
= Ө𝑖 (𝑦𝑖 | πœŽπ‘£2 )
Ө𝑖
= π‘₯𝑖𝑇 β + (
BLUP
MSE(Ө𝑖
y = Xβ + Zv + e
dengan X adalah matriks berukuran nxp dan
Z matriks berukuran nxq, sedangkan β
merupakan pengaruh tetap dan v merupakan
pengaruh acak dimana e~N(0,D) serta
v~N(0,A). A dan D merupakan komponen
ragam yang tidak diketahui dan bisa diduga
dari data (Rao 2003).
Nilai harapan y jika v diketahui adalah
E(y|v) = Xβ + Zv, dengan ragam D. Dari
persamaan model linier campuran di atas
dapat diketahui bahwa sebaran marginal
bagi y adalah menyebar normal dengan nilai
tengah Xβ dan ragam V = D + 𝐙A𝐙 𝑇
sehingga log-kemungkinan bagi (β, θ) untuk
θ = (A,D) adalah :
Log
L(β,θ)
= -1/2 log |V| (y – 𝐗𝛽)𝑇 𝐕 −1 (y - Xβ)
1/2
jika θ fixed (tetap) maka penduga bagi β
merupakan penyelesaian dari:
(X T 𝐕 −1 X) β = X T 𝐕 −1
yang tidak lain adalah penyelesaian melalui
generalized atau weighted least square
(WLS).
Log-kemungkinan
untuk
seluruh
parameter (β,θ,v) adalah sebagai berikut:
L(β,θ,v)=p(y|v)p(v)
Berdasarkan persamaan tersebut diatas dan
v~N(0, A), maka:
Log L(β,θ,v) = -1/2 log |D| - 1/2 (y − x𝛽 −
Z𝑣)𝑇 D−1 (y – Xβ - Zv) –
1/2 log |A| - 1/2𝑣 𝑇 A−1 v
untuk (β,θ) diketahui maka didapatkan
turunan persamaan log L(β,θ,v) terhadap v
adalah sebagai berikut:
dπ‘™π‘œπ‘”πΏ
𝑑𝑣
= Z 𝑇 D−1 (y – Xβ - Zv) – A−1 v
dan penduga bagi v merupakan penyelesaian
dari:
(𝐙 𝑇 𝐷 −1 Z+A−1 )v = 𝐙 𝑇 D−1 (y–Xβ).
Fay dan Herriot (1979) secara umum
menggunakan persamaan y = Xβ + Zv + e
dengan Z hanya mengandung intersep. Hal
tersebut berarti model hanya meliputi
pengaruh acak area. Penduga tersebut
kemudian dikenal sebagai BLUP.
𝐴
𝐴+𝐷 𝑖
)(𝑦𝑖− π‘₯𝑖𝑇 β)
) = g1i (A) + g 2i (A), dengan
g1i (A) = Var(Ө𝑖 |𝑦𝑖 , β, A) = A𝐷𝑖 /(A +
𝐷𝑖 )
g 2i
(A)
=
𝐷𝑖 )[𝑋𝑖𝑇 (𝑋 𝑇 𝑉 −1 X) 𝑋𝑖 ]
(𝐷𝑖 )2 /(A
+
Jika A diduga menggunakan metode ML,
REML, ataupun momen sehingga dengan
mensubtitusi β oleh 𝛽 dan A oleh 𝐴 terhadap
BLUP
penduga BLUP (Ө𝑖
), akan diperoleh
suatu penduga baru, yaitu:
EBLUP
Ө𝑖
= Ө𝑖 (𝑦𝑖 |A)
= π‘₯𝑖𝑇 𝛽 + (
A
A +D i
)( 𝑦𝑖 − π‘₯𝑖𝑇 𝛽 )
dengan
EBLUP
MSE(Ө𝑖
) = g1i (A) + g 2i (A) + 2g 3i (A)
dengan g 3i (A) =
2D 2i
2
m (A+ D i )3
m
j=1 (A
+ Dj ) 2
(Rao, 2003).
METODOLOGI
Data
Data yang digunakan dalam penelitian
ini adalah data SUSENAS 2008 dan PODES
2008 dengan informasi yang berbasis rumah
tangga. Peubah respon yang menjadi
perhatian dalam penelitian ini adalah IPM
pada beberapa kecamatan di Kabupaten
Bogor. Jumlah kecamatan yang disurvei
pada SUSENAS 2008 sebanyak 33 dari 40
kecamatan di Kabupaten Bogor.
Perhitungan angka harapan hidup
menggunakan data angka lahir hidup dan
anak masih hidup. Sedangkan pengetahuan
penduduk menggunakan data rata-rata lama
sekolah dan angka melek huruf. Untuk
ukuran kualitas hidup menggunakan data
pengeluaran perkapita riil yang disesuaikan
dan harga setiap komoditi yang diperoleh
dari internet. Data yang digunakan berasal
dari SUSENAS 2008 dan PODES 2008.
Peubah pendukung π‘₯𝑖 yang dianalisis
adalah sebanyak 10 peubah, diantaranya:
π‘₯1 = Persentase keluarga pertanian.
π‘₯2 = Jumlah SD Negeri.
π‘₯3 = Jumlah penduduk.
π‘₯4 = Jumlah keluarga.
π‘₯5 = Rata-rata jarak rumah ke Puskesmas.
Download