BAB I PENDAHULUAN 1.1 Kegunaan Metode

advertisement
BAB I
PENDAHULUAN
1.1 Kegunaan Metode Sampling
Pengambilan sampel dari suatu survei telah menjadi sesuatu yang besar
kegunaannya dalam kehidupan. Sebuah sampel terdiri sejumlah bola lampu dalam
satu periode waktu produksi dapat memberikan gambaran kualitas dari seluruh
bola lampu yang diproduksi dalam periode waktu tersebut. Tingkat sosial
ekonomi keluarga atau rumah tangga dari sejumlah keluarga yang diambil dari
seluruh keluarga yang tinggal di sebuah kota dapat menggambarkan tingkat sosial
ekonomi seluruh keluarga yang tinggal di kota tersebut. Sebuah jajak pendapat
terhadap sejumlah calon pemilih pada Pilkada disuatu kabupaten dapat
memberikan ramalan siapa calon kepala daerah yang akan terpilih pada Pilkada
yang akan datang. Gambaran atau ramalan seperti tersebut diatas akan sangat
bermanfaat bagi setiap yang berkompeten untuk mengambil sikap atau tindakan
sesuai dengan kepentingannya.
Dalam survei sampel, sampel diambil dari populasi, kemudian dihitung nilai
statistik guna menarik inferensi tentang parameter populasi. Pemilihan jenis
sampel yang sesuai serta metode estimasi yang tepat akan memberikan hasil yang
optimum dengan keakuratan yang tinggi. Keuntungan atau manfaat penggunaan
metode survei sampel adalah antara lain, mengurangi biaya, memberikan
kecepatan yang lebih besar, cakupan lebih besar, dan tingkat ketelitian sesuai
dengan yang diinginkan.
1.2 Tahap-Tahap dalam Survei Sampel
Tahapan-tahapan yang perlu dilakukan daalam sebuah survei sampel ada 11
tahap, yaitu :
1. Tujuan survei.
Merupakan pernyataan yang jelas tentang maksud dan tujuan survei.
Tanpa tujuan yang jelas, keputusan yang dapat diambil akan melenceng
dengan tujuannya.
1
2. Populasi yang akan diambil sampelnya.
Populasi adalah himpunan seluruh obyek penelitian yang mengandung
paramater-parameter yang akan dicari. Sampel adalah himpunan bagian
dari populasi tersebut. Dari sampel yang diambil, ditetapkan statistikstatistik estimator untuk parameter-parameter tersebut.
3. Data yang dikumpulkan.
Data atau informasi yang dikumpulkan harus sesuai dengan tujuan survei.
4. Tingkat ketelitian yang diinginkan.
Kesimpulan dalam estimasi selalu mengandung ketidakpastian yang dapat
diukur dengan probabilitas. Kesalahan dalam estimasi dengan probabilitas
tertentu dapat diperkecil dengan memperbesar sampel.
5. Metode pengukuran.
Suatu survei dapat dilaksanakan dengan menggunakan kuesioner disertai
wawancara atau dikirimkan lewat media komunikasi kepada responden,
seperti pos atau telepon. Selanjutnya dari isian kuesioner yang masuk
kembali disusun ringkasan dalam bentuk tabel-tabel.
6. Kerangka atau frame.
Sebelum pengambilan sampel, populasi dibagi dalam bagian-bagian yang
disebut unit pengambilan sampel atau unit. Dalam pengambilan sampel
penduduk sebuah kota, unit dapat berupa orang, atau berupa keluarga,
atau berupa semua penduduk yang tinggal di tiap rukun tetangga. Daftar
unit pengambilan sampel ini disebut kerangka.
7. Pemilihan sampel.
Perlu ditetapkan jenis sampel yang akan diambil, sesuai dengan keadaan,
serta ukuran sampel yang disesuaikan dengan tingkat ketelitian.
8. Uji pendahuluan.
Perlu sekali dilakukan uji coba terhadap kuesioner dalam lingkup yang
lebih kecil, guna mendeteksi kemungkinana adanya kesulitan responden
dalam jawabannya.
2
9. Organisasi lapangan.
Perlu antisipasi masalah-masalah administrasi dan pelatihan terhadap
tenaga-tenaga pencacah.
10. Ringkasan dan analisis data.
Dari jawaban kuesioner, perlu dilakukan editing untuk menghindari salah
catat atau kesalahan lainnya. Perlu diputuskan prosedur pengisian atau
penghitungan apabila jawaban untuk pertanyaan tertentu tidak diisi oleh
beberapa responden.
11. Keterangan yang bermanfaat untuk survei mendatang.
Semakin banyak informasi yang dapat dikumpulkan akan semakin mudah
memperoleh sampel yang memberikan perkiraan yang akurat. Setiap
sampel yang lengkap merupakan petunjuk yang baik untuk perbaikan
pengambilan sampel yang akan datang.
Pengambilan sampel membutuhkan perhatian pada seluruh tahap
tersebut, karena pelaksanaan yang buruk pada tahap tertentu dapat
menyebabkan gagalnya suatu survei. Teori pengambilan sampel mencoba
mengembangkan jenis sampel dan metode estimasi atau perkiraan dengan
tujuan memperoleh hasil yang efisien, biaya yang lebih kecil namun
keakuratannya tinggi. Jenis-jenis sanpel yang dikembangkan adalah
sampel-sampel yang diambil dengan kaidah probabilitas.
1.3 Sifat-Sifat Baik Untuk Sebuah Estimator
Misalkan sebuah populasi mempunyai parameter
diambil dari populasi tersebut misalkan
. Dari sampel yang
suatu statistik estimator untuk
.
Selanjutnya misalkan seluruhnya terdapat K sampel-sampel yang mungkin
terambil dari populasi tersebut dan masing-masing akan terambil dengan
probabilitas
.
Maka mean atau ekspektasi atau nilai harapan dari
adalah :
3
dengan
adalah nilai
Variansi dari
pada sampel ke-k.
didefinisikan dengan :
Rata-rata kuadrat kesalahan dari
didefinisikan dengan
dikatakan tak bias untuk parameter ⊝ jika E(
Statistik estimator
dikatakan konsisten untuk ⊝ jika
) = ⊝,
sama dengan ⊝ pada sampel yang
berhimpitan dengan populasi dan dikatakan efisien jika V(
) adalah terkecil
diantara semua estimator untuk ⊝.
Sifat-sifat tak bias, konsisten dan efisien adalah sifat-sifat baik yang
mungkin dimiliki oleh sebuah estimator. Dengan sifat-sifat tersebut keakuratan
yang tinggi dari sebuah estimator dapat diperoleh. Jika
E( ) = ⊝, dan ini berakibat RKK( ) = V(
E( ) ⊝, dan RKK ( ) V(
tak bias untuk ⊝, maka
). Tetapi jika bias untuk ⊝, maka
).
Deviasi standar dari
, ditulis
, didefinisikan sebagai akar dari
, ditulis S( ) adalah akar dari RKK( ).
variansinya. Kesalahan standar dari
Jadi
=
dalam kasus
,
S( ) =
tak bias untuk ⊝ maka
= S( )
4
1.4
Bias dan Pengaruhnya.
untuk ⊝, ditulis B(
Bias dari suatu estimator
B(
Jika m = E( ) dan
) = E(
), didefinisikan dengan
) ⊝
tak bias untuk ⊝, maka m = ⊝, dan B(
bias untuk ⊝, maka m ⊝ dan B(
)=m
) = 0. Tetapi jika
⊝ 0
Untuk sampel berukuran besar, distribusi dari statistik estimator
mendekati normal dengan mean E(
) dan variansi V(
). Pada kasus
akan
tak bias
untuk ⊝, maka E( ) = ⊝ dan
P(
Tetapi pada kasus
P(
⊝
1,96
+ 1,96
) = 0,95
bias untuk ⊝, maka E( )= m
1,96
m
⊝ dan
+ 1,96
) = 0,95
Kedua grafik distribusi tersebut pada kasus tak bias dan kasus bias adalah sebagai
berikut,
1,96
1,96
Kasus
tak bias untuk ⊝
0,95
(Gambar 1)
0,025
0,025
⊝
Kasus
bias untuk ⊝
dengan E(
) = m>⊝
(Gambar 2)
⊝
m
Jika kesalahan dalam estimasi ⊝ didefinisikan sebagai nilai mutlak dari selisih
dengan ⊝, yaitu |
⊝|, maka pada kasus tak bias,
5
P (|
⊝| >1,96
) = 0,05 ( daerah diarsir dalam gambar 1), dan pada kasus
bias untuk ⊝dengan E(
nilai P (|
⊝| > 1,96
contoh, untuk B(
P (|
) = m > ⊝,
⊝| > 1,96
)=m
) >0,05 (daerah diarsir dalam gambar 2). Sebagai
⊝ = (0,1)
, maka
⊝ < 1,96
) = P(
= P(
) + P(
< 2,06) + P(
⊝ > 1,96
)
> 1,86)
= 0,0197 + 0,0314
= 0,0511
Demikian pula, untuk B(
P (|
⊝| >1,96
)=m
) = P(
⊝=
(0,1)
< 1,86) + P(
, maka
> 2,06)
= 0,034 + 0,0197
= 0,0511
Dan untuk B(
P (|
) = (0,6)
⊝| > 1,96
atau B(
)=
, akan diperoleh
) = 0,0052 + 0,0869 = 0,0921
Jadi, ketika kita menyangka
tak bias untuk ⊝, maka probabilitas terjadi
kesalahan estimasi yang melebihi 1,96
jika kenyataannya
(0,6)
hanya kita sangka sebesar 0,05. Tetapi
bias untuk ⊝, maka nilai sebenarnya probabilitas tersebut
adalah lebih dari 0,05. Dan nilai probabilitas tersebut semakin besar untuk |B(
)|
yang semakin besar. Jadi adanya bias mengakibatkan semakin besar probabilitas
terjadinya kesalahan dalam estimasi dan hal ini tentu saja akan mengurangi
keakuratan dalam estimasi.
Dengan adanya pengaruh bias terhadap keakuratan hasil estimasi tersebut,
maka pengetahuan tentang sifat bias atau tak biasnya suatu estimator diperlukan
sekali. Dari hasil diatas, jika
estimator untuk ⊝ dan |B(
)| (0,1)
, maka
6
⊝| > 1,96
P (|
jika |B(
)|
)
0,0511 jauh berubah dan lebih besar dari 0,05. Tetapi
(0,1)
⊝| >1,96
, maka P (|
) < 0,0511,tak jauh beda
dengan 0,05.
bias untuk ⊝ namun |B(
Jadi jika
)| kecil yaitu kurang dari (0,1)
, maka
pengaruhnya kecil, dan bias tersebut dapat diabaikan.
1.5
Rata-Rata Kuadrat Kesalahan
Dari definisi rata-rata kuadrat kesalahan, RKK (
antara RKK (
RKK (
), V(
) dan B(
⊝
)=E(
), diperoleh hubungan
) sebagai berikut,
m) + (m ⊝)
= E((
=E(
= V(
Jika
) + (B(
tak bias untuk
)
, maka B(
) = 0 dan RKK (
) = V(
Untuk membandingkan dua buah estimator
dan
standar dari kedua estimator tersebut, yaitu (
) dan (
(
)=
,
(
)=
(
)=
).
, digunakan kesalahan
), yang nilainya
pada keadaan umum dan
(
jika
)=
,
dan
tak bias untuk
, nilai kesalahan standar yang lebih kecil
menunjukkan keakuratan yang lebih tinggi. Berikut ini diberikan ilustrasi visual
tentang bias dan kesalahan standar.
Misalkan terdapat 4 jenis senapan yang harus dipilih salah satu yang akan
memberikan hasil tembakan yang tepat dan keakuratan yang tinggi. Setiap
senapan dicoba sebanyak 8 kali tembakan dengan target titik pusat sebuah papan
lingkaran yang radiusnya sama. Misalkan hasil tembakan 4 jenis senapan tersebut
sebagai berikut,
7
X
X
X
X
X
X
X
X
X
X
X
X X
X
Senapan 1
X
X
Senapan 2
X X
XX XXXX X
X
X
XX
XXX X X
Senapan 3
Senapan 4
X
Hasil tembakan senapan 1 memberikan gambaran bias (tembakan melenceng)
dengan kesalahan standar yang tinggi (keakuratan rendah), senapan 2 tak bias
dengan kesalahan standar yang tinggi, senapan 3 bias namun kesalahan
standarnya rendah dan senapan 4 tak bias dengan kesalahan standar rendah.
Dalam kasus real target bukan merupakan titik, namun merupakan bidang yang
kecil. Jadi urutan senapan dimulai yang terbaik adalah: 4, 3, 2, 1 dan pilihan
terbaik adalah senapan 4.
8
BAB II
SAMPLING RANDOM SEDERHANA
2.1
Pengambilan Sampel Random Sederhana
Ditentukan sebuah populasi berukuran N, yaitu banyaknya anggota atau unit
populasi adalah N. Dari populasi ini akan diambil sampel berukuran n, yaitu
sampel dengan anggota atau unit sebanyak n. Jika pengambilan tanpa
pengembalian, maka terdapat
sampel-sampel yang mungkin terambil. Jika pengambilan dilakukan dengan
pengembalian maka terdapat
sampel-sampel yang mungkin terambil.
Sebuah sampel disebut sampel random sederhana jika setiap sampel yang
mungkin terambil, diperoleh dengan probabilitas sama. Jadi, pada pengambilan
tanpa pengembalian, jika setiap sampel yang mungkin terambil diperoleh dengan
probabilitas :
maka sampel yang diperoleh adalah sampel random sederhana. Pada pengambilan
dengan pengembalian, sebuah sampel random sederhana akan diperoleh dengan
probabilitas :
Dalam pembahasan selanjutnya, akan dibatasi pada sampel random sederhana
yang diambil tanpa pengembalian. Sebagai contoh, dari populasi berukuran 8 akan
diambil sampel random sederhana berukuran 3. Maka terdapat :
sampel-sampel
probabilitas
yang
mungkin
terambil,
masing-masing
terpilih
dengan
.
9
Pengambilan sampel random sederhana dapat dilakukan antara lain dengan
menggunakan Tabel bilangan-bilangan random.
2.2
Definisi dan Notasi
Unit-unit populasi berukuran N, ditulis dengan notasi atau lambang :
.
Parameter-parameter populasi ditulis dengan notasi huruf kapital, yaitu :
Total populasi , Y, didefinisikan :
Mean atau rata-rata populasi, , didefinisikan :
Variansi populasi, ada dua definisi yang harus dibedakan, ditulis dengan notasi
dan
,
Dalam pembahasan selanjutnya akan digunakan
populasi. Rumus lain untuk
untuk menyatakan variansi
,
=
10
atau
=
Deviasi standar dari populasi adalah , yaitu akar dari variansi.
Statistik-statistik sampel, ditulis dengan notasi huruf-huruf kecil. Unit-unit sampel
random sederhana berukuran n, ditulis dengan notasi :
Mean atau rata-rata sampel , , didefinisikan
=
Variansi sampel,
, didefinisikan :
=
Rumus lain untuk
,
atau
=
Deviasi standar sampel adalah akar dari variansi sampel, ditulis s.
11
2.3
Sifat-Sifat Estimator Mean dan Total Serta Variansinya
Dari sebuah populasi berukuran N, misalkan
, Y dan
adalah mean, total
dan variansinya. Nilai parameter-parameter tersebut tidak diketahui. Dengan
sampling random sederhana berukuran n, akan dipelajari estimator dari masingmasing parameter tersebut yang ditulis :
,
dan
beserta sifat-sifatnya. Dipelajari pula variansi dari
dan variansi dari
yang
ditulis,
V( ) dan V(Y)
Dalam sampling random sederhana berukuran n, estimator dari
estimator dari Y adalah N
dan estimator dari
adalah
adalah
,
.
Jadi
,
= N dan
Teorema 2.1
Dalam sampling random sederhana berukuran n yang diambil dari populasi
berukuran N, mean sampel,
, adalah suatu estimator tak bias untuk mean
populasi .
Bukti :
Dalam sampling ini terdapat
sampel-sampel yang mungkin terambil, masing-
masing akan terpilih dengan probabilitas
ke-k, k =1,2,...
dengan
. Misalkan
adalah mean sampel
, maka
adalah unit k-i di dalam sampel ke-k, i=1, 2,..., n.
Setiap unit tertentu,
, dalam populasi, i=1,2,...N,
12
dalam jumlahan :
akan memberikan kontribusi sebesar
jika berada dalam sampel ke-k dan tidak
memberikan kontribusi atau kontribusinya nol, jika tak berada dalam sampel ke-k.
Dari seluruh sampel yang mungkin terambil, banyaknya sampel yang memuat unit
tertentu
tersebut adalah
Jadi kontribusi
.
dalam jumlahan :
Jadi secara umum sebarang unit ke-i dalam populasi akan memberikan kontribusi
sebesar
dalam jumlahan tersebut, sehingga
Terbukti bahwa
adalah tak bias untuk . Akibatnya, karena Y = N , maka
adalah tak bias untuk Y.
Variansi dari
yang ditulis V( ) = V( ) dan rumus umumnya dapat diperoleh dan
dijabarkan dari definisi,
Teorema 2.2
Dalam sampling random sederhana berukuran n yang diambil dari populasi
berukuran N dengan variansi
V( ) = (
, variansi mean sampel, V( ), memenuhi rumus
.
13
Bukti :
Dalam jumlahan pertama, yaitu
setiap unit populasi,
, memberikan kontribusi sebesar
,
Jadi
Dalam jumlahan kedua, yaitu
, setiap pasang unit populasi ,
dan
dengan j > i, memberikan kontribusi
sebesar
.
14
Jadi
= 0 – (N 1)
=
=
(N 1)
=
Jadi
=
V( ) =
V( ) sering ditulis dengan rumus V( ) = (1
dengan f =
f)
dan disebut fraksi sampel. Kesalahan standar dari ,
=
2.4
Koreksi Pada Populasi yang Berhingga
Jika ukuran populasi, N, sangat besar terhadap ukuran sampel, n, maka fraksi
sampel, f =
, mendekati nol. Dalam kasus seperti ini rumus variansi dari
menjadi V( ) =
, ( tanpa faktor (1 f) ), dan kesalahan standar dari
menjadi
15
=
Demikian pula, V( ) dan
(1 f)), dan
menjadi V( ) =
, (tanpa faktor
=
Faktor (1 f) dalam rumus-rumusV( ) dan V( ) disebut faktor koreksi
pada populasi yang berhingga yang dalam bahasa Inggris, finite population
correction, ditulis fpc. Faktor fpc berperan memberikan koreksi pada V( )
maupun V( ) pada kasus populasi berhingga, apabila fraksi sampel , f, tidak
terlalu kecil. Jadi, jika f sangat kecil maka fpc diabaikan dan jika f tak terlalu kecil
maka fpc tak diabaikan. Dalam praktek biasanya fpc diabaikan jika f < 5 %.
2.5
Estimasi Kesalahan Standar
Dalam praktek, variansi populasi,
Pengetahuan tentang nilai
pada umumnya tidak diketahui.
, jika ada biasanya hanya melalui asumsi atau
anggapan saja. Akibatnya V( ), V( ),
, dan
tak dapat diperoleh nilainya.
Perlu ada estimasi untuk variansi dan kesalahan standar dari
Estimasi untuk V( ) akan ditulis
dan .
atau v ( )
Estimasi untuk V( ) akan ditulis
Estimasi untuk
akan ditulis s( )
Estimasi untuk
akan ditulis s( )
atau v(
Teorema 2.3
Dalam sampling random sederhana berukuran n yang diambil dari
populasi berukuran N, variansi sampel,
, adalah suatu estimator tak bias untuk
variansi populasi
Bukti :
dapat ditulis
16
Jadi
=
( N 1)
=
( nN
n N+n)
=
Ini berarti
tak bias untuk
Berdasarkan teorema 2.3, dengan mengganti
diganti
dalam rumus untuk
V( ) dan V( ) diperoleh hasil,
= v ( ) = (1 f)
, tak bias untuk V( )
dan
= (1 f)
tak bias untuk V( )
Dalam praktek variansi dari
dihitung dengan menggunakan rumus estimasi,
yaitu,
= v ( ) = (1
f)
Demikian pula variansi dari
dihitung dengan rumus estimasinya,
17
= v(
= (1
f)
Dan selanjutnya kesalahan standar dari
Dan kesalahan standar dari
2.6
dihitung dengan rumus s(
=s
dihitung dengan rumus s( ) = Ns
Batas-Batas Konfidensi
Untuk sampel berukuran besar, mean sampel,
normal dengan mean
, berdistribusi mendekati
dan variansi V( ) yang estimasinyav( ). Berdasarkan
distribusi tersebut diperoleh batas-batas konfidensi ( 1
,
= -
=
) untuk
adalah,
+
atau
,
= -
=
+
bila fpc dapat diabaikan.
Nilai
dan
disebut batas konfidensi bawah dan batas konfidensi atas untuk ,
dan berlaku P(
)=(1
)
Demikian pula batas-batas konfidensi ( 1- ) untuk Y adalah
,
= N( )
= N( )
atau
= N( )
,
= N( )
bila fpc dapat diabaikan.
2.7 Estimator Rasio
Dalam suatu survei sampel, kadang-kadang paramater yang akan diestimasi
adalah rasio dari dua parameter yang berbeda. Sebagai contoh, jika Y adalah total
18
biaya hidup per bulan dan
tangga di kota K, maka rasio
, adalah total penghasilan per bulan seluruh rumah
yang didefinisikan
=
menunjukkan proporsi atau persentase dari penghasilan rumah tangga yang
dibelanjakan untuk keperluan biaya hidup. Selanjutnya jika
adalah total
banyaknya anggota seluruh rumah tangga di kota K, maka rasio
yang
didefinisikan
=
menunjukkan mean penghasilan per bulan per anggota rumah tangga di kota K.
Kiranya perlu kejelian untuk dapat membedakan interpretasi
=
dalam contoh ini,
dengan
menunjukkan mean penghasilan per bulan per rumah tangga
dari seluruh rumah tangga di kota K. Dalam contoh ini pula, parameter apakah
yang menyatakan :
mean biaya hidup per bulan per anggota rumah tangga di kota K ?
Dan parameter apakah yang menyatakan :
mean biaya hidup per bulan per rumah tangga di kota K?
Misalkan unit-unit populasi berbentuk pasangan,
, i =1,2,..., N, dan
misalkan
=
,
=
,
Parameter rasio, R , didefinisikan
19
R=
atau R =
Dalam pasal ini, dengan sampling random sederhana berukuran n akan dipelajari
estimator untuk R beserta sifatnya.
Misalkan
adalah unit-unit sampel dalam sampling
random sederhana berukuran n. Maka
dan
Merupakan estimator tak bias untuk
dan . Jadi beralasan untuk menggunakan
=
sebagai estimator untuk R. Estimator, , bersifat bias untuk R, karena E ( )  R.
Jadi RKK(
=E
E
Namun jika ukuran sampel, n , besar, maka
= V( )
mendekati tak bias untuk R dengan
variansi seperti yang dinyatakan dalam teorema berikut,
Teorema 2.4
Dalam sampling random sederhana berukuran n,
jika n besar maka
Lambang “
,
mendekati tak bias untuk R dan variansinya
“ artinya “ mendekati “.
Bukti :
R=
, = , untuk n besar,
20
=
R=
Sehingga E(
E(
)
=
( E( )
E(
) ) = 0, jadi
mendekati tak
bias untuk R.
Selanjutnya V( ) = E
E
adalah mean sampel dari
=
E
R
=
dengan mean populasi
Jadi
V( )
=
=
(1 f )
=
(1 f )
Dalam praktek rumus pendekatan variansi, V( ) , pada kasus n besar, nilai V( )
tidak dapat diperoleh, sehingga diperlukan estimasinya.
Estimator tak bias untuk V( ) adalah,
) = v( ) =
Jika dalaam rumus ini nilai
tidak diketahui, dapat diganti dengan . Selanjutnya
kesalahan standar dari adalah,
s(
=
=
Untuk maksud penghitungan dapat dipakai rumus lain untuk
pada kasus n
besar,
=
21
Pada kasus
fpc,( 1
2.8
tidak diketahui, diganti dengan , dan kasus fraksi sampel kecil,
) , dapat diabaikan dalam penghitungan.
Estimasi Mean dan Total Sub-Populasi
Dalam beberapa
survei,
kadang-kadang estimasi
dilakukan
untuk
parameter-parameter bagian dari populasi atau sub-populasi. Jadi, sampling
dilakukan pada populasi guna mengestimasi paramater-parameter sub-populasi.
Sub-populasi tersebut dinamakan domain penelitian. Dalam survei rumah tangga
misalnya, estimasi diinginkan untuk paramater rumah tangga yang memiliki anak
usia balita atau estimasi parameter rumah tangga yang masuk kategori pra
sejahtera Dalam pasal ini parameter-parameter yang akan diestimasi adalah mean
dan total sub-populasi.
Misalkan sub-populasi atau domain penelitian ke-j mempunyai ukuran
dan
dalam sampling random sederhana berukuran n, terdapat
unit sampel yang
berasal dari sub-populasi tersebut. Misalkan
adalah unit-unit sub-
populasi. Maka total sub-populasi tersebut adalah,
dan meannya adalah,
=
Serta variansi sub-populasi adalah,
=
Misalkan
adalah unit-unit dalam sampling random sederhana
berukuran n, yang berasal dari sub-populasi. Maka mean unit-unit tersebut
22
dan variansinya,
=
Dari seluruh sampel berukuran n dengan
unit-unit spesifik dari
tertentu,
n, probabilitas diperoleh
unit sub-populasi adalah,
=
Nilai probabilitas ini memberi gambaran seolah-olah sampling random sederhana
berukuran
diambil dari sub-populasi berukuran
. Berdasarkan hasil-hasil di
muka maka estimator tak bias untuk mean sub-populasi,
, adalah,
dengan variansi,
V(
;
=
,
dan kesalahan standarnya,
Dalam praktek, variansi dan kesalahan standar dari
dihitung dengan rumus
estimasinya, yaitu,
= v( ) = (
s( ) =
kecuali jika
)
=
diketahui,
Untuk mengestimasi total sub-populasi,
ukuran sub-populasi,
Kasus 1,
, perlu ditinjau pengetahuan tentang
, dalam kasus 1 dan kasus 2 berikut :
diketahui.
23
Estimator tak bias untuk
adalah
dengan variansi,
V(
=
=(1
)
dan kesalahan standarnya
=
=
Estimasi untuk variansi dan kesalahan standar dari
) = v(
adalah
=(
s( ) =
Kasus 2,
tidak diketahui.
Estimator untuk total sub-populasi dalam kasus ini diperoleh demikian : Untuk
setiap unit populasi,
Maka total
Mean
, didefinisikan
dalam populasi adalah
dengan
memenuhi,
dalam sampel berukuran n adalah
merupakan estimator tak bias untuk
. Jadi estimator tak bias untuk
adalah
24
dengan variansi,
V(
)=
V( ) =
(1 f)
dengan
Kesalahan standar dari
adalah,
Penghitungan variansi dan kesalahan standar dari
dalam praktek digunakan
rumus estimasinya, yaitu,
) = v(
s(
)=
)=
(1 f)
=
Dari kasus 1 dan kasus 2 diatas, jika
estimator untuk total sub-populasi,
=
dan
dan jika
diketahui maka terdapat dua buah
, yang dapat digunakan yaitu,
=N
tidak diketahui, hanya estimator
yang dapat digunakan.
Apabila terdapat dua atau lebih estimator untuk suatu parameter, yang dipilih
adalah estimator dengan kesalahan standar yang terkecil, yang berarti memiliki
keakuratan yang tertinggi.
Soal-soal latihan :
1. Sebuah kota mempunyai 50 buah hotel dengan kamar sebanyak 1500
buah. Sebuah sampel random sederhana 5 buah jotel diketahui jumlah
kamar dan timgkat hunian ( persen kamar terisi saat musim liburan )
25
No Hotel
Jumlah Kamar
Tingkat Hunian
1
40
80 %
2
25
100 %
3
60
90 %
4
100
60 %
5
30
90 %
a. Estimasikanlah mean tingkat hunian seluruh hotel di kota tersebut saat
musim liburan.
b. Jika tiap kamar rata-rata terisi 2 orang tamu (bagi kamar yang terisi),
estimasikanlah total jumlah tamu yang tinggal diseluruh hotel di kota
tersebut saat musim liburan.
2. Sebuah Kabupaten dihuni 4.000 rumah tangga (rt), dan diketahui 500 rt
diantaranya memiliki sapi. Sebuah sampel random sederhana terdiri 250 rt
diketahui distribusi banyaknya sapi yang dimiliki sebagai berikut :
Banyaknya sapi
Banyaknya rumah tangga
0
215
1
5
2
14
3
10
4
6
a. Dari seluruh rumah tangga pemilik sapi di Kabupaten tersebut,
estimasikanlah total banyaknya rt yang sapinya lebih dari 2 ekor,
(berikanlah dua buah nilai estimasi), dan hitunglah kesalahan standarnya
masing-masing.
b. Berikanlah dua buah estimasi untuk total banyaknya sapi yang dimiliki
seluruh rumah tangga di Kabupaten tersebut, dan hitung variansi masingmasing.
26
3. Sebuah sampel random sederhana 50 orang mahasiswa FMIPA diketahui
terdapat 28 orang dari jurusan Matematika, 8 orang dari jurusan Fisika dan
yang lainnya dari jurusan Kimia.
Dari sampel random tersebut, diperoleh data IPK mahasiswa Fisika
sebagai berikut :
3,14
2,98
3,57
2,81
2,97
3,36
3,05
2,52
Diketahui pula total mahasiswa FMIPA 1700 orang, terdiri 675 orang dari
jurusan Matematika, 550 orang dari jurusan Fisika, dan yang lainnya dari
jurusan Kimia.
a. Estimasikanlah mean IPK seluruh mahasiswa jurusan Fisika FMIPA,
dan hitunglah pula kesalahan standarnya.
b. Berikanlah dua buah nilai estimasi total IPK seluruh mahasiswa
jurusan Fisika FMIPA, dan hitunglah dari masing-masing estimasi
tersebut nilai kesalahan standarnya.
4. Populasi berukuran 5 unit dengan nilai
sebagai berikut : 7, 10, 2, 11,
20. Diperhatikan sampel random sederhana berukuran 3, dan dua buah
estimator bagi total populasi, Y sebagai berikut :
Estimator pertama,
= 5 , estimator kedua
yang didefinisikan:
a. Daftarkanlah seluruh sampel yang mungkin terambil, dan hitunglah
dan
dari masing-masing sampel.
b. Tunjukkanlah bahwa
dan
masing-masing merupakan estimator
tak bias bagi Y.
c. Hitunglah variansi dari
dan
d. Untuk nilai k berapakah V(
.
mencapai minimum? Hitunglah pula
( ).
27
5. Suatu sampel random sederhana berukuran 50 dengan mean
diambil dari
sebuah populasi berukuran 1000 dengan variansi 2500. Dari sampel
tersebut diambil sub-sampel random sederhana berukuran 30 dengan mean
. Misalkan
adalah mean dari 20 unit sampel sisanya.
Hitunglah :
a. V(
b. V(
c. Kov( ,
)
)
)
28
BAB III
SAMPLING RANDOM SEDERHANA UNTUK PROPORSI
3.1
Karakteristik Kualitatif
Dalam survei sampel, kadang-kadang parameter yang akan diestimasi adalah
total banyak unitt, proporsi atau persentase unit populasi yang mempunyai
karakteristik atau sifat tertentu. Dalam survei rumah tangga misalnya, ingin
diestimasi berapa total banyaknya rumah tangga yang berhak mendapatkan
bantuan dalam Program Sosial Pemerintah dari seluruh rumah tangga yang
tinggaldi kota K. Hal ini diperlukan sekali untuk menetapkan anggaran yang perlu
disediakan dalam program tersebut untuk seluruh rumah tangga di kota K. Dari
pengamatan sejumlah komponen tertentu dari hasil produksi, diinginkan untuk
mengetahui berapa persentase komponen-komponen yang cacat dari seluruh hasil
produksi tersebut. Dari seluruh mahasiswa di sebuah universitas yang
menggunakan ponsel, ingin diestimasi proporsi dan total banyaknya mahasiswa
yang ponselnya merk M. Hasil pencacahan terhadap setiap unit sampel dijawab
dengan “ ya ” ( berhak mendapatkan; cacat; memakai merk M ) atau “ tidak ”.
Dengan demikian setiap unit akan masuk kedalam salah satu dari 2 kelas
klasifikasi, sebut saja kelas C dan kelas
.
Misalkan N adalah ukuran populasi, A adalah total banyaknya unit
populasi yang masuk kelas C dan P adalah proporsi atau persentase unit populasi
yang masuk kelas C, yaitu P =
. Parameter P dan A tidak diketahui nilainya dan
dalam bab ini akan dipelajari statistik estimator untuk parameter-parameter
tersebut beserta sifat-sifatnya.
3.2
Estimator Untuk Proporsi dan Total Banyak Unit Serta Variansinya.
Dalam sampling random sederhana berukuran n, misalkan aadalah
banyaknya unit sampel yang masuk kelas C, dan p adalah proporsi unit sampel
yang masuk kelas C, yaitu p =
. Maka diperoleh teorema berikut :
29
Teorema 3.1
Proporsi sampel, p =
P=
, adalah estimator yang tak bias untuk proporsi populasi,
, dengan variansi V(p) = E(p P
=
(
), dengan Q = 1
P
Bukti :
Untuk setiap unit dalam populasi didefinisikan
= 0, jika unit masuk kelas
= 1, jika masuk kelas C dan
. Maka untuk nilai-nilai populasi
ini, total
populasi,
dan mean populasi,
=
=
=P
Mean untuk sampelnya,
=
=
=p
dengan demikian total banyak unit populasi yang masuk kelas C dapat dipandang
atau merupakan total populasi khusus yaitu populasi yang nilai unit-unitnya 1 atau
0, dan proporsi populasi adalah mean dari populasi tersebut.
Berdasarkan Teorema 2.1, maka p tak bias untuk P. Untuk populasi
tersebut,
sehingga
=
( NP
N
)
=
PQ , dengan Q =1
P
30
Secara sama, untuk sampel
=
pq, dengan q = 1
, diperoleh
p.
Dan berdasarkan teorema 2.2 diperoleh bukti,
V(p) = V( ) =
=
=
(
)
Dari teorema 2.3,
=
adalah estimator tak bias untuk
=
, jadi estimator tak bias untuk V(p)
adalah,
(p) =v(p) =
=
=
(
Karena A = NP, maka estimator tak bias untuk A adalah
V( ) =
V(p) =
)
= Np dengan variansi,
PQ
Estimator tak bias untuk V( ) adalah
( )=v(
)=
v(p) =
pq
Dari rumus-rumus diatas, jelas bahwa dalam terapan V(p) dan V( ) tidak dapat
dihitung nilainya, karena memuat parameter P yang tidak diketahui nilainya, dan
justru akan diestimasi. Maka variansi dari p dan variansi dari
rumus estimatornya saja, yaitu v(p) dan v(
Rumus lain untuk v(p) dan v(
v(p) = (1
f)
v(
(1
)=
dihitung dari
).
) adalah
f)
Dari rumus ini, jika faktor koreksi dapat diabaikan maka v(p) dan v( ) menjadi,
v(p) =
, v( ) =
31
3.3
Pengaruh Nilai Proporsi P Pada Kesalahan Standar
Dari rumus V(p) dimuka,
V(p) =
,
jika faktor koreksi diabaikan, maka V(p) =
, dan kesalahan standarnya,
=
Nilai PQ dan
untuk beberapa nilai P seperti dalam tabel berikut ( P dalam
persen ),
P
0
10
20
30
40
PQ
0
900
1600 2100 2400 2500 2400 2100 1600 900
0
0
30
40
0
46
Nilai maksimum
49
50
50
60
49
70
46
80
40
90
30
100
adalah 50 % dicapai pada nilai P = 50 %. Pada
selang
30 %
P
0,70 % nilai
tak jauh berubah dari 50 %, tetapi pada selang
P < 30 % atau P > 70 %, nilai
akan jauh berubah dari 50 % .
Untuk P = 50 %, keinginan untuk mendapatkan kesalahan standar dari estimasi ,
= 5 %, diperlukan sampel sebesar n =100. Dan n = 100 ini tidak berubah
banyak untuk 40 %
P
60 %.
Jika diinginkan kesalahan yang lebih kecil lagi pada nilai P dalam selang
tersebut, misalnya kesalahan standar sebesar 2 %, maka ukuran sampel yang
diperlukan jauh meningkat menjadi 625. Ini berarti untuk nilai P sekitar 50 %,
untuk menurunkan kesalahan standar dari 5 %
menjadi 2 %, diperlukan
penambahan ukuran sampel dari 100 menjadi 625.
Pada kondisi sebaliknya, untuk n tetap, kesalahan standar dari p sekitar
untuk 40 %
P
60 %, tidak banyak berubah yang berarti tidak besar
32
pengaruhnya terhadap V(p). Namun jika P < 30 % atau P > 70 %, maka
pengaruhnya terhadap V(p) sangat besar.
3.4
Batas-Batas Konfidensi
Dalam sampling random sederhana berukuran n yang diambil dari populasi
berukuran N, banyaknya unit sampel yang masuk kelas C yaitu a, berdistribusi
hipergeometrik dengan distribusi probabilitas,
P(a =
)=
,
= 0, 1, 2,..., n
dan pada populasi yang berukuran sangat besar, distribusi dari a akan mendekati
Binomial,
P(a =
)=
Pendekatan selanjutnya, jika ukuran sampel relatif besar, maka distribusi
dari a akan mendekati normal dengan mean, E(a) = nP dan variansi v(a) =
v(p).
Dalam keadaan ini pula, p berdistribusi mendekati normal dengan mean, E(p) = P
dan variansi v(p). Berdasarkan distribusi ini, diperoleh batas-batas konfidensi
(1
) untuk P, yaitu :
=p
,
=p+
Batas-batas konfidensi ( 1
=N
) untuk A adalah
,
=N
Batas-batas konfidensi tersebut berlaku untuk sampel berukuran besar.
3.5
Klasifikasi ke Dalam Lebih Dari Dua Kelas
Dalam sebuah survei, seringkali responden diminta memilih salah satu dari
beberapa (lebih dari dua) jawaban yang tersedia. Maka hasil pencacahan unit-unit
sampel akan terklasifikasi lebih dari dua kelas. Pertanyaan kepada mahasiswa
tentang merk motor yang dipakai ke tempat kuliah dengan jawaban pilihan:
33
Honda, Yamaha, Suzuki, dll. Maka klasifikasi yang terjadi adalah 4 kelas.
Pertanyaan berapa jumlah anggota rumah tangga Anda? Jawaban yang masuk
adalah 1, 2, 3, 4, 5, lebih dari 5. Disini terjadi klasifikasi ke dalam 6 kelas.
Pertanyaan, siapa calon yang akan Anda pilih dalam Pilkada yang akan datang
diantara tiga calon yang sudah ditetapkan? Unit atau jawaban akan terklasifikasi
ke dalam 3 kelas.
Jika terjadi klasifikasi unit ke dalam lebih dari dua kelas, maka
permasalahan yang harus diselesaikan dapat berupa,
(a) Estimasi proporsi unit populasi yang masuk kelas C.
(b) Estimasi total banyaknya unit populasi yang masuk kelas C.
(c) Estimasi proporsi unit sub-populasi yang masuk kelas C.
(d) Estimasi total banyaknya unit sub-populasi yang masuk kelas C.
Sebagai contoh, misalkan di kota Baru beredar 7 merk sabun cuci dalam pasaran,
yaitu merk
Merk
,
,
,
dan
pabrik L,
dan
,
,
,
,
.
adalah produk pabrik K, merk
dan
adalah produk
adalah produk pabrik yang lainnya. Dalam sampling
random sederhana, terdiri n rumah tangga yang diambil dari seluruh ( N ) rumah
tangga yang tinggal di kota Baru tersebut, kita diminta menyelesaikan masalah
estimasi beberapa parameter, yaitu :
(1) Proporsi rumah tangga pemakai merk
, dari seluruh rumah tangga di
kota Baru.
(2) Total banyaknya rumah tangga di kota Baru yang memakai merk produk
pabrik L
(3) Proporsi rumah tangga pemakai merk
dari seluruh rumah tangga
pemakai produk pabrik K di kota Baru.
(4) Total banyaknya rumah tangga pemakai merk
atau
di kota Baru.
Penyelesaian masalah :
(1) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk
, maka (1) merupakan masalah estimasi proporsi unit populasi yang
masuk kelas C.
34
(2) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk
produk L maka (2) merupakam masalah estimasi total banyaknya unit
populasi yang masuk kelas C. Adanya informasi yang lebih banyak seperti
misalnya informasi tentang total banyaknya rumah tangga pemakai merk
produk K dan L, maka (2) dapat dipandang sebagai masalah estimasi total
banyaknya unit sub-populasi yang masuk kelas C, dengan memandang
informasi tersebut sebagai ukuran sub-populasi.
(3) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk
dan seluruh rumah tangga pemakai produk pabrik K sebagai subpopulasi, maka (3) merupakan masalah estimasi proporsi unit sub-populasi
yang masuk kelas C.
(4) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk
atau
, maka (4) merupakan masalah estimasi total banyaknya unit
populasi yang masuk kelas C. Dengan informasi yang lebih seperti yang
tersebut dalam (2), maka (4) dapat dipandang sebagai masalah estimasi
total banyaknya unit sub-populasi yang masuk kelas C.
Adanya informasi yang lebih banyak seperti yang tersebut dalam
penyelesaian masalah (2) dan (4), menjadikan masalah estimasi total
banyaknya unit yang masuk kelas C memiliki estimator yang tidak
tunggal. Masing-masing masalah (2) dan (4) di atas mempunyai dua buah
estimator dan kita dapat menunjuk estimator manakah yang lebih akurat
berdasarkan nilai kesalahan standarnya.
Misalkan unit-unit populasi diklasifikasikan ke dalam salah satu
dari k kelas, yaitu kelas
populasi,
dengan
,
,
,...
. Misalkan N adalah ukuran
adalah total banyaknya unit populasi yang masuk kelas
,
tidak diketahui, maka,
=
+
=N
Dengan sampling random sederhana berukuran n, akan dipelajari masalah
estimasi untuk beberapa parameter, yaitu seperti misalnya,
35
(1) Estimasi untuk
(2) Estimasi untuk
(3) Estimasi untuk
(4) Estimasi untuk
(5) Estimasi untuk
(6) Estimasi untuk
+
(7) Estimasi untuk
+
Misalkan dari sampel yang diambil diperoleh banyaknya unit sampel yang masuk
kelas
adalah
; i = 1, 2, 3,...k
Maka
Berdasarkan pembahasan dimuka bahwa p adalah estimator tak bias untuk P
dengan estimasi variansi tak biasnya,
v(p) = (1 f)
dan
adalah estimator tak bias untuk A dengan estimasi variansi tak biasnya,
v(
)=
(1 f)
maka diperoleh hasil-hasil sebagai berikut,
(1) Estimator tak bias untuk
biasnya v(
adalah p =
) = v(p) = (1 f)
(2) Estimator tak bias untuk
biasnya v(
) = v(p) = (1 f)
, dengan estimasi variansi tak
, dengan p =
adalah p =
dengan variansi tak
, dengan p =
36
(3) Dengan memandang gabungan kelas
,
dan
sebagai sub-
populasi atau domain penelitian, estimator tak bias untuk
adalah,
=
, dengan
biasnya, v(
=
dengan estimasi variansi tak
) = v( ) = (1
)
, dengan
=
dan
=
.
(4) Dengan memandang hal yang sama seperti dalam (3), estimator tak bias
untuk
adalah
=
dengan
dengan estimasi variansi tak biasnya v(
dengan
=
dan
=
=
) = v( ) = (1
,
)
,
.
Hasil-hasil estimasi dalam (5), (6) dan (7), jika
=
nilainya, maka ada dua buah estimator, tetapi jika
diketahui
tak diketahui nilainya, hanya
ada sebuah estimator hasilnya sebagai berikut,
(5) Jika
=
diketahui, maka estimator tak bias untuk
adalah :
Pertama ;
=
estimasi variansi v(
Kedua ;
v(
(6) Jika
(
, dengan
) =
= Np , dengan p =
)=
v(p) =
=
=
v( ) =
dan
=
(1
)
, dengan
dan dengan estimasi variansi
(1 f)
diketahui, maka estimator tak bias untuk
) adalah,
37
Pertama ;
=
dengan
estimasi variansi, v(
Kedua ;
v(
(
dan
v( ) =
(1
= Np , dengan p =
)=
(7) Jika
) =
=
v(p) =
=
, dengan
)
dan dengan estimasi variansi
(1 f)
=
diketahui maka estimator tak bias untuk
) adalah seperti pada (6) dengan
=
dalam masalah estimasi (5), (6) dan (7) jika
dan p =
tidak diketahui maka
hanya estimator kedua yang dapat digunakan.
Soal-soal latihan :
1. Unit-unit sebuah populasi diklasifikasikan ke dalam kelas-kelas
dan
. Misalkan
i =1, 2, 3, 4 ; dan
,
adalah banyaknya unit populasi yang masuk kelas
=
. Nilai
dan
banyaknya unit sampel yang masuk kelas
a) Tentukan estimator untuk
b) Tentukan estimator untuk
,
tidak diketahui. Dari populasi
ini diambil sampel random sederhana berukuran n dan misalkan
c) Jika nilai
,
adalah
.
dan tuliskanlah rumus variansinya.
dan tuliskanlah variansinya.
diketahui, tentukanlah dua buah estimator untuk
dan tuliskanlah masing-masing variansinya.
2. Sebuah kota dihuni 12.000 rumah tangga, dengan mata pencaharian pokok
diklasifikasikan : petani, pedagang, peg. Swasta dan PNS. Sebuah sampel
random yang terdiri 800 rumah tangga yang diambil dari kota tersebut
diketahui mata pencaharian pokok mereka sbb : petani 350 rt, pedagang
200 rt, peg. Swasta 175 rt, dan PNS 75 rt. Diketahui total banyaknya
38
rumah tangga dengan mata pencaharian pokok peg. Swasta atau PNS
adalah 3200 rt.
a) Estimasikanlah proporsi banyaknya rumah tangga dengan mata
pencaharian pokok petani di kota tersebut dan hitunglah pula
kesalahan standarnya.
b) Berikanlah dua buah nilai estimasi untuk total banyaknya rumah
tangga dengan mata pencaharian pokok pedagang di kota tersebut
(berapa rt) dan hitunglah pula kesalahan standar dari masing-masing
estimasi tersebut.
3. Terkait dengan program wajib belajar 9 tahun,akan diestimasi total
banyaknya penduduk kota K yang saat ini berusia antara 6 th dan 16 th.
Sebuah sampel random sederhana terdiri 200 rumah tangga diketahui
distribusi banyaknya anak yang berusia antara 6 th dan 16 th dalam rumah
tangga tersebut sbb :
Banyaknya anak usia Banyaknya rumah tangga
antara 6 th dan 16 th
0
60
1
70
2
30
3
20
4
15
5
5
Diketahui kota K dihuni 3000 rumah tangga, dengan 2000 rumah tangga
diantaranya mempunyai anak (anggota rt) yang berusia antara 6 th dan 16
th. Estimasikanlah total banyaknya rumah tangga kota K yang punya anak
usia 6 th-16 th lebih dari 2 orang (dua estimasi). Estimasikan pula total
banyaknya penduduk kota K ( berikan 2 estimasi ) yang berusia antara 6 th
dan 16 th. Hitunglah pula kesalahan standar masing-masing estimasi
tersebut.
39
4. Dari seluruh mahasiswa Universitas U diketahui 5000 orang mahasiswa
memiliki ponsel dan 600 orang diantara mereka harga ponselnya lebih dari
Rp.2.000.000,-. Sebuah sampel random sederhana terdiri 300 orang
mahasiswa pemilik ponsel dari universitas tersebut diketahui merk ponsel
dan harganya sbb:
Harga
Merk
Tak lebih dari
Rp.2.000.000,-
Merk Lain
Merk
Merk
100
68
54
38
20
12
6
2
Lebih dari
Rp.2.000.000,-
a. Dari seluruh mahasiswa Universitas U, estimasikanlah total
banyaknya mahasiswa pemilik ponsel Merk
dan hitung pula
kesalahan standarnya.
b. Dari
seluruh
mahasiswa
pemilik
ponsel
Merk
,
estimasikanlah proporsi mahasiswa yang harga ponselnya tak
lebih dari Rp. 2.000.000,c. Dari seluruh mahasiswa pemilik ponsel yang harganya tak
lebih dari Rp. 2.000.000,-, estimasikanlah proporsi mahasiswa
pemilik ponsel Merk
d. Berikanlah
dua
buah
dan hitung pula kesalahan standarnya.
estimasi
untuk
total
banyaknya
mahasiswa Universitas U pemilik ponsel Merk
yang
harganya tak lebih dari Rp.2.000.000,- dan hitunglah variansi
dari masing-masing estimasi tersebut.
5. Estimator tak bias bagi V(p) =
(p) =
adalah v(p) =
pq. Jadi
adalah bias bagi V(p). Tentukanlah besarnya bias
tersebut, B( (p)).
40
BAB IV
ESTIMASI UKURAN SAMPEL
4.1
Analisis Masalah dan Spesifikasi Ketelitian
Dalam setiap rancangan survei sampel, penentuan ukuran sampel merupakan
tahap yang harus dilewati. Ukuran sampel yang diambil akan berhubungan
langsung dengan biaya dan waktu. Semakin besar sampel diambil, akan semakin
besar pula biaya dan waktu yang diperlukan. Bagaimana hubungan ukuran sampel
dengan spesifikasi ketelitian? Spesifikasi ketelitian dalam estimasi merupakan
pernyataan ketelitian yang diinginkan dalam estimasi tersebut. Pernyataan ini
dapat berupa keakuratan yang diinginkan yang dapat dinyatakan dengan atau
melalui kesalahan standar dari estimatornya. Ketelitian yang diinginkan dapat
pula dinyatakan melalui tingkat kesalahan dalam estimasi yang masih dapat
ditoleransi yang terjadi pada tingkat keyakinan atau probabilitas tertentu. Tingkat
kesalahan tersebut harus ditetapkan dengan baik sesuai bidang penerapan estimasi
tersebut. Jika diinginkan ketelitian yang tinggi, maka tingkat kesalahan harus
ditetapkan dengan nilai yang kecil.
4.2
Rumus Untuk n Dalam Sampling Untuk Proporsi
Dalam sampling random sederhana untuk proporsi, misalkan tingkat
kesalahan estimasi yang masih dapat ditoleransi adalah d pada tingkat keyakinan
atau tingkat konfidensi 1
P( |p P|
, Ini berarti,
d)=1
Dengan menganggap p berdistribusi normal dengan mean, E(p) = P dan variansi
V(p) =
, maka diperoleh hubungan antara n dan d yaitu,
d=
Penyelesaian untuk n menghasilkan,
41
n=
Untuk penggunaan praktis, sebuah perkiraan awal p diperlukan untuk mengganti
P dalam rumus di atas sehingga n dapat dihitung. Perkiraan awal p ini dapat
diperoleh dengan mengambil sampel awal dan menghitung nilai p dalam sampel
tersebut atau menggunakan perkiraan lainnya, misalnya dari hasil survei yang
lampau. Dengan nilai perkiraan awal p tersebut, estimasi pertama ukuran sampel
adalah,
=
Jika
< 5% , ambil n =
. Namun jika
5% , maka ukuran sampel yang
diambil,
=
n=
Kesalahan relatif sebuah estimator
koefisien variasi dari
untuk
didefinisikan dengan
didefiniskan dengan
Misalkan dalam estimasi total banyak unit populasi yang masuk kelas C, yaitu
A = NP, kesalahan relatif dalam estimasi diinginkan tidak lebih dari r pada tingkat
konfidensi 1
. Maka,
P(
P(|p P|
r) = 1
rP)
=1
Dari hasil di muka, dengan mengganti d dengan rP diperoleh,
=
dengan p
adalah perkiraan awal untuk P.
42
4.3
Rumus Untuk n Dengan Data Kontinu
Dalam estimasi mean atau total populasi,
atau Y, sering diinginkan sebuah
kesalahan relatif tidak lebih dari r dalam estimasinya. Jadi,
P(
r) = 1
Dengan menganggap
maka,
r =
.
berdistribusi normal dengan mean
dan variansi V( ),
dengan penyelesaian untuk n
n=
Estimasi pertama,
Jika
=
< 5 %, ukuran sampel yang diambil n =
n=
, dan jika
5% , maka
=
Kadang-kadang sampel yang akan diambil diinginkan agar mempunyai
nilai koefisien variasi tertentu. Sebagai misal, untuk mengestimasi
agar estimatornya mempunyai nilai koefisien variasi kv =
=
, maka
, diinginkan
=
;
;n=
Estimasi pertama,
=
dengan C =
, kuadrat dari koefisien variasi.
Dalam rumus penghitungan ukuran sampel di atas, sampel awal diambil untuk
sekedar memperoleh perkiraan untuk P atau
, yang digunakan untuk menghitung
dan menetapkan n, dan sampel awal tersebut tak digunakan lagi dalam
43
sampling selanjutnya. Dalam praktek metode ini jarang sekali dipakai karena akan
memperlambat penyelesaian survei. Metode lain diberikan oleh Cox dan Stein,
yaitu dengan mengkombinasikan sampel awal atau sampel pertama yang diambil
berukuran
, dengan unit-unit tambahan yang diambil dari populasi dan
menjadikan ukuran sampel menjadi n. Estimator untuk P atau
dari kombinasi
sampel tersebut akan berubah sifatnya menjadi bias. Dengan menambahkan
estimasi dari bias pada estimator yang bersangkutan akan didapat estimator baru
yang tak bias untuk P dan
. Hasilnya diberikan dalam rumus-rumus berikut :
a)
Sampling untuk
dengan koefisien variasi ditetapkan kv =
.
Diambil sampel awal atau sampel pertama berukuran
dihitung mean dan variansinya
dan
, selanjutnya
. Dengan menganggap y
berdistribusi normal, ambil unit-unit tambahan sehingga ukuran sampel
menjadi,
n=
( 1 + 8C +
+
)
Mean sampel akhir, , merupakan estimator yang bias untuk
estimator yang baru untuk
. Ambil
yaitu :
= (1 2C)
b)
Sampling untuk
dengan variasi ditetapkan V.
Ambil unit-unit tambahan untuk membuat ukuran sampel menjadi,
n=
(1 + )
c)
Sampling untuk P
dengan variansi ditetapkan V
Misalkan
adalah estimasi untuk P dari sampel pertama. Ambil unit-unit
tambahan sehingga ukuran sampel menjadi,
44
n=
+
+
Proporsi dalam sampel akhir, p, merupakan estimator yang bias untuk P.
Untuk menghilangkan bias tersebut gunakan estimator baru untuk P yaitu,
=p+
d)
Sampling untuk P
dengan koefisien variasi ditetapkan kv =
Ambil unit-unit tambahan untuk membuat ukuran sampel menjadi,
n=
+
+
proporsi dalam sampel akhir, p, merupakan estimator yang bias untuk P,
dan untuk menghilangkannya, digunakan estimator baru,
=p
dalam rumus-rumus untuk (a), (b), (c) dan (d) diatas, dianggap
< n.
Unit-unit tambahan diambil untuk menjadikan sampel tersebut menjadi
berukuran n. Jadi sampel baru berukuran n merupakan gabungan sampel
pertama dengan unit-unit tambahan tersebut.
Soal-soal latihan :
1. Fakultas Teknik mempunyai mahasiswa
sebanyak 2800 orang. Sebuah
sampel random sederhana akan diambil dari mahasiswa
fakultas
tersebut guna mengestimasi total banyaknya mahasiswa yang tinggal di
tempat kos. Kesalahan estimasi diinginkan tidak lebih dari 50 orang pada
tingkat konfidensi 95 %. Berapa ukuran sampel yang harus diambil jika
estimasi untuk banyaknya mahasiswa yang tinggal di tempat kos adalah
500 orang?
2. Wilayah Kecamatan Duren merupakan penghasil buah durian. Hampir di
setiap halaman rumah tangga tertanam pohon durian. Guna mengestimasi
45
total banyaknya pohon durian yang tumbuh di kecamatan tersebut akan
digunakan sampling random sederhana, terdiri beberapa rumah tangga.
Hasil estimasi nanti diinginkan memiliki koefisien variasi 0,18. Telah
diambil sampel pertama berukuran 60 rumah tangga dan diperoleh mean
banyaknya pohon tiap rumah tangga 4,8 dan deviasi standar 7,1. Tentukan
ukuran sampel yang harus diambil, n. Selanjutnya jika dari sampel tersebut
diperoleh
Y = 8604 pohon. Tentukan estimasi akhir total banyaknya
pohon durian di kecamatan Duren.
46
BAB V
SAMPLING RANDOM BERSTRATA
5.1
Pengambilan Sampel Random Berstrata
Untuk mengambil sampel random berstrata dari populasi berukuran N,
mula-mula populasi dibagi menjadi beberapa bagian yang masing-masing
berukuran
,
, ...,
unit. Bagian-bagian populasi tersebut dinamakan strata
atau lapisan, dan tidak boleh overlap, sehingga,
+
+ ...+
=N
dengan L = banyaknya strata. Untuk memperoleh manfaat, nilai
, h = 1,2,...,L
harus diketahui. Jika strata-strata sudah ditentukan, sebuah sampel diambil dari
masing-masing strata secara random dan independen gabungan dari seluruh
sampel yang diambil dari setiap strata disebut sampel random berstrata. Jadi, jika
adalah ukuran sampel dari strata ke-h, h =1,2,...,L dan n adalah ukuran sampel
random berstrata, maka
< n untuk setiap h,
dan
+
Nilai-nilai
+ ...+
=n
, h = 1,2,...,L disebut alokasi sampel.
Stratifikasi atau pembagian populasi menjadi sejumlah strata, adalah
sebuah teknik biasa, namun ada beberapa prinsip atau alasan mengapa hal tersebut
dilakukan. Alasan dimaksud antara lain :
1) Jika dalam estimasi diinginkan ketelitian atau keakuratan pada bagianbagian dari populasi, per lakukan bagian-bagian tersebut sebagai subpopulasi dan selanjutnya dipandang sebagai strata.
2) Administrasi yang baik dapat menarik manfaat dari stratifikasi. Sebagai
contoh sebuah pusat agensi dapat menggunakan kantor-kantor cabang
sebagai strata. Lebih konkritnya misalnya, hasil UNAS SMA di wilayah
sebuah kantor Diknas di kota K dapat menggunakan hasil UNAS semua
siswa di seluruh SMA di wilayah kota tersebut. Semua siswa peserta
UNAS di setiap SMA tersebut dipandang sebagai strata.
47
3) Masalah sampling
dapat berbeda diantara bagian-bagian populasi.
Perbedaan itu dapat berupa biaya per unit sampling, dapat pula berupa adat
atau kebiasaan responden. Sebuah survei yang berpusat di kota
Yogyakarta pada populasi rumah tangga yang tinggal di provinsi DIY,
biaya per unit sampling di kota Yogyakarta, dan 4 kabupaten lainnya,
Sleman, Bantul, Kulonprogo dan Gunung Kidul dapat berbeda. Responden
yang tinggal di rumah dinas mempunyai adat kebiasaan yang berbeda
dengan responden yang tinggal di rumah-rumah biasa.
5.2 Definisi dan Notasi
Misalkan N adalah ukuran populasi, dan
adalah ukuran strata ke-h, h =
1,2,3,...L. Unit-unit strata ke-h ditulis dengan lambang
strata ke-h dan mean strata ke-h ditulis
dan
,
,... ,
. Total
adalah,
=
Variansi strata ke-h, ditulis
adalah,
atau
Dalam sampling random berstrata berukuran n, misalkan
adalah alokasi sampel
pada strata ke-h. Mean dan variansi sampel dari strata ke-h ditulis
dan
adalah :
dan
48
atau
Nilai
5.3
disebut bobot strata dan
=
disebut fraksi sampel dari strata ke-h.
Sifat-Sifat Estimator Mean dan Total Serta Variansinya
Dalam sampling random berstrata, estimator untuk total populasi, Y, ditulis
dengan
adalah :
dan estimator untuk mean populasi,
, ditulis
atau
adalah :
Rumus-rumus estimator tersebut diperoleh dengan alasan sebagai berikut. Mean
sampel dari strata ke-h,
bias untuk
, adalah estimator tak bias untuk
. Karena Y =
tak bias untuk
. Variansi dari
, maka
, sehingga
tak
tak bias untuk Y dan selanjutnya
diberikan dalam teorema berikut.
Teorema 5.1
Dalam sampling random berstrata, variansi dari
adalah,
Bukti :
49
Karena
tak bias untuk
V( )
=
, maka menurut teorema 2.2 ,
= (1
)
dan karena sampel-sampel dari setiap strata independen, maka,
dari teorema 5.1 akan diperoleh variansi dari
V(
) = V(N ) =
V(
, yaitu,
)
Dalam kasus faktor koreksi, fpc, dapat diabaikan maka,
dan
Ada beberapa alokasi sampel yang mempunyai sifat tertentu yaitu alokasi
sama untuk setiap strata dan alokasi proporsional. Sampling random berstrata
dikatakan mempunyai alokasi sama, jika nilai
sama untuk semua h, dan
dikatakan mempunyai alokasi proporsional jika
sebanding dengan ukuran
strata. Jadi dalam alokasi sama,
Rumus variansi dari
=
dan dalam alokasi proporsional,
=
n.
dalam alokasi proporsional mempunyai bentuk
yang lebih sederhana yaitu,
50
Nilai
V(
) tidak bergantung pada n, tetapi bergantung pada alokasi
sampel. Meskipun ukuran sampel, n , sama, tetapi jika alokasinya berbeda akan
menghasilkan variansi yang berbeda. Sebuah pertanyaan yang menarik adalah,
jika n ditetapkan, alokasi manakah yang akan menghasilkan V(
) minimum?
Masalah ini akan dipelajari dalam pasal 5.5
5.4
Estimasi Variansi dan Batas-Batas Konfidensi
Dalam sampling random berstrata
estimator
dan
selalu dapat
dihitung nilainya, tetapi variansinya dalam terapan umumnya tidak dapat dihitung
karena memuat parameter
diperlukan estimasi untuk V(
yang tidak diketahui nilainya. Oleh karena itu
). Berdasarkan teorema 2.3, diperoleh bahwa
adalah estimator tak bias untuk
. Jadi estimator tak bias untuk V(
dan estimator tak bias untuk V(
) adalah,
) adalah,
Dalam terapan variansi dari estimator untuk mean dan variansi dari estimator
untuk total populasi dihitung dengan rumus-rumus yang terakhir ini.
Jika ukuran sampel, besar maka
dengan mean
(1
) untuk
dan variansi v(
akan berdistribusi mendekati normal
). Dari distribusi ini batas-batas konfidensi
adalah,
dan batas-batas konfidensi (1
) untuk Y adalah,
=
51
=
5.5
Alokasi Optimum
Dalam sampling random berstrata, misalkan ukuran sampel, n, ditetapkan
nilainya, alokasi manakah yang memberikan V(
) minimum? Alokasi seperti ini
disebut alokasi optimum pada n tetap.
Masalah yang lebih umum, misalkan biaya survei sampel dirumuskan
sebagai jumlah dari biaya pokok,
, dan jumlah biaya sampling dari seluruh
strata. Misalkan biaya per unit sampel dari strata h adalah
, h = 1,2,...,L, maka
biaya survei sampel semuanya adalah C, mempunyai rumus,
dengan
adalah alokasi sampel,
dan
diketahui nilainya. Akan dipelajari
dua masalah, yaitu,
(a) Jika biaya C ditetapkan, alokasi manakah yang meminimumkan V(
Alokasi seperti ini, yaitu alokasi yang meminimumkan V(
)?
) pada biaya C
yang ditetapkan disebut alokasi optimum pada C tetap.
(b) Jika V( ) ditetapkan sebesar V, alokasi manakah yang meminimumkan
biaya C? Hasilnya disebut alokasi optimum pada variansi tetap.
Masalah (a) dan (b) merupakan masalah ekstrem minimum fungsi L
variabel dengan sebuah kendala.
Dalam (a) dicari alokasi sampel,
, h =1,2,...L yang meminimumkan
dengan kendala,
52
Penyelesaian dapat menggunakan metode Lagrange. Dibentuk fungsi
Lagrange :
Syarat esktrim,
= 0, h =1,2,...,L dan
−
+
= 0, menghasilkan,
= 0 , h =1,2,...,L
(1)
dan
Dari (1) diperoleh penyelesaian untuk
=
,
=
=
Jumlahkan,
Jadi
=
. n=
(3)
Substitusikanlah (3) ke (2) menghasilkan,
Dengan penyelesaian untuk n,
53
n = (C
)
(4)
Substitusikan (4) ke (3) menghasilkan,
= (C
)
(5)
dengan syarat
Rumus alokasi (5) akan menghasilkan nilai minimum dari V(
dengan substitusi
pada (5) ke rumus V(
Dalam (b), dicari alokasi sampel,
), yang diperoleh
).
, h =1,2,...L yang meminimumkan,
dengan kendala,
V(
) V=0
Penyelesaiannya dapat dilakukan secara sama dan menghasilkan rumus alokasi,
=
(6)
dengan syarat
Nilai minimum biaya survei diperoleh dengan substitusi
dalam (6) ke
rumus C. Rumus alokasi (5) dan (6) menunjukkan bahwa semakin besar
semakin kecil
, alokasinya semakin besar. Pada keadaan khusus, jika
dan
=k,
suatu konstan untuk semua h, maka,
atau
n=
54
Dalam kasus ini alokasi optimum pada C tetap ekuivalen dengan alokasi optimum
pada n tetap. Rumus alokasi optimum pada n tetap adalah diperoleh dari (3),
.n
=
(7)
dengan nilai minimum variansi,
( )=
5.6
dengan syarat
Keakuratan Relatif Sampling Random Berstrata Terhadap Sampling
Random Sederhana
Rumus variansi dari estimator
nilainya akan kecil bilamana
, yaitu V(
) memperlihatkan bahwa
kecil untuk semua h. Hal ini berarti bahwa
sampling random berstrata akan memiliki keakuratan yang tinggi jika stratifikasi
yaitu pembagian populasi menjadi beberapa strata dapat menghasilkan stratastrata yang unitnya bersifat homogen. Pada populasi penghasilan per bulan, rumah
tangga di sebuah kecamatan misalnya, dengan mendefinisikan kelompokkelompok penghasilan rendah, sedang, tinggi sebagai strata-strata kiranya dapat
diharapkan sampling random berstrata akan menghasilkan keakuratan yang lebih
tinggi dari pada sampling random sederhana. Secara umum, perbandingan antara
sampling random sederhana dan sampling random berstrata pada ukuran sampel,
n, tetap, diberikan dalam teorema berikut.
Teorema 5.2
Jika
diabaikan, maka untuk n tetap,
Bukti :
= (1
=
f)
=
55
Perhatikan kesamaan berikut,
Jika
diabaikan, maka
juga diabaikan dan kesamaan tersebut menjadi,
Oleh karena itu,
Dari definisi jelas bahwa
jika
diabaikan. Dalam kasus ini,
Dengan
5.7
. Jadi terbukti bahwa
=
, yaitu rata-rata tertimbang dari
Alokasi yang Melampaui 100 %
Penghitungan alokasi optimum pada biaya, C, tetap maupun alokasi
optimum pada variansi, V, tetap dengan rumus-rumus yang telah diberikan di
muka ada kemungkinan menghasilkan nilai alokasi
>
, untuk suatu strata h.
Kondisi seperti ini dikatakan telah terjadi alokasi yang melampaui 100 %. Karena
tidak mungkin mengambil sampel yang ukurannya melampaui strata, maka untuk
56
strata tersebut diambil
=
, dan sisa unit ditambahkan alokasinya pada sampel
dari strata yang lain sebanding dengan bobot alokasinya.
Memperhatikan rumus alokasi optimum pada n tetap,
.n
=
tampak bahwa
sebanding dengan
. Ini berarti untuk
kecil dan
besar, berpotensi terjadi alokasi yang melampaui 100 %, untuk menghindari
penghitungan alokasi yang berulang, sebaiknya dihitung lebih dahulu alokasi
sampel pada strata tersebut. Setelah itu dihitung alokasi sampel yang berpotensi
pada urutan kedua melampaui 100 %, dan seterusnya. Sebagai contoh, dari L
strata, misalkan strata ke-3 adalah yang paling berpotensi memiliki alokasi yang
melampaui 100 %. Maka kita hitung dahulu alokasinya,
.n
=
Jika ternyata
>
, maka pada strata ke-3 ditetapkan alokasinya,
=
,
alokasi pada strata yang lain menjadi,
=(n
)
,
Selanjutnya misalkan strata ke-1 berpotensi pada urutan ke dua terjadi alokasi
melampaui 100 %, maka hitung dahulu alokasinya,
=(n
)
Jika
, maka teruskan penghitungan alokasi untuk strata yang lainnya.
Tetapi jika
>
, maka tetapkan alokasi pada strata ke-1,
pada strata yang lain,
=(n
,
)
=
dan alokasi
menjadi
,
,
57
5.8
Sampling Random Berstrata Untuk Proporsi
Misalkan sebuah populasi berukuran N terbagi menjadi L strata dengan
ukuran strata
, h =1,2,...L dan unit-unit populasi maupun strata diklasifikasikan
ke dalam kelas C atau
kelas C dan
. Misalkan A adalah banyaknya unit populasi yang masuk
adalah banyaknya unit strata ke-h yang masuk kelas C. Maka,
+
+...+
Selanjutnya misalkan P =
=
=A
, yaitu proporsi unit populasi yang masuk kelas C dan
, yaitu proporsi unit strata ke-h yang masuk kelas C. Akan dipelajari
estimator untuk P dan A beserta sifatnya.
Dalam sampling random berstrata berukuran n dengan alokasi
misalkan
,
adalah banyaknya unit sampel dari strata ke-h yang masuk kelas C,
dan misalkan
=
adalah proporsi unit sampel dari strata ke-h yang masuk
kelas C. Dari hasil-hasil yang diperoleh dalam Bab III, maka
tak bias untuk
V(
adalah estimator
, dengan variansi,
=
Selanjutnya
=
adalah estimator tak bias untuk
.
Jadi
adalah tak bias untuk A,
dan akhirnya,
adalah estimator tak bias untuk P, dengan variansi,
58
Variansi dari
adalah,
dalam kasus faktor koreksi, fpc , dapat diabaikan maka,
dan
Pada alokasi proporsional,
=
. n, variansi dari
mempunyai rumus,
Dalam hampir semua aplikasi, jika faktor koreksi, fpc, tidak diabaikan,
diabaikan, sehingga rumus yang lebih sederhana untuk V(
Dalam terapannya di dalam praktek, nilai V(
, akan
) adalah :
) tidak dapat dihitung.
Penghitungan variansi tersebut dilakukan melalui estimasinya, yang diperoleh
dengan substitusi
menggantikan
.
Jadi,
Alokasi optimum pada n tetap menghasilkan rumus alokasi,
59
=
dan alokasi optimum pada biaya C =
=
+
tetap dihitung dengan rumus,
.n
Soal-soal latihan :
1. Untuk mengestimasi mean IPK tahun pertama seluruh mahasiswa FMIPA,
diambil sampel random berstrata 20 orang mahasiswa dengan jurusan
Fisika, kimia, dan Matematika dipandang sebagai strata.
Diperoleh data IPK mereka sbb :
Jurusan Fisika : 2,85 ; 2,90 ; 3,45 ; 2,70 ; 3,10
Jurusan Kimia : 2,40 ; 2,25 ; 2,95 ; 2,10 ; 2,95 ; 3,25 ; 2,65
Jur. Matematika: 3,05 ; 2,15 ; 1,95 ; 2,85 ; 2,30 ; 2,80 ; 3,30 ; 2,00
Estimasikanlah mean IPK tahun pertama seluruh mahasiswa FMIPA, dan
hitunglah variansi dari estimasi ini. Diketahui total banyaknya mahasiswa
FMIPA jurusan Fisika, Kimia dan Matematika berturut-turut 600, 500, dan
700 orang.
2. Suatu survei dilakukan untuk mengestimasi proporsi pemirsa TV yang
paling menyenangi beberapa program/acara terpilih yaitu musik, olahraga,
kesenian tradisional, film kartun. Sampel yang diambil adalah sampel
random berstrata kelompok usia pemirsa, dengan alokasi
yang
diperkirakan proporsional. Diperoleh data program/acara yang paling
disenangi sbb :
Kelompok
Jumlah
Program/acara yang paling disenangi
Usia
responden
Musik Olahraga
< 12 th
400
50
20
Film
Kesenian
kartun
tradisional
250
80
60
12 sd 30 th
900
70
100
60
40
> 30 th
200
40
110
5
45
diketahui total banyaknya pemirsa TV 42 juta orang. Saudara diminta
mengestimasi dan menghitung kesalahan standarnya :
a)
proporsi pemirsa TV yang paling menyenangi acara musik
b)
proporsi pemirsa TV yang paling menyenangi bukan olahraga
c)
total banyaknya pemirsa TV yang paling menyenangi film kartun
atau kesenian tradisional
3. Sebuah kota mempunyai wilayah terdiri 7 buah kecamatan. Dengan
memperhatikan penduduk yang tinggal di setiap kecamatan sebagai strata,
diambil sampel random berstrata untuk mengestimasi :
a)
proporsi penduduk di kabupaten tsb yang usianya di atas 60 tahun
b)
total banyaknya penduduk di kabupaten tsb pada usia wajib belajar
(6 th – 15 th)
dari sampel yang diambil diperoleh data sbb :
Nomor kecamatan
1
2
3
4
5
6
7
Ukuran sampel
150
240
120
210
170
200
160
Usia 60 th
20
30
20
25
30
30
25
45
40
15
50
40
35
20
Usia
wajib
belajar
Jumlah penduduk di kecamatan 1,2,...7 berturut-turut : 2500, 4500, 2000,
4000, 3000, 3500, 2500.
Berikanlah hasil estimasi saudara tsb pada (a) dan (b) dan hitunglah
variansinya.
4. Sebuah populasi terbagi menjadi 3 strata dengan
Strata
1
600
2
9
2
300
3
16
61
3
100
10
Fungsi biaya, C = 500 +
25
. Dikehendaki V(
) = 0,05. Tentukanlah
alokasi sampel yang meminimumkan biaya C, dan hitunglah biaya
minimumnya.
5. Sebuah populasi terbagi 4 strata dengan ukuran strata 1,2,3 dan 4 berturutturut 500, 250, 150 dan 100 dan variansinya berturut-turut 1,4,16,36.
Dalam sampel random berstrata ditetapkan fungsi biaya,
C = 2.220 +
dengan
= 16,
= 25,
= 64
dan
= 144.
a)
Jika tersedia biaya C = 7500, tentukanlah alokasi sampel yang
meminimumkan variansi dari
dan hitunglah variansi minimum
tersebut.
b)
Jika dari ukuran sampel seperti tersebut pada (a), digunakan
alokasi proporsional, hitunglah variansi dari
.
62
BAB VI
ESTIMATOR RASIO
6.1
Metode Estimator Rasio Untuk Mean dan Total
Metode estimator rasio untuk mean,
pendukung
yang berhubungan dengan
populasi X dari
, dan total , Y, memerlukan variabel
, untuk setiap unit dalam sampel. Total
harus diketahui. Dalam praktek
sering kali merupakan nilai
pada beberapa waktu yang lalu ketika sensus lengkap dilakukan. Tujuan
metode ini adalah untuk memperoleh peningkatan hasil penelitian dengan
memanfaatkan hubungan antara
estimator untuk rasio, R, adalah
dan
= . Jadi estimator rasio untuk Y dan
.X,
Jika
adalah nilai
. Dalam sampling random sederhana,
adalah
= .
pada beberapa waktu yang lalu, metode estimator
rasio menggunakan sampel untuk memperkirakan perubahan relatif
terjadi sejak waktu itu. Estimasi perubahan relatif,
yang telah
dikalikan dengan total, X,
yang diketahui akan memberikan estimasi untuk total Y pada waktu sekarang.
Jika rasio
hampir sama untuk setiap unit sampel ( , ), nilai rasio
variasinya
kecil dari sampel yang satu dengan sampel yang lainnya, dan estimator rasio
untuk Y akan memiliki ketelitian yang tinggi. Dalam terapan lainnya,
merupakan luas daerah pertanian dan
dapat
adalah hasil pertanian. Estimator rasio
untuk total hasil pertanian, Y, maupun mean hasil pertanian per satuan luas lahan,
, ketelitiannya akan tinggi jika seluruh petani menunjukkan hasil yang hampir
sama dari persentase hasil pertanian terhadap luas lahan.
63
6.2
Pendekatan Variansi Dari Estimator Untuk Mean
Dalam pembahasan bab II, estimator rasio,
=
adalah bias untuk R,
namun jika sampel berukuran besar, maka estimator tersebut mendekati tak bias,
dengan variansi pendekatan yang diberikan dalam teorema 2.4. Untuk sampel
berukuran besar, variansi dari
diberikan dalam teorema berikut.
Teorema 6.1
Dalam sampling random sederhana, untuk sampel berukuran besar, variansi dari
adalah
Bukti diperoleh dari kesamaan V( ) =
Koefisien korelasi, , antara
dan
V( ) dan teorema 2.4.
dalam populasi didefnisikan :
Berdasarkan ini, bentuk lain dari V( ) untuk n besar adalah :
=
(
=
(
)
atau
dengan
)
yang disebut kovariansi antara
dan
dalam populasi.
Bentuk lain lagi,
64
=
=
)
dimana
,
adalah kuadrat dari koefisien variasi dari
dan
dan
adalah kovariansi relatifnya.
Variansi dari estimator rasio untuk total populasi adalah :
V( ) =
6.3
Estimasi Variansi Berdasarkan Sampel
Dalam terapan,
tidak dapat dihitung karena memuat parameter R
yang tidak diketahui. Sebagai estimator dari
adalah :
atau
atau
dengan
6.4
=
yaitu kovariansi antara
dan
dalam sampel.
Batas-Batas Konfidensi
Dalam estimator rasio, jika ukuran sampel, n , besar, maka
mendekati normal dengan mean
jika n
dan variansi v( ). Pendekatan ini cukup baik
30 dan koefisien variasi dari
konfidensi (
berdistribusi
dan
kurang dari 0,1. Batas-batas
) untuk Y adalah :
65
=
=
Batas-batas konfidensi (
=
=
6.5
+
) untuk Y adalah :
atau
=N
atau
=N
Perbandingan Estimator Rasio Dengan Mean Per Unit
Perbandingan antara estimator rasio dengan mean per unit dapat dilakukan
dengan membandingkan
dengan V( ). Hasilnya diberikan dalam teorema
berikut.
Teorema 6.2
Dalam sampling random sederhana berukuran besar, estimator rasio,
,
memiliki variansi yang lebih kecil dari estimator mean per unit, , jika
>
Bukti :
V( ) =
=
)
(
Jadi
< V( ) jika :
<
>
=
66
Dalam teori regresi, koefisien korelasi, , menunjukkan hubungan linear antara
dan
dalam populasi. Teorema 6.2 menerangkan bahwa estimator rasio,
lebih akurat daripada
jika :
1. Hubungan antara
dan
2. Variansi dari
6.6
,
membentuk pola garis lurus yang melalui origin.
disekitar garis tersebut adalah proporsional terhadap
.
Bias Dari Estimator Rasio
Secara umum, estimator rasio mempunyai faktor bias kira-kira sebesar .
Kesalahan standar dari estimator rasio mempunyai faktor
standar) juga mempunyai faktor sebesar
. Jadi (bias/kesalahan
dan menjadi tidak berarti jika n besar.
Hasil di atas ini dapat dijelaskan sebagai berikut.
Deret taylor dari
=
disekitar
adalah :
=
=
Jadi
=
=
+
Ekspetasi suku-suku di ruas kanan :
E
=0
67
=
=
=
Jadi bias dari
E(
=R
adalah :
)
=
Dari hasil ini terlihat bahwa estimator rasio mempunyai faktor bias kira-kira
sebesar
6.7
Jenis Estimator Rasio yang Tak Bias
Secara umum, metode untuk mendapatkan sebuah estimator yang tak bias
untuk parameter
dapat dilakukan dengan langkah sebagai berikut.
1. Pertama, tentukan sebuah estimator untuk
2. Dapatkan rumus untuk bias dari
, yaitu B(
3. Dapatkan estimator tak bias untuk B(
4. Maka estimator
sebagai estimator awal, ditulis
) = E(
), yaitu
yang didefinisikan dengan
.
)
). Jadi E(
=
)) =
)
) adalah tak bias
untuk .
Satu jenis estimator tak bias untuk R dikemukakan oleh Hartley dan Ross. Dalam
sampling random sederhana berukuran n, (
(
) didefinisikan
Selanjutnya
bias dari
=
=
); i=1,2,...n ; pada setiap unit
.
dipakai sebagai estimator awal untuk R. Akan dicari
yaitu B( ) = E( ) R. Perhatikan kesamaan :
=
68
) = (R E( )) =
=
(R – E( ))
Jadi
B( ) = E( ) – R =
Estimator tak bias untuk
adalah
=
Jadi estimator tak bias untuk B( ) adalah ( ) = –
Akhirnya diperoleh estimator tak bias untuk R, yang ditulis
, yaitu
= +
Dari hasil ini, diperoleh pula estimator tak bias untuk
dan Y, yaitu :
=
dan
=X
Sebuah estimator tak bias lainnya dikemukakan oleh Mickey. Dalam sampling
random sederhana ( ,
) ; i=1,2,...,n
didefinisikan :
=
, k=1,2,...,n
Selanjutnya dihitung
untuk R. Bias dari
=
, dan digunakan sebagai estimator awal
yaitu : B( ) = E(
memiliki estimator tak bias :
R)
( )= –
Jadi estimator tak bias untuk R adalah :
Selanjutnya estimator tak bias untuk
=
+
dan Y adalah :
=
dan
=X
69
6.8
Estimator Rasio Dalam Sampling Random Berstrara.
Dalam sampling random berstrata, terdapat dua cara untuk memperoleh
estimator rasio untuk mean populasi, yaitu cara terpisah dan cara kombinasi. Cara
terpisah dilakukan melalui estimasi total strata,
, terpisah bagi setiap strata,
estimasi total populasi, Y, dan akhirnya estimasi mean populasi, .
Estimator untuk
adalah :
=
=
Estimator untuk Y =
adalah :
=
Akhirnya estimator untuk
adalah :
=
Dalam lambang
dan
, s berarti separated atau terpisah.
Dalam rumus estimator tersebut, jelas bahwa pengetahuan tentang
atau
untuk semua h sangat diperlukan. Jika tidak demikian, maka etimator dengan cara
terpisah tidak dapat dilakukan. Sebagai contoh misalnya hanya diketahui total
populasi dari
yaitu X atau meannya,
, tetapi
maupun
tidak diketahui.
Maka cara terpisah tidak dapat digunakan. Pada kasus yang terakhir ini, hanya
cara kombinasi yang dapat digunakan. Pada cara kombinasi, pertama dihitung
dan
. Kemudian R diestimasi dengan
Akhirnya estimator untuk
=
=
adalah :
=
dan estimator untuk Y adalah :
=
Dalam lambang
Variansi dari
X=N
dan
, c berarti combined atau kombinasi.
dan variansi dari
diberikan dalam teorema berikut.
70
Teorema 6.3
Dalam sampling random berstrata, jika
V(
besar pada setiap strata, maka
)=
Bukti teorema 6.3 diperoleh langsung dari teorema 6.1 dengan memperhatikan
bahwa sampel-sampel dari strata bersifat independen.
Teorema 6.4
Dalam sampling random berstrata, jika n besar maka :
V(
)=
Bukti menggunakan argumen yang sama seperti dalam bukti teorema 2.4
=
R =
(
-R
)
(
Dengan memperhatikan
Jadi V(
) = V(
-R
maka
).
=
-R
) dan
= 0.
)=
=
=
Perbedaan rumus variansi, V(
) dan V(
Dalam terapan, penghitungan variansi dari
) terletak pada faktor
dan
dan R.
dihitung melalui rumus
estimasinya, yaitu :
v(
)=
dengan syarat
dan v(
besar untuk semua h,
)=
dengan syarat n besar.
71
Soal-soal latihan :
1.
Dari sampel random sederhana yang terdiri 10 rumah tangga (rt) diketahui
penghasilan per bulan dan biaya hidup per bulan sbb (dalam ribuan rupiah)
Penghasilan
1.750
2.550
1.100
1.800
3.450
2.900
3.550
2.450
2.100
1.500
Biaya hidup
1.600
2.200
1.050
1.500
2.850
2.250
3.100
2.100
1.650
1.350
Estimasikanlah mean biaya hidup per bulan seluruh rumah tangga dalam
populasi dengan metode :
a. mean per unit
b. estimator rasio
c. menggunakan estiomator
=
, jika diketahui mean
penghasilan seluruh rt populasi Rp. 2.350.000,2.
Dari sampel random sederhana 33 keluarga berpenghasilan rendah dicatat
data banyaknya anggota keluarga ( ) , dan besarnya belanja keluarga
dalam sebulan ( ) dan diketahui
= 123,
(
= 9072,
= 533 ,
= 2822412,
= 35955
dinyatakan dalam ribuan rupiah)
Diketahui populasi keluarga berpenghasilan rendah ada 400 keluarga,
dengan total banyaknya anggota keluarga 1522 orang.
Estimasikanlah mean besarnya belanja keluarga dalam sebulan dengan
menggunakan estimator :
a. mean per unit
b. estimator rasio
dan hitunglah juga kesalahan standar dari masing-masing estimasi
tersebut.
3.
Sampel random sederhana terdiri 10 orang karyawan yang diambil dari
populasi 175 orang karyawan sebuah perusahaan, diketahui nilai kerja
sebelum pelatihan,
, dan setelah pelatihan,
, sebagai berikut :
72
60
68
72
75
82
58
71
64
67
73
65
74
80
81
90
64
76
66
72
82
Diketahui mean nilai kerja seluruh karyawan perusahaan tersebut sebelum
pelatihan 73.
Berikanlah tiga buah nilai estimasi mean nilai kerja seluruh karyawan
perusahaan tersebut setelah mengikuti pelatihan.
4.
Dari populasi 1.000 orang wisudawan yang terdiri 400 orang program
studi PSI, 250 orang PS2 dan 350 orang PS3 diambil sampel random
berstrata dengan memperhatikan program studi sebagai strata. Diperoleh
data indeks prestasi dua tahun pertama ( ) dan indeks prestasi saat lulus
( ) sbb :
PS 1
PS 2
PS 3
3,2
3,6
2,8
3,0
2,7
3,1
2,4
2,7
2,9
3,4
2,8
3,4
2,5
3,1
3,1
3,7
2,8
3,6
2,7
3,4
2,6
3,1
2,7
2,9
2,8
3,3
2,4
2,5
2,3
2,7
2,5
2,9
2,9
3,6
3,2
3,7
3,0
3,4
3,1
3,5
2,8
3,1
2,0
2,6
2,9
3,3
Diketahui mean IP 2 tahun pertama seluruh lulusan dari PS 1, PS 2 dan PS
3 berturut-turut 2,7 : 2,8 : 2,9.
Berikanlah tiga buah nilai estimasi mean IP seluruh lulusan ketiga
program studi tersebut dengan menggunakan estimator : mean per unit,
rasio terpisah dan rasio kombinasi.
73
BAB VII
ESTIMATOR REGRESI
7.1
Metode Estimasi Regresi Linear
Seperti pada estimator rasio, estimator regresi linear dirancang untuk
meningkatkan ketelitian dalam estimasi, dengan memanfaatkan hubungan antara
variabel tambahan
yang berkorelasi dengan
Jika hubungan antara
dan
.
mendekati linear, meskipun tidak melalui titik
origin maka estimator yang didasarkan regresi linear
pada
lebih baik
daripada estimator rasio.
Dalam sampel random sederhana berukuran n, ( ,
linear untuk mean populasi,
), estimator regresi
,didefinisikan :
=
+b( -
)
dengan lambang lr menyatakan regresi linear dan b adalah koefisien regresi.
Estimator regresi dapat dipandang sebagai keadaan umum dari estimator mean per
unit maupun estimator rasio dan sebaliknya estimator mean per unit dan estimator
rasio merupakan keadaan khusus dari estimator regresi linear. Hal ini dapat
dilihat, untuk b = 0, maka
maka
=
+
( -
)=
=
dan untuk b =
=
,
.
Oleh karena itu dengan pemilihan b yang sesuai diharapkan menghasilkan
estimator dengan variansi yang lebih kecil.
7.2
Estimator Regresi dengan b Tertentu
Dalam estimator regresi linear, jika b nilainya ditentukan lebih dahulu,
misalnya b =
, suatu konstan, maka estimator regresi linear bersifat tak bias
dengan variansi seperti yang diberikan dalam teorema berikut.
74
Teorema 7.1
Dalam sampel random sederhana, jika
adalah konstan yang ditentukan lebih
dahulu, maka estimator regresi linear
=
+
( -
) tak bias untuk ,
dengan variansi :
=
Bukti :
Karena
E(
konstan, maka
) = E( +
( -
Selanjutnya ,
)) = E( ) +
E( - ) =
adalah mean sampel dari
+0= .
+
(
) dengan mean
populasinya . Oleh karena itu menurut teorema 2.2,
=
Dari teorema 7.1 ini diperoleh estimasi tak bias untuk V(
v(
)=
Dari hasil pada teorema 7.1 munculah pertanyaan, nilai
memberikan V(
), yaitu
manakah yang akan
) minimum? Jawabannya diberikan dalam teorema berikut.
Teorema 7.2
Nilai
yang meminimumkan V(
) adalah
dengan variansi minimumnya
Vmin(
)=
)
75
Bukti :
V(
) adalah fungsi kuadrat dari variabel
Jadi V(
dari V(
Vmin(
, dengan koefisien dari
) minimum untuk
adalah
. Kemudian nilai minimum
) adalah
) =
– 2(
(
=
=
7.3
)
Estimator regresi dengan b dihitung dari sampel.
Teorema 7.2 menyarankan bahwa jika b harus dihitung dari sampel, maka
b=
yang tidak lain adalah estimator kuadrat terkecil untuk B. Dengan nilai b tersebut.
Estimator regresi linear untuk
menjadi
+b(
Sama halnya seperti pada estimator rasio,
dihitung dari sampel,
karena b bukan konstan, tetapi
bersifat bias dengan bias mengandung faktor
Meskipun demikian, bila n besar, maka
.
mendekati tak bias dengan variansi
seperti yang diberikan dalam teorema berikut.
Teorema 7.3
Jika b adalah estimator kuadrat terkecil untuk B, yaitu b =
besar
+b(
mendekati tak bias untuk
, maka untuk n
dengan
76
.
V(
)=
) dengan
7.4
Estimasi variansi dari sampel
Pada kasus n besar, nilai V(
) yang rumus pendekatannya diberikan dalam
teorema 7.3 dalam praktek tidak dapat dihitung karena memuat parameter
dan
Diperlukan estimasi untuk V(
).
Misalkan
e i = yi –
– B(xi –
)
maka
=
)
Dalam sampling random sederhana berukuran n, menurut teorema 2.3,
adalah tak bias untuk
.
B(
=(
b(
dengan mengabaikan suku ke-2 ruas kanan, dapat dipakai
sebagai estimator untuk
(
namun bersifat bias. Dalam teori regresi, pembagi
digunakan sebagai pengganti
bias untuk
dengan b =
agar memberikan hasil yang tak
. Jadi estimator tak bias untuk
adalah :
,
dan oleh karena itu estimator untuk V(
) adalah :
77
atau dengan rumus lain
v(
7.5
) =
Perbandingan Estimator
dan
dengan Sampel Berukuran
Besar
Perbandingan antara tiga buah estimator untuk mean populasi,
estimator mean per unit,
estimator rasio,
, yaitu
, dan estimator regresi linear,
,
dapat dilakukan melalui pendekatan variansinya.
V( ) =
(mean per unit)
V( ) =
V(
(
)=
)
)
(Rasio)
(Regresi)
Jelas bahwa variansi estimator regresi lebih kecil daripada variansi mean per unit,
kecuali
. Variansi estimator regresi akan lebih kecil daripada variansi
estimator rasio jika
atau
>0
atau
> 0 , dengan
B=
Jadi estimator regresi lebih teliti atau lebih akurat daripada estimator rasio, kecuali
jika
.
78
7.6
Estimator Regresi Dalam Sampling Random Berstata
Sama seperti dalam estimator rasio, terdapat dua jenis estimator regresi
dalam sampling random berstata, yaitu estimator dengan cara terpisah dan cara
kombinasi.
Dengan cara terpisah, estimator untuk mean strata ke-h adalah
+ bk (
Maka estimator untuk total populasi adalah
dan estimator untuk mean populasi adalah
Dalam kasus bh ditentukan lebih dahulu untuk setiap h, variansi dari
diperoleh berdasarkan teorema 7.1, yaitu :
Selanjutnya, menurut teorema 7.2, V (
) minimum jika
=
dengan nilai minimum.
Estimator kedua, dengan cara kombinasi,
+ b(
Dalam kasus b ditentukan lebih dahulu, estimator tersebut bersifat tak bias dengan
variansi
Nilai b yang meminimumkan variansi adalah
=
79
Nilai
adalah mean tertimbang atau terbobot dari koefisien regresi strata,
=
. Jika
, maka
=
= (Σ
Σ
.
Soal-soal latihan :
1. Dari sampel random sederhana yang terdiri 10 rumah tangga (rt) diketahui
penghasilan per bulan dan biaya hidup per bulan sbb (dalam ribuan rupiah)
Penghasilan
1.750
2.550
1.100
1.800
3.450
2.900
3.550
2.450
2.100
1.500
Biaya
1.600
2.200
1.050
1.500
2.850
2.250
3.100
2.100
1.650
1.350
Hidup
Estimasikanlah mean biaya hidup per bulan seluruh rumah tangga dalam
populasi dengan metode regresi linear, jika diketahui mean penghasilan seluruh
rt populasi Rp. 2.350.000,2. Sampel random sederhana berukuran 6 diperoleh data
sbb : (3,28),
(7,55), (6,40), (2,17), (5,40), (6,48). Jika ukuran populasi 300 dan diketahui
= 2,25 ,
= 198 dan
serta
4,75.
a) Tentukanlah estimator regresi linear bagi .
b) Hitunglah
.
Dari data soal tersebut, tentukanlah pula
c) Nilai estimasi
bagi rasio R.
d) Nilai estimasi bagi
melalui
.
3. Dari sampel random sederhana 33 keluarga berpenghasilan rendah dicatat data
banyaknya anggota keluarga ( ) dan besarnya belanja keluarga dalam sebulan
( ) dan diketahui
= 35955. (
= 123,
= 9072,
= 533,
= 2822412,
dinyatakan dalam ribuan rupiah ).
Diketahui populasi keluarga berpenghasilan rendah ada 400 keluarga, dengan
total banyaknya anggota keluarga 1522 orang. Estimasikanlah mean besarnya
belanja keluarga dalam sebulan dengan menggunakan estimator regresi linear
dan hitunglah kesalahan standar dalam estimasi tersebut.
80
4. Sampel random sederhana terdiri 10 orang karyawan yang diambil dari
populasi 175 orang karyawan sebuah perusahaan, diketahui nilai kerja sebelum
60
68
72
75
82
58
71
64
67
73
65
74
80
81
90
64
76
66
72
82
pelatihan,
, dan setelah pelatihan,
, sebagai berikut
Diketahui mean nilai kerja seluruh karyawan perusahaan tersebut sebelum
pelatihan 73.
Berikanlah estimasi regresi linear untuk mean nilai kerja seluruh karyawan
perusahaan tersebut setelah mengikuti pelatihan dan hitunglah pula kesalahan
standarnya.
5. Dari data soal latihan nomor 4 bab VI, berikanlah estimasi regresi linear secara
terpisah dan secara kombinasi untuk mean IP seluruh lulusan dari ketiga
program studi tersebut.
81
BAB VIII
SAMPLING SISTEMATIK
8.1 Pengambilan Sampel Sistematik
Ditentukan sebuah populasi berukuran N. Untuk mengambil sampel
sistematik, mula-mula N unit populasi diberi nomor 1 sampai dengan N.
Kemudian secara random diambil sebuah unit dari k unit pertama,
Misalkan terambil unit
,
, ...,
.
. Maka unit-unit populasi yang bernomor j, j+k, j+2k,...
dan seterusnya menjadi unit sampel. Sampel yang diperoleh ditentukan oleh
hasil/pengambilan sebuah unit, dari k unit pertama dan sampel tersebut
dinamakan sampel sistematik 1 unit setiap k atau disingkat sampel sistematik
setiap k. Sebagai contoh, dari populasi berukuran 23 akan diambil sampel
sistematik setiap 5. Langkah pertama, diambil secara random satu unit diantara 5
unit pertama,
,
,
,
,
. Misalkan terambil unit
, maka unit-unit
populasi yang masuk sebagai unit sampel adalah
dan sampel
yang diperoleh berukuran 5. Jika pada pengambilan tersebut diperoleh hasil
maka sampel yang didapat beranggotakan unit-unit
dan
,
, dan
ukurannya adalah 4. Dalam contoh ini ada 5 buah sampel yang mungkin diperoleh
yang terdiri 3 buah sampel masing-masing berukuran 5 dan 2 buah sampel
masing-masing berukuran 4. Setiap sampel dari 5 buah sampel tersebut diperoleh
dengan probabilitas yang sama yaitu .
Daftar sampel beserta nomor unit-unit anggotanya sebagai berikut :
Daftar sampel-sampel sistematik setiap 5 yang diambil dari populasi
berukuran 23.
Nomor sampel
Nomor Unit
1
2
3
4
5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
82
16
17
18
21
22
23
19
20
dalam contoh ini, N bukan kelipatan k, sehingga ukuran sampel-sampel yang
mungkin terambil, tidak seluruhnya sama. Jika n kelipatan k, yaitu N = kn, maka
ada k buah sampel yang mungkin terambil dan masing-masing sampel berukuran
n.
Perbandingan antara sampel sistematik setiap k dengan sampel random
berstrata dapat dilakukan dengan memandang k unit pertama sebagai strata 1, k
unit kedua sebagai strata 2, k unit ketiga sebagai strata 3 dan seterusnya.
Selanjutnya sampel random berstrata diambil dengan alokasi satu unit sretiap
strata. Maka nomor unit-unit sampel sistematik dan nomor unit-unit sampel
random berstrata dapat digambarkan sebagai berikut.
x
x
k
o
x
2k
x
o
3k
4k
x = nomor unit sampel sistematik
= nomor unit sampel random berstrata
Jarak titik nomor berurutan dari unit sampel sistematik sama, yaitu = k; tetapi
jarak titik nomor berurutan dari unit sampel random berstrata tidak selalu sama.
Dalam pembahasan selanjutnya, kita akan membatasi diri dalam kasus N
kelipatan k, yaitu N = kn, sehingga masing-masing sampel yang mungkin terambil
mempunyai ukuran yang sama, yaitu n.
8.2 Variansi Dari Estimator Mean
Ditentukan sebuah populasi berukuran N dan misalkan
adalah mean
populasi tersebut. Dalam sampling sistematik setiap k, misalkan
adalah mean
sampel sistematik, maka
bersifat tak bias untuk
yang ditunjukkan sebagai
berikut. Ada k buah sampel yang mungkin terambil, masing-masing berukuran n
dan terambil dengan probabilitas . Misalkan
sampel ke – i, j = 1,2,...n , i = 1,2,...k, dan misalkan
adalah unit ke – j di dalam
adalah mean sampel ke – i.
Maka
83
Jadi
tak bias untuk .
Variansi dari
diberikan dalamn teorema berikut ini.
Teorema 8.1
Untuk N = kn, mean sampel sistematik setiap k,
, tak bias untuk
dengan
variansi
V(
)=
dengan
adalah variansi (rata-rata variansi) antara unit-unit yang terletak di dalam
sampel sistematik yang sama.
Bukti
Dengan menggunakan kesamaan umum yang diperoleh dalam analisis variansi.
Menurut definisi,
Jadi
dan
84
V(
)=
8.3 Efisiensi Sampling Sistematik Terhadap Sampling Random Sederhana
Perbandingan estimator
dengan
dapat diperoleh dari teorema 8.1.
Sebagai akibat dari teorema 8.1, mean sampel sistematik memiliki presisi yang
lebih tinggi daripada mean sampel random sederhana jika hanya jika
>
Bukti
Dalam sampling random sederhana berukuran n, variansi dari estimator mean,
.
V( ) =
Dari teorema 8.1, V(
) < V( ) jika dan hanya jika
, yaitu jika k(n-1)
> ( N-1 -
)
= k(n-1)
<
atau
>
.
Interpretasi dari hasil ini adalah bahwa sampel sistematik lebih teliti atau
presisinya lebih tinggi daripada sampel random sederhana jika variansi didalam
sampel-sampel sistematik lebih besar daripada variansi populasi, yaitu jika unitunit di dalam setiaps sampel bersifat heterogen.
Teorema 8.2
V(
)=
Dengan
,
adalah koefisien korelasi antara pasangan unit-unit yang berada dalam
sampel sistematik yang sama, dengan rumus
Penjelasan : Pada faktor pembilang,
terdapat sebanyak
(n)(n-1)/2 pasang unit-unit dalam sampel yang sama, dan banyaknya sampel
adalah k. Jadi mean (rata-rata) faktor pembilang diambil meliputi seluruh
85
k(n)(n-1)/2 pasangan unit-unit. Sementara faktor penyebut,
(N-1)
/N sehingga diperoleh
=
dengan rumus di atas.
Bukti
Dari definisi,
Jadi
sehingga
V(
)=
.
Teorema 8.2 menunjukkan bahwa korelasi positif antara unit-unit dalam
sampel yang sama akan menaikkan variansi dari
.
8.4 Perbandingan Sampling Sistematik Dengan Sampling Random Berstrata
Teorema 8.1 dan teorema 8.2 menjelaskan V(
oleh karena itu diperoleh hubunga antara
) dinyatakan dalam
, yang
dengan , mana yang presisinya
lebih tinggi guna mengestimasi
Perbandingan antara
dengan
dalam estimasi
, dilakukan dengan
memandang k unit pertama populasi sebagai strata 1, k unit kedua sebagai strata
2, dan seterusnya. Jadi terdapat n strata yang masing-masing berukuran k.
86
Sampling random berstrata berukuran n dilakukan dengan alokasi 1 unit setiap
strata. Perbandingan antara
dengan
diperoleh melalui teorema berikut.
Teorema 8.3
V(
)=
dengan
adalah variansi (rata-rata variansi) dari unit-unit yang terletak dalam strata
yang sama.
adalah korelasi antara simpangan terhadap mean strata dari
pasangan unit-unit dalam sampel yang sama, yang dirumuskan dengan
Bukti teorema 8.3 dapat dilakukan secara sama seperti pada bukti teorema 8.2.
Disisi lain, variansi estiamator
V(
hasilnya adalah
)=
Jadi,
dan
mempunyai presisi yang sama jika dan hanya jika
Jika
> 0, maka
maka
presisinya lebih tinggi daripada
8.5
presisinya lebih tinggi daripada
.
, dan jika
.
Sampling Sistematik Untuk Proporsi
Proporsi unit-unit populasi yang masuk kelas C dari sebuah populasi dapat
dipandang sebagai mean populasi yang nilai unit-unitnya 1 atau 0. Hal ini telah
dijelaskan dalam pasal 3.2. Jika P adalah proporsi unit-unit populasi yang masuk
kelas C dan
maka
adalah proporsi unit-unit sampel sistematik yang masuk kelas C,
tak bias untuk P dan variansinya adalah
87
V(
dengan
)=E
=
adalah proporsi unit-unit yang masuk kelas C dalam sampel sistematik
ke-i. Dari teorema 8.1 dapat diperoleh rumus lain untuk V(
), yaitu
Soal-soal latihan.
1. Dari populasi dalam contoh 1 dengan trend naik (susunan II), bandingkanlah
estimator
dengan
. Sebagai estimator untuk
, manakah yang
presisinya lebih tinggi?
2. Sebuah populasi berupa biaya hidup sebulan dari 15 keluarga, sbb (dalam
ratusan ribu rupiah).
,
,
Diambil sampel sistematik setiap 3 keluarga dan misalkan
adalah mean
biaya hidup sebulan dari sampel tersebut.
a) Hitunglah V(
)
b) Hitunglah pula V( ) dalam sampel random sederhana berukuran 5
dari populasi tersebut. Dari dua jenis sampel tersebut, jenis manakah
yang Sdr, sarankan untuk digunakan dalam estimasi populasi mean,
3. Diperhatikan sampel sistematik setiap 10 halaman dari sebuah buku yang
memuat 80 halaman untuk mengestimasi mean banyaknya salah cetak tiap
halaman. Dari 10 buah sampel yang mungkin terambil diketahui variansi
masing-masing sbb :
Jika variansi banyaknya salah cetak per halaman buku tersebut
, hitunglah
variansi dari estimator mean.
88
4. Sebuah populasi berukuran 15 unit dengan nilai
sampai
berturut-turut
sbb :
3, 5, 6, 20, 22, 23, 11, 13, 14, 7, 9, 10, 28, 30, 31.
Bandingkanlah tiga buah estimator untuk mean berikut ini :
a) Mean per unit, , dalam sampel random sederhana berukuran 5.
b) Sampel sistematik setiap 3 unit,
c) Mean sampel random berstrata dengan satu unit setiap strata,
.
Hitunglah masing-masing variansi dari ketiga estimator tersebut. Estimamator
manakah yang presisinya tertinggi?
5. Sebuah buku terdiri 30 halaman. Banyaknya salah cetak pada halaman 1
sampai 30 berturut-turut : 1, 2, 0, 0, 3, 2, 2, 0, 0, 1, 1, 0, 3, 1, 1, 2, 3, 0, 0, 0, 2,
0, 1, 0, 0, 0, 1, 1, 3, 2. Diperhatikan dua macam sampel, yaitu sampel random
sederhana berukuran 10 dan sampel sistematik tiap 3 halaman, untuk
mengestimasi mean banyaknya salah cetak per halaman. Estimator manakah
yang presisinya lebih tinggi? Mengapa demikian?
89
DAFTAR PUSTAKA
1. Cochran, W.G, 1977, Sampling Techniques, John Wiley and Sons, third edition.
2. Jessen, R.J, 1978, Statistical Survey Techniques, John Wiley and Sons.
3. Yamane, Taro., 1967, Elementary Sampling Theory, Prentice Hall.
90
Download