BAB I PENDAHULUAN 1.1 Kegunaan Metode Sampling Pengambilan sampel dari suatu survei telah menjadi sesuatu yang besar kegunaannya dalam kehidupan. Sebuah sampel terdiri sejumlah bola lampu dalam satu periode waktu produksi dapat memberikan gambaran kualitas dari seluruh bola lampu yang diproduksi dalam periode waktu tersebut. Tingkat sosial ekonomi keluarga atau rumah tangga dari sejumlah keluarga yang diambil dari seluruh keluarga yang tinggal di sebuah kota dapat menggambarkan tingkat sosial ekonomi seluruh keluarga yang tinggal di kota tersebut. Sebuah jajak pendapat terhadap sejumlah calon pemilih pada Pilkada disuatu kabupaten dapat memberikan ramalan siapa calon kepala daerah yang akan terpilih pada Pilkada yang akan datang. Gambaran atau ramalan seperti tersebut diatas akan sangat bermanfaat bagi setiap yang berkompeten untuk mengambil sikap atau tindakan sesuai dengan kepentingannya. Dalam survei sampel, sampel diambil dari populasi, kemudian dihitung nilai statistik guna menarik inferensi tentang parameter populasi. Pemilihan jenis sampel yang sesuai serta metode estimasi yang tepat akan memberikan hasil yang optimum dengan keakuratan yang tinggi. Keuntungan atau manfaat penggunaan metode survei sampel adalah antara lain, mengurangi biaya, memberikan kecepatan yang lebih besar, cakupan lebih besar, dan tingkat ketelitian sesuai dengan yang diinginkan. 1.2 Tahap-Tahap dalam Survei Sampel Tahapan-tahapan yang perlu dilakukan daalam sebuah survei sampel ada 11 tahap, yaitu : 1. Tujuan survei. Merupakan pernyataan yang jelas tentang maksud dan tujuan survei. Tanpa tujuan yang jelas, keputusan yang dapat diambil akan melenceng dengan tujuannya. 1 2. Populasi yang akan diambil sampelnya. Populasi adalah himpunan seluruh obyek penelitian yang mengandung paramater-parameter yang akan dicari. Sampel adalah himpunan bagian dari populasi tersebut. Dari sampel yang diambil, ditetapkan statistikstatistik estimator untuk parameter-parameter tersebut. 3. Data yang dikumpulkan. Data atau informasi yang dikumpulkan harus sesuai dengan tujuan survei. 4. Tingkat ketelitian yang diinginkan. Kesimpulan dalam estimasi selalu mengandung ketidakpastian yang dapat diukur dengan probabilitas. Kesalahan dalam estimasi dengan probabilitas tertentu dapat diperkecil dengan memperbesar sampel. 5. Metode pengukuran. Suatu survei dapat dilaksanakan dengan menggunakan kuesioner disertai wawancara atau dikirimkan lewat media komunikasi kepada responden, seperti pos atau telepon. Selanjutnya dari isian kuesioner yang masuk kembali disusun ringkasan dalam bentuk tabel-tabel. 6. Kerangka atau frame. Sebelum pengambilan sampel, populasi dibagi dalam bagian-bagian yang disebut unit pengambilan sampel atau unit. Dalam pengambilan sampel penduduk sebuah kota, unit dapat berupa orang, atau berupa keluarga, atau berupa semua penduduk yang tinggal di tiap rukun tetangga. Daftar unit pengambilan sampel ini disebut kerangka. 7. Pemilihan sampel. Perlu ditetapkan jenis sampel yang akan diambil, sesuai dengan keadaan, serta ukuran sampel yang disesuaikan dengan tingkat ketelitian. 8. Uji pendahuluan. Perlu sekali dilakukan uji coba terhadap kuesioner dalam lingkup yang lebih kecil, guna mendeteksi kemungkinana adanya kesulitan responden dalam jawabannya. 2 9. Organisasi lapangan. Perlu antisipasi masalah-masalah administrasi dan pelatihan terhadap tenaga-tenaga pencacah. 10. Ringkasan dan analisis data. Dari jawaban kuesioner, perlu dilakukan editing untuk menghindari salah catat atau kesalahan lainnya. Perlu diputuskan prosedur pengisian atau penghitungan apabila jawaban untuk pertanyaan tertentu tidak diisi oleh beberapa responden. 11. Keterangan yang bermanfaat untuk survei mendatang. Semakin banyak informasi yang dapat dikumpulkan akan semakin mudah memperoleh sampel yang memberikan perkiraan yang akurat. Setiap sampel yang lengkap merupakan petunjuk yang baik untuk perbaikan pengambilan sampel yang akan datang. Pengambilan sampel membutuhkan perhatian pada seluruh tahap tersebut, karena pelaksanaan yang buruk pada tahap tertentu dapat menyebabkan gagalnya suatu survei. Teori pengambilan sampel mencoba mengembangkan jenis sampel dan metode estimasi atau perkiraan dengan tujuan memperoleh hasil yang efisien, biaya yang lebih kecil namun keakuratannya tinggi. Jenis-jenis sanpel yang dikembangkan adalah sampel-sampel yang diambil dengan kaidah probabilitas. 1.3 Sifat-Sifat Baik Untuk Sebuah Estimator Misalkan sebuah populasi mempunyai parameter diambil dari populasi tersebut misalkan . Dari sampel yang suatu statistik estimator untuk . Selanjutnya misalkan seluruhnya terdapat K sampel-sampel yang mungkin terambil dari populasi tersebut dan masing-masing akan terambil dengan probabilitas . Maka mean atau ekspektasi atau nilai harapan dari adalah : 3 dengan adalah nilai Variansi dari pada sampel ke-k. didefinisikan dengan : Rata-rata kuadrat kesalahan dari didefinisikan dengan dikatakan tak bias untuk parameter ⊝ jika E( Statistik estimator dikatakan konsisten untuk ⊝ jika ) = ⊝, sama dengan ⊝ pada sampel yang berhimpitan dengan populasi dan dikatakan efisien jika V( ) adalah terkecil diantara semua estimator untuk ⊝. Sifat-sifat tak bias, konsisten dan efisien adalah sifat-sifat baik yang mungkin dimiliki oleh sebuah estimator. Dengan sifat-sifat tersebut keakuratan yang tinggi dari sebuah estimator dapat diperoleh. Jika E( ) = ⊝, dan ini berakibat RKK( ) = V( E( ) ⊝, dan RKK ( ) V( tak bias untuk ⊝, maka ). Tetapi jika bias untuk ⊝, maka ). Deviasi standar dari , ditulis , didefinisikan sebagai akar dari , ditulis S( ) adalah akar dari RKK( ). variansinya. Kesalahan standar dari Jadi = dalam kasus , S( ) = tak bias untuk ⊝ maka = S( ) 4 1.4 Bias dan Pengaruhnya. untuk ⊝, ditulis B( Bias dari suatu estimator B( Jika m = E( ) dan ) = E( ), didefinisikan dengan ) ⊝ tak bias untuk ⊝, maka m = ⊝, dan B( bias untuk ⊝, maka m ⊝ dan B( )=m ) = 0. Tetapi jika ⊝ 0 Untuk sampel berukuran besar, distribusi dari statistik estimator mendekati normal dengan mean E( ) dan variansi V( ). Pada kasus akan tak bias untuk ⊝, maka E( ) = ⊝ dan P( Tetapi pada kasus P( ⊝ 1,96 + 1,96 ) = 0,95 bias untuk ⊝, maka E( )= m 1,96 m ⊝ dan + 1,96 ) = 0,95 Kedua grafik distribusi tersebut pada kasus tak bias dan kasus bias adalah sebagai berikut, 1,96 1,96 Kasus tak bias untuk ⊝ 0,95 (Gambar 1) 0,025 0,025 ⊝ Kasus bias untuk ⊝ dengan E( ) = m>⊝ (Gambar 2) ⊝ m Jika kesalahan dalam estimasi ⊝ didefinisikan sebagai nilai mutlak dari selisih dengan ⊝, yaitu | ⊝|, maka pada kasus tak bias, 5 P (| ⊝| >1,96 ) = 0,05 ( daerah diarsir dalam gambar 1), dan pada kasus bias untuk ⊝dengan E( nilai P (| ⊝| > 1,96 contoh, untuk B( P (| ) = m > ⊝, ⊝| > 1,96 )=m ) >0,05 (daerah diarsir dalam gambar 2). Sebagai ⊝ = (0,1) , maka ⊝ < 1,96 ) = P( = P( ) + P( < 2,06) + P( ⊝ > 1,96 ) > 1,86) = 0,0197 + 0,0314 = 0,0511 Demikian pula, untuk B( P (| ⊝| >1,96 )=m ) = P( ⊝= (0,1) < 1,86) + P( , maka > 2,06) = 0,034 + 0,0197 = 0,0511 Dan untuk B( P (| ) = (0,6) ⊝| > 1,96 atau B( )= , akan diperoleh ) = 0,0052 + 0,0869 = 0,0921 Jadi, ketika kita menyangka tak bias untuk ⊝, maka probabilitas terjadi kesalahan estimasi yang melebihi 1,96 jika kenyataannya (0,6) hanya kita sangka sebesar 0,05. Tetapi bias untuk ⊝, maka nilai sebenarnya probabilitas tersebut adalah lebih dari 0,05. Dan nilai probabilitas tersebut semakin besar untuk |B( )| yang semakin besar. Jadi adanya bias mengakibatkan semakin besar probabilitas terjadinya kesalahan dalam estimasi dan hal ini tentu saja akan mengurangi keakuratan dalam estimasi. Dengan adanya pengaruh bias terhadap keakuratan hasil estimasi tersebut, maka pengetahuan tentang sifat bias atau tak biasnya suatu estimator diperlukan sekali. Dari hasil diatas, jika estimator untuk ⊝ dan |B( )| (0,1) , maka 6 ⊝| > 1,96 P (| jika |B( )| ) 0,0511 jauh berubah dan lebih besar dari 0,05. Tetapi (0,1) ⊝| >1,96 , maka P (| ) < 0,0511,tak jauh beda dengan 0,05. bias untuk ⊝ namun |B( Jadi jika )| kecil yaitu kurang dari (0,1) , maka pengaruhnya kecil, dan bias tersebut dapat diabaikan. 1.5 Rata-Rata Kuadrat Kesalahan Dari definisi rata-rata kuadrat kesalahan, RKK ( antara RKK ( RKK ( ), V( ) dan B( ⊝ )=E( ), diperoleh hubungan ) sebagai berikut, m) + (m ⊝) = E(( =E( = V( Jika ) + (B( tak bias untuk ) , maka B( ) = 0 dan RKK ( ) = V( Untuk membandingkan dua buah estimator dan standar dari kedua estimator tersebut, yaitu ( ) dan ( ( )= , ( )= ( )= ). , digunakan kesalahan ), yang nilainya pada keadaan umum dan ( jika )= , dan tak bias untuk , nilai kesalahan standar yang lebih kecil menunjukkan keakuratan yang lebih tinggi. Berikut ini diberikan ilustrasi visual tentang bias dan kesalahan standar. Misalkan terdapat 4 jenis senapan yang harus dipilih salah satu yang akan memberikan hasil tembakan yang tepat dan keakuratan yang tinggi. Setiap senapan dicoba sebanyak 8 kali tembakan dengan target titik pusat sebuah papan lingkaran yang radiusnya sama. Misalkan hasil tembakan 4 jenis senapan tersebut sebagai berikut, 7 X X X X X X X X X X X X X X Senapan 1 X X Senapan 2 X X XX XXXX X X X XX XXX X X Senapan 3 Senapan 4 X Hasil tembakan senapan 1 memberikan gambaran bias (tembakan melenceng) dengan kesalahan standar yang tinggi (keakuratan rendah), senapan 2 tak bias dengan kesalahan standar yang tinggi, senapan 3 bias namun kesalahan standarnya rendah dan senapan 4 tak bias dengan kesalahan standar rendah. Dalam kasus real target bukan merupakan titik, namun merupakan bidang yang kecil. Jadi urutan senapan dimulai yang terbaik adalah: 4, 3, 2, 1 dan pilihan terbaik adalah senapan 4. 8 BAB II SAMPLING RANDOM SEDERHANA 2.1 Pengambilan Sampel Random Sederhana Ditentukan sebuah populasi berukuran N, yaitu banyaknya anggota atau unit populasi adalah N. Dari populasi ini akan diambil sampel berukuran n, yaitu sampel dengan anggota atau unit sebanyak n. Jika pengambilan tanpa pengembalian, maka terdapat sampel-sampel yang mungkin terambil. Jika pengambilan dilakukan dengan pengembalian maka terdapat sampel-sampel yang mungkin terambil. Sebuah sampel disebut sampel random sederhana jika setiap sampel yang mungkin terambil, diperoleh dengan probabilitas sama. Jadi, pada pengambilan tanpa pengembalian, jika setiap sampel yang mungkin terambil diperoleh dengan probabilitas : maka sampel yang diperoleh adalah sampel random sederhana. Pada pengambilan dengan pengembalian, sebuah sampel random sederhana akan diperoleh dengan probabilitas : Dalam pembahasan selanjutnya, akan dibatasi pada sampel random sederhana yang diambil tanpa pengembalian. Sebagai contoh, dari populasi berukuran 8 akan diambil sampel random sederhana berukuran 3. Maka terdapat : sampel-sampel probabilitas yang mungkin terambil, masing-masing terpilih dengan . 9 Pengambilan sampel random sederhana dapat dilakukan antara lain dengan menggunakan Tabel bilangan-bilangan random. 2.2 Definisi dan Notasi Unit-unit populasi berukuran N, ditulis dengan notasi atau lambang : . Parameter-parameter populasi ditulis dengan notasi huruf kapital, yaitu : Total populasi , Y, didefinisikan : Mean atau rata-rata populasi, , didefinisikan : Variansi populasi, ada dua definisi yang harus dibedakan, ditulis dengan notasi dan , Dalam pembahasan selanjutnya akan digunakan populasi. Rumus lain untuk untuk menyatakan variansi , = 10 atau = Deviasi standar dari populasi adalah , yaitu akar dari variansi. Statistik-statistik sampel, ditulis dengan notasi huruf-huruf kecil. Unit-unit sampel random sederhana berukuran n, ditulis dengan notasi : Mean atau rata-rata sampel , , didefinisikan = Variansi sampel, , didefinisikan : = Rumus lain untuk , atau = Deviasi standar sampel adalah akar dari variansi sampel, ditulis s. 11 2.3 Sifat-Sifat Estimator Mean dan Total Serta Variansinya Dari sebuah populasi berukuran N, misalkan , Y dan adalah mean, total dan variansinya. Nilai parameter-parameter tersebut tidak diketahui. Dengan sampling random sederhana berukuran n, akan dipelajari estimator dari masingmasing parameter tersebut yang ditulis : , dan beserta sifat-sifatnya. Dipelajari pula variansi dari dan variansi dari yang ditulis, V( ) dan V(Y) Dalam sampling random sederhana berukuran n, estimator dari estimator dari Y adalah N dan estimator dari adalah adalah , . Jadi , = N dan Teorema 2.1 Dalam sampling random sederhana berukuran n yang diambil dari populasi berukuran N, mean sampel, , adalah suatu estimator tak bias untuk mean populasi . Bukti : Dalam sampling ini terdapat sampel-sampel yang mungkin terambil, masing- masing akan terpilih dengan probabilitas ke-k, k =1,2,... dengan . Misalkan adalah mean sampel , maka adalah unit k-i di dalam sampel ke-k, i=1, 2,..., n. Setiap unit tertentu, , dalam populasi, i=1,2,...N, 12 dalam jumlahan : akan memberikan kontribusi sebesar jika berada dalam sampel ke-k dan tidak memberikan kontribusi atau kontribusinya nol, jika tak berada dalam sampel ke-k. Dari seluruh sampel yang mungkin terambil, banyaknya sampel yang memuat unit tertentu tersebut adalah Jadi kontribusi . dalam jumlahan : Jadi secara umum sebarang unit ke-i dalam populasi akan memberikan kontribusi sebesar dalam jumlahan tersebut, sehingga Terbukti bahwa adalah tak bias untuk . Akibatnya, karena Y = N , maka adalah tak bias untuk Y. Variansi dari yang ditulis V( ) = V( ) dan rumus umumnya dapat diperoleh dan dijabarkan dari definisi, Teorema 2.2 Dalam sampling random sederhana berukuran n yang diambil dari populasi berukuran N dengan variansi V( ) = ( , variansi mean sampel, V( ), memenuhi rumus . 13 Bukti : Dalam jumlahan pertama, yaitu setiap unit populasi, , memberikan kontribusi sebesar , Jadi Dalam jumlahan kedua, yaitu , setiap pasang unit populasi , dan dengan j > i, memberikan kontribusi sebesar . 14 Jadi = 0 – (N 1) = = (N 1) = Jadi = V( ) = V( ) sering ditulis dengan rumus V( ) = (1 dengan f = f) dan disebut fraksi sampel. Kesalahan standar dari , = 2.4 Koreksi Pada Populasi yang Berhingga Jika ukuran populasi, N, sangat besar terhadap ukuran sampel, n, maka fraksi sampel, f = , mendekati nol. Dalam kasus seperti ini rumus variansi dari menjadi V( ) = , ( tanpa faktor (1 f) ), dan kesalahan standar dari menjadi 15 = Demikian pula, V( ) dan (1 f)), dan menjadi V( ) = , (tanpa faktor = Faktor (1 f) dalam rumus-rumusV( ) dan V( ) disebut faktor koreksi pada populasi yang berhingga yang dalam bahasa Inggris, finite population correction, ditulis fpc. Faktor fpc berperan memberikan koreksi pada V( ) maupun V( ) pada kasus populasi berhingga, apabila fraksi sampel , f, tidak terlalu kecil. Jadi, jika f sangat kecil maka fpc diabaikan dan jika f tak terlalu kecil maka fpc tak diabaikan. Dalam praktek biasanya fpc diabaikan jika f < 5 %. 2.5 Estimasi Kesalahan Standar Dalam praktek, variansi populasi, Pengetahuan tentang nilai pada umumnya tidak diketahui. , jika ada biasanya hanya melalui asumsi atau anggapan saja. Akibatnya V( ), V( ), , dan tak dapat diperoleh nilainya. Perlu ada estimasi untuk variansi dan kesalahan standar dari Estimasi untuk V( ) akan ditulis dan . atau v ( ) Estimasi untuk V( ) akan ditulis Estimasi untuk akan ditulis s( ) Estimasi untuk akan ditulis s( ) atau v( Teorema 2.3 Dalam sampling random sederhana berukuran n yang diambil dari populasi berukuran N, variansi sampel, , adalah suatu estimator tak bias untuk variansi populasi Bukti : dapat ditulis 16 Jadi = ( N 1) = ( nN n N+n) = Ini berarti tak bias untuk Berdasarkan teorema 2.3, dengan mengganti diganti dalam rumus untuk V( ) dan V( ) diperoleh hasil, = v ( ) = (1 f) , tak bias untuk V( ) dan = (1 f) tak bias untuk V( ) Dalam praktek variansi dari dihitung dengan menggunakan rumus estimasi, yaitu, = v ( ) = (1 f) Demikian pula variansi dari dihitung dengan rumus estimasinya, 17 = v( = (1 f) Dan selanjutnya kesalahan standar dari Dan kesalahan standar dari 2.6 dihitung dengan rumus s( =s dihitung dengan rumus s( ) = Ns Batas-Batas Konfidensi Untuk sampel berukuran besar, mean sampel, normal dengan mean , berdistribusi mendekati dan variansi V( ) yang estimasinyav( ). Berdasarkan distribusi tersebut diperoleh batas-batas konfidensi ( 1 , = - = ) untuk adalah, + atau , = - = + bila fpc dapat diabaikan. Nilai dan disebut batas konfidensi bawah dan batas konfidensi atas untuk , dan berlaku P( )=(1 ) Demikian pula batas-batas konfidensi ( 1- ) untuk Y adalah , = N( ) = N( ) atau = N( ) , = N( ) bila fpc dapat diabaikan. 2.7 Estimator Rasio Dalam suatu survei sampel, kadang-kadang paramater yang akan diestimasi adalah rasio dari dua parameter yang berbeda. Sebagai contoh, jika Y adalah total 18 biaya hidup per bulan dan tangga di kota K, maka rasio , adalah total penghasilan per bulan seluruh rumah yang didefinisikan = menunjukkan proporsi atau persentase dari penghasilan rumah tangga yang dibelanjakan untuk keperluan biaya hidup. Selanjutnya jika adalah total banyaknya anggota seluruh rumah tangga di kota K, maka rasio yang didefinisikan = menunjukkan mean penghasilan per bulan per anggota rumah tangga di kota K. Kiranya perlu kejelian untuk dapat membedakan interpretasi = dalam contoh ini, dengan menunjukkan mean penghasilan per bulan per rumah tangga dari seluruh rumah tangga di kota K. Dalam contoh ini pula, parameter apakah yang menyatakan : mean biaya hidup per bulan per anggota rumah tangga di kota K ? Dan parameter apakah yang menyatakan : mean biaya hidup per bulan per rumah tangga di kota K? Misalkan unit-unit populasi berbentuk pasangan, , i =1,2,..., N, dan misalkan = , = , Parameter rasio, R , didefinisikan 19 R= atau R = Dalam pasal ini, dengan sampling random sederhana berukuran n akan dipelajari estimator untuk R beserta sifatnya. Misalkan adalah unit-unit sampel dalam sampling random sederhana berukuran n. Maka dan Merupakan estimator tak bias untuk dan . Jadi beralasan untuk menggunakan = sebagai estimator untuk R. Estimator, , bersifat bias untuk R, karena E ( ) R. Jadi RKK( =E E Namun jika ukuran sampel, n , besar, maka = V( ) mendekati tak bias untuk R dengan variansi seperti yang dinyatakan dalam teorema berikut, Teorema 2.4 Dalam sampling random sederhana berukuran n, jika n besar maka Lambang “ , mendekati tak bias untuk R dan variansinya “ artinya “ mendekati “. Bukti : R= , = , untuk n besar, 20 = R= Sehingga E( E( ) = ( E( ) E( ) ) = 0, jadi mendekati tak bias untuk R. Selanjutnya V( ) = E E adalah mean sampel dari = E R = dengan mean populasi Jadi V( ) = = (1 f ) = (1 f ) Dalam praktek rumus pendekatan variansi, V( ) , pada kasus n besar, nilai V( ) tidak dapat diperoleh, sehingga diperlukan estimasinya. Estimator tak bias untuk V( ) adalah, ) = v( ) = Jika dalaam rumus ini nilai tidak diketahui, dapat diganti dengan . Selanjutnya kesalahan standar dari adalah, s( = = Untuk maksud penghitungan dapat dipakai rumus lain untuk pada kasus n besar, = 21 Pada kasus fpc,( 1 2.8 tidak diketahui, diganti dengan , dan kasus fraksi sampel kecil, ) , dapat diabaikan dalam penghitungan. Estimasi Mean dan Total Sub-Populasi Dalam beberapa survei, kadang-kadang estimasi dilakukan untuk parameter-parameter bagian dari populasi atau sub-populasi. Jadi, sampling dilakukan pada populasi guna mengestimasi paramater-parameter sub-populasi. Sub-populasi tersebut dinamakan domain penelitian. Dalam survei rumah tangga misalnya, estimasi diinginkan untuk paramater rumah tangga yang memiliki anak usia balita atau estimasi parameter rumah tangga yang masuk kategori pra sejahtera Dalam pasal ini parameter-parameter yang akan diestimasi adalah mean dan total sub-populasi. Misalkan sub-populasi atau domain penelitian ke-j mempunyai ukuran dan dalam sampling random sederhana berukuran n, terdapat unit sampel yang berasal dari sub-populasi tersebut. Misalkan adalah unit-unit sub- populasi. Maka total sub-populasi tersebut adalah, dan meannya adalah, = Serta variansi sub-populasi adalah, = Misalkan adalah unit-unit dalam sampling random sederhana berukuran n, yang berasal dari sub-populasi. Maka mean unit-unit tersebut 22 dan variansinya, = Dari seluruh sampel berukuran n dengan unit-unit spesifik dari tertentu, n, probabilitas diperoleh unit sub-populasi adalah, = Nilai probabilitas ini memberi gambaran seolah-olah sampling random sederhana berukuran diambil dari sub-populasi berukuran . Berdasarkan hasil-hasil di muka maka estimator tak bias untuk mean sub-populasi, , adalah, dengan variansi, V( ; = , dan kesalahan standarnya, Dalam praktek, variansi dan kesalahan standar dari dihitung dengan rumus estimasinya, yaitu, = v( ) = ( s( ) = kecuali jika ) = diketahui, Untuk mengestimasi total sub-populasi, ukuran sub-populasi, Kasus 1, , perlu ditinjau pengetahuan tentang , dalam kasus 1 dan kasus 2 berikut : diketahui. 23 Estimator tak bias untuk adalah dengan variansi, V( = =(1 ) dan kesalahan standarnya = = Estimasi untuk variansi dan kesalahan standar dari ) = v( adalah =( s( ) = Kasus 2, tidak diketahui. Estimator untuk total sub-populasi dalam kasus ini diperoleh demikian : Untuk setiap unit populasi, Maka total Mean , didefinisikan dalam populasi adalah dengan memenuhi, dalam sampel berukuran n adalah merupakan estimator tak bias untuk . Jadi estimator tak bias untuk adalah 24 dengan variansi, V( )= V( ) = (1 f) dengan Kesalahan standar dari adalah, Penghitungan variansi dan kesalahan standar dari dalam praktek digunakan rumus estimasinya, yaitu, ) = v( s( )= )= (1 f) = Dari kasus 1 dan kasus 2 diatas, jika estimator untuk total sub-populasi, = dan dan jika diketahui maka terdapat dua buah , yang dapat digunakan yaitu, =N tidak diketahui, hanya estimator yang dapat digunakan. Apabila terdapat dua atau lebih estimator untuk suatu parameter, yang dipilih adalah estimator dengan kesalahan standar yang terkecil, yang berarti memiliki keakuratan yang tertinggi. Soal-soal latihan : 1. Sebuah kota mempunyai 50 buah hotel dengan kamar sebanyak 1500 buah. Sebuah sampel random sederhana 5 buah jotel diketahui jumlah kamar dan timgkat hunian ( persen kamar terisi saat musim liburan ) 25 No Hotel Jumlah Kamar Tingkat Hunian 1 40 80 % 2 25 100 % 3 60 90 % 4 100 60 % 5 30 90 % a. Estimasikanlah mean tingkat hunian seluruh hotel di kota tersebut saat musim liburan. b. Jika tiap kamar rata-rata terisi 2 orang tamu (bagi kamar yang terisi), estimasikanlah total jumlah tamu yang tinggal diseluruh hotel di kota tersebut saat musim liburan. 2. Sebuah Kabupaten dihuni 4.000 rumah tangga (rt), dan diketahui 500 rt diantaranya memiliki sapi. Sebuah sampel random sederhana terdiri 250 rt diketahui distribusi banyaknya sapi yang dimiliki sebagai berikut : Banyaknya sapi Banyaknya rumah tangga 0 215 1 5 2 14 3 10 4 6 a. Dari seluruh rumah tangga pemilik sapi di Kabupaten tersebut, estimasikanlah total banyaknya rt yang sapinya lebih dari 2 ekor, (berikanlah dua buah nilai estimasi), dan hitunglah kesalahan standarnya masing-masing. b. Berikanlah dua buah estimasi untuk total banyaknya sapi yang dimiliki seluruh rumah tangga di Kabupaten tersebut, dan hitung variansi masingmasing. 26 3. Sebuah sampel random sederhana 50 orang mahasiswa FMIPA diketahui terdapat 28 orang dari jurusan Matematika, 8 orang dari jurusan Fisika dan yang lainnya dari jurusan Kimia. Dari sampel random tersebut, diperoleh data IPK mahasiswa Fisika sebagai berikut : 3,14 2,98 3,57 2,81 2,97 3,36 3,05 2,52 Diketahui pula total mahasiswa FMIPA 1700 orang, terdiri 675 orang dari jurusan Matematika, 550 orang dari jurusan Fisika, dan yang lainnya dari jurusan Kimia. a. Estimasikanlah mean IPK seluruh mahasiswa jurusan Fisika FMIPA, dan hitunglah pula kesalahan standarnya. b. Berikanlah dua buah nilai estimasi total IPK seluruh mahasiswa jurusan Fisika FMIPA, dan hitunglah dari masing-masing estimasi tersebut nilai kesalahan standarnya. 4. Populasi berukuran 5 unit dengan nilai sebagai berikut : 7, 10, 2, 11, 20. Diperhatikan sampel random sederhana berukuran 3, dan dua buah estimator bagi total populasi, Y sebagai berikut : Estimator pertama, = 5 , estimator kedua yang didefinisikan: a. Daftarkanlah seluruh sampel yang mungkin terambil, dan hitunglah dan dari masing-masing sampel. b. Tunjukkanlah bahwa dan masing-masing merupakan estimator tak bias bagi Y. c. Hitunglah variansi dari dan d. Untuk nilai k berapakah V( . mencapai minimum? Hitunglah pula ( ). 27 5. Suatu sampel random sederhana berukuran 50 dengan mean diambil dari sebuah populasi berukuran 1000 dengan variansi 2500. Dari sampel tersebut diambil sub-sampel random sederhana berukuran 30 dengan mean . Misalkan adalah mean dari 20 unit sampel sisanya. Hitunglah : a. V( b. V( c. Kov( , ) ) ) 28 BAB III SAMPLING RANDOM SEDERHANA UNTUK PROPORSI 3.1 Karakteristik Kualitatif Dalam survei sampel, kadang-kadang parameter yang akan diestimasi adalah total banyak unitt, proporsi atau persentase unit populasi yang mempunyai karakteristik atau sifat tertentu. Dalam survei rumah tangga misalnya, ingin diestimasi berapa total banyaknya rumah tangga yang berhak mendapatkan bantuan dalam Program Sosial Pemerintah dari seluruh rumah tangga yang tinggaldi kota K. Hal ini diperlukan sekali untuk menetapkan anggaran yang perlu disediakan dalam program tersebut untuk seluruh rumah tangga di kota K. Dari pengamatan sejumlah komponen tertentu dari hasil produksi, diinginkan untuk mengetahui berapa persentase komponen-komponen yang cacat dari seluruh hasil produksi tersebut. Dari seluruh mahasiswa di sebuah universitas yang menggunakan ponsel, ingin diestimasi proporsi dan total banyaknya mahasiswa yang ponselnya merk M. Hasil pencacahan terhadap setiap unit sampel dijawab dengan “ ya ” ( berhak mendapatkan; cacat; memakai merk M ) atau “ tidak ”. Dengan demikian setiap unit akan masuk kedalam salah satu dari 2 kelas klasifikasi, sebut saja kelas C dan kelas . Misalkan N adalah ukuran populasi, A adalah total banyaknya unit populasi yang masuk kelas C dan P adalah proporsi atau persentase unit populasi yang masuk kelas C, yaitu P = . Parameter P dan A tidak diketahui nilainya dan dalam bab ini akan dipelajari statistik estimator untuk parameter-parameter tersebut beserta sifat-sifatnya. 3.2 Estimator Untuk Proporsi dan Total Banyak Unit Serta Variansinya. Dalam sampling random sederhana berukuran n, misalkan aadalah banyaknya unit sampel yang masuk kelas C, dan p adalah proporsi unit sampel yang masuk kelas C, yaitu p = . Maka diperoleh teorema berikut : 29 Teorema 3.1 Proporsi sampel, p = P= , adalah estimator yang tak bias untuk proporsi populasi, , dengan variansi V(p) = E(p P = ( ), dengan Q = 1 P Bukti : Untuk setiap unit dalam populasi didefinisikan = 0, jika unit masuk kelas = 1, jika masuk kelas C dan . Maka untuk nilai-nilai populasi ini, total populasi, dan mean populasi, = = =P Mean untuk sampelnya, = = =p dengan demikian total banyak unit populasi yang masuk kelas C dapat dipandang atau merupakan total populasi khusus yaitu populasi yang nilai unit-unitnya 1 atau 0, dan proporsi populasi adalah mean dari populasi tersebut. Berdasarkan Teorema 2.1, maka p tak bias untuk P. Untuk populasi tersebut, sehingga = ( NP N ) = PQ , dengan Q =1 P 30 Secara sama, untuk sampel = pq, dengan q = 1 , diperoleh p. Dan berdasarkan teorema 2.2 diperoleh bukti, V(p) = V( ) = = = ( ) Dari teorema 2.3, = adalah estimator tak bias untuk = , jadi estimator tak bias untuk V(p) adalah, (p) =v(p) = = = ( Karena A = NP, maka estimator tak bias untuk A adalah V( ) = V(p) = ) = Np dengan variansi, PQ Estimator tak bias untuk V( ) adalah ( )=v( )= v(p) = pq Dari rumus-rumus diatas, jelas bahwa dalam terapan V(p) dan V( ) tidak dapat dihitung nilainya, karena memuat parameter P yang tidak diketahui nilainya, dan justru akan diestimasi. Maka variansi dari p dan variansi dari rumus estimatornya saja, yaitu v(p) dan v( Rumus lain untuk v(p) dan v( v(p) = (1 f) v( (1 )= dihitung dari ). ) adalah f) Dari rumus ini, jika faktor koreksi dapat diabaikan maka v(p) dan v( ) menjadi, v(p) = , v( ) = 31 3.3 Pengaruh Nilai Proporsi P Pada Kesalahan Standar Dari rumus V(p) dimuka, V(p) = , jika faktor koreksi diabaikan, maka V(p) = , dan kesalahan standarnya, = Nilai PQ dan untuk beberapa nilai P seperti dalam tabel berikut ( P dalam persen ), P 0 10 20 30 40 PQ 0 900 1600 2100 2400 2500 2400 2100 1600 900 0 0 30 40 0 46 Nilai maksimum 49 50 50 60 49 70 46 80 40 90 30 100 adalah 50 % dicapai pada nilai P = 50 %. Pada selang 30 % P 0,70 % nilai tak jauh berubah dari 50 %, tetapi pada selang P < 30 % atau P > 70 %, nilai akan jauh berubah dari 50 % . Untuk P = 50 %, keinginan untuk mendapatkan kesalahan standar dari estimasi , = 5 %, diperlukan sampel sebesar n =100. Dan n = 100 ini tidak berubah banyak untuk 40 % P 60 %. Jika diinginkan kesalahan yang lebih kecil lagi pada nilai P dalam selang tersebut, misalnya kesalahan standar sebesar 2 %, maka ukuran sampel yang diperlukan jauh meningkat menjadi 625. Ini berarti untuk nilai P sekitar 50 %, untuk menurunkan kesalahan standar dari 5 % menjadi 2 %, diperlukan penambahan ukuran sampel dari 100 menjadi 625. Pada kondisi sebaliknya, untuk n tetap, kesalahan standar dari p sekitar untuk 40 % P 60 %, tidak banyak berubah yang berarti tidak besar 32 pengaruhnya terhadap V(p). Namun jika P < 30 % atau P > 70 %, maka pengaruhnya terhadap V(p) sangat besar. 3.4 Batas-Batas Konfidensi Dalam sampling random sederhana berukuran n yang diambil dari populasi berukuran N, banyaknya unit sampel yang masuk kelas C yaitu a, berdistribusi hipergeometrik dengan distribusi probabilitas, P(a = )= , = 0, 1, 2,..., n dan pada populasi yang berukuran sangat besar, distribusi dari a akan mendekati Binomial, P(a = )= Pendekatan selanjutnya, jika ukuran sampel relatif besar, maka distribusi dari a akan mendekati normal dengan mean, E(a) = nP dan variansi v(a) = v(p). Dalam keadaan ini pula, p berdistribusi mendekati normal dengan mean, E(p) = P dan variansi v(p). Berdasarkan distribusi ini, diperoleh batas-batas konfidensi (1 ) untuk P, yaitu : =p , =p+ Batas-batas konfidensi ( 1 =N ) untuk A adalah , =N Batas-batas konfidensi tersebut berlaku untuk sampel berukuran besar. 3.5 Klasifikasi ke Dalam Lebih Dari Dua Kelas Dalam sebuah survei, seringkali responden diminta memilih salah satu dari beberapa (lebih dari dua) jawaban yang tersedia. Maka hasil pencacahan unit-unit sampel akan terklasifikasi lebih dari dua kelas. Pertanyaan kepada mahasiswa tentang merk motor yang dipakai ke tempat kuliah dengan jawaban pilihan: 33 Honda, Yamaha, Suzuki, dll. Maka klasifikasi yang terjadi adalah 4 kelas. Pertanyaan berapa jumlah anggota rumah tangga Anda? Jawaban yang masuk adalah 1, 2, 3, 4, 5, lebih dari 5. Disini terjadi klasifikasi ke dalam 6 kelas. Pertanyaan, siapa calon yang akan Anda pilih dalam Pilkada yang akan datang diantara tiga calon yang sudah ditetapkan? Unit atau jawaban akan terklasifikasi ke dalam 3 kelas. Jika terjadi klasifikasi unit ke dalam lebih dari dua kelas, maka permasalahan yang harus diselesaikan dapat berupa, (a) Estimasi proporsi unit populasi yang masuk kelas C. (b) Estimasi total banyaknya unit populasi yang masuk kelas C. (c) Estimasi proporsi unit sub-populasi yang masuk kelas C. (d) Estimasi total banyaknya unit sub-populasi yang masuk kelas C. Sebagai contoh, misalkan di kota Baru beredar 7 merk sabun cuci dalam pasaran, yaitu merk Merk , , , dan pabrik L, dan , , , , . adalah produk pabrik K, merk dan adalah produk adalah produk pabrik yang lainnya. Dalam sampling random sederhana, terdiri n rumah tangga yang diambil dari seluruh ( N ) rumah tangga yang tinggal di kota Baru tersebut, kita diminta menyelesaikan masalah estimasi beberapa parameter, yaitu : (1) Proporsi rumah tangga pemakai merk , dari seluruh rumah tangga di kota Baru. (2) Total banyaknya rumah tangga di kota Baru yang memakai merk produk pabrik L (3) Proporsi rumah tangga pemakai merk dari seluruh rumah tangga pemakai produk pabrik K di kota Baru. (4) Total banyaknya rumah tangga pemakai merk atau di kota Baru. Penyelesaian masalah : (1) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk , maka (1) merupakan masalah estimasi proporsi unit populasi yang masuk kelas C. 34 (2) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk produk L maka (2) merupakam masalah estimasi total banyaknya unit populasi yang masuk kelas C. Adanya informasi yang lebih banyak seperti misalnya informasi tentang total banyaknya rumah tangga pemakai merk produk K dan L, maka (2) dapat dipandang sebagai masalah estimasi total banyaknya unit sub-populasi yang masuk kelas C, dengan memandang informasi tersebut sebagai ukuran sub-populasi. (3) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk dan seluruh rumah tangga pemakai produk pabrik K sebagai subpopulasi, maka (3) merupakan masalah estimasi proporsi unit sub-populasi yang masuk kelas C. (4) Dengan mendefinisikan kelas C sebagai kelas rumah tangga pemakai merk atau , maka (4) merupakan masalah estimasi total banyaknya unit populasi yang masuk kelas C. Dengan informasi yang lebih seperti yang tersebut dalam (2), maka (4) dapat dipandang sebagai masalah estimasi total banyaknya unit sub-populasi yang masuk kelas C. Adanya informasi yang lebih banyak seperti yang tersebut dalam penyelesaian masalah (2) dan (4), menjadikan masalah estimasi total banyaknya unit yang masuk kelas C memiliki estimator yang tidak tunggal. Masing-masing masalah (2) dan (4) di atas mempunyai dua buah estimator dan kita dapat menunjuk estimator manakah yang lebih akurat berdasarkan nilai kesalahan standarnya. Misalkan unit-unit populasi diklasifikasikan ke dalam salah satu dari k kelas, yaitu kelas populasi, dengan , , ,... . Misalkan N adalah ukuran adalah total banyaknya unit populasi yang masuk kelas , tidak diketahui, maka, = + =N Dengan sampling random sederhana berukuran n, akan dipelajari masalah estimasi untuk beberapa parameter, yaitu seperti misalnya, 35 (1) Estimasi untuk (2) Estimasi untuk (3) Estimasi untuk (4) Estimasi untuk (5) Estimasi untuk (6) Estimasi untuk + (7) Estimasi untuk + Misalkan dari sampel yang diambil diperoleh banyaknya unit sampel yang masuk kelas adalah ; i = 1, 2, 3,...k Maka Berdasarkan pembahasan dimuka bahwa p adalah estimator tak bias untuk P dengan estimasi variansi tak biasnya, v(p) = (1 f) dan adalah estimator tak bias untuk A dengan estimasi variansi tak biasnya, v( )= (1 f) maka diperoleh hasil-hasil sebagai berikut, (1) Estimator tak bias untuk biasnya v( adalah p = ) = v(p) = (1 f) (2) Estimator tak bias untuk biasnya v( ) = v(p) = (1 f) , dengan estimasi variansi tak , dengan p = adalah p = dengan variansi tak , dengan p = 36 (3) Dengan memandang gabungan kelas , dan sebagai sub- populasi atau domain penelitian, estimator tak bias untuk adalah, = , dengan biasnya, v( = dengan estimasi variansi tak ) = v( ) = (1 ) , dengan = dan = . (4) Dengan memandang hal yang sama seperti dalam (3), estimator tak bias untuk adalah = dengan dengan estimasi variansi tak biasnya v( dengan = dan = = ) = v( ) = (1 , ) , . Hasil-hasil estimasi dalam (5), (6) dan (7), jika = nilainya, maka ada dua buah estimator, tetapi jika diketahui tak diketahui nilainya, hanya ada sebuah estimator hasilnya sebagai berikut, (5) Jika = diketahui, maka estimator tak bias untuk adalah : Pertama ; = estimasi variansi v( Kedua ; v( (6) Jika ( , dengan ) = = Np , dengan p = )= v(p) = = = v( ) = dan = (1 ) , dengan dan dengan estimasi variansi (1 f) diketahui, maka estimator tak bias untuk ) adalah, 37 Pertama ; = dengan estimasi variansi, v( Kedua ; v( ( dan v( ) = (1 = Np , dengan p = )= (7) Jika ) = = v(p) = = , dengan ) dan dengan estimasi variansi (1 f) = diketahui maka estimator tak bias untuk ) adalah seperti pada (6) dengan = dalam masalah estimasi (5), (6) dan (7) jika dan p = tidak diketahui maka hanya estimator kedua yang dapat digunakan. Soal-soal latihan : 1. Unit-unit sebuah populasi diklasifikasikan ke dalam kelas-kelas dan . Misalkan i =1, 2, 3, 4 ; dan , adalah banyaknya unit populasi yang masuk kelas = . Nilai dan banyaknya unit sampel yang masuk kelas a) Tentukan estimator untuk b) Tentukan estimator untuk , tidak diketahui. Dari populasi ini diambil sampel random sederhana berukuran n dan misalkan c) Jika nilai , adalah . dan tuliskanlah rumus variansinya. dan tuliskanlah variansinya. diketahui, tentukanlah dua buah estimator untuk dan tuliskanlah masing-masing variansinya. 2. Sebuah kota dihuni 12.000 rumah tangga, dengan mata pencaharian pokok diklasifikasikan : petani, pedagang, peg. Swasta dan PNS. Sebuah sampel random yang terdiri 800 rumah tangga yang diambil dari kota tersebut diketahui mata pencaharian pokok mereka sbb : petani 350 rt, pedagang 200 rt, peg. Swasta 175 rt, dan PNS 75 rt. Diketahui total banyaknya 38 rumah tangga dengan mata pencaharian pokok peg. Swasta atau PNS adalah 3200 rt. a) Estimasikanlah proporsi banyaknya rumah tangga dengan mata pencaharian pokok petani di kota tersebut dan hitunglah pula kesalahan standarnya. b) Berikanlah dua buah nilai estimasi untuk total banyaknya rumah tangga dengan mata pencaharian pokok pedagang di kota tersebut (berapa rt) dan hitunglah pula kesalahan standar dari masing-masing estimasi tersebut. 3. Terkait dengan program wajib belajar 9 tahun,akan diestimasi total banyaknya penduduk kota K yang saat ini berusia antara 6 th dan 16 th. Sebuah sampel random sederhana terdiri 200 rumah tangga diketahui distribusi banyaknya anak yang berusia antara 6 th dan 16 th dalam rumah tangga tersebut sbb : Banyaknya anak usia Banyaknya rumah tangga antara 6 th dan 16 th 0 60 1 70 2 30 3 20 4 15 5 5 Diketahui kota K dihuni 3000 rumah tangga, dengan 2000 rumah tangga diantaranya mempunyai anak (anggota rt) yang berusia antara 6 th dan 16 th. Estimasikanlah total banyaknya rumah tangga kota K yang punya anak usia 6 th-16 th lebih dari 2 orang (dua estimasi). Estimasikan pula total banyaknya penduduk kota K ( berikan 2 estimasi ) yang berusia antara 6 th dan 16 th. Hitunglah pula kesalahan standar masing-masing estimasi tersebut. 39 4. Dari seluruh mahasiswa Universitas U diketahui 5000 orang mahasiswa memiliki ponsel dan 600 orang diantara mereka harga ponselnya lebih dari Rp.2.000.000,-. Sebuah sampel random sederhana terdiri 300 orang mahasiswa pemilik ponsel dari universitas tersebut diketahui merk ponsel dan harganya sbb: Harga Merk Tak lebih dari Rp.2.000.000,- Merk Lain Merk Merk 100 68 54 38 20 12 6 2 Lebih dari Rp.2.000.000,- a. Dari seluruh mahasiswa Universitas U, estimasikanlah total banyaknya mahasiswa pemilik ponsel Merk dan hitung pula kesalahan standarnya. b. Dari seluruh mahasiswa pemilik ponsel Merk , estimasikanlah proporsi mahasiswa yang harga ponselnya tak lebih dari Rp. 2.000.000,c. Dari seluruh mahasiswa pemilik ponsel yang harganya tak lebih dari Rp. 2.000.000,-, estimasikanlah proporsi mahasiswa pemilik ponsel Merk d. Berikanlah dua buah dan hitung pula kesalahan standarnya. estimasi untuk total banyaknya mahasiswa Universitas U pemilik ponsel Merk yang harganya tak lebih dari Rp.2.000.000,- dan hitunglah variansi dari masing-masing estimasi tersebut. 5. Estimator tak bias bagi V(p) = (p) = adalah v(p) = pq. Jadi adalah bias bagi V(p). Tentukanlah besarnya bias tersebut, B( (p)). 40 BAB IV ESTIMASI UKURAN SAMPEL 4.1 Analisis Masalah dan Spesifikasi Ketelitian Dalam setiap rancangan survei sampel, penentuan ukuran sampel merupakan tahap yang harus dilewati. Ukuran sampel yang diambil akan berhubungan langsung dengan biaya dan waktu. Semakin besar sampel diambil, akan semakin besar pula biaya dan waktu yang diperlukan. Bagaimana hubungan ukuran sampel dengan spesifikasi ketelitian? Spesifikasi ketelitian dalam estimasi merupakan pernyataan ketelitian yang diinginkan dalam estimasi tersebut. Pernyataan ini dapat berupa keakuratan yang diinginkan yang dapat dinyatakan dengan atau melalui kesalahan standar dari estimatornya. Ketelitian yang diinginkan dapat pula dinyatakan melalui tingkat kesalahan dalam estimasi yang masih dapat ditoleransi yang terjadi pada tingkat keyakinan atau probabilitas tertentu. Tingkat kesalahan tersebut harus ditetapkan dengan baik sesuai bidang penerapan estimasi tersebut. Jika diinginkan ketelitian yang tinggi, maka tingkat kesalahan harus ditetapkan dengan nilai yang kecil. 4.2 Rumus Untuk n Dalam Sampling Untuk Proporsi Dalam sampling random sederhana untuk proporsi, misalkan tingkat kesalahan estimasi yang masih dapat ditoleransi adalah d pada tingkat keyakinan atau tingkat konfidensi 1 P( |p P| , Ini berarti, d)=1 Dengan menganggap p berdistribusi normal dengan mean, E(p) = P dan variansi V(p) = , maka diperoleh hubungan antara n dan d yaitu, d= Penyelesaian untuk n menghasilkan, 41 n= Untuk penggunaan praktis, sebuah perkiraan awal p diperlukan untuk mengganti P dalam rumus di atas sehingga n dapat dihitung. Perkiraan awal p ini dapat diperoleh dengan mengambil sampel awal dan menghitung nilai p dalam sampel tersebut atau menggunakan perkiraan lainnya, misalnya dari hasil survei yang lampau. Dengan nilai perkiraan awal p tersebut, estimasi pertama ukuran sampel adalah, = Jika < 5% , ambil n = . Namun jika 5% , maka ukuran sampel yang diambil, = n= Kesalahan relatif sebuah estimator koefisien variasi dari untuk didefinisikan dengan didefiniskan dengan Misalkan dalam estimasi total banyak unit populasi yang masuk kelas C, yaitu A = NP, kesalahan relatif dalam estimasi diinginkan tidak lebih dari r pada tingkat konfidensi 1 . Maka, P( P(|p P| r) = 1 rP) =1 Dari hasil di muka, dengan mengganti d dengan rP diperoleh, = dengan p adalah perkiraan awal untuk P. 42 4.3 Rumus Untuk n Dengan Data Kontinu Dalam estimasi mean atau total populasi, atau Y, sering diinginkan sebuah kesalahan relatif tidak lebih dari r dalam estimasinya. Jadi, P( r) = 1 Dengan menganggap maka, r = . berdistribusi normal dengan mean dan variansi V( ), dengan penyelesaian untuk n n= Estimasi pertama, Jika = < 5 %, ukuran sampel yang diambil n = n= , dan jika 5% , maka = Kadang-kadang sampel yang akan diambil diinginkan agar mempunyai nilai koefisien variasi tertentu. Sebagai misal, untuk mengestimasi agar estimatornya mempunyai nilai koefisien variasi kv = = , maka , diinginkan = ; ;n= Estimasi pertama, = dengan C = , kuadrat dari koefisien variasi. Dalam rumus penghitungan ukuran sampel di atas, sampel awal diambil untuk sekedar memperoleh perkiraan untuk P atau , yang digunakan untuk menghitung dan menetapkan n, dan sampel awal tersebut tak digunakan lagi dalam 43 sampling selanjutnya. Dalam praktek metode ini jarang sekali dipakai karena akan memperlambat penyelesaian survei. Metode lain diberikan oleh Cox dan Stein, yaitu dengan mengkombinasikan sampel awal atau sampel pertama yang diambil berukuran , dengan unit-unit tambahan yang diambil dari populasi dan menjadikan ukuran sampel menjadi n. Estimator untuk P atau dari kombinasi sampel tersebut akan berubah sifatnya menjadi bias. Dengan menambahkan estimasi dari bias pada estimator yang bersangkutan akan didapat estimator baru yang tak bias untuk P dan . Hasilnya diberikan dalam rumus-rumus berikut : a) Sampling untuk dengan koefisien variasi ditetapkan kv = . Diambil sampel awal atau sampel pertama berukuran dihitung mean dan variansinya dan , selanjutnya . Dengan menganggap y berdistribusi normal, ambil unit-unit tambahan sehingga ukuran sampel menjadi, n= ( 1 + 8C + + ) Mean sampel akhir, , merupakan estimator yang bias untuk estimator yang baru untuk . Ambil yaitu : = (1 2C) b) Sampling untuk dengan variasi ditetapkan V. Ambil unit-unit tambahan untuk membuat ukuran sampel menjadi, n= (1 + ) c) Sampling untuk P dengan variansi ditetapkan V Misalkan adalah estimasi untuk P dari sampel pertama. Ambil unit-unit tambahan sehingga ukuran sampel menjadi, 44 n= + + Proporsi dalam sampel akhir, p, merupakan estimator yang bias untuk P. Untuk menghilangkan bias tersebut gunakan estimator baru untuk P yaitu, =p+ d) Sampling untuk P dengan koefisien variasi ditetapkan kv = Ambil unit-unit tambahan untuk membuat ukuran sampel menjadi, n= + + proporsi dalam sampel akhir, p, merupakan estimator yang bias untuk P, dan untuk menghilangkannya, digunakan estimator baru, =p dalam rumus-rumus untuk (a), (b), (c) dan (d) diatas, dianggap < n. Unit-unit tambahan diambil untuk menjadikan sampel tersebut menjadi berukuran n. Jadi sampel baru berukuran n merupakan gabungan sampel pertama dengan unit-unit tambahan tersebut. Soal-soal latihan : 1. Fakultas Teknik mempunyai mahasiswa sebanyak 2800 orang. Sebuah sampel random sederhana akan diambil dari mahasiswa fakultas tersebut guna mengestimasi total banyaknya mahasiswa yang tinggal di tempat kos. Kesalahan estimasi diinginkan tidak lebih dari 50 orang pada tingkat konfidensi 95 %. Berapa ukuran sampel yang harus diambil jika estimasi untuk banyaknya mahasiswa yang tinggal di tempat kos adalah 500 orang? 2. Wilayah Kecamatan Duren merupakan penghasil buah durian. Hampir di setiap halaman rumah tangga tertanam pohon durian. Guna mengestimasi 45 total banyaknya pohon durian yang tumbuh di kecamatan tersebut akan digunakan sampling random sederhana, terdiri beberapa rumah tangga. Hasil estimasi nanti diinginkan memiliki koefisien variasi 0,18. Telah diambil sampel pertama berukuran 60 rumah tangga dan diperoleh mean banyaknya pohon tiap rumah tangga 4,8 dan deviasi standar 7,1. Tentukan ukuran sampel yang harus diambil, n. Selanjutnya jika dari sampel tersebut diperoleh Y = 8604 pohon. Tentukan estimasi akhir total banyaknya pohon durian di kecamatan Duren. 46 BAB V SAMPLING RANDOM BERSTRATA 5.1 Pengambilan Sampel Random Berstrata Untuk mengambil sampel random berstrata dari populasi berukuran N, mula-mula populasi dibagi menjadi beberapa bagian yang masing-masing berukuran , , ..., unit. Bagian-bagian populasi tersebut dinamakan strata atau lapisan, dan tidak boleh overlap, sehingga, + + ...+ =N dengan L = banyaknya strata. Untuk memperoleh manfaat, nilai , h = 1,2,...,L harus diketahui. Jika strata-strata sudah ditentukan, sebuah sampel diambil dari masing-masing strata secara random dan independen gabungan dari seluruh sampel yang diambil dari setiap strata disebut sampel random berstrata. Jadi, jika adalah ukuran sampel dari strata ke-h, h =1,2,...,L dan n adalah ukuran sampel random berstrata, maka < n untuk setiap h, dan + Nilai-nilai + ...+ =n , h = 1,2,...,L disebut alokasi sampel. Stratifikasi atau pembagian populasi menjadi sejumlah strata, adalah sebuah teknik biasa, namun ada beberapa prinsip atau alasan mengapa hal tersebut dilakukan. Alasan dimaksud antara lain : 1) Jika dalam estimasi diinginkan ketelitian atau keakuratan pada bagianbagian dari populasi, per lakukan bagian-bagian tersebut sebagai subpopulasi dan selanjutnya dipandang sebagai strata. 2) Administrasi yang baik dapat menarik manfaat dari stratifikasi. Sebagai contoh sebuah pusat agensi dapat menggunakan kantor-kantor cabang sebagai strata. Lebih konkritnya misalnya, hasil UNAS SMA di wilayah sebuah kantor Diknas di kota K dapat menggunakan hasil UNAS semua siswa di seluruh SMA di wilayah kota tersebut. Semua siswa peserta UNAS di setiap SMA tersebut dipandang sebagai strata. 47 3) Masalah sampling dapat berbeda diantara bagian-bagian populasi. Perbedaan itu dapat berupa biaya per unit sampling, dapat pula berupa adat atau kebiasaan responden. Sebuah survei yang berpusat di kota Yogyakarta pada populasi rumah tangga yang tinggal di provinsi DIY, biaya per unit sampling di kota Yogyakarta, dan 4 kabupaten lainnya, Sleman, Bantul, Kulonprogo dan Gunung Kidul dapat berbeda. Responden yang tinggal di rumah dinas mempunyai adat kebiasaan yang berbeda dengan responden yang tinggal di rumah-rumah biasa. 5.2 Definisi dan Notasi Misalkan N adalah ukuran populasi, dan adalah ukuran strata ke-h, h = 1,2,3,...L. Unit-unit strata ke-h ditulis dengan lambang strata ke-h dan mean strata ke-h ditulis dan , ,... , . Total adalah, = Variansi strata ke-h, ditulis adalah, atau Dalam sampling random berstrata berukuran n, misalkan adalah alokasi sampel pada strata ke-h. Mean dan variansi sampel dari strata ke-h ditulis dan adalah : dan 48 atau Nilai 5.3 disebut bobot strata dan = disebut fraksi sampel dari strata ke-h. Sifat-Sifat Estimator Mean dan Total Serta Variansinya Dalam sampling random berstrata, estimator untuk total populasi, Y, ditulis dengan adalah : dan estimator untuk mean populasi, , ditulis atau adalah : Rumus-rumus estimator tersebut diperoleh dengan alasan sebagai berikut. Mean sampel dari strata ke-h, bias untuk , adalah estimator tak bias untuk . Karena Y = tak bias untuk . Variansi dari , maka , sehingga tak tak bias untuk Y dan selanjutnya diberikan dalam teorema berikut. Teorema 5.1 Dalam sampling random berstrata, variansi dari adalah, Bukti : 49 Karena tak bias untuk V( ) = , maka menurut teorema 2.2 , = (1 ) dan karena sampel-sampel dari setiap strata independen, maka, dari teorema 5.1 akan diperoleh variansi dari V( ) = V(N ) = V( , yaitu, ) Dalam kasus faktor koreksi, fpc, dapat diabaikan maka, dan Ada beberapa alokasi sampel yang mempunyai sifat tertentu yaitu alokasi sama untuk setiap strata dan alokasi proporsional. Sampling random berstrata dikatakan mempunyai alokasi sama, jika nilai sama untuk semua h, dan dikatakan mempunyai alokasi proporsional jika sebanding dengan ukuran strata. Jadi dalam alokasi sama, Rumus variansi dari = dan dalam alokasi proporsional, = n. dalam alokasi proporsional mempunyai bentuk yang lebih sederhana yaitu, 50 Nilai V( ) tidak bergantung pada n, tetapi bergantung pada alokasi sampel. Meskipun ukuran sampel, n , sama, tetapi jika alokasinya berbeda akan menghasilkan variansi yang berbeda. Sebuah pertanyaan yang menarik adalah, jika n ditetapkan, alokasi manakah yang akan menghasilkan V( ) minimum? Masalah ini akan dipelajari dalam pasal 5.5 5.4 Estimasi Variansi dan Batas-Batas Konfidensi Dalam sampling random berstrata estimator dan selalu dapat dihitung nilainya, tetapi variansinya dalam terapan umumnya tidak dapat dihitung karena memuat parameter diperlukan estimasi untuk V( yang tidak diketahui nilainya. Oleh karena itu ). Berdasarkan teorema 2.3, diperoleh bahwa adalah estimator tak bias untuk . Jadi estimator tak bias untuk V( dan estimator tak bias untuk V( ) adalah, ) adalah, Dalam terapan variansi dari estimator untuk mean dan variansi dari estimator untuk total populasi dihitung dengan rumus-rumus yang terakhir ini. Jika ukuran sampel, besar maka dengan mean (1 ) untuk dan variansi v( akan berdistribusi mendekati normal ). Dari distribusi ini batas-batas konfidensi adalah, dan batas-batas konfidensi (1 ) untuk Y adalah, = 51 = 5.5 Alokasi Optimum Dalam sampling random berstrata, misalkan ukuran sampel, n, ditetapkan nilainya, alokasi manakah yang memberikan V( ) minimum? Alokasi seperti ini disebut alokasi optimum pada n tetap. Masalah yang lebih umum, misalkan biaya survei sampel dirumuskan sebagai jumlah dari biaya pokok, , dan jumlah biaya sampling dari seluruh strata. Misalkan biaya per unit sampel dari strata h adalah , h = 1,2,...,L, maka biaya survei sampel semuanya adalah C, mempunyai rumus, dengan adalah alokasi sampel, dan diketahui nilainya. Akan dipelajari dua masalah, yaitu, (a) Jika biaya C ditetapkan, alokasi manakah yang meminimumkan V( Alokasi seperti ini, yaitu alokasi yang meminimumkan V( )? ) pada biaya C yang ditetapkan disebut alokasi optimum pada C tetap. (b) Jika V( ) ditetapkan sebesar V, alokasi manakah yang meminimumkan biaya C? Hasilnya disebut alokasi optimum pada variansi tetap. Masalah (a) dan (b) merupakan masalah ekstrem minimum fungsi L variabel dengan sebuah kendala. Dalam (a) dicari alokasi sampel, , h =1,2,...L yang meminimumkan dengan kendala, 52 Penyelesaian dapat menggunakan metode Lagrange. Dibentuk fungsi Lagrange : Syarat esktrim, = 0, h =1,2,...,L dan − + = 0, menghasilkan, = 0 , h =1,2,...,L (1) dan Dari (1) diperoleh penyelesaian untuk = , = = Jumlahkan, Jadi = . n= (3) Substitusikanlah (3) ke (2) menghasilkan, Dengan penyelesaian untuk n, 53 n = (C ) (4) Substitusikan (4) ke (3) menghasilkan, = (C ) (5) dengan syarat Rumus alokasi (5) akan menghasilkan nilai minimum dari V( dengan substitusi pada (5) ke rumus V( Dalam (b), dicari alokasi sampel, ), yang diperoleh ). , h =1,2,...L yang meminimumkan, dengan kendala, V( ) V=0 Penyelesaiannya dapat dilakukan secara sama dan menghasilkan rumus alokasi, = (6) dengan syarat Nilai minimum biaya survei diperoleh dengan substitusi dalam (6) ke rumus C. Rumus alokasi (5) dan (6) menunjukkan bahwa semakin besar semakin kecil , alokasinya semakin besar. Pada keadaan khusus, jika dan =k, suatu konstan untuk semua h, maka, atau n= 54 Dalam kasus ini alokasi optimum pada C tetap ekuivalen dengan alokasi optimum pada n tetap. Rumus alokasi optimum pada n tetap adalah diperoleh dari (3), .n = (7) dengan nilai minimum variansi, ( )= 5.6 dengan syarat Keakuratan Relatif Sampling Random Berstrata Terhadap Sampling Random Sederhana Rumus variansi dari estimator nilainya akan kecil bilamana , yaitu V( ) memperlihatkan bahwa kecil untuk semua h. Hal ini berarti bahwa sampling random berstrata akan memiliki keakuratan yang tinggi jika stratifikasi yaitu pembagian populasi menjadi beberapa strata dapat menghasilkan stratastrata yang unitnya bersifat homogen. Pada populasi penghasilan per bulan, rumah tangga di sebuah kecamatan misalnya, dengan mendefinisikan kelompokkelompok penghasilan rendah, sedang, tinggi sebagai strata-strata kiranya dapat diharapkan sampling random berstrata akan menghasilkan keakuratan yang lebih tinggi dari pada sampling random sederhana. Secara umum, perbandingan antara sampling random sederhana dan sampling random berstrata pada ukuran sampel, n, tetap, diberikan dalam teorema berikut. Teorema 5.2 Jika diabaikan, maka untuk n tetap, Bukti : = (1 = f) = 55 Perhatikan kesamaan berikut, Jika diabaikan, maka juga diabaikan dan kesamaan tersebut menjadi, Oleh karena itu, Dari definisi jelas bahwa jika diabaikan. Dalam kasus ini, Dengan 5.7 . Jadi terbukti bahwa = , yaitu rata-rata tertimbang dari Alokasi yang Melampaui 100 % Penghitungan alokasi optimum pada biaya, C, tetap maupun alokasi optimum pada variansi, V, tetap dengan rumus-rumus yang telah diberikan di muka ada kemungkinan menghasilkan nilai alokasi > , untuk suatu strata h. Kondisi seperti ini dikatakan telah terjadi alokasi yang melampaui 100 %. Karena tidak mungkin mengambil sampel yang ukurannya melampaui strata, maka untuk 56 strata tersebut diambil = , dan sisa unit ditambahkan alokasinya pada sampel dari strata yang lain sebanding dengan bobot alokasinya. Memperhatikan rumus alokasi optimum pada n tetap, .n = tampak bahwa sebanding dengan . Ini berarti untuk kecil dan besar, berpotensi terjadi alokasi yang melampaui 100 %, untuk menghindari penghitungan alokasi yang berulang, sebaiknya dihitung lebih dahulu alokasi sampel pada strata tersebut. Setelah itu dihitung alokasi sampel yang berpotensi pada urutan kedua melampaui 100 %, dan seterusnya. Sebagai contoh, dari L strata, misalkan strata ke-3 adalah yang paling berpotensi memiliki alokasi yang melampaui 100 %. Maka kita hitung dahulu alokasinya, .n = Jika ternyata > , maka pada strata ke-3 ditetapkan alokasinya, = , alokasi pada strata yang lain menjadi, =(n ) , Selanjutnya misalkan strata ke-1 berpotensi pada urutan ke dua terjadi alokasi melampaui 100 %, maka hitung dahulu alokasinya, =(n ) Jika , maka teruskan penghitungan alokasi untuk strata yang lainnya. Tetapi jika > , maka tetapkan alokasi pada strata ke-1, pada strata yang lain, =(n , ) = dan alokasi menjadi , , 57 5.8 Sampling Random Berstrata Untuk Proporsi Misalkan sebuah populasi berukuran N terbagi menjadi L strata dengan ukuran strata , h =1,2,...L dan unit-unit populasi maupun strata diklasifikasikan ke dalam kelas C atau kelas C dan . Misalkan A adalah banyaknya unit populasi yang masuk adalah banyaknya unit strata ke-h yang masuk kelas C. Maka, + +...+ Selanjutnya misalkan P = = =A , yaitu proporsi unit populasi yang masuk kelas C dan , yaitu proporsi unit strata ke-h yang masuk kelas C. Akan dipelajari estimator untuk P dan A beserta sifatnya. Dalam sampling random berstrata berukuran n dengan alokasi misalkan , adalah banyaknya unit sampel dari strata ke-h yang masuk kelas C, dan misalkan = adalah proporsi unit sampel dari strata ke-h yang masuk kelas C. Dari hasil-hasil yang diperoleh dalam Bab III, maka tak bias untuk V( adalah estimator , dengan variansi, = Selanjutnya = adalah estimator tak bias untuk . Jadi adalah tak bias untuk A, dan akhirnya, adalah estimator tak bias untuk P, dengan variansi, 58 Variansi dari adalah, dalam kasus faktor koreksi, fpc , dapat diabaikan maka, dan Pada alokasi proporsional, = . n, variansi dari mempunyai rumus, Dalam hampir semua aplikasi, jika faktor koreksi, fpc, tidak diabaikan, diabaikan, sehingga rumus yang lebih sederhana untuk V( Dalam terapannya di dalam praktek, nilai V( , akan ) adalah : ) tidak dapat dihitung. Penghitungan variansi tersebut dilakukan melalui estimasinya, yang diperoleh dengan substitusi menggantikan . Jadi, Alokasi optimum pada n tetap menghasilkan rumus alokasi, 59 = dan alokasi optimum pada biaya C = = + tetap dihitung dengan rumus, .n Soal-soal latihan : 1. Untuk mengestimasi mean IPK tahun pertama seluruh mahasiswa FMIPA, diambil sampel random berstrata 20 orang mahasiswa dengan jurusan Fisika, kimia, dan Matematika dipandang sebagai strata. Diperoleh data IPK mereka sbb : Jurusan Fisika : 2,85 ; 2,90 ; 3,45 ; 2,70 ; 3,10 Jurusan Kimia : 2,40 ; 2,25 ; 2,95 ; 2,10 ; 2,95 ; 3,25 ; 2,65 Jur. Matematika: 3,05 ; 2,15 ; 1,95 ; 2,85 ; 2,30 ; 2,80 ; 3,30 ; 2,00 Estimasikanlah mean IPK tahun pertama seluruh mahasiswa FMIPA, dan hitunglah variansi dari estimasi ini. Diketahui total banyaknya mahasiswa FMIPA jurusan Fisika, Kimia dan Matematika berturut-turut 600, 500, dan 700 orang. 2. Suatu survei dilakukan untuk mengestimasi proporsi pemirsa TV yang paling menyenangi beberapa program/acara terpilih yaitu musik, olahraga, kesenian tradisional, film kartun. Sampel yang diambil adalah sampel random berstrata kelompok usia pemirsa, dengan alokasi yang diperkirakan proporsional. Diperoleh data program/acara yang paling disenangi sbb : Kelompok Jumlah Program/acara yang paling disenangi Usia responden Musik Olahraga < 12 th 400 50 20 Film Kesenian kartun tradisional 250 80 60 12 sd 30 th 900 70 100 60 40 > 30 th 200 40 110 5 45 diketahui total banyaknya pemirsa TV 42 juta orang. Saudara diminta mengestimasi dan menghitung kesalahan standarnya : a) proporsi pemirsa TV yang paling menyenangi acara musik b) proporsi pemirsa TV yang paling menyenangi bukan olahraga c) total banyaknya pemirsa TV yang paling menyenangi film kartun atau kesenian tradisional 3. Sebuah kota mempunyai wilayah terdiri 7 buah kecamatan. Dengan memperhatikan penduduk yang tinggal di setiap kecamatan sebagai strata, diambil sampel random berstrata untuk mengestimasi : a) proporsi penduduk di kabupaten tsb yang usianya di atas 60 tahun b) total banyaknya penduduk di kabupaten tsb pada usia wajib belajar (6 th – 15 th) dari sampel yang diambil diperoleh data sbb : Nomor kecamatan 1 2 3 4 5 6 7 Ukuran sampel 150 240 120 210 170 200 160 Usia 60 th 20 30 20 25 30 30 25 45 40 15 50 40 35 20 Usia wajib belajar Jumlah penduduk di kecamatan 1,2,...7 berturut-turut : 2500, 4500, 2000, 4000, 3000, 3500, 2500. Berikanlah hasil estimasi saudara tsb pada (a) dan (b) dan hitunglah variansinya. 4. Sebuah populasi terbagi menjadi 3 strata dengan Strata 1 600 2 9 2 300 3 16 61 3 100 10 Fungsi biaya, C = 500 + 25 . Dikehendaki V( ) = 0,05. Tentukanlah alokasi sampel yang meminimumkan biaya C, dan hitunglah biaya minimumnya. 5. Sebuah populasi terbagi 4 strata dengan ukuran strata 1,2,3 dan 4 berturutturut 500, 250, 150 dan 100 dan variansinya berturut-turut 1,4,16,36. Dalam sampel random berstrata ditetapkan fungsi biaya, C = 2.220 + dengan = 16, = 25, = 64 dan = 144. a) Jika tersedia biaya C = 7500, tentukanlah alokasi sampel yang meminimumkan variansi dari dan hitunglah variansi minimum tersebut. b) Jika dari ukuran sampel seperti tersebut pada (a), digunakan alokasi proporsional, hitunglah variansi dari . 62 BAB VI ESTIMATOR RASIO 6.1 Metode Estimator Rasio Untuk Mean dan Total Metode estimator rasio untuk mean, pendukung yang berhubungan dengan populasi X dari , dan total , Y, memerlukan variabel , untuk setiap unit dalam sampel. Total harus diketahui. Dalam praktek sering kali merupakan nilai pada beberapa waktu yang lalu ketika sensus lengkap dilakukan. Tujuan metode ini adalah untuk memperoleh peningkatan hasil penelitian dengan memanfaatkan hubungan antara estimator untuk rasio, R, adalah dan = . Jadi estimator rasio untuk Y dan .X, Jika adalah nilai . Dalam sampling random sederhana, adalah = . pada beberapa waktu yang lalu, metode estimator rasio menggunakan sampel untuk memperkirakan perubahan relatif terjadi sejak waktu itu. Estimasi perubahan relatif, yang telah dikalikan dengan total, X, yang diketahui akan memberikan estimasi untuk total Y pada waktu sekarang. Jika rasio hampir sama untuk setiap unit sampel ( , ), nilai rasio variasinya kecil dari sampel yang satu dengan sampel yang lainnya, dan estimator rasio untuk Y akan memiliki ketelitian yang tinggi. Dalam terapan lainnya, merupakan luas daerah pertanian dan dapat adalah hasil pertanian. Estimator rasio untuk total hasil pertanian, Y, maupun mean hasil pertanian per satuan luas lahan, , ketelitiannya akan tinggi jika seluruh petani menunjukkan hasil yang hampir sama dari persentase hasil pertanian terhadap luas lahan. 63 6.2 Pendekatan Variansi Dari Estimator Untuk Mean Dalam pembahasan bab II, estimator rasio, = adalah bias untuk R, namun jika sampel berukuran besar, maka estimator tersebut mendekati tak bias, dengan variansi pendekatan yang diberikan dalam teorema 2.4. Untuk sampel berukuran besar, variansi dari diberikan dalam teorema berikut. Teorema 6.1 Dalam sampling random sederhana, untuk sampel berukuran besar, variansi dari adalah Bukti diperoleh dari kesamaan V( ) = Koefisien korelasi, , antara dan V( ) dan teorema 2.4. dalam populasi didefnisikan : Berdasarkan ini, bentuk lain dari V( ) untuk n besar adalah : = ( = ( ) atau dengan ) yang disebut kovariansi antara dan dalam populasi. Bentuk lain lagi, 64 = = ) dimana , adalah kuadrat dari koefisien variasi dari dan dan adalah kovariansi relatifnya. Variansi dari estimator rasio untuk total populasi adalah : V( ) = 6.3 Estimasi Variansi Berdasarkan Sampel Dalam terapan, tidak dapat dihitung karena memuat parameter R yang tidak diketahui. Sebagai estimator dari adalah : atau atau dengan 6.4 = yaitu kovariansi antara dan dalam sampel. Batas-Batas Konfidensi Dalam estimator rasio, jika ukuran sampel, n , besar, maka mendekati normal dengan mean jika n dan variansi v( ). Pendekatan ini cukup baik 30 dan koefisien variasi dari konfidensi ( berdistribusi dan kurang dari 0,1. Batas-batas ) untuk Y adalah : 65 = = Batas-batas konfidensi ( = = 6.5 + ) untuk Y adalah : atau =N atau =N Perbandingan Estimator Rasio Dengan Mean Per Unit Perbandingan antara estimator rasio dengan mean per unit dapat dilakukan dengan membandingkan dengan V( ). Hasilnya diberikan dalam teorema berikut. Teorema 6.2 Dalam sampling random sederhana berukuran besar, estimator rasio, , memiliki variansi yang lebih kecil dari estimator mean per unit, , jika > Bukti : V( ) = = ) ( Jadi < V( ) jika : < > = 66 Dalam teori regresi, koefisien korelasi, , menunjukkan hubungan linear antara dan dalam populasi. Teorema 6.2 menerangkan bahwa estimator rasio, lebih akurat daripada jika : 1. Hubungan antara dan 2. Variansi dari 6.6 , membentuk pola garis lurus yang melalui origin. disekitar garis tersebut adalah proporsional terhadap . Bias Dari Estimator Rasio Secara umum, estimator rasio mempunyai faktor bias kira-kira sebesar . Kesalahan standar dari estimator rasio mempunyai faktor standar) juga mempunyai faktor sebesar . Jadi (bias/kesalahan dan menjadi tidak berarti jika n besar. Hasil di atas ini dapat dijelaskan sebagai berikut. Deret taylor dari = disekitar adalah : = = Jadi = = + Ekspetasi suku-suku di ruas kanan : E =0 67 = = = Jadi bias dari E( =R adalah : ) = Dari hasil ini terlihat bahwa estimator rasio mempunyai faktor bias kira-kira sebesar 6.7 Jenis Estimator Rasio yang Tak Bias Secara umum, metode untuk mendapatkan sebuah estimator yang tak bias untuk parameter dapat dilakukan dengan langkah sebagai berikut. 1. Pertama, tentukan sebuah estimator untuk 2. Dapatkan rumus untuk bias dari , yaitu B( 3. Dapatkan estimator tak bias untuk B( 4. Maka estimator sebagai estimator awal, ditulis ) = E( ), yaitu yang didefinisikan dengan . ) ). Jadi E( = )) = ) ) adalah tak bias untuk . Satu jenis estimator tak bias untuk R dikemukakan oleh Hartley dan Ross. Dalam sampling random sederhana berukuran n, ( ( ) didefinisikan Selanjutnya bias dari = = ); i=1,2,...n ; pada setiap unit . dipakai sebagai estimator awal untuk R. Akan dicari yaitu B( ) = E( ) R. Perhatikan kesamaan : = 68 ) = (R E( )) = = (R – E( )) Jadi B( ) = E( ) – R = Estimator tak bias untuk adalah = Jadi estimator tak bias untuk B( ) adalah ( ) = – Akhirnya diperoleh estimator tak bias untuk R, yang ditulis , yaitu = + Dari hasil ini, diperoleh pula estimator tak bias untuk dan Y, yaitu : = dan =X Sebuah estimator tak bias lainnya dikemukakan oleh Mickey. Dalam sampling random sederhana ( , ) ; i=1,2,...,n didefinisikan : = , k=1,2,...,n Selanjutnya dihitung untuk R. Bias dari = , dan digunakan sebagai estimator awal yaitu : B( ) = E( memiliki estimator tak bias : R) ( )= – Jadi estimator tak bias untuk R adalah : Selanjutnya estimator tak bias untuk = + dan Y adalah : = dan =X 69 6.8 Estimator Rasio Dalam Sampling Random Berstrara. Dalam sampling random berstrata, terdapat dua cara untuk memperoleh estimator rasio untuk mean populasi, yaitu cara terpisah dan cara kombinasi. Cara terpisah dilakukan melalui estimasi total strata, , terpisah bagi setiap strata, estimasi total populasi, Y, dan akhirnya estimasi mean populasi, . Estimator untuk adalah : = = Estimator untuk Y = adalah : = Akhirnya estimator untuk adalah : = Dalam lambang dan , s berarti separated atau terpisah. Dalam rumus estimator tersebut, jelas bahwa pengetahuan tentang atau untuk semua h sangat diperlukan. Jika tidak demikian, maka etimator dengan cara terpisah tidak dapat dilakukan. Sebagai contoh misalnya hanya diketahui total populasi dari yaitu X atau meannya, , tetapi maupun tidak diketahui. Maka cara terpisah tidak dapat digunakan. Pada kasus yang terakhir ini, hanya cara kombinasi yang dapat digunakan. Pada cara kombinasi, pertama dihitung dan . Kemudian R diestimasi dengan Akhirnya estimator untuk = = adalah : = dan estimator untuk Y adalah : = Dalam lambang Variansi dari X=N dan , c berarti combined atau kombinasi. dan variansi dari diberikan dalam teorema berikut. 70 Teorema 6.3 Dalam sampling random berstrata, jika V( besar pada setiap strata, maka )= Bukti teorema 6.3 diperoleh langsung dari teorema 6.1 dengan memperhatikan bahwa sampel-sampel dari strata bersifat independen. Teorema 6.4 Dalam sampling random berstrata, jika n besar maka : V( )= Bukti menggunakan argumen yang sama seperti dalam bukti teorema 2.4 = R = ( -R ) ( Dengan memperhatikan Jadi V( ) = V( -R maka ). = -R ) dan = 0. )= = = Perbedaan rumus variansi, V( ) dan V( Dalam terapan, penghitungan variansi dari ) terletak pada faktor dan dan R. dihitung melalui rumus estimasinya, yaitu : v( )= dengan syarat dan v( besar untuk semua h, )= dengan syarat n besar. 71 Soal-soal latihan : 1. Dari sampel random sederhana yang terdiri 10 rumah tangga (rt) diketahui penghasilan per bulan dan biaya hidup per bulan sbb (dalam ribuan rupiah) Penghasilan 1.750 2.550 1.100 1.800 3.450 2.900 3.550 2.450 2.100 1.500 Biaya hidup 1.600 2.200 1.050 1.500 2.850 2.250 3.100 2.100 1.650 1.350 Estimasikanlah mean biaya hidup per bulan seluruh rumah tangga dalam populasi dengan metode : a. mean per unit b. estimator rasio c. menggunakan estiomator = , jika diketahui mean penghasilan seluruh rt populasi Rp. 2.350.000,2. Dari sampel random sederhana 33 keluarga berpenghasilan rendah dicatat data banyaknya anggota keluarga ( ) , dan besarnya belanja keluarga dalam sebulan ( ) dan diketahui = 123, ( = 9072, = 533 , = 2822412, = 35955 dinyatakan dalam ribuan rupiah) Diketahui populasi keluarga berpenghasilan rendah ada 400 keluarga, dengan total banyaknya anggota keluarga 1522 orang. Estimasikanlah mean besarnya belanja keluarga dalam sebulan dengan menggunakan estimator : a. mean per unit b. estimator rasio dan hitunglah juga kesalahan standar dari masing-masing estimasi tersebut. 3. Sampel random sederhana terdiri 10 orang karyawan yang diambil dari populasi 175 orang karyawan sebuah perusahaan, diketahui nilai kerja sebelum pelatihan, , dan setelah pelatihan, , sebagai berikut : 72 60 68 72 75 82 58 71 64 67 73 65 74 80 81 90 64 76 66 72 82 Diketahui mean nilai kerja seluruh karyawan perusahaan tersebut sebelum pelatihan 73. Berikanlah tiga buah nilai estimasi mean nilai kerja seluruh karyawan perusahaan tersebut setelah mengikuti pelatihan. 4. Dari populasi 1.000 orang wisudawan yang terdiri 400 orang program studi PSI, 250 orang PS2 dan 350 orang PS3 diambil sampel random berstrata dengan memperhatikan program studi sebagai strata. Diperoleh data indeks prestasi dua tahun pertama ( ) dan indeks prestasi saat lulus ( ) sbb : PS 1 PS 2 PS 3 3,2 3,6 2,8 3,0 2,7 3,1 2,4 2,7 2,9 3,4 2,8 3,4 2,5 3,1 3,1 3,7 2,8 3,6 2,7 3,4 2,6 3,1 2,7 2,9 2,8 3,3 2,4 2,5 2,3 2,7 2,5 2,9 2,9 3,6 3,2 3,7 3,0 3,4 3,1 3,5 2,8 3,1 2,0 2,6 2,9 3,3 Diketahui mean IP 2 tahun pertama seluruh lulusan dari PS 1, PS 2 dan PS 3 berturut-turut 2,7 : 2,8 : 2,9. Berikanlah tiga buah nilai estimasi mean IP seluruh lulusan ketiga program studi tersebut dengan menggunakan estimator : mean per unit, rasio terpisah dan rasio kombinasi. 73 BAB VII ESTIMATOR REGRESI 7.1 Metode Estimasi Regresi Linear Seperti pada estimator rasio, estimator regresi linear dirancang untuk meningkatkan ketelitian dalam estimasi, dengan memanfaatkan hubungan antara variabel tambahan yang berkorelasi dengan Jika hubungan antara dan . mendekati linear, meskipun tidak melalui titik origin maka estimator yang didasarkan regresi linear pada lebih baik daripada estimator rasio. Dalam sampel random sederhana berukuran n, ( , linear untuk mean populasi, ), estimator regresi ,didefinisikan : = +b( - ) dengan lambang lr menyatakan regresi linear dan b adalah koefisien regresi. Estimator regresi dapat dipandang sebagai keadaan umum dari estimator mean per unit maupun estimator rasio dan sebaliknya estimator mean per unit dan estimator rasio merupakan keadaan khusus dari estimator regresi linear. Hal ini dapat dilihat, untuk b = 0, maka maka = + ( - )= = dan untuk b = = , . Oleh karena itu dengan pemilihan b yang sesuai diharapkan menghasilkan estimator dengan variansi yang lebih kecil. 7.2 Estimator Regresi dengan b Tertentu Dalam estimator regresi linear, jika b nilainya ditentukan lebih dahulu, misalnya b = , suatu konstan, maka estimator regresi linear bersifat tak bias dengan variansi seperti yang diberikan dalam teorema berikut. 74 Teorema 7.1 Dalam sampel random sederhana, jika adalah konstan yang ditentukan lebih dahulu, maka estimator regresi linear = + ( - ) tak bias untuk , dengan variansi : = Bukti : Karena E( konstan, maka ) = E( + ( - Selanjutnya , )) = E( ) + E( - ) = adalah mean sampel dari +0= . + ( ) dengan mean populasinya . Oleh karena itu menurut teorema 2.2, = Dari teorema 7.1 ini diperoleh estimasi tak bias untuk V( v( )= Dari hasil pada teorema 7.1 munculah pertanyaan, nilai memberikan V( ), yaitu manakah yang akan ) minimum? Jawabannya diberikan dalam teorema berikut. Teorema 7.2 Nilai yang meminimumkan V( ) adalah dengan variansi minimumnya Vmin( )= ) 75 Bukti : V( ) adalah fungsi kuadrat dari variabel Jadi V( dari V( Vmin( , dengan koefisien dari ) minimum untuk adalah . Kemudian nilai minimum ) adalah ) = – 2( ( = = 7.3 ) Estimator regresi dengan b dihitung dari sampel. Teorema 7.2 menyarankan bahwa jika b harus dihitung dari sampel, maka b= yang tidak lain adalah estimator kuadrat terkecil untuk B. Dengan nilai b tersebut. Estimator regresi linear untuk menjadi +b( Sama halnya seperti pada estimator rasio, dihitung dari sampel, karena b bukan konstan, tetapi bersifat bias dengan bias mengandung faktor Meskipun demikian, bila n besar, maka . mendekati tak bias dengan variansi seperti yang diberikan dalam teorema berikut. Teorema 7.3 Jika b adalah estimator kuadrat terkecil untuk B, yaitu b = besar +b( mendekati tak bias untuk , maka untuk n dengan 76 . V( )= ) dengan 7.4 Estimasi variansi dari sampel Pada kasus n besar, nilai V( ) yang rumus pendekatannya diberikan dalam teorema 7.3 dalam praktek tidak dapat dihitung karena memuat parameter dan Diperlukan estimasi untuk V( ). Misalkan e i = yi – – B(xi – ) maka = ) Dalam sampling random sederhana berukuran n, menurut teorema 2.3, adalah tak bias untuk . B( =( b( dengan mengabaikan suku ke-2 ruas kanan, dapat dipakai sebagai estimator untuk ( namun bersifat bias. Dalam teori regresi, pembagi digunakan sebagai pengganti bias untuk dengan b = agar memberikan hasil yang tak . Jadi estimator tak bias untuk adalah : , dan oleh karena itu estimator untuk V( ) adalah : 77 atau dengan rumus lain v( 7.5 ) = Perbandingan Estimator dan dengan Sampel Berukuran Besar Perbandingan antara tiga buah estimator untuk mean populasi, estimator mean per unit, estimator rasio, , yaitu , dan estimator regresi linear, , dapat dilakukan melalui pendekatan variansinya. V( ) = (mean per unit) V( ) = V( ( )= ) ) (Rasio) (Regresi) Jelas bahwa variansi estimator regresi lebih kecil daripada variansi mean per unit, kecuali . Variansi estimator regresi akan lebih kecil daripada variansi estimator rasio jika atau >0 atau > 0 , dengan B= Jadi estimator regresi lebih teliti atau lebih akurat daripada estimator rasio, kecuali jika . 78 7.6 Estimator Regresi Dalam Sampling Random Berstata Sama seperti dalam estimator rasio, terdapat dua jenis estimator regresi dalam sampling random berstata, yaitu estimator dengan cara terpisah dan cara kombinasi. Dengan cara terpisah, estimator untuk mean strata ke-h adalah + bk ( Maka estimator untuk total populasi adalah dan estimator untuk mean populasi adalah Dalam kasus bh ditentukan lebih dahulu untuk setiap h, variansi dari diperoleh berdasarkan teorema 7.1, yaitu : Selanjutnya, menurut teorema 7.2, V ( ) minimum jika = dengan nilai minimum. Estimator kedua, dengan cara kombinasi, + b( Dalam kasus b ditentukan lebih dahulu, estimator tersebut bersifat tak bias dengan variansi Nilai b yang meminimumkan variansi adalah = 79 Nilai adalah mean tertimbang atau terbobot dari koefisien regresi strata, = . Jika , maka = = (Σ Σ . Soal-soal latihan : 1. Dari sampel random sederhana yang terdiri 10 rumah tangga (rt) diketahui penghasilan per bulan dan biaya hidup per bulan sbb (dalam ribuan rupiah) Penghasilan 1.750 2.550 1.100 1.800 3.450 2.900 3.550 2.450 2.100 1.500 Biaya 1.600 2.200 1.050 1.500 2.850 2.250 3.100 2.100 1.650 1.350 Hidup Estimasikanlah mean biaya hidup per bulan seluruh rumah tangga dalam populasi dengan metode regresi linear, jika diketahui mean penghasilan seluruh rt populasi Rp. 2.350.000,2. Sampel random sederhana berukuran 6 diperoleh data sbb : (3,28), (7,55), (6,40), (2,17), (5,40), (6,48). Jika ukuran populasi 300 dan diketahui = 2,25 , = 198 dan serta 4,75. a) Tentukanlah estimator regresi linear bagi . b) Hitunglah . Dari data soal tersebut, tentukanlah pula c) Nilai estimasi bagi rasio R. d) Nilai estimasi bagi melalui . 3. Dari sampel random sederhana 33 keluarga berpenghasilan rendah dicatat data banyaknya anggota keluarga ( ) dan besarnya belanja keluarga dalam sebulan ( ) dan diketahui = 35955. ( = 123, = 9072, = 533, = 2822412, dinyatakan dalam ribuan rupiah ). Diketahui populasi keluarga berpenghasilan rendah ada 400 keluarga, dengan total banyaknya anggota keluarga 1522 orang. Estimasikanlah mean besarnya belanja keluarga dalam sebulan dengan menggunakan estimator regresi linear dan hitunglah kesalahan standar dalam estimasi tersebut. 80 4. Sampel random sederhana terdiri 10 orang karyawan yang diambil dari populasi 175 orang karyawan sebuah perusahaan, diketahui nilai kerja sebelum 60 68 72 75 82 58 71 64 67 73 65 74 80 81 90 64 76 66 72 82 pelatihan, , dan setelah pelatihan, , sebagai berikut Diketahui mean nilai kerja seluruh karyawan perusahaan tersebut sebelum pelatihan 73. Berikanlah estimasi regresi linear untuk mean nilai kerja seluruh karyawan perusahaan tersebut setelah mengikuti pelatihan dan hitunglah pula kesalahan standarnya. 5. Dari data soal latihan nomor 4 bab VI, berikanlah estimasi regresi linear secara terpisah dan secara kombinasi untuk mean IP seluruh lulusan dari ketiga program studi tersebut. 81 BAB VIII SAMPLING SISTEMATIK 8.1 Pengambilan Sampel Sistematik Ditentukan sebuah populasi berukuran N. Untuk mengambil sampel sistematik, mula-mula N unit populasi diberi nomor 1 sampai dengan N. Kemudian secara random diambil sebuah unit dari k unit pertama, Misalkan terambil unit , , ..., . . Maka unit-unit populasi yang bernomor j, j+k, j+2k,... dan seterusnya menjadi unit sampel. Sampel yang diperoleh ditentukan oleh hasil/pengambilan sebuah unit, dari k unit pertama dan sampel tersebut dinamakan sampel sistematik 1 unit setiap k atau disingkat sampel sistematik setiap k. Sebagai contoh, dari populasi berukuran 23 akan diambil sampel sistematik setiap 5. Langkah pertama, diambil secara random satu unit diantara 5 unit pertama, , , , , . Misalkan terambil unit , maka unit-unit populasi yang masuk sebagai unit sampel adalah dan sampel yang diperoleh berukuran 5. Jika pada pengambilan tersebut diperoleh hasil maka sampel yang didapat beranggotakan unit-unit dan , , dan ukurannya adalah 4. Dalam contoh ini ada 5 buah sampel yang mungkin diperoleh yang terdiri 3 buah sampel masing-masing berukuran 5 dan 2 buah sampel masing-masing berukuran 4. Setiap sampel dari 5 buah sampel tersebut diperoleh dengan probabilitas yang sama yaitu . Daftar sampel beserta nomor unit-unit anggotanya sebagai berikut : Daftar sampel-sampel sistematik setiap 5 yang diambil dari populasi berukuran 23. Nomor sampel Nomor Unit 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 82 16 17 18 21 22 23 19 20 dalam contoh ini, N bukan kelipatan k, sehingga ukuran sampel-sampel yang mungkin terambil, tidak seluruhnya sama. Jika n kelipatan k, yaitu N = kn, maka ada k buah sampel yang mungkin terambil dan masing-masing sampel berukuran n. Perbandingan antara sampel sistematik setiap k dengan sampel random berstrata dapat dilakukan dengan memandang k unit pertama sebagai strata 1, k unit kedua sebagai strata 2, k unit ketiga sebagai strata 3 dan seterusnya. Selanjutnya sampel random berstrata diambil dengan alokasi satu unit sretiap strata. Maka nomor unit-unit sampel sistematik dan nomor unit-unit sampel random berstrata dapat digambarkan sebagai berikut. x x k o x 2k x o 3k 4k x = nomor unit sampel sistematik = nomor unit sampel random berstrata Jarak titik nomor berurutan dari unit sampel sistematik sama, yaitu = k; tetapi jarak titik nomor berurutan dari unit sampel random berstrata tidak selalu sama. Dalam pembahasan selanjutnya, kita akan membatasi diri dalam kasus N kelipatan k, yaitu N = kn, sehingga masing-masing sampel yang mungkin terambil mempunyai ukuran yang sama, yaitu n. 8.2 Variansi Dari Estimator Mean Ditentukan sebuah populasi berukuran N dan misalkan adalah mean populasi tersebut. Dalam sampling sistematik setiap k, misalkan adalah mean sampel sistematik, maka bersifat tak bias untuk yang ditunjukkan sebagai berikut. Ada k buah sampel yang mungkin terambil, masing-masing berukuran n dan terambil dengan probabilitas . Misalkan sampel ke – i, j = 1,2,...n , i = 1,2,...k, dan misalkan adalah unit ke – j di dalam adalah mean sampel ke – i. Maka 83 Jadi tak bias untuk . Variansi dari diberikan dalamn teorema berikut ini. Teorema 8.1 Untuk N = kn, mean sampel sistematik setiap k, , tak bias untuk dengan variansi V( )= dengan adalah variansi (rata-rata variansi) antara unit-unit yang terletak di dalam sampel sistematik yang sama. Bukti Dengan menggunakan kesamaan umum yang diperoleh dalam analisis variansi. Menurut definisi, Jadi dan 84 V( )= 8.3 Efisiensi Sampling Sistematik Terhadap Sampling Random Sederhana Perbandingan estimator dengan dapat diperoleh dari teorema 8.1. Sebagai akibat dari teorema 8.1, mean sampel sistematik memiliki presisi yang lebih tinggi daripada mean sampel random sederhana jika hanya jika > Bukti Dalam sampling random sederhana berukuran n, variansi dari estimator mean, . V( ) = Dari teorema 8.1, V( ) < V( ) jika dan hanya jika , yaitu jika k(n-1) > ( N-1 - ) = k(n-1) < atau > . Interpretasi dari hasil ini adalah bahwa sampel sistematik lebih teliti atau presisinya lebih tinggi daripada sampel random sederhana jika variansi didalam sampel-sampel sistematik lebih besar daripada variansi populasi, yaitu jika unitunit di dalam setiaps sampel bersifat heterogen. Teorema 8.2 V( )= Dengan , adalah koefisien korelasi antara pasangan unit-unit yang berada dalam sampel sistematik yang sama, dengan rumus Penjelasan : Pada faktor pembilang, terdapat sebanyak (n)(n-1)/2 pasang unit-unit dalam sampel yang sama, dan banyaknya sampel adalah k. Jadi mean (rata-rata) faktor pembilang diambil meliputi seluruh 85 k(n)(n-1)/2 pasangan unit-unit. Sementara faktor penyebut, (N-1) /N sehingga diperoleh = dengan rumus di atas. Bukti Dari definisi, Jadi sehingga V( )= . Teorema 8.2 menunjukkan bahwa korelasi positif antara unit-unit dalam sampel yang sama akan menaikkan variansi dari . 8.4 Perbandingan Sampling Sistematik Dengan Sampling Random Berstrata Teorema 8.1 dan teorema 8.2 menjelaskan V( oleh karena itu diperoleh hubunga antara ) dinyatakan dalam , yang dengan , mana yang presisinya lebih tinggi guna mengestimasi Perbandingan antara dengan dalam estimasi , dilakukan dengan memandang k unit pertama populasi sebagai strata 1, k unit kedua sebagai strata 2, dan seterusnya. Jadi terdapat n strata yang masing-masing berukuran k. 86 Sampling random berstrata berukuran n dilakukan dengan alokasi 1 unit setiap strata. Perbandingan antara dengan diperoleh melalui teorema berikut. Teorema 8.3 V( )= dengan adalah variansi (rata-rata variansi) dari unit-unit yang terletak dalam strata yang sama. adalah korelasi antara simpangan terhadap mean strata dari pasangan unit-unit dalam sampel yang sama, yang dirumuskan dengan Bukti teorema 8.3 dapat dilakukan secara sama seperti pada bukti teorema 8.2. Disisi lain, variansi estiamator V( hasilnya adalah )= Jadi, dan mempunyai presisi yang sama jika dan hanya jika Jika > 0, maka maka presisinya lebih tinggi daripada 8.5 presisinya lebih tinggi daripada . , dan jika . Sampling Sistematik Untuk Proporsi Proporsi unit-unit populasi yang masuk kelas C dari sebuah populasi dapat dipandang sebagai mean populasi yang nilai unit-unitnya 1 atau 0. Hal ini telah dijelaskan dalam pasal 3.2. Jika P adalah proporsi unit-unit populasi yang masuk kelas C dan maka adalah proporsi unit-unit sampel sistematik yang masuk kelas C, tak bias untuk P dan variansinya adalah 87 V( dengan )=E = adalah proporsi unit-unit yang masuk kelas C dalam sampel sistematik ke-i. Dari teorema 8.1 dapat diperoleh rumus lain untuk V( ), yaitu Soal-soal latihan. 1. Dari populasi dalam contoh 1 dengan trend naik (susunan II), bandingkanlah estimator dengan . Sebagai estimator untuk , manakah yang presisinya lebih tinggi? 2. Sebuah populasi berupa biaya hidup sebulan dari 15 keluarga, sbb (dalam ratusan ribu rupiah). , , Diambil sampel sistematik setiap 3 keluarga dan misalkan adalah mean biaya hidup sebulan dari sampel tersebut. a) Hitunglah V( ) b) Hitunglah pula V( ) dalam sampel random sederhana berukuran 5 dari populasi tersebut. Dari dua jenis sampel tersebut, jenis manakah yang Sdr, sarankan untuk digunakan dalam estimasi populasi mean, 3. Diperhatikan sampel sistematik setiap 10 halaman dari sebuah buku yang memuat 80 halaman untuk mengestimasi mean banyaknya salah cetak tiap halaman. Dari 10 buah sampel yang mungkin terambil diketahui variansi masing-masing sbb : Jika variansi banyaknya salah cetak per halaman buku tersebut , hitunglah variansi dari estimator mean. 88 4. Sebuah populasi berukuran 15 unit dengan nilai sampai berturut-turut sbb : 3, 5, 6, 20, 22, 23, 11, 13, 14, 7, 9, 10, 28, 30, 31. Bandingkanlah tiga buah estimator untuk mean berikut ini : a) Mean per unit, , dalam sampel random sederhana berukuran 5. b) Sampel sistematik setiap 3 unit, c) Mean sampel random berstrata dengan satu unit setiap strata, . Hitunglah masing-masing variansi dari ketiga estimator tersebut. Estimamator manakah yang presisinya tertinggi? 5. Sebuah buku terdiri 30 halaman. Banyaknya salah cetak pada halaman 1 sampai 30 berturut-turut : 1, 2, 0, 0, 3, 2, 2, 0, 0, 1, 1, 0, 3, 1, 1, 2, 3, 0, 0, 0, 2, 0, 1, 0, 0, 0, 1, 1, 3, 2. Diperhatikan dua macam sampel, yaitu sampel random sederhana berukuran 10 dan sampel sistematik tiap 3 halaman, untuk mengestimasi mean banyaknya salah cetak per halaman. Estimator manakah yang presisinya lebih tinggi? Mengapa demikian? 89 DAFTAR PUSTAKA 1. Cochran, W.G, 1977, Sampling Techniques, John Wiley and Sons, third edition. 2. Jessen, R.J, 1978, Statistical Survey Techniques, John Wiley and Sons. 3. Yamane, Taro., 1967, Elementary Sampling Theory, Prentice Hall. 90