TUGAS STATISTIK 1 Materi Pertemuan XI Kelompok 5 : Sesi 11 1. 2. 3. 4. 5. Agatha Dilla Maralisa Asri Ayu Apriliatna Orisa Elfath Treatment M. Kabanga 201466072 201466029 201466044 201466075 201466176 FAKULTAS FISIOTERAPI UNIVERSITAS ESA UNGGUL 2016 Temu XI KONSEP DISTRIBUSI SAMPLING A. Pendahuluan 1 Di dalam statistik deskriptif telah dibicarakan bagaimana mendapatkan deskripsi dari data yang diolah atau sengaja dikumpulkan untuk mendapatkan informasi yang terkandung di dalamnya. Di dalam statistik inferens kita akan membicarakan bagaimana menggeneralisasi informasi yang telah didapatkan. Sebagai contoh, dari suatu rapid survei yang dilakukan di Tangerang dengan mewawancarai sebanyak 210 orang ibu yang mempunyai balita (sampel) didapatkan bahwa yang melakukan pemeriksaan sampai KA sebanyak 20%. Hasil yang didapatkan ini adalah informasi dari 210 ibu balita. Sebenarnya maksud kita melakukan suatu pengumpulan data tersebut adalah ingin mengetahui berapa sebenarnya yang melakukan pemeriksaan sesuai KA di Kabupaten Tangerang. Data dari pengumpulan sebanyak 210 ibu tersebut ingin kita perlakukan menjadi informasi untuk (Tangerang). Untuk itu akan dipakai metode statistik inferens. 2 Jadi, statistik inferens adalah semua cara metode yang dipergunakan untuk menggeneralisasi hasil dari suatu sampel menjadi hasil populasi. Dasar-dasar di dalam statistik inferens ini adalah “distribusi sampling”. Dengan demikian, sebelum membicarakan materi estimasi dan uji hipotesis perlu memahami apa yang disebut distribusi sampling. Distribusi sampling adalah distribusi dari mean-mean sampel yang diambil secara berulang kali dari suatu populasi. Untuk itu perlu kita ketahui suatu ketentuan yang dapat membedakan beberapa ukuran antara sampel dan populasi. Ukuran-ukuran untuk sampel dan populasi adalah sebagai berikut. Sampel 1 2 Populasi Nilai (karakteristik) Statistik Parameter Mean (rata-rata hitung) x µ Standar deviasi S Jumlah Unit N N Sutanto Priyo Hastono dan Luknis Sabri, Statistik Kesehatan (Jakarta: PT Rajawali Persada, 2010) hal. 75 Sutanto Priyo Hastono , ibid hal. 76 Misalnya kita mempunyai suatu populasi yang mempunyai mean = µ dengan N elemen dan standar deviasi . 1. Dilakukan pengambilan sampel random besarnya n (X1,X2, ...Xn), dihitung rata-rata x dan simpangan baku s. Sampel yang diambil berulang kali ini akan menghasilkan bermacam-macam nilai rata-rata. Dari sampel satu sampai satu sampai sampel ke m didapatkan rata-rata hitung X 1........... X m 2. Mean atau rata-rata dari sampel-sampel ini ( X 1........... X m) kalau disusun akan membentuk suatu distribusi. 3Distribusi dari nilai mean-mean sampel inilah yang disebut distribusi sampling harga mean. POPULASI X1,X2, ...Xn Mean = µ Standar deviasi = Sampel 1 Sampel 2 Sampel 3 Sampel m X1,...Xn X1,...Xn X1,...Xn X1,...Xn (n observasi) (n observasi) (n observasi) (n observasi) X X X X 1 2 Distribusi Sampling 3 Sutanto Priyo Hastono , ibid hal. 77 3 m B. Sifat-sifat Distribusi Sampling Sifat distribusi sampling ini disebut Central Limit Theorem (teorema limit pusat). Sifat inilah yang mendasari teori inferens. Sifat-sifat tersebut adalah sebagai berikut. Sifat 1 Apabila sampel sampel random dengan n elemen masing-masing diambil dari suatu populasi normal, yang mempunyai mean = µ variasi 2, distribusi sampling harga mean akan mempunyai mean sama dengan µ dan varian 2/n atau standar deviasi / .n. 4Standar deviasi distribusi sampling harga mean ini dikenal sebagai "Standar Error" (SE). Sifat 2 Apabila populasi berdistribusi normal, distribusi sampling harga juga akan berdistribusi normal. Maka, berlaku sifat seperti persamaan di bawah ini (z Score adalah nilai deviasi relatif antara nilai sampel dan populasi = nilai distribusi normal standar): 𝑍= X − µ 𝑆𝐸 Sifat 3 Walaupun populasi berdistribusi sembarang, kalau diambil sampel sampel berulang kali secara random, distribusi harga meannya akan membentuk distribusi normal. Contoh : Dipunyai populasi lima orang penderita penyakit "D" yang masa inkubasinya sebagai berikut. 4 Sutanto Priyo Hastono , ibid hal. 78 µ No Pasien Masa Inkubasi (hari) 1 2 2 3 3 6 4 8 5 11 = 6 hari berasal dari 2+3+6+8+11/15 2 = 10,8 hari berasal dari = 10,8 = 3,29 hari 5 ( X ) 2 n 1 Diambil sampel dengan besar n = 2. Dari Populasi di atas kemungkinan sampel yang terjadi 52 = 25 sampe-sampel tersebut seperti tertera di dalam tabel di bawah ini. 5 Sampel Pasien yang terpilih Masa inkubasi Mean 1 1;1 2;2 2 2 1;2 2;3 2,5 3 1;3 2;6 4 4 1;4 2;8 5 5 1;5 2;11 6,5 6 2;1 3;2 2,5 7 2;2 3;3 3 8 2;3 3;6 4,5 9 2;4 3;8 5,5 10 2;5 3;11 7 11 3;1 6;2 4 12 3;2 6;3 4,5 13 3;3 6;6 6 14 3;4 6;8 7 Sutanto Priyo Hastono , ibid hal. 79 6 15 3;5 6;11 8,5 16 4;1 8;2 5 17 4;2 8;3 5,5 18 4;3 8;6 7 19 4;4 8;8 8 20 4;5 8;11 9,5 21 5;1 11;2 6,5 22 5;2 11;3 7 23 5;3 11;6 8,5 24 5;4 11;8 9,5 25 5;5 11;11 11 Dari distribusi sampling (Data pada kolam 4) didapatkan: XX 2 + 2,5 + 4 ...s/d.... .. 11 6...... 25 varian (SE2) = (X X ) n 1 = 5,4 nilai ini tidak lain, adalah = 2/n, = 10,8/2 = 5,4 SE = 6 5.4 = 2,32 hari. Sutanto Priyo Hastono , ibid hal. 80 Distribusi sampling harga mean dari kedua puluh lima sampel yang diperoleh dari lima populasi di atas kalau digambarkan dalam bentuk kurva akan membentuk kurva yang simetris (kurva normal umum). sampling, maka sifat-sifat kurva normal dapat diperlakukan. Contoh Soal Selama ini diyakini bahwa kadar haemoglobin (Hb) orang sehat (µ) = 12 gr % dan ( ) = 2,5 gr %. Seorang mahasiswa telah mengambil sebanyak 25 orang pengunjung suatu Puskesmas. Hitunglah probabilitas dari rata-rata Hb sampel tadi. a) > 13 gr % b) Antara 11 sp 13,5 gr % 7 Penyelesaian a) µ = 12 gr % = 2,5 gr % n = 25 SE = Z= n 2,5 25 = 0,5 gr % 13 12 2 tabel = 0,47772 0,5 13 gr % ) = 0,5 - 0,47772 = 0,0228. b) Z1 Z1 11 12 2,0 tabel = 0,47772 0,5 13,5 12 3,0 tabel = 0,4987 + 0,5 0,975 9 p( gr < X < 13,5 gr %) = 0,9759 A. 7 TEKNIK PENENTUAN JUMLAH SAMPEL Sutanto Priyo Hastono , ibid hal. 81 8 Untuk menentukan banyaknya sampel yang dapat diambil dari suatu populasi yang berukuran tertentu digunakan perhitungan sebagai berikut. 1. Untuk Pengambilan sampel dengan Pengembalian Pengambilan sampel disebut dengan pengambilan jika anggota yang telah diambil untuk dijadikan sampel disatukan kembali dengan anggota populasi lainnya sehingga masih ada kesempatan untuk dipilih kembali. Jika dari populasi berukuran N diambil sampel berukuran dengan pengembalian maka banyaknya sampel yang mungkin diambil adalah Nn Contoh: 9 Untuk populasi berukuran 4 dengan anggota-anggotanya A, B, C, D, dan sampel yang diambil berukuran 2 maka banyaknya sampel yang mungkin dapat diambil adalah 42 = 16 buah, yaitu: sampel 1 : AA sampel 9 : CA sampel 2 : AB sampel 10 : CB sampel 3 : AC sampel 11 : CC sampel 4 : AD sampel 12 : CD sampel 5 : BA sampel 13 : DA sampel 6 : BB sampel 14 : DB sampel 7 : BC sampel 15 : DC sampel 8 : BD sampel 16: DD 8 Ir. M. Iqbal Hasan,M.M., Pokok-Pokok Materi Statistik 2(Statistik Inferensif) (Jakarta: PT Bumi Aksana, 2003) hal. 92 9 Ir. M. Iqbal Hasan,M.M., ibid , hal.93 Secara teoretis, populasi berhingga yang dikenali sampling dengan cara pengembalian dapat dianggap sebagai populasi tak berhingga. Hal itu disebabkan berapapun banyaknya sampel yang diambil, populasi tidak akan pernah habis. 2. Untuk Pengambilan sampel Tanpa Pengembalian Pengambilan sampel disebut tanpa pengembalian jika anggota populasi yang telah diambil untuk dijadikan sampel tidak disatukan dengan anggota populasi lainnya. Jika dari populasi berukuran N diambil sampel berukuran n tanpa pengembalian maka banyaknya sampel yang mungkin dapat diambil adalah C N n N! n!( N n)! Contoh: Untuk populasi berukuran 5 dengan anggota-anggotanya A. B, D, E, dan sampel yang diambil berukuran 2 maka banyaknya sampel yang mungkin dapat diambil adalah C 5 2 5! 2!(5 2)! = 10 buah sampel Ke-10 buah sampel itu adalah sampel 1 : AA sampel 6 : BD sampel 2 : AC sampel 7 : BE sampel 3 : AD sampel 8 : CD sampel 4 : AE sampel 9 : CE sampel 5 : BC sampel 10 : DE B. PENGERTIAN DISTRIBUSI SAMPLING 10 Distribusi sampling adalah distribusi dari besaran-besaran statistik. Seperti rata-rata, simpangan baku, proporsi (persentase) yang mungkin muncul dari sampel-sampel. Distribusi dari rata-rata sampel disebut distribusi sampling rata-rata atau distribusi rata-rata sampel, distribusi dari distribusi dari proporsi sampel disebut distribusi sampling proporsi atau distribusi proporsi sampel, dan sebagainya. Contoh: Jika besar populasi adalah 3 (N = 3), misalkan A, B, C, kemudian diambil sampel berukuran 2 (n = 2)maka akan diperoleh 3 sampel, yaitu AB, BC, AC (sampelnya tanpa pengembalian). Dari ke-3 sampel tersebut dihitung rata-ratanya, maka didapatkan 3 rata-rata sampel. Tiga rata-rata sampel tersebut membentuk suatu distribusi, disebut distribusi sampling rata-rata atau distribusi rata-rata sampel. Demikian pula dengan perhitungan simpangan baku, varians, proporsi sampel akan membentuk distribusi simpangan baku, distribusi vanans, dan distribusi proporsi. C. 11 JENIS-JENIS DISTRIBUSI SAMPLING Berdasarkan besaran statistik yang digunakan, dikenal beberapa jenis distribusi dan sampling, yaitu distribusi sampling rata-rata, proporsi, beda dua rata-rata, dan beda dua proporsi. 1. Distribusi Sampling Rata-Rata Distribusi sampling rata-rata atau distribusi rata-rata sampel adalah distribusi dari besaran rata-rata yang muncul dari sampel-sampel. Contoh soal: 10 11 Ir. M. Iqbal Hasan,M.M., ibid , hal.94 Ir. M. Iqbal Hasan,M.M., ibid , hal.95 sebuah populasi berukuran 6 yang anggotanya adalah 2, 3, 5, 6, 8, 9 dan sampelnya berukuran 2. Buatlah distribusi sampling rata-ratanya jika pengambilan sampelnya dilakukan tanpa pengembalian! Penyelesaian: Sampel berukuran 2 (n = 2) dengan rata-ratanya yang dapat dibentuk dari populasi berukuran 6 (N = 6) dengan anggota 2, 3, 5. 6, 8. 9 adalah sampel 1 : 2;3 dengan rata-rata = 2,5 sampel 2 : 2;5 dengan rata-rata = 3,5 sampel 3 : 2;6 dengan rata-rata = 4 sampel 4 : 2;8 dengan rata-rata = 5 sampel 5 : 2;9 dengan rata-rata = 5,5 sampel 6 : 3;5 dengan rata-rata = 4 sampel 7 : 3;6 dengan rata-rata = 4,5 sampel 8 : 3;8 dengan rata-rata = 5,5 sampel 9 : 3;9 dengan rata-rata = 6 sampel 10 : 5;6 dengan rata-rata = 5,5 sampel 11 : 5;8 dengan rata-rata = 6,5 sampel 12 : 5;9 dengan rata-rata = 7 sampel 13 : 6;8 dengan rata-rata = 7 sampel 14 : 6;9 dengan rata-rata = 7,5 sampel 15 : 8;9 dengan rata-rata = 8,5 Distribusi sampling rata-ratanya diperlihatkan dalam tabel berikut ini. TABEL 3.3 DISTRIBUSI SAMPLING RATA-RATA X ƒ Probabilitas 2,5 1 0,07 3,5 1 0,07 4 2 0,13 4,5 1 0,07 5 1 0,07 5,5 3 0,20 6 1 0,07 6,5 1 0,07 7 2 0,13 7,5 1 0,07 8,5 1 0,07 Jumlah 15 1,00 Pada distribusi sampling rata-rata berlaku hal-hal berikut ini. a. Pemilihan sampel dari populasi terbatas Bila populasi terbatas yang berukuran N dan berdistribusi normal dengan rata-rata µ dan simpangan baku , rata-rata sampel X yang didasarkan pada sampel random berukuran n dan dipilih dari populasi di atas, akan memiliki distribusi normal dengan rata-rata dan simpangan baku seperti ini. 1) Untuk pengambilan sampel tanpa pengembalian atau n > 5% N X = µ X 2) 12 n N n N 1 Untuk pengambilan sampel dengan pengembalian atau n ≤ 5% N X = µ X n Contoh soal: Toko UNDUR UNDUR memiliki 5 karyawan, yaitu A, B, C, D E dengan upah per jam (nbaan napiah) 2, 3, 3, 4, 5. Jika upah yang diperuleh itu dianggap sebagai populasi, tentukan: 12 Ir. M. Iqbal Hasan,M.M., ibid , hal.96 a) rata-rata sampel dari 2 unsur (upah dari dua karyawan), b) rata-rata dari rata-rata sampel, c) simpangan baku dari rata-rata sampel! Pengambilan sampel dilakukan tanpa pengembalian Penyelesaian: Banyaknya sampel yang mungkin adalah C 5 2 5! 2!(5 2)! = 10 buah Ke-10 buah sampel itu ialah: 1. 2;3 6. 3;4 2. 2;3 7. 3,5 3. 2;4 8. 3;4 4. 2;5 9. 3;5 5. 3;3 10. 4;5 a. Rata-rata sampelnya ialah: sampel 1 = 2,5 sampel 6 = 3,5 sampel 2 = 2.5 sampel 7 = 4 sampel 3 = 3 sampel 8 = 3,5 sampel 4 = 3,5 sampel 9 = 4 sampel 5 = 3 sampel 10 = 4,5 b. 13 13 Rata-rata dari rata-rata sampel adalah 233 45 5 Ir. M. Iqbal Hasan,M.M., ibid , hal.97 = 3,4 X = µ = 3,4 c. Simpangan baku dari rata-rata sampel (2 3,4) 2 (3 3,4) 2 (3 3,4) 2 (4 3,4) 2 (5 3,4) 2 5 = 1,02 X n N n N 1 1,02 5 2 0,62 2 5 1 b. Untuk pemilihan sampel dari populasi yang tidak terbatas Bila populasi memiliki ukuran yang tidak berhingga dan secara normal dengan rata-rata u dan simpangan baku , maka rata-rata sampel X yang didasarkan pada sampel random yang berukuran n dan yang dipilih dengan pengembalian atau tanpa pengembalian dari populasi tersebut akan memiliki distribusi normal dengan rata-rata dan simpangan baku: X = µ dan X c. n Daftar distribusi normal untuk distribusi sampling rata-rata Penggunaan daftar distribusi normal untuk distribusi sampling rata-rata, dapat digunakan rumus: Z X X 14 1) Z 2) Untuk populasi terbatas atau Z atau n X X n > 5%, berlaku : N X N N 1 Untuk populasi tidak terbatas atau Z X X atau Z n ≤ 5%, berlaku : N X n Pada umumnya, normalitas dari distribusi sampling rata-rata disebut teori limit sentral dan dinyatakan sebagai berikut. 1) Jika populasi cukup besar dan berdistribusi secara normal maka distribusi sampling rataratanya akan normal. 2) Jika tidak normal maka distribusi samping rata-ratanya akan mendekati normal, apabila jumlah sampel cukup besar, biasanya 30 atau lebih (n ≥ 30). 3) Distribusi normal dan rata-rata sampel memiliki rata-rata yang sama dengan rata-rata harapan E( X ) dan simpangan baku X , Nilai-nilai itu dapat dihitung dan rata-rata populasi (µ) dan simpangan baku pagulus ( ). Contoh soal: Upah per jam para pekeria PT GEBYAR memiliki tingkat upah rata-rata Rp500,00 per jam dan simpangan baku Rp60,00. Berapa probabilitas bahwa upah rata-rata 50 orang pekeria yang merupakan sampel random akan berada di antara Rp510,00 dan Rp520,00? Penyelesaian: 14 Ir. M. Iqbal Hasan,M.M., ibid , hal.98 Jika ukuran populasi tidak diketahui maka dianggap sebagai populasi tidak terbatas. µ = 500, = Rp60; n = 50; X = 510 dan 520 Dengan demikian: X n 60 Z 50 8,485 X X Untuk X = 510 maka Z = 510 500 1,18 8,485 Untuk X = 520 maka Z = 520 500 2,36 8,485 Didapat: P (1.18 < Z < 2.36) P (1.18 < Z < 2.36) = P (0 < Z < 2,36) - P (0 < Z < 1,18) = 0,4909 - 0,3810 = 0,1099 Jadi, probabilitas bahwa upah rata-rata dan sampel berada di antara Rp510,00 dan Rp520,00 adalah 0,1099 atau 10,99% atau 11%. 2. Distribusi sampling Proporsi Proporsi dari populasi dinyatakan dengan P = dengan P = X dan proporsi untuk sampel dinyatakan N X N Distribusi sampling proporsi adalah distribusi dan proporsi (persentase) yang diperoleh dari semua sampel sama besar yang mungkin dari satu populasi. Distribusi sampling proporsi juga memiliki arti yang penting seperti halnya distribusi sampling rata-rata. Distribusi sampling proporsi dapat digunakan untuk mengetahui persentase atau perbandingan antara dua hal yang berkomplemen (peristiwa binomial), seperti perokok dan bukan perokok, persentase pemilih dan bukan pemilih di suatu pemilu, dan perbandingan antara pemakai dan bukan pemakai hasil produksi tertentu. Contoh: Sebuah populasi yang beranggotakan 6 orang, 3 di antaranya perokok dan yang lainnya bukan perokok. Apabila diambil sampel yang beranggotakan 3 orang, proporsi atau banyaknya sampel untuk ke-3 anggota sampel perokok, 2 perokok dan 1 bukan perokok , 1 perokok dan 2 bukan perokok dan ke-3 nya bukan dapat diketahui (pemilihan sampel tanpa pengembalian), misalnya, anggota populasi adalah A, B, C untuk perokok dan K L M untuk bukaa perokok. Banyaknya sampel yang dapat diambil adalah C 6 3 6! = 20 buah 3!(6 3)! Ke-20 buah sampel itu ialah 1. ABC 6. ACL 11. BCK 16. BLM 2. ABK 7. ACM 12. BCL 17. CKL 3. ABL 8. AKL 13. BCM 18. CKM 4. ABM 9. AKM 14. BKL 19. CLM 5. ACK 10. ALM 15. BKM 20. KLM Distribusi sampling proporsinya (X = perokok, n = 3) adalah TABEL 3.4 DISTRIBUSI SAMPLING PROPORSI (X) X Proporsi Sampel N ƒ Prob. X = 3 (3(p), 0 (bp)) 1 1 0,05 X = 2 (2(p), 1 (bp)) 0,67 9 0,45 X = 1 (1(p), 2 (bp)) 0,33 9 0,45 X = 0 (0(p), 3 (bp)) 0 1 0,05 20 1,00 Sampel yang mungkin Jumlah Catatan: - P = perokok dan bp = bukan perokok - 3(p), 0(bp) = ABC 2(p), 1(bp) = ABK, ABL, ABM, ACK, ACL, ACM, BCK, BCL, BCM i (p), 2(bp) = AKL, AKM, ALM, BKL, BKM, BLM, CKL CKM, CLM 0(p), 3(bp) = KLM Pada distribusi sampling proporsi, berlaku hal-hal sebagai berikut. 1) Untuk pengambilan sampel dengan pengembalian atau jika ukuran populasi besar N dibandingkan dengan ukuran sampel, yaitu ≤ 5%, memiliki rata-rata dan n simpangan baku: p p p P(1 P) n PQ n Keterangan: P = proporsi kejadian sukses Q = proporsi kejadian gagal (l - P) 2) Untuk pengambilan sampel tanpa pengembalian atau jika ukuran populasi kecil N dibandingkan dengan ukuran sampel, yaitu > 5%, memiliki rata-rata dan simpangan n baku: p p p P(1 P) n p PQ n N n N 1 N n N 1 Contoh soal: Sebuah toko memiliki 6 karyawan, misalkan A, B, C untuk yang senang membaca dan X, Y, Z untuk yang tidak senang membaca. Jika dari 6 karyawan tersebut diambil sampel yang beranggotakan 4 karyawan (pengambilan sampel tanpa pengembalian), tentukan: a. banyaknya sampel yang mungkin diambil, b. distribusi sampling proporsinya. c. rata-rata dan simpangan baku sampling proporsinya! Penyelesaian : a. Banyaknya sampel yang mungkin adalah: C 6 4 6! = 15 buah sampel 4!(6 4)! Ke-15 buah sampel itu ialah: 1) 1 senang membaca dan 3 tidak : C 2) C 3 3 = 3 X 1 = 3, yaitu: AXYZ BXYZ CXYZ C 3 2 = 3 X 3 = 9 yaitu: ABXY, ABXZ, ABYZ, ACXY, ACXZ, ACYZ, BCXZ, BCYZ 3 senang membaca dan 1 tidak : X b. X 2 senang membaca dan 2 tidak : X 3) 3 1 C 3 1 = 1 x 3 = 3, yaitu: ABCX, ABCY, ABCZ Jika X = senang membaca dan n = jumlah sampel maka distribusi sampling proporsinya adalah TABEL 3.5 DISTRIBUSI SAMPLING PROPORSI (X) X Proporsi Sampel N ƒ Prob. 1 0,25 3 0,2 2 0,50 9 0,6 3 0,25 3 0,2 15 1,0 Sampel yang mungkin Jumlah c. Proporsi populasi untuk peristiwa sukses (senang membaca) adalah P= Jadi : µp = P = 0,5 1 =0,5 2 p p P(1 P ) n N n N 1 0,51 0,5 64 6 1 4 p 0,158 3) Daftar distribusi normal untuk distribusi sampling proporsi dapat ditentukan sebagai berikut. a) Z b) Z Jika n besar maka nilai Z adalah pP p Jika n sangat kecil maka nilai Z adalah p 1 P 2n p Keterangan : 1 = faktor koreksi kontinuitas 2n Contoh soal: Toko mainan anak BONEKA bermaksud mengadakan pertunjukan sulap secara tetap seminggu sekali atau sebulan sekali. Pimpinan toko memperkirakan bahwa pengunjung akan mencapai 40% dari seluruh Pengunjung toko dalam interval waktu yang sama. Jika dari hasil sampel, diketahui probabilitas proporsi yang mengikuti acara sulap itu hanya 15% atau lebih di bawah rata-rata populasi maka acara itu diadakan sebulan sekali. Untuk itu, setiap pengunjung diberi kuesioner dan dari jawabannya diambil 500 sebagai sampel. Hasil sampel menunjukkan 175 pengunjung mengikuti acara tersebut. Menurut pendapat anda, sebaiknya acara sulap itu diadakan seminggu sekali atau sebulan sekali? Penyelesaian: P = 40% = 0,4 n = 500 p= 175 0,35 500 Karena sampel kecil maka digunakan faktor koreksi. Z p 1 P 2n p 1 0,4 1.000 2,55 (0,4)(0,6) 600 0,35 Didapatkan P (-2,55 < Z < 0) P (-2,55 < Z < 0) = P (-2,55 < Z < 2,55) = 0,4946 Jadi, probabilitas proporsi sampel yang mengikuti acara tersebut adalah 0,4946 atau 49,46% yang berarti lebih dari 15% di bawah rata-rata sampel. Dengan demikian, acara pertunjukkan sulap tersebut diadakan sebulan sekali. 3. Distribusi Sampling yang Lain a. Distribusi sampling beda dua rata-rata Distribusi sampling beda dua rata-rata adalah distribusi dari perbedaan dua besaran rata-rata yang muncul dari sampel-sampel dua populasi. Misalkan, dua populasi normal N1, N2, memiliki rata-rata masing µ1 dan µ2 dan simpangan baku masing-masing 2 , dan 2 , Dari kedua populasi N1 dan N2, tersebut, diambil sampel random, yaitu n1 dan n2, dengan rata-rata masing-masing X 1 dan X 2 , lalu dari kedua ratarata itu dihitung semua bedanya. Dari semua beda rata-rata yang diperoleh akan membentuk suatu distribusi, yaitu distribusi sampling beda rata-rata. Pada distribusi sampling beda dua rata-rata, untuk N1 dan N2, cukup besar berlaku hal-hal sebagai berikut. 1) X Rata rata 1X 2 1 2 2) simpangan baku: X 1X 2 3) 2 2 1 2 n1 n2 Untuk n1 dan n2, dengan n1 dan n2 > 30, distribusi sampling rata-rata akan mendekati distribusi nomal. dengan variabel tandom standar yang beda rumus Z-nya: Z X 1 X 2 1 2 X 1X 2 Contoh soal: Misalkan, rata-rata pendapatan manajer dan karyawan biasa per hari, masing-masing adalah Rp50.000,00 dengan simpangan baku Rp15.000,00 dan Rp12.000,00 dengan simpangan baku Rp1.000,00. Jika diambil sampel random manajer sebanyak 40 orang dan karyawan biasa sebanyak 150 orang. tentukan : a) beda rata-rata pendapatan sampel b) simpangan baku rata-rata pendapatan sampel. c) probabilitas beda rata-rata pendapatan manajer dan karyawan biasa lebih dari Rp35.000.00! Penyelesaian: µ1 = 50.000 µ2 = 12.000 1 = 15.000 2 = 1.000 n1 = 40 n2 = 15 X a. 1X 2 1 2 = 50.000 12.000 = 38.000 Z b. X 1 X 2 1 2 X 1X 2 35.000 38.000 2.373,11 = -1,26 P( X 1 - X 2 , > 35.000) = P(Z > 1.26) = 0,5 + 0,3962 = 0,8962 b. Distribusi sampling beda dua proporsi Distribusi sampling beda dua proporsi adalah distribusi dari perbedaan dua besaran proporsi yang muncul dari sampel dua populasi. Misalkan, terdapat dua populasi N1, N2, (2 populasi binomial). kemudian diambil sampel random, yaitu n1 dan n2, dengan P1 dan P2, maka beda antara kedua sampel proporsi (P1 - P2) akan membentuk suatu distribusi, yaitu distribusi sampling beda proporsi. Pada distribusi sampling beda dua proporsi berlaku hal-hal berikut. 1) Rata-rata: p p p1 p 2 1 2 2) Simpangan baku: p p 1 2 p1 (1 p1 ) p2 (1 p2 ) n1 n2 Jika n1 dan n2 (n1, n2 ≥ 30) cukup besar, distribusi sampling beda proporsi akan 3) mendekat distribusi normal, dengan variabel random standar yang rumus Z-nya: Z p1 p 2 p1 p 2 p p 1 2 Catatan: P1 - P2 = X1 X 2 n1 n2 Contoh soal: Sebanyak 35% dari pelamar kerja diterima bekerja di Bank UNGGUL. Mereka tahun sebelumnya pernah melamar, tetapi tidak diterima sebanyak 30% dari pelamar kerja yang belum pernah melamar di tahun sebelumnya, tahun ini diterima di bank tersebut. Apabila diambil sampel random sebanyak 250 pelamar, baik yang belum pernah melamar maupun yang pernah melamar, berapa probabilitas bahwa beda proporsi yang pernah melamar dan akhirnya diterima tahun ini dengan yang belum pernah melamar yang juga diterima tahun ini adalah kurang dari 2%? Penyelesaian: P1 = 30% = 0,35 P2 = 35% = 0,3 n1 = 250 n2 = 250 P1 - P2 = 2% = 0,02 Z p1 p 2 p1 p 2 p p 1 2 0,02 (0,35 0,3) (0,35)(0,65) (0,3)(0,7) 250 250 = -0,71 Didapat: P(Z < -0,71) = 0,5 - 0,2612 = 0,2388 atau 23,88% Dasar – dasar di dalam statistik inferens ini adalah “distribusi sampling”. Dengan demikian sebelum membicarakan materi estimasi dan uji hipotesis perlu memahami apa yang disebut distribusi sampling. Distribusi sampling adalah distribusi dari mean-mean sampel yang diambil secara berulang kali dai suatu populasi. Untuk itu perlu kita ketahui suatu ketentuan yang dapat membedakan beberapa ukuran antara sampel dan populasi. Ukuran-ukuran untuk sampel adalah sebagai berikut.15 Nilai (karakteristik ) Mean (rata-rata hitung) Standar deviasi Jumlah Unit Sampel Statistik X s n Populasi Parameter µ σ ɴ SIFAT – SIFAT DISTRIBUSI SAMPLING Sifat distribusi sampling ini disebut Central Limit Theorem (teorema limit pusat). Sifat inilah yang mendasari teori inferens. Sifat-sifat tersebut adalah sebagai berikut. Sifat 1 Apabila sampel-sampel random dengan n elemen masing-masing diambil dari suatu populasi normal, yang mempunyai mean = µ varian σ2 , distribusi sampling harga mean akan mempunyai mean sama dengan µ dan varian σ2 /n atau standar deviasi σ / √.n. Standar deviasi distribusi sampling harga mean ini dikenal sebagai “Standar Error” (SE). Sifat 2 Apabila populasi berdistribusi normal, distribusi sampling harga mean juga akan berdistribusi normal. Maka berlaku sifat seperti persamaan di bawah ini (z score adalah nilai deviasi relatif antara nilai sampel dan populasi = nilai distribusi normal standar): Z= 𝜒−𝜇 𝑆𝐸 Sifat 3 Walaupun populasi berdistribusi sembarang, kalau diambil sampel-sampel berulang kali secara random, distribusi harga meannya akan membentuk distribusi normal. 16 15 16 Sutanto Priyo Hastono, Statistik Kesehatan, Rajawali Pers, Jakarta, 2013, Hlm. 75 Ibid. Hlm. 77