MITOS JUMLAH SAMPEL MINIMUM

advertisement
MITOS JUMLAH
SAMPEL MINIMUM
Pendahuluan
1. Jumlah sampel yang dirasa cukup sehingga dapat diklaim
mewakili populasi merupakan masalah klasik yang dihadapi
oleh peneliti kuantitatif.
2. Dan jawaban klasik yang sering diberikan pada mereka adalah:
minimum 30 sampel!
3. Pada berbagai literatur pengantar statistika disebutkan bahwa
angka 30 merupakan pembatas untuk mengkategorikan
jumlah sampel. Jika sampel > 30 maka kategorinya adalah
sampel besar, jika <= 30 kategorinya sampel kecil.
4. Kategori ini berimplikasi pada rumus statistika yang digunakan
jika ingin melakukan pendugaan parameter (nilai populasi,
rata-rata dan proporsi), beda kategori beda rumusnya.
Mengapa 30
• jumlah sampel 30 berasal dari “tingkat ketelitian” pada
sebagian besar tabel-tabel statistika yang mengisi halamanhalaman lampiran pada sejumlah textbook statistika. Tabeltabel tersebut adalah tabel distribusi t, tabel chi square,
dan tabel distribusi F. Yang dimaksud dengan “tingkat
ketelitian” adalah detail nilai “n” alias jumlah sampel yang
digunakan untuk mencari nilai masing-masing distribusi.
Pada tabel-tabel tersebut nilai “n” mulai dari 1-30
ditampilkan detil (n=1,n=2,n=3,n=4,…dst.) untuk “n” di atas
30 langsung melompat ke 40, 60, 120 sampai tak hingga.
Jadi angka 30 merupakan nilai kritis! Untuk n>30 nilai
masing-masing distribusi tersebut sudah tidak terlalu
“penting” untuk dirinci.
Mengapa 30
• Setelah mencoba beberapa kombinasi jumlah sampel
misalnya 5, 10, 15, 20, 25, 30, 31, dst… secara
berulang-ulang dari sebuah populasi yang
menggunakan data berukuran rasio hingga lebih dari
100 kali menunjukkan kecenderungan distribusi sampel
yang terbentuk mendekati asumsi distribusi normal
ketika jumlah sampel mencapai 30. Semakin besar
jumlah sampelnya semakin normal distribusinya.
• Bisa jadi penentuan angka 30 ini berdasarkan pada
“eksperimen” ini, bahwa pada saat jumlah sampel lebih
besar dari 30 peluang distribusi yang dihasilkan bentuk
mirip genta alias distribusi normal semakin besar.
Mengapa 30
• Persoalannya “aturan 30″ ini cenderung berlaku
bagi analisis statistika yang menuntut
terpenuhinya asumsi distribusi normal.
• Agar distribusi data bisa normal syaratnya adalah
data harus random, dan jumlah sampel besar. Jika
jumlah sampel “kecil” seperti yang telah
dibuktikan oleh “eksperimen” di atas, bentuk
genta tidak tercipta dengan baik, bisa agak
menceng ke kanan, atau kekiri, atau
bergelombang.
Mengapa 30
• bukan jumlah yang menentukan suatu sampel mewakili
atau tidak mewakili karakter suatu populasi. Ada
banyak faktor yang menentukan tingkat representasi
sampel misalnya tehnik penarikan sampel,
ketersediaan rerangka sampel, heterogenitas populasi
dll.
• Jika sampel ditarik secara random maka menurut teori
probabilita bisa dianggap mewakili, namun jika
rerangka sampelnya tidak lengkap data yang dihasilkan
bisa bias karena ada anggota populasi yang tidak ikut
menjadi “peserta”, dan jika populasinya homogen
murni bisa jadi satu sampel sudah cukup mewakili.
Jika Cukup Sesendok Tak Perlu
Semangkok
Download