MITOS JUMLAH SAMPEL MINIMUM Pendahuluan 1. Jumlah sampel yang dirasa cukup sehingga dapat diklaim mewakili populasi merupakan masalah klasik yang dihadapi oleh peneliti kuantitatif. 2. Dan jawaban klasik yang sering diberikan pada mereka adalah: minimum 30 sampel! 3. Pada berbagai literatur pengantar statistika disebutkan bahwa angka 30 merupakan pembatas untuk mengkategorikan jumlah sampel. Jika sampel > 30 maka kategorinya adalah sampel besar, jika <= 30 kategorinya sampel kecil. 4. Kategori ini berimplikasi pada rumus statistika yang digunakan jika ingin melakukan pendugaan parameter (nilai populasi, rata-rata dan proporsi), beda kategori beda rumusnya. Mengapa 30 • jumlah sampel 30 berasal dari “tingkat ketelitian” pada sebagian besar tabel-tabel statistika yang mengisi halamanhalaman lampiran pada sejumlah textbook statistika. Tabeltabel tersebut adalah tabel distribusi t, tabel chi square, dan tabel distribusi F. Yang dimaksud dengan “tingkat ketelitian” adalah detail nilai “n” alias jumlah sampel yang digunakan untuk mencari nilai masing-masing distribusi. Pada tabel-tabel tersebut nilai “n” mulai dari 1-30 ditampilkan detil (n=1,n=2,n=3,n=4,…dst.) untuk “n” di atas 30 langsung melompat ke 40, 60, 120 sampai tak hingga. Jadi angka 30 merupakan nilai kritis! Untuk n>30 nilai masing-masing distribusi tersebut sudah tidak terlalu “penting” untuk dirinci. Mengapa 30 • Setelah mencoba beberapa kombinasi jumlah sampel misalnya 5, 10, 15, 20, 25, 30, 31, dst… secara berulang-ulang dari sebuah populasi yang menggunakan data berukuran rasio hingga lebih dari 100 kali menunjukkan kecenderungan distribusi sampel yang terbentuk mendekati asumsi distribusi normal ketika jumlah sampel mencapai 30. Semakin besar jumlah sampelnya semakin normal distribusinya. • Bisa jadi penentuan angka 30 ini berdasarkan pada “eksperimen” ini, bahwa pada saat jumlah sampel lebih besar dari 30 peluang distribusi yang dihasilkan bentuk mirip genta alias distribusi normal semakin besar. Mengapa 30 • Persoalannya “aturan 30″ ini cenderung berlaku bagi analisis statistika yang menuntut terpenuhinya asumsi distribusi normal. • Agar distribusi data bisa normal syaratnya adalah data harus random, dan jumlah sampel besar. Jika jumlah sampel “kecil” seperti yang telah dibuktikan oleh “eksperimen” di atas, bentuk genta tidak tercipta dengan baik, bisa agak menceng ke kanan, atau kekiri, atau bergelombang. Mengapa 30 • bukan jumlah yang menentukan suatu sampel mewakili atau tidak mewakili karakter suatu populasi. Ada banyak faktor yang menentukan tingkat representasi sampel misalnya tehnik penarikan sampel, ketersediaan rerangka sampel, heterogenitas populasi dll. • Jika sampel ditarik secara random maka menurut teori probabilita bisa dianggap mewakili, namun jika rerangka sampelnya tidak lengkap data yang dihasilkan bisa bias karena ada anggota populasi yang tidak ikut menjadi “peserta”, dan jika populasinya homogen murni bisa jadi satu sampel sudah cukup mewakili. Jika Cukup Sesendok Tak Perlu Semangkok