BAB I PENDAHULUAN Kata statistika mula-mula diambil dari bahasa latin ‘STATUS’ yang berarti NEGARA, untuk menggambarkan fakta tentang kondisi ekonomi, kependudukan (demografi), masalah politik dan pendidikan dari suatu negara. Lambat laun digunakan untuk menyatakan kumpulan data/fakta yang berbentuk angka baik yang belum tersusun maupun yang sudah tersusun dalam bentuk tabel, grafik atau diagram. Misal : statistik kelahiran, statistik kecelakaan. Sebagai ilmu, STATISTIKA adalah sekumpulan metode yang digunakan untuk : - merencanakan dan mengumpulkan informasi (data) - menyajikan data (melalui tabel, grafik atau diagram) - menganalisa data dan memberikan interpretasi - mengambil kesimpulan dalam situasi ada ketidakpastian dan variasi Statistika dapat dikelompokkan ke dalam dua kelompok besar : 1. STATISTIKA DESKRIPTIF Metode yang berkaitan dengan pengumpulan dan penyajian data. Tujuan : data yang disajikan lebih mudah dipahami. 2. STATISTIKA INDUKTIF (INFERENSI) Metode yang berkaitan dengan analisis sebagian data dan kemudian sampai pada peramalan atau pengambilan kesimpulan mengenai keseluruhan data induknya. 1.1. POPULASI & SAMPEL Populasi : suatu kumpulan obyek yang lengkap dan jelas, yang ingin dipelajari sifatsifatnya. ukuran/besaran yang dihitung dari populasi disebut PARAMETER. Bila penelitian dilakukan terhadap seluruh populasi disebut SENSUS. Sampel : himpunan bagian dari suatu populasi. ukuran/besaran yang dihitung dari sampel disebut STATISTIK. Bila penelitian dilakukan terhadap sebagian anggota populasi disebut SAMPLING. Alasan digunakan sampel adalah : - penghematan biaya - penghematan waktu - ada penelitian yang bersifat merusak - populasi mempunyai anggota tak berhingga. 1.2. DATA STATISTIK Klasifikasi data berdasarkan tipe datanya dapat dibedakan menjadi dua yaitu : DATA KUANTITATIF & KUALITATIF Data Kuantitatif : Bila hasil pengamatan / observasinya berbentuk bilangan. Dari nilainya, data kuantitatif dapat digolongkan menjadi dua : 1. Data Diskrit bila nilainya merupakan jumlah berhingga atau tidak berhingga, namun dapat dihitung. Diperoleh dari hasil menghitung. Contoh : data tentang banyaknya produk yang cacat. 1 2. Data Kontinu bila nilainya merupakan bilangan riil yang terdapat dalam suatu interval. Diperoleh dari hasil mengukur. Contoh : data tinggi badan, data lamanya suatu reaksi kimia tertentu. Data Kualitatif : Bila hasil pengamatannya berbentuk kategorik (atau dapat digolongkan dalam salah satu kelas). Misalnya : sembuh, puas, berhasil. 1.3. SKALA PENGUKURAN Pengukuran adalah usaha memasangkan angka-angka terhadap obyek-obyek atau peristiwa-peristiwa menurut aturan tertentu. Berdasarkan skala pengukurannya variabel dapat dikategorikan menjadi empat, yaitu variabel berskala nominal, ordinal, interval dan rasio sebagai berikut : 1. Skala Nominal Angka-angka yang terdapat pada skala nominal hanya sebagai nama penggolongan. Angka tersebut tidak mengukur besar tetapi hanya sebagai lambang. Dalam hal ini, angka 1 tidak lebih besar dari 0 begitu pula angka 0 tidak lebih kecil dari 1. Sebagai contoh pemberian kode 1 pada laki-laki dan 0 pada perempuan. Hal itu tidak berarti laki-laki mempunyai nilai satu dan perempuan nilai nol. Angka-angka tersebut hanyalah membedakan antara laki-laki dan perempuan, dengan demikian kita bisa juga menukar laki-laki menjadi 0 dan perempuan menjadi 1 tanpa merubah makna.Contoh lainnya adalah variabel agama yang dipeluk, diberi kode 1 untuk Islam, 2 untuk Katolik ,3 untuk Protestan, 4 untuk Hindu/Budha,5 untuk Konghucu. 2. Skala Ordinal. Seperti pada skala nominal, angka-angka yang disajikan pada skala ordinal juga hanya sebagai nama penggolongan. Pada skala ordinal penggolongannya telah membentuk suatu tingkatan, ada yang dianggap tingkat terendah dan ada pula yang dianggap tingkat tertinggi. Walaupun demikian jarak antara dua angka atau penggolongan yang berurutan tidak perlu sama. Perhatikan tabel berikut yang merupakan pengukuran skala sikap. Sikap sangat tidak puas diberi nilai 1, tidak puas diberi nilai 2, dan seterusnya sampai sangat puas yang diberi nilai 5. Angka-angka ini mempunyai makna dimana angka 2 lebih besar dari 1, sedangkan 3 lebih besar dari 2 dan seterusnya. Jarak antara 1 dengan 2, dan 2 dengan 3 tidak perlu sama. Dalam hal ini kita tidak dapat mengukur jarak sikap antara sangat tidak puas dengan tidak puas dan yang lainnya. Tabel. Pengukuran Skala Sikap Pernyataan Sangat Puas Puas Tidak ada pendapat (Abstain) Tidak Puas Sangat Tidak Puas Nilai 5 4 3 2 1 2 3. Skala Interval Angka-angka yang disajikan pada skala interval telah menunjukkan suatu tingkatan. Angka 1 lebih kecil dari angka 2, sedangkan angka 2 lebih kecil dari angka 3 dan seterusnya. Pada skala interval, dua angka berurutan yang mempunyai jarak yang sama tidak dapat diperbandingkan. Sebagai suatu contoh pada pengukuran suhu dengan standard derajat celcius. Perbedaan antara suhu 400 dan 300 sama dengan perbedaan antara suhu 800 dan 700 yaitu masingmasing 100, tetapi benda yang bersuhu 400 tidak berarti panasnya dua kali benda yang bersuhu 200. Hal ini disebabkan slaka interval tidak memiliki nilai dasar mutlak. Nilai dasar pada termometer Celcius, yaitu 00 C merupakan suatu kondisi perjanjian pada saat air murni membeku menjadi es pada tekanan udara 76 Hg dan bukan berarti kondisi pada saat itu tidak memiliki derajat panas.Contoh lainnya adalah Indeks Prestasi. 4. Skala Rasio. Skala rasio merupakan skala pengukuran tertinggi. Data pada skala rasio bersifat sama seperti data skala interval. Kelebihan skala rasio disbandingkan skala interval, yaitu nilai-nilai pada skala rasio dapat dibandingkan karena mempunyai nilai dasar mutlak. Nilai 90 pada hasil ujian memiliki nilai dasar mutlak 0, yaitu pada saat seorang mahasiswa sama sekali tidak dapat mengerjakan soal ujian. Contoh lainnya adalah pengukuran tinggi, berat. 1.4. UKURAN PEMUSATAN Ukuran pemusatan merupakan suatu informasi yang memberikan penjelasan bahwa data memiliki satu atau lebih titik dimana dia memusat atau terkumpul. Ukuranukuran pemusatan yang sering digunakan antara lain: 1. MEAN (RATA-RATA HITUNG) A. Data Belum Dikelompokkan Misalkan x1 , x2 , x3 , … xn nilai-nilai hasil pengamatan, maka meannya adalah n x x i 1 i n dengan n = jumlah pengamatan B. Data Telah Dikelompokkan (dalam distribusi frekuensi) Diasumsikan bahwa semua pengamatan dalam suatu kelas sama dengan titik tengah kelasnya. k x fx i i i 1 k f i 1 dengan i fi = frekuensi kelas ke-i xi = titik tengah kelas ke-i k = jumlah kelas 3 2. MEDIAN Membagi seluruh jumlah pengamatan ke dalam dua bagian yang sama. A. Data Belum Dikelompokkan Nilai yang terletak di tengah-tengah data yang telah disusun secara terurut. B. Data Telah Dikelompokkan c( n F ) 2 Median Lmed f med dengan Lmed = batas bawah kelas dari kelas median c = lebar kelas n = jumlah pengamatan F = frekuensi kumulatif sebelum/ dibawah kelas median fmed = frekuensi dari kelas median. Langkah awal : buat distribusi kumulatif ‘kurang dari’ 3. MODUS Nilai pengamatan yang paling sering muncul (punya frekuensi tertinggi). A. Data Belum Dikelompokkan Modus xi yang paling sering muncul B. Data Telah Dikelompokkan a Modus Lmo c a b dengan Lmo = batas bawah kelas dari kelas modus c = lebar kelas a = f kelas modus – f kelas terdekat sebelumnya b = f kelas modus – f kelas terdekat berikutnya 1.5. UKURAN LETAK (LOKASI) Jika sekelompok data (yang sudah terurut) dibagi menjadi 2 bagian yang sama, bilangan yang terletak atau berlokasi di tengah disebut MEDIAN. Ukuran lokasi yang lain : 1. KUARTIL : Jika data dibagi menjadi 4 bagian yang sama 2. DESIL : Jika data dibagi menjadi 10 bagian yang sama 3. PERSENTIL Jika data dibagi menjadi 100 bagian yang sama Data Belum Dikelompokkan Gunakan prinsip TUKEY (‘membesar ke’). Jika hasil baginya berupa : Bilangan pecahan bulatkan ke bilangan bulat berikutnya. Bilangan bulat bilangan tersebut + ½ 4 Data Telah Dikelompokkan c( jn F ) 4 , Q j LQ fQ c( jn F ) 10 , D j LD fD j 1,2,3 j 1,2,...,9 F) c( jn 100 j 1,2,...,99 , Pj LP fP Keterangan : LQ = Batas bawah dari kelas kuartil LD = Batas bawah dari kelas desil LP = Batas bawah dari kelas presentil F = frekwensi kumulatif sebelum kelas kuartil/desil/presentil fQ = frekwensi pada kelas kuartil. fD = frekwensi pada kelas desil. fP = frekwensi pada kelas presentil. 1.6. UKURAN PENYEBARAN Ukuran yang menyatakan sejauh mana data tersebar di sekitar nilai tengahnya. Sering disebut juga dengan ukuran penyimpangan (variasi). 1. RANGE (WILAYAH) Ukuran penyebaran yang paling sederhana (mengukur secara cepat & kasar) Hasilnya kurang memuaskan, karena tergantung pada nilai terbesar & terkecil. Tanpa mengikut- sertakan nilai-nilai pengamatan secara keseluruhan. Range = Data terbesar – Data terkecil 2. SIMPANGAN RATA-RATA (MEAN DEVIATION) Rata-rata penyimpangan nilai-nilai pengamatan terhadap mean-nya. A. Data Belum Dikelompokkan Misalkan x1 , x2 , x3 , … xn nilai-nilai hasil pengamatan, n MD x i 1 i x n dengan n = jumlah pengamatan B. Data Telah Dikelompokkan k x f i 1 i xi x n 3. SIMPANGAN BAKU (STANDARD DEVIATION) Paling banyak digunakan sbg ukuran penyebaran. Rumus dibawah ini adalah rumus untuk simpangan baku sampel. Untuk simpangan baku populasi, rumusnya hampir sama, hanya mengganti n-1 dengan N pada penyebutnya. (N adalah ukuran dari populasinya) 5 A. Data Belum Dikelompokkan n s 2 xi x i 1 n 1 n x 2 i i 1 nx 2 n 1 B. Data Telah Dikelompokkan n s 2 xi x f i i 1 n 1 n x i 1 f nx 2 2 i i n 1 SOAL-SOAL LATIHAN : 1. Lama reaksi terhadap suatu rangsangan tertentu dari sembilan individu yang diambil secara acak adalah sebagai berikut : (dalam detik) 2,5 3,6 3,1 4,3 2,9 2,3 2,6 4,1 3,4 Tentukan : a. Meannya b. Mediannya. 2. Indeks prestasi dari 20 mahasiswa yang diperoleh secara acak dari wisudawan semester lalu adalah : 3,2 2,9 2,7 2,4 2,8 2,9 3,8 3,0 2,5 3,3 2,8 2,5 3,7 2,8 2,1 3,2 2,3 3,1 2,5 2,9 Tentukan : a. Meannya b. Mediannya c. Modusnya. 3. Distribusi frekuensi di bawah ini menunjukkan nilai ujian Statistika dari 80 mahasiswa di Fakultas Farmasi tahun lalu : Nilai ujian 31 – 40 41 – 50 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 Jumlah mahasiswa 2 3 5 14 24 20 12 Tentukan : a. Meannya b. Mediannya c. Modusnya. 4. Dari soal no. 2, tentukan : a. Kuartil pertama b. Kuartil ketiga c. Desil kedelapan dan jelaskan artinya. 6 5. Dari soal no. 3, tentukan : a. Kuartil pertama b. Kuartil ketiga c. Desil keempat d. Persentil keduapuluh e. Desil kesembilan. Dan jelaskan artinya. 6. Dari soal no. 2, tentukan : a. Range-nya b. Simpangan rata-ratanya c. Simpangan bakunya. 7. Dari soal no. 3, tentukan : a. Simpangan rata-ratanya b. Simpangan bakunya. 8. Dua alat pengukur kadar sulfur monoksida di udara hendak dibandingkan. Hasil pengukurannya ditunjuk- kan pada tabel berikut ini : Sulfur Monoksida Alat A 0,86 0,82 0,75 0,55 0,89 0,61 0,81 0,68 0,65 Alat B 0,89 0,74 0,63 0,55 0,76 0,70 0,69 0,57 a. Tentukan mean dan median hasil pengukuran untuk masing-masing alat b. Tentukan range, simpangan rata-ratanya, serta simpangan bakunya c. Diantara hasil pengukuran kedua alat tersebut, manakah yang datanya lebih bervariasi atau beragam ? 9. Berikut ini pencatatan banyaknya strontium 90 dalam ukuran pico curies perliter (pci/l) yg dilakukan pada susu. Strontium 90 (pci/l) frekuensi 8,0 – 8,4 3 8,5 – 8,9 9 9,0 – 9,4 27 9,5 – 9,9 22 10,0 – 10,4 20 10,5 – 10,9 14 11,0 – 11,4 4 11,5 – 11,9 1 Tentukan : a. Mean, median, dan modusnya b. P30, Q1, D6 c. Varians dan simpangan bakunya. 7 10. Data berikut berupa daya tahan sampai mati, diukur sampai sepersepuluh menit terdekat, dari sampel acak 50 lalat yang telah disemprot dengan bahan kimia baru dalam suatu percobaan laboratorium : 2,4 0,7 3,9 2,8 1,3 1,6 2,9 2,6 3,7 2,1 3,2 3,5 1,8 3,1 0,3 4,6 0,9 3,4 2,3 2,5 0,4 2,1 2,3 1,5 4,3 1,8 2,4 1,3 2,6 1,8 2,7 0,4 2,8 3,5 1,4 1,7 3,9 1,1 5,9 2,0 5,3 6,3 0,2 2,0 1,9 1,2 2,5 2,1 1,2 1,7 Dengan menggunakan 8 kelas dengan nilai terendah mulai di 0,1, a. Buat distribusi frekuensinya. b. Carilah : - Meannya - Mediannya - Simpangan bakunya, - P89, Q3, D4 Dengan menggunakan : - Data asalnya - Data yang telah dikelompokkan. 11. Data berikut menunjukkan nilai hasil ujian Statistika Elementer mahasiswa semester II dari Universitas “Bintang Kejora” 70, 75, 45, 70, 50, 60, 90, 75, 45, 60, 90, 70, 75, 60, 60, 45, 50, 60, 60, 70, 70, 50, 45, 75, 70, 60, 90, 45, 90, 50 Carilah rata-rata nilai Matematika mahasiswa dengan cara : a. Data tidak dikelompokkan b. Data dikelompokkan. 12. Dari suatu penelitian terhadap 30 orang responden diperoleh data berat badan (kg) sebagai berikut : 49 53 59 56 66 50 48 65 50 60 65 38 48 68 62 a. Susunlah tabel frekwensinya . b. Hitung rata-rata, varians dan kuartil. c. Apa yang dapat anda simpulkan. 55 54 64 30 78 70 62 60 65 55 39 42 80 53 41 13. Distribusi frekuensi berikut mewakili jumlah hari absen karena sakit selama setahun dari para pekerja atau karyawan di perusahaan “MANDIRI” Jumlah hari absen Jumlah pekerja 1-4 5 5-8 12 9-12 23 13-16 8 17-20 2 Total 50 a. Tentukan mean, modus, median dari data pada table di atas! b. Tentukan Q1, Q3, dan simpangan kuartilnya! c. Tentukan varians (s2) dan simpangan bakunya! 8 BAB I SUPLEMEN DISTRIBUSI FREKUENSI Distribusi frekuensi adalah bentuk penyusunan yang teratur mengenai serangkaian data dengan menggolongkannya ke dalam kelas atau kelompok tertentu. Dalam distribusi frekuensi, dikenal beberapa istilah sebagai beikut : LIMIT KELAS : Nilai batas tiap kelas yang digunakan sebagai pedoman dalam memasukkan angkaangka ke dalam kelas-kelas tertentu. BATAS KELAS : Batas teoritis sebuah kelas. LEBAR (INTERVAL) KELAS : Lebar dari sebuah kelas. Jika lebar kelas sama, maka lebar kelas adalah selisih dua titik tengah berurutan, atau selisih dua batas bawah berurutan, atau, selisih dua batas atas berurutan, atau selisih dua limit bawah berurutan, atau selisih dua limit atas berurutan PENYUSUNAN DISTRIBUSI FREKUENSI : 1. Tentukan jumlah kelas yang diperlukan. Jumlah kelas jangan terlalu besar atau terlalu kecil. Tergantung pada ciri data mentah dan tujuan penggunaannya. Saran dari Sturges : k = jumlah kelas = 1 + 3,322 log n 2. Tentukan lebar kelas. Lebar kelas sebaiknya sama bagi setiap kelas dan dalam bilangan praktis. Lebar kelas = range/k 3. Masukkan angka-angka ke dalam kelas-kelas yang sesuai & hitung frekuensinya 4. Buat tabel distribusi frekuensi. 9