STATISTIK LANJUTAN MODUS, MEDIAN, DISPERSI, POLIGON FREKUENSI DAN KURVA FREKUENSI MODUS • Modus dari sekumpulan data adalah nilai dari variable yang paling sering muncul. Sebagai contoh, dalam sekumpulan nilai-nilai 2, 2, 6, 7, 7, 7, 10, 13, modusnya adalah 7. • Dalam satu data mungkin saja terdapat lebih dari satu modus, misalnya 23, 25, 25, 25, 27, 27, 28, 28, 28, memiliki dua modus, 25 dan 28, yang masing-masing angka tersebut muncul 3 kali Modus dari distribusi frekuensi data berkelompok • Massa dari 50 coran (casting) memberikan data distribusi frekuensi berikut: Massa x (kg) 10 – 12 13 - 15 16 - 18 19 - 21 22 - 24 25 - 27 28 - 30 Frequency (f) 3 7 16 10 8 5 1 Dari gambar di samping bisa dilihat bahwa kelas yang mempunyai frekuensi tertinggi adalah kelas ketiga Y Frekuensi f 20 15 adalah kelas ketiga, dengan batas-batas 15,5 dan 18,5 kg 10 5 X Massa (kg) Y Y 20 20 A C Frekuensi f Frekuensi f A 15 D 10 c C 15 u l 10 D B B 5 5 X X Modus L Modus Massa (kg) Massa (kg) • Kedua garis diagonal AD dan BC digambarkan seperti pada gambar. Nilai x dari perpotongan kedua diagonal tersebut adalah modus dari set data iniLakukan perhitungan pada histogram dan akan menentukan bahwa untuk set data ini. Modusnya adalah sebagai berikut Jika L = nilai batas bawah L = AB = selisih frekuensi pada batas bawah U = CD = selisih frekuensi pada batas atas C = interval kelas Maka modus Y 20 Frekuensi f A c C 15 u l 10 D B 5 X L • • • • Modus Massa (kg) Dari gambar di atas diperoleh L = 15,5; l = 16-7 = 9; u = 16 – 10 = 6; c = 3 Maka modus ∴ Modus = 17,3 MEDIAN • median, yaitu nilai dari suku tengah apabila seluruh data disusun secara meningkat (ascending) ataupun menurun (descending) • Sebagai contoh, untuk 4, 7, 8, 9, 12, 15, 26, mediannya = 9 • Jika banyakya nilai yang ada adalah genap, maka mediannya adalah rata-rata dari kedua suku tengah, sebagai contoh mempunyai median • Dengan cara yang sama, untuk himpunan nilai-nilai 13, 4, 18, 23, 9, 16, 18, 10, 20, 6 • Karena dengan menyusun suku-suku secara menaik, diperoleh : • 4, 6, 9, 10, 13, 16, 18, 18, 20, 23 dan median = Median dari data yang dikelompokkan • Karena merupakan nilai dari suku tengah, median akan membagi histogram frekuensi menjadi dua luas yang sama besar. Kenyataan ini memberikan kita sebuah metode untuk menentukan median. • Sebagai contoh, temperature dari suatu komponen diamati dlam 80 kesempatan dengan interval-interval yang teratur. Distribusi frekuensinya adalah Temperatur x (oC) 30,0 - 30,2 30,3 - 30,5 30,6 - 30,8 30,9 - 31.1 31,2 -31,4 Frekuensi (f) 6 12 15 20 13 31,5 - 31,7 31,8 - 32,0 9 5 • Pertama menggambar histogram frekuensinya Frequency f Y X 30,1 30,4 30,7 31,0 31,3 Temperatur (oC) 31,6 31,9 Mediannya adalah rata-rata dari suku ke 40 dan ke 41, jika kita jumlahkan frekuensi-frekuensi dari empat persegipanjang, maka suku-suku ini akan termasuk dalam kelas ke empat Jika kita menyisipkan garis putus-putus untuk menyatakan nilai dari median tersebut, maka garis ini akan membagi luas histogram menjadi dua bagian yang sama Frequency f Y A 12 6 30,1 15 B 13 9 5 30,4 30,7 31,0 31,3 31,6 31,9 median Temperatur (oC) X DISPERSI • Rata-rata modus, dan median memberikan informasi yang penting mengenai keseluruhan data yang dicatat. Akan tetapi ketiganya tidak memberikan informasi apapun tentang disperse dari nilai-nilai di sekitar nilai tengah. • Set data 26, 27, 28, 29,30 mempunyai rata-rata 28 • Dan 5, 19, 20, 36, juga mempunyai rata-rata 28 • Kedua set data ini mempunyai rata-rata yang sama, tapi terlihat jelas bahwa set data yang pertama lebih rapat teratur di sekitar rata-ratanya daripada yang kedua. Dengan demikian kita memerlukan satu ukuran yang menyatakan penyebaran nilai-nilai di sekitar nilai rata-rata. Jangkauan • Nilai paling sederhana untuk menyatakan penyebaran atau disperse adalah jangkauan yang tak lain adalah selisih antara nilai tertinggi dan nilai terendah dalam suatu set data. • Dalam kedua contoh kasus di atas, jangkauan dari set data yang pertama adalah 30 – 26 = 4 sementara dari set yang kedua adalah 60 – 5 = 55. • Kelemahan dari jangkauan adalah jangkauan hanya berhubungan dengan nilai-nilai ekstrim, tanpa memperhitungkan perilaku dari nilai-nilai intermediatnya (nilai-nilai di antara nilai ekstrim) Deviasi Standar • Deviasi standar dari rata-rata (standar deviation from the mean) sering digunakan dalam statistic untuk menyatakan derajat disperse. • Deviasi standar memperhitungkan deviasi (penyimpanan) dari setiap nilai dari nilai rataratanya, dan ditentukan sebagai berikut : • Rata-rata dari set data yang terdir dari n buah nilai dihitung terlebih dahulu. • Deviasi setiap nilai, ini dari nilai rata-ratanya dihitung dan hasilnya dikuadratkan, yaitu • Rata-ratanya dicari dan hasilnya disebut varians dari set data tersebut, • Akar kuadrat dari varians disebut deviasi standar, dinotasikan dengan huruf yunani ‘sigma’ n=6 • Jadi, untuk set nilai-nilai 3, 6, 7, 8, 11, 13, ratarata , varians dan deviasi standarnya adalah sebagai berikut : x 3 6 7 8 11 13 f 1 1 1 1 1 1 n=6 x–8 -5 -2 -1 0 3 5 (x - 8)2 25 4 1 0 9 25 Rumus alternative untuk deviasi standar • Rumus dapat juga ditulis dalam bentuk lain yang lebih mudah, • ; yang hanya membutuhkan rata-rata dan kuadrat dari nilai-nilai x. • Untuk data yang dikelompokkan, rumus ini menjadi dan pekerjaan akan semakin lebih sederhana lagi jika menggunakan proses pengkodean yang telah dibahas sebelumnya.