Depok, 2011 Penalaran Statistik 2 Penyusun: MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia Lingkup bahasan • Ukuran Pusat Kecondongan • Ukuran Penyebaran Data • Distribusi dan Ukuran Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga mahasiswa dapat cepat mempelajari dan mudah mengingatnya. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 2 Ukuran Pusat Kecondongan MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 3 Bagaimana cara menentukan satu nilai yang dapat mewakili suatu data? • Sebuah perusahaan penyewaan mobil, mencatat jumlah mobil yang disewa dalam satu pekan sbb: Tabel 1 Hari Senin Selasa Rabu Kamis Jumat Sabtu Minggu Jumlah mobil yang disewa 10 12 9 17 15 21 22 • Ketika pengusaha tsb ingin menyatakan jumlah mobil yang disewa per hari di pekan ini dalam satu nilai saja, dia perlu menentukan satu nilai tsb yang mana nilai ini dapat mewakili nilai-nilai jumlah mobil yang disewa setiap harinya di pekan tsb. • Nilai ini merupakan nilai “tengah” dari satu set data di tabel di atas. Secara umum nilai ini dikenal sebagai nilai rata-rata (average). Di ilmu statistik nilai rata-rata disebut sebagai Ukuran Pusat Kecondongan. • Di sini kita akan membahas empat nilai ukuran pusat kecondongan, yaitu: mean, median, mode, dan midrange. • Setiap nilai ini dihitung dengan cara yang berbeda, sehingga kita tidak menyebutnya sebagai nilai ratarata, tetapi langsung menyebutnya dengan nama mean, median, mode, atau midrange. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 4 Menentukan Nilai Rata--rata dengan Menghitung Mean • Ketika kita ingin menentukan jumlah mobil yang disewa per hari dari data satu pekan (Tabel 1), pada umumnya orang berfikir dan menghitung dengan cara menjumlahkan semua item data sewa mobil dari hari Senin sampai Minggu dan kemudian membaginya dengan angka 7. Cara penentuan nilai rata-rata seperti ini dikenal dengan menghitung nilai mean. • Mean diberi simbul untuk nilai mean dari sampel, dan diberi simbul untuk nilai mean dari populasi. • Contoh 1: menghitung nilai mean dari mobil yang disewa per hari untuk data di Tabel 1. • Jadi nilai mean jumlah mobil yang disewa per hari di pekan tsb adalah 15,2. Kita dapat menyatakannya: rata-rata ada 15 mobil yang disewa per hari. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 5 Bagaimana Menyatakan Mean dalam Bentuk Simbul (Rumus Rumus)? • Mean adalah jumlah dari semua item data ( = 10 + 12 + … + 22 ) dibagi dengan jumlah itemnya ( = 7 ). ̅= = 15,2 • Jika setiap item data kita beri simbul xi , yangmana i adalah bilangan 1, 2, 3, …, maka setiap item data dapat diidentiikasi: x1 = 10, x2 = 12, x3 = 9, …, x7 = 22. Jadi huruf i memberi identitas setiap item data dan mempunyai angka terbesar sama dengan total item data = 7, yang biasanya diberi simbul n (=7). • Dengan demikian untuk menghitung mean dapat diberi simbul: ∑ ==1 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 6 Contoh 2: Menghitung Mean dengan Rumus • • Pembangkit listrik tenaga uap membuang sisa air turbinnya ke laut. Agar tidak mengganggu lingkungan, temperatur air tsb selalu dimonitor. Salah satu data hasil monitor temperatur ( oC) bulanannya adalah sebagai berikut: Data 2: 36,37,37,38,38,38,38,39,39,39, 39,39,40,40,40,40,40,41,41,41, 41,42,42,42,42,43,43,43,44,44. Hitunglah mean dari temperatur tsb. Penyelesaian: Jumlah item data, n = 30. Rumus mean: Berdasarkan rumus mean, dapat dihitung: ̅= ∑ ==1 = ∑ =1 =30 30 = ̅= ∑ ==1 36 + 37 + 37 + 38 + 38 + 38 + 38 + 39 + 39 + 39 30 39 + 39 + 40 + 40 + 40 + 40 + 40 + 41 + 41 + 41 30 41 + 42 + 42 + 42 + +42 + 43 + 43 + 43 + 44 +1206 44 7 = = 40,2 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 30 Jadi mean temperatur di bulan tsb = 40,2oC. Cara Menghitung Mean dengan Distribusi Frekuensi • • Di Contoh 2 dijumpai beberapa item data dengan nilai yang sama. Kejadian ini memberika ide tentang cara menghitung mean yang lebih sederhana yaitu dengan menggunakan distribusi frekuensi. Marilah kita analisis cara menghitung mean di contoh 2: = 37 x 2 = 38 x 4 ̅= ∑ =1 ∑=1 =30 = 30 36 + 37 + 37 + 38 + 38 + 38 + 38 + 39 + 39 + 39 = 30 = 40 x 5 dst. 39 + 39 + 40 + 40 + 40 + 40 + 40 + 41 + 41 + 41 30 41 ++42 + 42 + +4243 + 43 + + 44 + 44 1206 Berdasarkan analisis di atas, rumus mean 42 dapat dituliskan: + 43 = 40,2 = • 30 x : nilai data pengamatan f : frekuensi data pengamatan Σ xf : jumlah semua hasil kali data pengamatan dan frekuensi. n : frekuensi total. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia ̅= ∑ 8 Contoh 3: Menghitung Mean dengan Distribusi Frekuensi • • Hitunglah mean dari data di Contoh 2 dengan menggunakan distribusi frekuensi. Penyelesaian: Setiap item data yang mempunyai nilai sama dihitung frekuensinya, kemudian digunakan untuk menghitung mean dengan cara distribusi frekuensi: ̅= = ∑ Item data Frekuensi 36 × 1 + 37 × 2 + 38 × 4 + 39 × 5 + 40 × 5 + 41 × 4 + 42 × 44 + 43 × 3 + 44 × 2 1206 = = 40,2 30 Mean temperatur = 40,2oC. 30 Frekuensi total Kita dapat pula menghitung mean dengan menggunakan bantuan tabel distribusi frekuensi. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 9 Contoh 3: Menghitung Mean dengan Distribusi Frekuensi (lanjutan) • • Kita dapat membuatkan distribusi frekuensi dari Data 2 di Contoh 2. Sehingga mean dapat dihitung: Tabel 2 x f 36 1 ∑ 1206 37 2 ̅= = = 40,2 30 38 4 39 5 40 5 41 4 42 4 43 3 44 2 Item data Frekuensi total f = n= 30 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia xf 36 74 152 195 200 164 168 129 88 Σxf = 1206 10 Contoh 4: Pengaruh nilai item data yang ekstrem terhadap mean • • • • • Misalnya ada data yang ekstrem di tabel 1. Pada hari Jumat yang tadinya hanya tersewakan 15 mobil, tetapi karena bertepatan dengan hari libur, maka ada 50 mobil yang tersewakan. Maka tabel 1 menjadi. Tabel 3 Hari Senin Selasa Rabu Kamis Jumat Sabtu Minggu Jumlah mobil yang disewa 10 12 9 17 50 21 22 10 + 12 + 9 + 17 + 50 + 21 + 22 ̅ = = 20,1 7 Sebelumnya kita dapatkan nilai meannya 15,2. Setelah ada perubahan satu item data yang ekstrem yaitu di hari Jumat, ternyata nilai meannya jauh berbeda dari nilai semula. Contoh ini menunjukkan bahwa nilai mean sangat sensitif terhadap perubahan ekstrem nilai item data. Mungkin kita berfikir, lebih baik nilai ekstrem tersebut dibuang saja atau perlu dicara cara perhitungan nilai rata-rata selain mean. Nilai meannya sekarang adalah: MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 11 Median • • • Cara kedua untuk menyatakan nilai rata-rata adalah median. Median merupakan nilai tengah dari suatu set data. Cara mencari median: 1. Urutkan item data dari nilai terendah sampai nilai tertinggi. 2. Jika jumlah item datanya ganjil, maka nilai mediannya adalah data yang terletak di tengah set data. 3. Ketika jumlah item datanya genap, nilai mediannya adalah mean dari dua item data yang ada di tengah set data. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 12 Contoh 5: Menentukan Median • • Kita ambil contoh menghitung median dari data tabel 1. Hari Senin Selasa Rabu Kamis Jumat Sabtu Minggu Jumlah mobil yang disewa 10 12 9 17 15 21 22 Penyelesaian: – Langkah 1: mengurutkan item data dari nilai terkecil sampai terbesar. 9 , 10 , 12 , 15 , 17 , 21 , 22 Nilai tengah/ median – Langkah 2: melihat jumlah item data. Total item data adalah 7, jadi bilangan ganjil. – Langkah 3: Karena total item datanya ganjil maka median adalah item data yang terletak di tengah, yaitu angka 15. Seandainya hari kerja perusahaan hanya 6 hari per pekan, maka data hari Minggu tidak ada, sehingga jumlah item datanya adalah genap yaitu 6 . Sekarang nilai mediannya dapat dihitung sbb: – Mengurutkan item data dari nilai terkecil sampai terbesar. 9 , 10 , 12 , 15 , 17 , 21 Nilai tengah/ median – Karena total item datanya genap yaitu 6, maka median adalah mean dari dua item data yang terletak di tengah, yaitu median = (12 + 15)/2 = 27/2 = 13,5. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 13 Contoh 6: Membandingkan Median dan Mean • • • • Pada contoh 5, kita sudah menghitung median dari data tabel 1. Mediannya adalah 15. Pada contoh 1, kita telah menghitung mean. Mean dari data tabel 1 adalah 15,2. Dua hasil ini tidak berbeda jauh. Jadi mean dan median tidak berbeda jauh jika tidak dijumpai item data yang bernilai ekstrem (sangat besar atau sangat kecil). Sekarang kita ambil contoh 4, yangmana terdapat data ekstrem (tabel 3). Di data tabel 3, diperoleh mean = 20,1. • Jika kita hitung median dari data tabel 3, diperoleh median = 17. 9 , 10 , 12 , 17 , 21 , 22 , 50 • Dari perhitungan median data tabel 3, diperoleh hasil yang tidak berbeda jauh dari median data tabel 1, walaupun di tabel 3 dijumpai item data yang ekstrem. Hal yang berlawanan terjadi pada mean data tabel 3, mennya berbeda sangat jauh dengan mean data tabel 1. • Nilai tengah/ median Kesimpulan: Jika pada data dijumpai nilai ekstrem (sangat besar atau sangat kecil dibandingkan dengan nilai item data lainnya), maka nilai rata-rata yang dianggap lebih “mewakili” nilai set data adalah median. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 14 Mode • • • • • Cara ketiga untuk menyatakan nilai rata-rata adalah mode. Mode adalah suatu nilai yang sering muncul atau terjadi di suatu set data. Jika dalam suatu set data, semua item data hanya terjadi atau muncul satu kali saja, maka data tersebut tidak mempunyai mode. Di lain pihak, jika ada lebih dari satu item data yang mempunyai frekuensi tertinggi, maka setiap item data tersebut adalah mode. Contoh 7: – Data di Tabel 1: 9 , 10 , 12 , 15 , 17 , 21 , 22. Setiap item data hanya muncul satu kali saja, sehingga data ini tidak punya mode. – Data di Tabel 2: Temperatur 39 oC dan 40oC, masing-masing mempunyai frekuensi 5 yang merupakan frekuensi tertinggi di data. Jadi mode dari data tabel 2 adalah 39 dan 40. Data seperti ini disebut bimodal (mempunyai dua mode). 15 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia Midrange • • • Cara keempat untuk menyatakan nilai rata-rata adalah midrange. Midrange adalah mean dari nilai terendah dan tertinggi. Contoh 8: – Data di Tabel 1: 9 , 10 , 12 , 15 , 17 , 21 , 22. Nilai terendah dan tertinggi dari data adalah 9 dan 22. Jadi midrange datanya adalah (9 + 22)/ 2 = 15,5. – Data di Tabel 2: Nilai terendah dan tertinggi dari data adalah 36 dan 44. Jadi midrange temperatur air adalah (39 oC + 40oC)/ 2 = 39,5oC. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 16 Nilai Rata--rata Mana Yang Tepat Untuk Digunakan?? Pertanyaan ini tidak mudah untuk dijawab. Nilai rata-rata yang sering digunakan adalah mean, median, dan mode. Ketiga nilai ini mempunyai cara perhitungan yang berbeda, sehingga pemilihan nilai rata-rata sangat tergantung dari kebutuhan kita untuk menyimpulkan suatu data. Mean. Nilai rata-rata yang sering digunakan adalah mean. Tetapi perlu diingat bahwa mean sangat sensitif terhadap item data yang ekstrim. Oleh sebab itu di olimpiade, nilai tertinggi dan terendah dari lomba luncur es selalu dibuang. Median. Jika distribusi data tak simetri, maka median lebih tepat untuk digunakan sebagai nilai rata-rata. Misalnya gaji pegawai, pendapatan keluarga, dan pertumbuhan ekonomi. Distribusi data ini sangat tidak simetri, sehingga median lebih tepat (lebih mempunyai arti) jika digunakan untuk menghitung nilai rata-rata dari pada mean. Mode. Mode adalah satu-satunya ukuran yang selalu menampilkan nilai item data itu sendiri. Seorang pengusaha atau perancang mode (sepatu, baju, dll.) selalu menggunakan mode untuk memutuskan barang yang dijualnya. Misalnya, dari survei diperoleh data bahwa ukuran sepatu yang paling laku (mode) adalah 37 dan 40. Maka perancang sepatu tidak akan memutuskan untuk membuat sepatu dengan ukuran 38,5 lebih banyak lagi. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 17 Ukuran Penyebaran Data MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 18 Lampu LCD Projector Mana yang Kita Pilih?? Dua perusahaan lampu LCD Projector menuliskan spesifikasi lampu sbb: Perusahaan A: Waktu hidup rata-rata lampu 5000 jam. Perusahaan B: waktu hidup rata-rata lampu 4000 jam. Sepintas lalu, kita akan memilih lampu dari perusahaan A, karena mempunyai waktu hidup yang lebih lama. Akan tetapi, pada waktu uji kualitas diperoleh data, semua lampu B mempunyai waktu hidup tidak keluar dari angka 500 jam dari nilai rata-ratanya, sedangkan lampu A waktu hidupnya sangat bervariasi. Beberapa lampu A bahkan mempunyai waktu hidup 2000 jam di bawah waktu hidup rata-ratanya. Riwayat informasi data ini menyimpulkan bahwa lampu A dapat mempunyai waktu hidup sampai serendah 5000 – 2000 = 3000 jam, sedangkan lampu B waktu hidupnya paling rendah adalah 3500 jam. Dengan demikian kita akan memilih lampu B. Cerita ini memberikan pengertian, meskipun nilai rata-rata diambil dari distribusi data, tetapi tidak dapat bercerita tentang riwayat data. Dengan demikian kita perlu mengembangkan suatu metode untuk mengukur sebaran dari suatu data. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 19 Bagaimana mengukur sebaran data secara langsung?? Dua orang mahasiswa A dan B disurvei tentang waktu (dalam jam) yang digunakannya untuk olah raga setiap pekan. Diperoleh data survei sbb: Tabel 4 Pekan ke Mhs. A Mhs. B 1 5 1 2 6 2 3 7 7 4 8 12 5 9 13 Mean 7 7 Median 7 7 Jika dilihat mean dan median dari kedua mahasiswa, maka diambil kesimpulan keduanya menghabiskan waktu rata-rata yang sama untuk olah raga, yaitu 7 jam per pekan . Tetapi jika dilihat dari sebaran data di tabel, mahasiswa A lebih konsisten dalam berolah raga mingguan dibandingkan dengan mahasiswa B. Sebaran data menunjukkan jam per pekan dari mhs. B sangat bervariasi jauh dari nilai rata-ratanya. Cara termudah untuk mengukur sebaran data adalah dengan menghitung range, yaitu nilai tertinggi di data dikurangi dengan nilai terendah di data. Berdasarkan data di atas Range dari mhs A = 9 – 5 = 4, sedangkan mhs B = 13 – 1 = 12. Nilai range ini menunjukkan dengan jelas mhs B mempunyai sebaran data 3 kali mhs A. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 20 Range adalah ukuran penyebaran data yang kasar Kita harus berhati-hati dengan nilai range. Range dapat menjerumuskan kita jika tidak ditafsirkan secara bijak. Marilah kita ambil contoh berikut. Pada kontes menyelam diperoleh data waktu selam (menit) dari dua peserta (A dan B), sbb: Tabel 5 Penyelaman ke Peserta A Peserta B 1 28 27 2 22 27 3 21 28 4 26 6 5 18 27 Mean 23 23 Median 22 27 Range 10 22 Jika dilihat nilai rangenya, peserta A (range = 10) lebih konsisten karena rangenya lebih kecil dibandingkan peserta B (range = 22). Bagaimanapun kenyataanya peserta B lebih konsisten. Sebaran data menunjukkan waktu selam B lebih seragam kecuali ada satu item data, yaitu 6 yang ekstrem. Angka 6 ini mungkin disebabkan ada kesalahan teknis saat menyelam atau ada kesalahan lainnya. Perhatikan pula: Data B mediannya tidak terpengaruh oleh nilai ekstrem. Contoh ini menuntut kita untuk mencari cara yang lebih baik dalam mengukur sebaran data. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 21 Deviasi standar adalah ukuran penyebaran data yang dapat diandalkan Marilah kita mengamati peyimpangan (deviasi) setiap item data dari nilai mean di tabel 5. Penyelaman ke Peserta A Penyimpangan item data ( ) dari mean ( = x– ) x 1 28 2 22 3 21 4 26 5 18 28 – 23 22 – 23 21 – 23 26 – 23 18 – 23 =5 = -1 =-2 =3 Mean 23 - Median 22 - Range 10 - =-5 ̅ Jika dianalisis total penyimpangan item data dari mean selalu sama dengan nol, karena mean adalah pusat data. Sebagian data akan menyimpang di sebelah kiri (negatif) dan sebagian lainnya di sebelah kanan (positif), sehingga saling meniadakan. Dengan kata lain perhitungan penyimpangan seperti ini tidak bermanfaat. Agar jumlah semua penyimpangan tidak nol, masing-masing nilai simpangan kita kuadratkan. Metode perhitungan simpangan seperti ini menghasilkan deviasi standar. Rumus deviasi standar ( s ) dari suatu sampel dengan jumlah item data n adalah = ∑ − ̅ −1 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 2 22 Contoh 9: Menghitung Deviasi Standar Marilah kita menghitung deviasi standar data di tabel 5. Penyelaman ke Peserta A Penyimpangan item data ( ) dari mean ( = x– ) x 1 28 2 22 3 21 4 26 5 18 28 – 23 22 – 23 21 – 23 26 – 23 18 – 23 =5 = -1 =-2 =3 Mean 23 - Median 22 - Range 10 - =-5 ̅ Di data ini, mean = 23, n = 5, sehingga nilai deviasi standar dapat dihitung sbb: = ∑ − ̅ −1 2 = = 28 − 23 2 + 22 − 23 25 + 1 + 4 + 9 + 25 4 = 2 + 21 − 232 + 26 − 232 + 18 − 23 5−1 64 4 2 =4 Nilai deviasi standar = 4. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 23 Arti deviasi standar dan mean suatu data Satu set data dapat diwakili oleh nilai mean dan deviasi standar. Nilai mean menunjukkan akurasi dari data tersebut, sedangkan deviasi standar (s) menunjukkan sebaran (konsistensi) datanya. Contoh 10: Perusahaan cat mengisikan cairan cat sebayak 1 liter ke dalam kaleng dengan keran otomatik. Perusahaan ini menggunakan dua keran A dan B secara bergantian. Hasil pengukuran berulang pada volume cat dalam kaleng, untuk keran A dan B adalah Amean = 1,05 liter, ; As = 0,20 liter Bmean = 1,20 liter, Bs = 0,05 liter Kesimpulan: Keran A mempunyai nilai mean (1,05) yang baik/akurat karena dekat dengan nilai 1 liter, tetapi konsistensinya tidak baik, sebab deviasi standarnya besar (0,25). Keran B mempunyai masalah dengan akurasi, karena meannya (1,20) jauh dari nilai 1 liter, walupun begitu konsistensi keran baik, sebab deviasi standarnya kecil (0,05). Hasil ini dapat digambarkan sbb: 9,6 9,7 9,8 9,9 1 1,1 1,2 1,3 1,4 9,6 9,7 9,8 9,9 1 Keran A MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 1,1 1,2 1,3 1,4 Keran B 24 Bagaimana cara membandingkan dua distribusi data yang berbeda? Walaupun satu set data dapat diwakili oleh nilai mean dan deviasi standarnya, tetapi ketika kita ingin membandingkan dua set (atau lebih) data, nilai deviasi standar tidaklah mencukupi untuk menentukan kulitas suatu data. Contoh 11: Seandainya dua keran A dan B seperti contoh sebelumnya dites berulang pada daerah ukuran yang berbeda dan diperoleh datanya, keran mana yang mempunyai kualitas lebih baik? Data: Keran A: 12,13,16,18,18, 20 ml; Penyelesaian: Keran B: 125, 131, 114, 158, 168, 193 ml. Setelah dihitung: Amean= 16,167ml, As= 3,125 ml ; Bmean= 153,167ml, Bs= 25,294ml Berdasarkan hasil hitungan standar deviasi, keran A mempunyai nilai deviasi yang jauh lebih kecil dibandingkan dengan keran B. Tetapi karena nilai mean kedua keran mempunyai daerah ukuran yang berbeda, maka kualitas keran tidak dapat ditentukan secara langsung dengan besar atau kecilnya nilai standar deviasi. Maka diperlukan cara lain untuk membandingkan dua set data yang mempunyai nilai mean yang berbeda daerah ukurannya, yaitu koefisien variasi. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 25 Koefisien Variasi Koefisien variasi menggunakan ukuran pusat kecondongan (mean) dan deviasi standar sekaligus untuk membandingkan dua set (atau lebih) data. Koefisien Variasi (V) dihitung dengan: = .100 untuk data̅ sampel = . 100 untuk data populasi Di sini terlihat bahwa ukuran kualitas data ditentukan oleh nilai relatif dari standar deviasi terhadap mean. Jika nilai koefisien variasi data adalah kecil, maka datanya berkualitas (mempunyai konsistensi yang tinggi pada daerah ukuran tertentu). Contoh 12: Berdasarkan contoh 11, hitunglah nilai koefisien variasi dari keran A dan B, jika: Amean= 16,167ml, As= 3,125 ml ; Bmean= 153,167ml, Bs= 25,294ml Penyelesaian: Berdasarkan hasil perhitungan koefisien variasi, terlihat bahwa nilai VB lebih kecil dibandingkan dengan nilai VA, dengan demikian kualitas keran B lebih baik dari pada keran A. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 26 Distribusi dan Ukuran MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 27 Distribusi Frekuensi dan Distribusi Induk Kita telah belajar mengorganisir data hasil sampling menjadi distribusi frekuensi. Distribusi frekuensi yang diperoleh dari data sampel disebut sebagai distribusi sampel. Jika distribusi tersebut diperoleh dari data populasi , disebut distribusi induk. Distribusi sampel Frekuensi Distribusi induk Grafik distribusi yang dihaluskan Nilai yang diamati MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 28 Bagaimana hubungan Distribusi dan Ukuran? Distribusi data dapat diwakili oleh dua parameter (nilai) yaitu ukuran pusat kecondongan dan ukuran penyebaran data. Dimana letak nilai-nilai ukuran pusat kecondongan di suatu distribusi data? Nilai mode mudah ditentukan yaitu nilai yang mempunyai frekuensi paling tinggi. Pada distribusi tak sismetri, nilai mean akan berada lebih dekat di daerah sisi miring dan nilai median terletak di antara nilai mode dan mean. Median Mode Median Mean MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 29 Distribusi Normal Distribusi normal adalah simetri dan sering digunakan di kehidupan sehari-hari. Rkarena simetri, letak mode, median, dan mean () berimpit di pusat distribusi. Bentuk distribusi normal bisa ramping atau melebar tergantung dari ukuran penyebaran datanya atau deviasi standarnya (σ ) . Mode Median Deviasi standar kecil Deviasi standar besar Mean σ σ MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 30 Sifat--sifat Distribusi Normal Distribusi normal adalah simetri, berbentuk lonceng, dan sering digunakan di kehidupan sehari-hari. Karena simetri, letak mode, median, dan mean () berimpit di pusat distribusi dan mempunyai nilai yang sama. Kaidah empiris yang berlaku pada setiap distribusi normal: Kira-kira 68% dari seluruh data berada dalam satu deviasi standar dari mean (antara – 1σ dan +1σ ). 68% 95% 99,7% µ−3σ µ−2σ µ−1σ µ+1σ µ+2σ µ+3σ Kira-kira 95% dari seluruh data berada dalam dua deviasi standar dari mean (antara – 2σ dan +2σ ). Kira-kira 99,7% dari seluruh data berada dalam tiga deviasi standar dari mean (antara – 3σ dan +3σ ). MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 31 Penggunaan Distribusi Normal Distribusi normal dapat digunakan untuk memprediksi sifat-sifat populasi. Contoh 13: Suatu Rumah Sakit Umum Daerah mencatat, pada tahun 2010 telah menangani 2000 persalinan. Analisis data menunjukkan mean berat badan bayi sama dengan 3700 g dan deviasi standarnya 50 g. A.Berapa jumlah bayi yang mempunyai berat badan antara 3650 – 3750 g? B.Berapa jumlah bayi yang mempunyai berat badan antara 3700 – 3800 g? C.Berapa jumlah bayi yang mempunyai berat badan lebih dari 3850 g? Penyelesaian: Data berat badan bayi mengikuti distribusi normal, sehingga kita harus meninjau permasalahan ini dengan sifat-sifat distribusi normal. Berdasarkan data, jumlah populasi (N) = 2000 bayi, mean () = 3700 g, dan deviasi standar (σ) = 50 g. Jika informasi ini digambarkan pada grafik normal, akan didapatkan penyelesaian jawaban A, B, dan C lebih sederhana. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 32 Contoh 13 (lanjutan) N = 2000, = 3700, = 50 68% 68% 95% 99,7 % µ−3σ µ−2σ A. B. C. µ−1σ µ+1σ µ+2σ µ+3σ 3550 3600 95% 99,7 % 3650 3700 375038003850 Berapa jumlah bayi yang mempunyai berat badan antara 3650 – 3750 g? Jumlah bayi dengan berat badan antara 3650 – 3750g berdasarkan distribusi normal (kedua grafik di atas) = antara – 1σ dan +1σ = 68% populasi = 0,68 x 2000 = 1360 bayi. Berapa jumlah bayi yang mempunyai berat badan antara 3700 – 3800 g? Daerah 3700 – 3800 = daerah antara dan +2σ = 0,5 x 95% populasi = 0,5 x 0,95 x 2000 = 950. Jadi jumlah bayi dengan berat badan antara 3700 – 3800g adalah 950 bayi. Berapa jumlah bayi yang mempunyai berat badan lebih dari 3850 g? Angka 3850 = +3σ . Daerah antara –3σ dan +3σ = 99,7% populasi. Jadi jumlah di luar daerah –3σ sampai +3σ = 0,3% populasi, sehingga jumlah bayi dengan berat di atas 3850g = 0,5 x 0,3% x 2000 = 3 bayi. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 33 Kesimpulan • Suatu distribusi data dapat diwakili dengan dua parameter yaitu ukuran pusat kecondongan dan deviasi standar. • Ukuran pusat kecondongan merupakan nilai rata-rata dari suatu set data. Nilai ini dapat dinyatakan dalam mean, median, mode, dan midrange. • Kita harus memilih nilai rata-rata yang tepat untuk mewakili suatu set data. • Ukuran penyebaran data dinyatakan dalam deviasi standar. • Koefisien variasi digunakan untuk membandingkan kualitas dua set (atau lebih) data. • Pada distribusi normal (simetri) nilai mean, median, dan modus adalah sama dan terletak di tengan distribusi data, sedangkan untuk distribusi tak simetri, ketiga nilai tersebut berbeda. • Kita dapat memprediksi sifat-sifat suatu populasi dengan menggunakan distribusi normal. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 34 Daftar Pustaka • Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with Application, Ed. Ke-8, Boston, Pearson Addison Wesley. • Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson Addison Wesley. • Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008, Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley. • Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison Wesley. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 35 MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia