Penalaran Statistik 2

advertisement
Depok, 2011
Penalaran Statistik 2
Penyusun:
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Lingkup bahasan
• Ukuran Pusat Kecondongan
• Ukuran Penyebaran Data
• Distribusi dan Ukuran
Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan
agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah
berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga
mahasiswa dapat cepat mempelajari dan mudah mengingatnya.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
2
Ukuran Pusat Kecondongan
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
3
Bagaimana cara menentukan satu nilai yang dapat mewakili suatu data?
• Sebuah perusahaan penyewaan mobil, mencatat jumlah mobil yang disewa dalam satu
pekan sbb:
Tabel 1
Hari
Senin Selasa Rabu Kamis Jumat Sabtu Minggu
Jumlah mobil yang disewa
10
12
9
17
15
21
22
• Ketika pengusaha tsb ingin menyatakan jumlah mobil yang disewa per hari di pekan ini dalam satu nilai
saja, dia perlu menentukan satu nilai tsb yang mana nilai ini dapat mewakili nilai-nilai jumlah mobil yang
disewa setiap harinya di pekan tsb.
• Nilai ini merupakan nilai “tengah” dari satu set data di tabel di atas. Secara umum nilai ini dikenal
sebagai nilai rata-rata (average). Di ilmu statistik nilai rata-rata disebut sebagai Ukuran Pusat
Kecondongan.
• Di sini kita akan membahas empat nilai ukuran pusat kecondongan, yaitu: mean, median, mode, dan
midrange.
• Setiap nilai ini dihitung dengan cara yang berbeda, sehingga kita tidak menyebutnya sebagai nilai ratarata, tetapi langsung menyebutnya dengan nama mean, median, mode, atau midrange.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
4
Menentukan Nilai Rata--rata dengan Menghitung Mean
• Ketika kita ingin menentukan jumlah mobil yang disewa per hari dari data satu
pekan (Tabel 1), pada umumnya orang berfikir dan menghitung dengan cara
menjumlahkan semua item data sewa mobil dari hari Senin sampai Minggu dan
kemudian membaginya dengan angka 7. Cara penentuan nilai rata-rata seperti
ini dikenal dengan menghitung nilai mean.
• Mean diberi simbul
untuk nilai mean dari sampel, dan diberi simbul untuk
nilai mean dari populasi.
• Contoh 1: menghitung nilai mean dari mobil yang disewa per hari untuk data di
Tabel 1.
• Jadi nilai mean jumlah mobil yang disewa per hari di pekan tsb adalah 15,2.
Kita dapat menyatakannya: rata-rata ada 15 mobil yang disewa per hari.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
5
Bagaimana Menyatakan Mean dalam Bentuk Simbul (Rumus
Rumus)?
• Mean adalah jumlah dari semua item data ( = 10 + 12 + … + 22 ) dibagi dengan jumlah
itemnya ( = 7 ).
̅=
= 15,2
• Jika setiap item data kita beri simbul xi , yangmana i adalah bilangan 1, 2, 3, …, maka
setiap item data dapat diidentiikasi: x1 = 10, x2 = 12, x3 = 9, …, x7 = 22. Jadi huruf i
memberi identitas setiap item data dan mempunyai angka terbesar sama dengan total
item data = 7, yang biasanya diberi simbul n (=7).
• Dengan demikian untuk menghitung mean dapat diberi simbul:
∑ ==1
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
6
Contoh 2: Menghitung Mean dengan Rumus
•
•
Pembangkit listrik tenaga uap membuang sisa air turbinnya ke laut. Agar tidak mengganggu
lingkungan, temperatur air tsb selalu dimonitor. Salah satu data hasil monitor temperatur ( oC)
bulanannya adalah sebagai berikut:
Data 2: 36,37,37,38,38,38,38,39,39,39,
39,39,40,40,40,40,40,41,41,41,
41,42,42,42,42,43,43,43,44,44.
Hitunglah mean dari temperatur tsb.
Penyelesaian:
Jumlah item data, n = 30. Rumus mean:
Berdasarkan rumus mean, dapat dihitung:
̅=
∑ ==1
=
∑ =1
=30
30
=
̅=
∑ ==1
36 + 37 + 37 + 38 + 38 + 38 + 38 + 39 + 39 + 39
30
39 + 39 + 40 + 40 + 40 + 40 + 40 + 41 + 41 + 41
30
41 + 42 + 42 + 42 + +42 + 43 + 43 + 43 + 44 +1206
44
7
=
= 40,2
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
30
Jadi mean temperatur di
bulan tsb = 40,2oC.
Cara Menghitung Mean dengan Distribusi Frekuensi
•
•
Di Contoh 2 dijumpai beberapa item data dengan nilai yang sama. Kejadian ini memberika ide
tentang cara menghitung mean yang lebih sederhana yaitu dengan menggunakan distribusi
frekuensi.
Marilah kita analisis cara menghitung mean di contoh 2:
= 37 x 2
= 38 x 4
̅=
∑ =1
∑=1
=30
=
30
36 + 37 + 37 + 38 + 38 + 38 + 38 + 39 + 39 + 39
=
30
= 40 x 5
dst.
39 + 39 + 40 + 40 + 40 + 40 + 40 + 41 + 41 + 41
30
41 ++42
+ 42
+ +4243
+ 43
+ + 44 + 44
1206
Berdasarkan analisis di atas, rumus
mean 42
dapat
dituliskan:
+ 43
= 40,2
=
•
30
x : nilai data pengamatan
f : frekuensi data pengamatan
Σ xf : jumlah semua hasil kali data pengamatan dan frekuensi.
n : frekuensi total.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
̅=
∑
8
Contoh 3: Menghitung Mean dengan Distribusi Frekuensi
•
•
Hitunglah mean dari data di Contoh 2 dengan menggunakan distribusi frekuensi.
Penyelesaian:
Setiap item data yang mempunyai nilai sama dihitung frekuensinya, kemudian
digunakan untuk menghitung mean dengan cara distribusi frekuensi:
̅=
=
∑
Item data
Frekuensi
36 × 1 + 37 × 2 + 38 × 4 + 39 × 5 + 40 × 5 + 41 × 4 + 42 × 44 + 43 × 3 + 44 × 2
1206
=
= 40,2
30
Mean temperatur = 40,2oC.
30
Frekuensi total
Kita dapat pula menghitung mean dengan menggunakan bantuan tabel distribusi
frekuensi.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
9
Contoh 3: Menghitung Mean dengan Distribusi Frekuensi (lanjutan)
•
•
Kita dapat membuatkan distribusi frekuensi dari Data 2 di Contoh 2.
Sehingga mean dapat dihitung:
Tabel 2
x
f
36
1
∑
1206
37
2
̅=
=
= 40,2
30
38
4
39
5
40
5
41
4
42
4
43
3
44
2
Item data Frekuensi total
f = n= 30
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
xf
36
74
152
195
200
164
168
129
88
Σxf = 1206
10
Contoh 4: Pengaruh nilai item data yang ekstrem terhadap mean
•
•
•
•
•
Misalnya ada data yang ekstrem di tabel 1. Pada hari Jumat yang tadinya hanya tersewakan
15 mobil, tetapi karena bertepatan dengan hari libur, maka ada 50 mobil yang tersewakan.
Maka tabel 1 menjadi.
Tabel 3
Hari
Senin
Selasa
Rabu
Kamis
Jumat
Sabtu
Minggu
Jumlah mobil yang disewa
10
12
9
17
50
21
22
10 + 12 + 9 + 17 + 50 + 21 + 22
̅
=
= 20,1
7
Sebelumnya kita dapatkan nilai meannya 15,2. Setelah ada perubahan satu item data yang
ekstrem yaitu di hari Jumat, ternyata nilai meannya jauh berbeda dari nilai semula.
Contoh ini menunjukkan bahwa nilai mean sangat sensitif terhadap perubahan ekstrem nilai
item data.
Mungkin kita berfikir, lebih baik nilai ekstrem tersebut dibuang saja atau perlu dicara cara
perhitungan nilai rata-rata selain mean.
Nilai meannya sekarang adalah:
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
11
Median
•
•
•
Cara kedua untuk menyatakan nilai rata-rata adalah median.
Median merupakan nilai tengah dari suatu set data.
Cara mencari median:
1. Urutkan item data dari nilai terendah sampai nilai tertinggi.
2. Jika jumlah item datanya ganjil, maka nilai mediannya adalah
data yang terletak di tengah set data.
3. Ketika jumlah item datanya genap, nilai mediannya adalah mean
dari dua item data yang ada di tengah set data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
12
Contoh 5: Menentukan Median
•
•
Kita ambil contoh menghitung median dari data tabel 1.
Hari
Senin
Selasa
Rabu
Kamis
Jumat
Sabtu
Minggu
Jumlah mobil yang disewa
10
12
9
17
15
21
22
Penyelesaian:
– Langkah 1: mengurutkan item data dari nilai terkecil sampai terbesar.
9 , 10 , 12 , 15 , 17 , 21 , 22
Nilai tengah/
median
– Langkah 2: melihat jumlah item data. Total item data adalah 7, jadi bilangan ganjil.
– Langkah 3: Karena total item datanya ganjil maka median adalah item data yang terletak
di tengah, yaitu angka 15.
Seandainya hari kerja perusahaan hanya 6 hari per pekan, maka data hari Minggu tidak ada, sehingga
jumlah item datanya adalah genap yaitu 6 . Sekarang nilai mediannya dapat dihitung sbb:
– Mengurutkan item data dari nilai terkecil sampai terbesar.
9 , 10 , 12 , 15 , 17 , 21
Nilai tengah/
median
– Karena total item datanya genap yaitu 6, maka median adalah mean dari dua item data yang
terletak di tengah, yaitu median = (12 + 15)/2 = 27/2 = 13,5.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
13
Contoh 6: Membandingkan Median dan Mean
•
•
•
•
Pada contoh 5, kita sudah menghitung median dari data tabel 1. Mediannya adalah 15.
Pada contoh 1, kita telah menghitung mean. Mean dari data tabel 1 adalah 15,2.
Dua hasil ini tidak berbeda jauh. Jadi mean dan median tidak berbeda jauh jika tidak
dijumpai item data yang bernilai ekstrem (sangat besar atau sangat kecil).
Sekarang kita ambil contoh 4, yangmana terdapat data ekstrem (tabel 3). Di data tabel 3,
diperoleh mean = 20,1.
•
Jika kita hitung median dari data tabel 3, diperoleh median = 17.
9 , 10 , 12 , 17 , 21 , 22 , 50
•
Dari perhitungan median data tabel 3, diperoleh hasil yang tidak berbeda jauh dari median
data tabel 1, walaupun di tabel 3 dijumpai item data yang ekstrem. Hal yang berlawanan
terjadi pada mean data tabel 3, mennya berbeda sangat jauh dengan mean data tabel 1.
•
Nilai tengah/
median
Kesimpulan:
Jika pada data dijumpai nilai ekstrem (sangat besar atau sangat kecil
dibandingkan dengan nilai item data lainnya), maka nilai rata-rata yang
dianggap lebih “mewakili” nilai set data adalah median.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
14
Mode
•
•
•
•
•
Cara ketiga untuk menyatakan nilai rata-rata adalah mode.
Mode adalah suatu nilai yang sering muncul atau terjadi di suatu set data.
Jika dalam suatu set data, semua item data hanya terjadi atau muncul satu
kali saja, maka data tersebut tidak mempunyai mode.
Di lain pihak, jika ada lebih dari satu item data yang mempunyai frekuensi
tertinggi, maka setiap item data tersebut adalah mode.
Contoh 7:
– Data di Tabel 1:
9 , 10 , 12 , 15 , 17 , 21 , 22. Setiap item data hanya muncul
satu kali saja, sehingga data ini tidak punya mode.
– Data di Tabel 2: Temperatur 39 oC dan 40oC, masing-masing mempunyai
frekuensi 5 yang merupakan frekuensi tertinggi di data. Jadi mode dari data
tabel 2 adalah 39 dan 40. Data seperti ini disebut bimodal (mempunyai dua
mode).
15
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Midrange
•
•
•
Cara keempat untuk menyatakan nilai rata-rata adalah midrange.
Midrange adalah mean dari nilai terendah dan tertinggi.
Contoh 8:
– Data di Tabel 1:
9 , 10 , 12 , 15 , 17 , 21 , 22. Nilai terendah dan
tertinggi dari data adalah 9 dan 22. Jadi midrange datanya adalah
(9 + 22)/ 2 = 15,5.
– Data di Tabel 2: Nilai terendah dan tertinggi dari data adalah 36 dan
44. Jadi midrange temperatur air adalah (39 oC + 40oC)/ 2 = 39,5oC.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
16
Nilai Rata--rata Mana Yang Tepat Untuk Digunakan??
Pertanyaan ini tidak mudah untuk dijawab.
Nilai rata-rata yang sering digunakan adalah mean, median, dan mode. Ketiga nilai ini
mempunyai cara perhitungan yang berbeda, sehingga pemilihan nilai rata-rata sangat
tergantung dari kebutuhan kita untuk menyimpulkan suatu data.
Mean. Nilai rata-rata yang sering digunakan adalah mean. Tetapi perlu diingat bahwa
mean sangat sensitif terhadap item data yang ekstrim. Oleh sebab itu di olimpiade, nilai
tertinggi dan terendah dari lomba luncur es selalu dibuang.
Median. Jika distribusi data tak simetri, maka median lebih tepat untuk digunakan sebagai
nilai rata-rata. Misalnya gaji pegawai, pendapatan keluarga, dan pertumbuhan ekonomi.
Distribusi data ini sangat tidak simetri, sehingga median lebih tepat (lebih mempunyai arti)
jika digunakan untuk menghitung nilai rata-rata dari pada mean.
Mode. Mode adalah satu-satunya ukuran yang selalu menampilkan nilai item data itu
sendiri. Seorang pengusaha atau perancang mode (sepatu, baju, dll.) selalu menggunakan
mode untuk memutuskan barang yang dijualnya. Misalnya, dari survei diperoleh data
bahwa ukuran sepatu yang paling laku (mode) adalah 37 dan 40. Maka perancang sepatu
tidak akan memutuskan untuk membuat sepatu dengan ukuran 38,5 lebih banyak lagi.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
17
Ukuran Penyebaran Data
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
18
Lampu LCD Projector Mana yang Kita Pilih??
Dua perusahaan lampu LCD Projector menuliskan spesifikasi lampu sbb:
Perusahaan A: Waktu hidup rata-rata lampu 5000 jam.
Perusahaan B: waktu hidup rata-rata lampu 4000 jam.
Sepintas lalu, kita akan memilih lampu dari perusahaan A, karena mempunyai waktu hidup
yang lebih lama. Akan tetapi, pada waktu uji kualitas diperoleh data, semua lampu B
mempunyai waktu hidup tidak keluar dari angka 500 jam dari nilai rata-ratanya, sedangkan
lampu A waktu hidupnya sangat bervariasi. Beberapa lampu A bahkan mempunyai waktu
hidup 2000 jam di bawah waktu hidup rata-ratanya.
Riwayat informasi data ini menyimpulkan bahwa lampu A dapat mempunyai waktu hidup
sampai serendah 5000 – 2000 = 3000 jam, sedangkan lampu B waktu hidupnya paling
rendah adalah 3500 jam. Dengan demikian kita akan memilih lampu B.
Cerita ini memberikan pengertian, meskipun nilai rata-rata diambil dari distribusi data,
tetapi tidak dapat bercerita tentang riwayat data.
Dengan demikian kita perlu mengembangkan suatu metode untuk mengukur sebaran dari
suatu data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
19
Bagaimana mengukur sebaran data secara langsung??
Dua orang mahasiswa A dan B disurvei tentang waktu (dalam jam) yang digunakannya
untuk olah raga setiap pekan. Diperoleh data survei sbb:
Tabel 4
Pekan ke
Mhs. A
Mhs. B
1
5
1
2
6
2
3
7
7
4
8
12
5
9
13
Mean
7
7
Median
7
7
Jika dilihat mean dan median dari kedua mahasiswa, maka diambil kesimpulan keduanya
menghabiskan waktu rata-rata yang sama untuk olah raga, yaitu 7 jam per pekan . Tetapi
jika dilihat dari sebaran data di tabel, mahasiswa A lebih konsisten dalam berolah raga
mingguan dibandingkan dengan mahasiswa B. Sebaran data menunjukkan jam per pekan
dari mhs. B sangat bervariasi jauh dari nilai rata-ratanya.
Cara termudah untuk mengukur sebaran data adalah dengan menghitung range, yaitu
nilai tertinggi di data dikurangi dengan nilai terendah di data.
Berdasarkan data di atas Range dari mhs A = 9 – 5 = 4, sedangkan mhs B = 13 – 1 = 12.
Nilai range ini menunjukkan dengan jelas mhs B mempunyai sebaran data 3 kali mhs A.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
20
Range adalah ukuran penyebaran data yang kasar
Kita harus berhati-hati dengan nilai range. Range dapat menjerumuskan kita jika tidak
ditafsirkan secara bijak. Marilah kita ambil contoh berikut.
Pada kontes menyelam diperoleh data waktu selam (menit) dari dua peserta (A dan B), sbb:
Tabel 5
Penyelaman ke
Peserta A
Peserta B
1
28
27
2
22
27
3
21
28
4
26
6
5
18
27
Mean
23
23
Median
22
27
Range
10
22
Jika dilihat nilai rangenya, peserta A (range = 10) lebih konsisten karena rangenya lebih
kecil dibandingkan peserta B (range = 22).
Bagaimanapun kenyataanya peserta B lebih konsisten. Sebaran data menunjukkan waktu
selam B lebih seragam kecuali ada satu item data, yaitu 6 yang ekstrem. Angka 6 ini
mungkin disebabkan ada kesalahan teknis saat menyelam atau ada kesalahan lainnya.
Perhatikan pula: Data B mediannya tidak terpengaruh oleh nilai ekstrem.
Contoh ini menuntut kita untuk mencari cara yang lebih baik dalam mengukur sebaran data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
21
Deviasi standar adalah ukuran penyebaran data yang dapat diandalkan
Marilah kita mengamati peyimpangan (deviasi) setiap item data dari nilai mean di tabel 5.
Penyelaman ke
Peserta A
Penyimpangan item data ( )
dari mean ( =
x–
)
x
1
28
2
22
3
21
4
26
5
18
28 – 23
22 – 23
21 – 23
26 – 23
18 – 23
=5
= -1
=-2
=3
Mean
23
-
Median
22
-
Range
10
-
=-5
̅
Jika dianalisis total penyimpangan item data dari mean selalu sama dengan nol, karena mean
adalah pusat data. Sebagian data akan menyimpang di sebelah kiri (negatif) dan sebagian
lainnya di sebelah kanan (positif), sehingga saling meniadakan. Dengan kata lain perhitungan
penyimpangan seperti ini tidak bermanfaat.
Agar jumlah semua penyimpangan tidak nol, masing-masing nilai simpangan kita kuadratkan.
Metode perhitungan simpangan seperti ini menghasilkan deviasi standar.
Rumus deviasi standar ( s ) dari suatu sampel dengan jumlah item data n adalah
=
∑
− ̅
−1
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
2
22
Contoh 9: Menghitung Deviasi Standar
Marilah kita menghitung deviasi standar data di tabel 5.
Penyelaman ke
Peserta A
Penyimpangan item data ( )
dari mean ( =
x–
)
x
1
28
2
22
3
21
4
26
5
18
28 – 23
22 – 23
21 – 23
26 – 23
18 – 23
=5
= -1
=-2
=3
Mean
23
-
Median
22
-
Range
10
-
=-5
̅
Di data ini, mean = 23, n = 5, sehingga nilai deviasi standar dapat dihitung sbb:
=
∑
− ̅
−1
2
=
=
28 − 23 2 + 22 − 23
25 + 1 + 4 + 9 + 25
4
=
2
+ 21 − 232 + 26 − 232 + 18 − 23
5−1
64
4
2
=4
Nilai deviasi standar = 4.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
23
Arti deviasi standar dan mean suatu data
Satu set data dapat diwakili oleh nilai mean dan deviasi standar. Nilai mean menunjukkan akurasi
dari data tersebut, sedangkan deviasi standar (s) menunjukkan sebaran (konsistensi) datanya.
Contoh 10:
Perusahaan cat mengisikan cairan cat sebayak 1 liter ke dalam kaleng dengan keran otomatik.
Perusahaan ini menggunakan dua keran A dan B secara bergantian. Hasil pengukuran
berulang pada volume cat dalam kaleng, untuk keran A dan B adalah
Amean = 1,05 liter,
;
As = 0,20 liter
Bmean = 1,20 liter,
Bs = 0,05 liter
Kesimpulan:
Keran A mempunyai nilai mean (1,05) yang baik/akurat karena dekat dengan nilai 1 liter, tetapi
konsistensinya tidak baik, sebab deviasi standarnya besar (0,25).
Keran B mempunyai masalah dengan akurasi, karena meannya (1,20) jauh dari nilai 1 liter,
walupun begitu konsistensi keran baik, sebab deviasi standarnya kecil (0,05).
Hasil ini dapat digambarkan sbb:
9,6 9,7 9,8 9,9 1
1,1 1,2 1,3 1,4
9,6 9,7 9,8 9,9 1
Keran A
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
1,1 1,2 1,3 1,4
Keran B
24
Bagaimana cara membandingkan dua distribusi data yang berbeda?
Walaupun satu set data dapat diwakili oleh nilai mean dan deviasi standarnya, tetapi ketika kita ingin
membandingkan dua set (atau lebih) data, nilai deviasi standar tidaklah mencukupi untuk
menentukan kulitas suatu data.
Contoh 11:
Seandainya dua keran A dan B seperti contoh sebelumnya dites berulang pada daerah ukuran
yang berbeda dan diperoleh datanya, keran mana yang mempunyai kualitas lebih baik?
Data: Keran A: 12,13,16,18,18, 20 ml;
Penyelesaian:
Keran B: 125, 131, 114, 158, 168, 193 ml.
Setelah dihitung: Amean= 16,167ml, As= 3,125 ml ;
Bmean= 153,167ml,
Bs= 25,294ml
Berdasarkan hasil hitungan standar deviasi, keran A mempunyai nilai deviasi yang jauh lebih
kecil dibandingkan dengan keran B. Tetapi karena nilai mean kedua keran mempunyai
daerah ukuran yang berbeda, maka kualitas keran tidak dapat ditentukan secara langsung
dengan besar atau kecilnya nilai standar deviasi.
Maka diperlukan cara lain untuk membandingkan dua set data yang mempunyai nilai
mean yang berbeda daerah ukurannya, yaitu koefisien variasi.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
25
Koefisien Variasi
Koefisien variasi menggunakan ukuran pusat kecondongan (mean) dan deviasi standar sekaligus
untuk membandingkan dua set (atau lebih) data.
Koefisien Variasi (V) dihitung dengan:
=
.100
untuk data̅ sampel
= . 100
untuk data populasi
Di sini terlihat bahwa ukuran kualitas data ditentukan oleh nilai relatif dari standar deviasi terhadap
mean. Jika nilai koefisien variasi data adalah kecil, maka datanya berkualitas (mempunyai
konsistensi yang tinggi pada daerah ukuran tertentu).
Contoh 12: Berdasarkan contoh 11, hitunglah nilai koefisien variasi dari keran A dan B, jika:
Amean= 16,167ml, As= 3,125 ml ;
Bmean= 153,167ml, Bs= 25,294ml
Penyelesaian:
Berdasarkan hasil perhitungan koefisien variasi, terlihat bahwa nilai VB lebih kecil
dibandingkan dengan nilai VA, dengan demikian kualitas keran B lebih baik dari pada keran A.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
26
Distribusi dan Ukuran
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
27
Distribusi Frekuensi dan Distribusi Induk
Kita telah belajar mengorganisir data hasil sampling menjadi distribusi frekuensi.
Distribusi frekuensi yang diperoleh dari data sampel disebut sebagai distribusi sampel.
Jika distribusi tersebut diperoleh dari data populasi , disebut distribusi induk.
Distribusi sampel
Frekuensi
Distribusi induk
Grafik distribusi
yang dihaluskan
Nilai yang diamati
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
28
Bagaimana hubungan Distribusi dan Ukuran?
Distribusi data dapat diwakili oleh dua parameter (nilai) yaitu ukuran pusat kecondongan
dan ukuran penyebaran data.
Dimana letak nilai-nilai ukuran pusat kecondongan di suatu distribusi data?
Nilai mode mudah ditentukan yaitu nilai yang mempunyai frekuensi paling tinggi.
Pada distribusi tak sismetri, nilai mean akan berada lebih dekat di daerah sisi miring
dan nilai median terletak di antara nilai mode dan mean.
Median
Mode
Median
Mean
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
29
Distribusi Normal
Distribusi normal adalah simetri dan sering digunakan di kehidupan sehari-hari.
Rkarena simetri, letak mode, median, dan mean () berimpit di pusat distribusi.
Bentuk distribusi normal bisa ramping atau melebar tergantung dari ukuran penyebaran
datanya atau deviasi standarnya (σ ) .
Mode
Median
Deviasi standar
kecil
Deviasi standar
besar
Mean
σ
σ

MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia

30
Sifat--sifat Distribusi Normal
Distribusi normal adalah simetri, berbentuk lonceng,
dan sering digunakan di kehidupan sehari-hari.
Karena simetri, letak mode, median, dan mean ()
berimpit di pusat distribusi dan mempunyai nilai yang
sama.
Kaidah empiris yang berlaku pada setiap distribusi
normal:
Kira-kira 68% dari seluruh data berada dalam
satu deviasi standar dari mean (antara – 1σ
dan +1σ ).
68%
95%
99,7%
µ−3σ µ−2σ
µ−1σ

µ+1σ µ+2σ µ+3σ
Kira-kira 95% dari seluruh data berada dalam
dua deviasi standar dari mean (antara – 2σ
dan +2σ ).
Kira-kira 99,7% dari seluruh data berada dalam
tiga deviasi standar dari mean (antara – 3σ
dan +3σ ).
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
31
Penggunaan Distribusi Normal
Distribusi normal dapat digunakan untuk memprediksi sifat-sifat populasi.
Contoh 13: Suatu Rumah Sakit Umum Daerah mencatat, pada tahun 2010 telah
menangani 2000 persalinan. Analisis data menunjukkan mean berat badan
bayi sama dengan 3700 g dan deviasi standarnya 50 g.
A.Berapa jumlah bayi yang mempunyai berat badan antara 3650 – 3750 g?
B.Berapa jumlah bayi yang mempunyai berat badan antara 3700 – 3800 g?
C.Berapa jumlah bayi yang mempunyai berat badan lebih dari 3850 g?
Penyelesaian:
Data berat badan bayi mengikuti distribusi normal, sehingga kita harus meninjau
permasalahan ini dengan sifat-sifat distribusi normal. Berdasarkan data, jumlah
populasi (N) = 2000 bayi, mean () = 3700 g, dan deviasi standar (σ) = 50 g.
Jika informasi ini digambarkan pada grafik normal, akan didapatkan penyelesaian
jawaban A, B, dan C lebih sederhana.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
32
Contoh 13 (lanjutan)
N = 2000, = 3700, = 50
68%
68%
95%
99,7 %
µ−3σ µ−2σ
A.
B.
C.
µ−1σ

µ+1σ µ+2σ µ+3σ
3550 3600
95%
99,7 %
3650 3700
375038003850
Berapa jumlah bayi yang mempunyai berat badan antara 3650 – 3750 g?
Jumlah bayi dengan berat badan antara 3650 – 3750g berdasarkan distribusi normal (kedua grafik di
atas) = antara – 1σ dan +1σ = 68% populasi = 0,68 x 2000 = 1360 bayi.
Berapa jumlah bayi yang mempunyai berat badan antara 3700 – 3800 g?
Daerah 3700 – 3800 = daerah antara dan +2σ = 0,5 x 95% populasi = 0,5 x 0,95 x 2000 = 950. Jadi
jumlah bayi dengan berat badan antara 3700 – 3800g adalah 950 bayi.
Berapa jumlah bayi yang mempunyai berat badan lebih dari 3850 g?
Angka 3850 = +3σ . Daerah antara –3σ dan +3σ = 99,7% populasi. Jadi jumlah di luar daerah –3σ
sampai +3σ = 0,3% populasi, sehingga jumlah bayi dengan berat di atas 3850g = 0,5 x 0,3% x 2000 =
3 bayi.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
33
Kesimpulan
• Suatu distribusi data dapat diwakili dengan dua parameter yaitu ukuran
pusat kecondongan dan deviasi standar.
• Ukuran pusat kecondongan merupakan nilai rata-rata dari suatu set data.
Nilai ini dapat dinyatakan dalam mean, median, mode, dan midrange.
• Kita harus memilih nilai rata-rata yang tepat untuk mewakili suatu set data.
• Ukuran penyebaran data dinyatakan dalam deviasi standar.
• Koefisien variasi digunakan untuk membandingkan kualitas dua set (atau
lebih) data.
• Pada distribusi normal (simetri) nilai mean, median, dan modus adalah
sama dan terletak di tengan distribusi data, sedangkan untuk distribusi tak
simetri, ketiga nilai tersebut berbeda.
• Kita dapat memprediksi sifat-sifat suatu populasi dengan menggunakan
distribusi normal.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
34
Daftar Pustaka
•
Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with
Application, Ed. Ke-8, Boston, Pearson Addison Wesley.
•
Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson
Addison Wesley.
•
Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008,
Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley.
•
Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison
Wesley.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
35
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Download