Statistika Industri I-Variabilitas

advertisement
Azimmatul Ihwah
• Ukuran tendensi sentral seperti mean, median, dan modus
seringkali tidak mempunyai cukup informasi untuk menyimpulkan
data yg ada.
• Ada cara yg lebih baik untuk menginterpretasi data yg akan
dibahas kali ini, yaitu variabilitas (ukuran sebaran/dispersi)
• Seorang pemain pada suatu tim basket mengalami cedera, jadi
pelatih tim tersebut ingin mencari pemain baru untuk
menggantikan pemain yg cedera itu. Ada tiga kandidat yg
didapat dr seleksi yg dilakukan. Berikut adalah skor point yg
didapat ketiga pemain dalam setiap pertandingan yg pernah
diikuti.
• Berapa mean, median dan modus masing-masing pemain
tersebut?
• Pemain mana yg akan dipilih oleh pelatih tim basket untuk
menggantikan pemain yg cedera?
• Mean, median dan modus masing-masing pemain adalah sama
yaitu 10.
• Hasil dari penghitungan mean, median dan modus memang
menghasilkan sesuatu yg sama, tetapi kalau dicermati lg pada
skor masing-masing pemain memiliki pencapaian yg berbeda.
• Contohnya pada pemain kedua dan ketiga. Pemain ketiga
pernah hanya memperoleh skor 3 pada 2 kali pertandingan,
tetapi pemain kedua selalu menghasilkan skor di atas 7 pada
pertandingan yg pernah diikuti.
• Kita dapat mengukur pusat dari data di atas dgn melihat
mean. Tetapi mean tidak bisa menjelaskan seberapa menyebar
data itu
• Salah satu
jangkauan.
ukuran
sebaran
data (variabilitas) adalah
• Jangkauan disebut juga range / rentangan.
• Menghitung jangkauan adalah sangat mudah, yaitu
mengurangkan nilai tertinggi dengan nilai terendah dari data.
• Contoh skor dr salah 1 pemain mempunyai jangkauan = 13 – 7
=6
• Temukan jangkauan dari data di bawah ini
1.
2.
• Perhitungan mean, nilai terendah, nilai tertinggi dan jangkauan
dari kedua data diatas menghasilkan nilai yg sama
• Jangkauan pada data menghasilkan nilai yg sama, tetapi
perhatikan histogram dr kedua data. Kalau dicermati lagi
ternyata data tersebar secara berbeda.
• Pada histogram data kedua, ternyata terjadi ‘loncatan’ dari
skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11
mempunyai frekuensi 0.
• Jangkauan hanya mendeskripsikan lebar dari data, namun
tidak bisa menunjukkan apakah terdapat jarak dari skor data
satu ke data berikutnya.
• Banyak data mempunyai jangkauan yg sama, namun dari
jangkauan kita hanya bisa tahu seberapa jauh jarak antara
nilai terendah dan nilai tertinggi. Sehingga banyak informasi
dari data yg tidak terjelaskan.
• Jadi jangkauan merupakan cara yg paling mudah atau cara
yg paling dasar untuk mengetahui sebaran data, namun sangat
terbatas sekali untuk memberikan informasi mengenai sebaran
yg sesungguhnya dalam data.
• Bila kurva data yg kita punya seperti dibawah ini, salah satu
cara untuk mengatasinya adlh dgn membuat mini range /
jangkauan kecil
• Salah satu cara untuk membuat mini range adalah mengurutkan
data kemudian membagi menjadi 4 bagian yang sama.
• Contoh
• Kita dapat mengonstruksikan jangkauan dengan cara terlebih
dahulu mencari nilai diantara dua bagian data
• Kuartil adalah nilai yg memisahkan antar bagian data.
• Kuartil terendah dinamakan kuartil pertama (𝑄1 ) dan kuartil
tertinggi dinamakan kuartil ketiga ( 𝑄3 ). Sedangkan kuartil
tengah (𝑄2 ) merupakan median karena membagi data menjadi
dua bagian yg sama.
• Jangkauan dari nilai dalam kuartil terendah dan kuartil
tertinggi dinamakan jangkauan interkuartil
• Jangkauan interkuartil = 𝑄3 - 𝑄1
Jika banyak data n, maka
• Mencari letak kuartil terendah :
Pertama hitung n : 4. Selanjutnya,
1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari
kuartil terendah adalah dgn mencari rata-rata dari data ke-k
dan data ke-(k+1).
2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas.
Posisi kuartil terendah adalah pada hasil pembulatan
tersebut.
Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas
menjadi 3. Jadi kuartil terendah adalah data ke-3
• Mencari letak kuartil tertinggi :
Pertama hitung 3n : 4. Selanjutnya,
1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka
nilai kuartil tertinggi adalah dengan mencari rata-rata data
ke-m dan data ke-(m+1).
2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya
ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan
tersebut.
• Jika data disajikan dalam tabel distribusi frekuensi data
berkelompok, maka kuartil ke-i dicari dgn rumus
• πΎπ‘’π‘Žπ‘Ÿπ‘‘π‘–π‘™ π‘˜π‘’ − 𝑖 = 𝑏 + 𝑙
𝑖
𝑁−𝐹
4
𝑓
, 𝑖 = 1,2,3
dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas
kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f
adalah frekuensi kelas kuartil dan N adalah banyaknya data.
Simpangan Kuartil
Qd = simpangan kuartil
Q3 = nilai kuartil ke-3
Q1 = nilai kuartil ke-1
Simpangan mutlak rata-rata
(mean deviation)
Data tidak berkelompok
Data berkelompok
Xm,i = nilai tengah dari interval kelas
k = jumlah interval kelas
n = banyaknya data
fi = frekuensi dalam interval
• Box Plot pertama kali dikenalkan oleh American Statistician,
John Tukey, pada tahun 1977 yg berguna untuk menampilkan
lima summary dalam data yaitu median, kuartil , data
maksimum dan minimum.
• Boxplot merupakan diagram yg terdiri dari box dan whiskers,
sehingga biasa disebut juga dgn box and whisker plot.
• Box Plot dapat digambarkan dalam posisi vertical maupun
horizontal.
Interpretasi Boxplot:
• Box mengandung 50% dari data. Tepi kanan dari box disebut Q3
(75% dari data) dan tepi kiri dari box disebut Q1(25 % dari data).
• Garis yang terdapat pada box disebut dengan median data (Q2).
• Titik terakhir dari garis vertical merupakan nilai maksimum dan
minimum (jika tidak ada outlier)
• Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier
yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari
kuartil pertama dan ketiga.
• Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai
terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan
titik ujung garis whisker kanan adalah nilai tertinggi dari data yg
kurang dari Q3+(1.5xjangkauan interkuartil)
• Apabila jarak antara tepi kiri dan tepi kanan ke median data
tidak sama, berarti distribusi data tersebut tidak simetris
(skewed).
• Misal berikut ini terdapat data tinggi badan siswa dalam cm:
148.7 149.8 147.9 152.1 152.1
147.9 150.4 160.0 150.5 150.4
147.3 142.6 153.4 149.3 153.8
144.7 154.9 152.7 150.5 151.0
149.2 154.0 152.7 147.2 145.8
149.9 151.2 148.0 148.0 153.0
146.3 149.2 149.3 153.0 150.7
152.2 148.7 148.7 146.8 148.9
155.1 151.5 148.9 152.3 156.2
153.3 151.6 154.1 150.3 142.4
Dari data tersebut diperoleh beberapa statistik:
Mean : 150.37 cm
Median : 150.38 cm
SE Mean: 0.46
St. Dev: 3.31
Nilai minimum: 142.4 cm
Nilai maximum: 160 cm
Q1: 148.49 cm
Q3: 152.69 cm
• Boxplot untuk data diatas adalah
(Data maks <
Q3+1.5xIQR)
(Data min > Q11.5XIQR)
• Terdapat 1 outlier yaitu 160, karena 160 > 𝑄3 + 1.5 x 4.2
• Buat Boxplot dari skor point kedua pemain basket berikut (buat
dalam satu gambar)
• Pemain mana yg akhirnya dipilih untuk menggantikan pemain
yg cedera?
• Jika akhirnya pelatih memilih pemain pertama untuk
menggantikan pemain yg cedera dlm tim berdasarkan median
maupun jangkauan interkuartil, namun problemnya adalah
kedua ukuran data tersebut hanya dapat mengukur seberapa
jauh jarak skor tertinggi dan skor terendah. Pelatih tersebut
ingin juga mengetahui seberapa stabil kondisi pemain dgn
melihat skornya.
• Terdapat ukuran yg lebih tepat untuk mengukur seberapa
dekat skor yg diperoleh dgn mean. Dengan kata lain kita ingin
mengetahui seberepa besar variabilitas data.
• Salah satu cara untuk mengetahui variabilitas data adalah
melalui variansi.
• Variansi juga adalah salah satu cara untuk mengukur sebaran
data.
• Variansi pada populasi disimbolkan dengan 𝜎 2 , dihitung
dengan menggunakan rumus.
𝑓 π‘₯−πœ‡ 2
untuk data pada tabel distribusi frekuensi data tunggal
𝑁
𝑓 π‘₯𝑖 −πœ‡ 2
untuk data pada tabel distribusi frekuensi data
𝑁
berkelompok, dgn π‘₯𝑖 merupakan titik tengah tiap kelas
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N
adalah banyak data.
Untuk penyederhanaan penghitungan, variansi dapat dihitung
menggunakan rumus
•
•
𝑓π‘₯ 2
𝑁
𝑓π‘₯ 2
,
𝑁
𝑓π‘₯𝑖2
𝑓π‘₯𝑖 2
,
𝑁
−
data tunggal
untuk data pada tabel distribusi frekuensi
−
untuk data pada tabel distribusi frekuensi
𝑁
data berkelompok, dengan π‘₯𝑖 adalah titik tengah tiap kelas.
dan
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N
adalah banyak data.
Variansi pada sampel disimbolkan dgn 𝑠 2 , dihitung dengan
rumus.
•
𝑓 π‘₯−π‘₯ 2
𝑛−1
untuk data pada tabel distribusi frekuensi data
tunggal
•
𝑓 π‘₯𝑖 −π‘₯ 2
𝑛−1
untuk data pada tabel distribusi frekuensi data
berkelompok, dgn π‘₯𝑖 merupakan titik tengah tiap kelas.
dan
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n
adalah ukuran sampel.
Penyederhanaan rumus variansi pada sampel
•
𝑛
𝑓π‘₯ 2 − 𝑓π‘₯ 2
,
𝑛 𝑛−1
untuk data pada tabel distribusi frekuensi data
tunggal.
•
𝑛
𝑓π‘₯𝑖2 −
𝑛 𝑛−1
𝑓π‘₯𝑖 2
, untuk data pada tabel distribusi frekuensi data
berkelompok, dengan π‘₯𝑖 merupakan titik tengah tiap kelas.
dan
f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran
sampel.
• Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap
nilai dari mean.
• Ukuran yg benar-benar menyatakan jarak nilai dari mean
adalah standar deviasi.
• Standar deviasi merupakan akar dari variansi.
• Standar deviasi pada populasi disimbolkan dengan 𝜎 dan
pada sampel disimbolkan dengan s.
𝜎 = π‘‰π‘Žπ‘Ÿπ‘–π‘Žπ‘›π‘ π‘–
• Menunjukkan seberapa nilai menyimpang dari rataannya.
• Standard scores atau bilangan baku merupakan ukuran yg
bersifat individual.
• Bilangan baku untuk setiap nilai/skor π‘₯𝑖 pada sampel
dilambangkan dengan 𝑧𝑖 dicari dgn menggunakan rumus
π‘₯𝑖 − π‘₯
𝑧𝑖 =
𝑠
• Hitung dan bandingkan standard scores dari kedua pemain
basket berikut
• Berikut standard scores dari kedua pemain dalam kurva
• Jika skor kedua pemain distandardize, maka skor dari pemain
kedua lebih tinggi dari pemain pertama.
• Jadi meskipun pencapain skor pemain pertama lebih tinggi
pada suatu pertandingan, tetapi dikatakan bahwa track record
pencapaian prestasi pemain kedua relatif lebih baik dr pemain
pertama.
ο‚— Diketahui besarnya pinjaman 7 orang nasabah suatu
bank sbb. (dalam juta Rp).
ο‚—
Nama
A
B
C
D
Pinjaman
12.57
14.65
25.50
5.75
E
F
G
11.80 16.55 15.89
Selidiki, apakah terdapat nasabah yang pinjamannya
cukup sedikit atau sangat besar dibandingkan dengan
nasabah lainnya
36
Download