Variabilitas

advertisement
Azimmatul Ihwah
• Ukuran tendensi sentral seperti mean, median, dan
modus seringkali tidak mempunyai cukup informasi untuk
menyimpulkan data yg ada.
• Ada cara yg lebih baik untuk menginterpretasi data yg
akan dibahas kali ini.
• Salah satu ukuran sebaran data (variabilitas) adalah
jangkauan.
• Jangkauan disebut juga range / rentangan.
• Menghitung jangkauan adalah sangat mudah, yaitu
mengurangkan nilai tertinggi dengan nilai terendah dari
data.
• Contoh skor dr salah 1 pemain mempunyai jangkauan =
13 – 7 = 6
• Temukan mean, nilai terendah, nilai tertinggi dan
jangkauan dari data di bawah ini
1.
2.
• Perhitungan mean, nilai terendah, nilai tertinggi dan
jangkauan dari kedua data diatas menghasilkan nilai yg
sama
• Jangkauan pada data menghasilkan nilai yg sama, tetapi
perhatikan histogram dr kedua data. Kalau dicermati lagi
ternyata data tersebar secara berbeda.
• Pada histogram data kedua, ternyata terjadi ‘loncatan’
dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9
dan 11 mempunyai frekuensi 0.
• Jangkauan hanya mendeskripsikan lebar dari data,
namun tidak bisa menunjukkan apakah terdapat jarak
dari skor data satu ke data berikutnya.
• Banyak data mempunyai jangkauan yg sama, namun
dari jangkauan kita hanya bisa tahu seberapa jauh jarak
antara nilai terendah dan nilai tertinggi. Sehingga banyak
informasi dari data yg tidak terjelaskan.
• Jadi jangkauan merupakan cara yg paling mudah atau
cara yg paling dasar untuk mengetahui sebaran data,
namun sangat terbatas sekali untuk memberikan
informasi mengenai sebaran yg sesungguhnya dalam
data.
• Salah satu cara untuk membuat mini range adalah
mengurutkan data kemudian membagi menjadi 4 bagian
yang sama.
• Contoh
• Kita dapat mengonstruksikan jangkauan dengan cara
terlebih dahulu mencari nilai diantara dua bagian data
• Kuartil adalah nilai yg memisahkan antar bagian data.
• Kuartil terendah dinamakan kuartil pertama (𝑄1 ) dan
kuartil tertinggi dinamakan kuartil ketiga (𝑄3 ). Sedangkan
kuartil tengah (𝑄2 ) merupakan median karena membagi
data menjadi dua bagian yg sama.
• Jangkauan dari nilai dalam kuartil terendah dan kuartil
tertinggi dinamakan jangkauan interkuartil
• Jangkauan interkuartil = 𝑄3 - 𝑄1
Jika banyak data n, maka
• Mencari letak kuartil terendah :
Pertama hitung n : 4. Selanjutnya,
1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka
mencari kuartil terendah adalah dgn mencari rata-rata
dari data ke-k dan data ke-(k+1).
2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke
atas. Posisi kuartil terendah adalah pada hasil
pembulatan tersebut.
Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas
menjadi 3. Jadi kuartil terendah adalah data ke-3
• Mencari letak kuartil tertinggi :
Pertama hitung 3n : 4. Selanjutnya,
1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m,
maka nilai kuartil tertinggi adalah dengan mencari ratarata data ke-m dan data ke-(m+1).
2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan
hasilnya ke atas. Posisi kuartil tertinggi adalah pada
hasil pembulatan tersebut.
• Determine range, lower and upper quartile, and
interquartile range from the data below
• Jika data disajikan dalam tabel distribusi frekuensi data
berkelompok, maka kuartil ke-i dicari dgn rumus
• πΎπ‘’π‘Žπ‘Ÿπ‘‘π‘–π‘™ π‘˜π‘’ − 𝑖 = 𝑏 + 𝑙
𝑖
𝑁−𝐹
4
𝑓
, 𝑖 = 1,2,3
dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas
kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i,
f adalah frekuensi kelas kuartil dan N adalah banyaknya
data.
• Hitung 𝑄1 , 𝑄2 , 𝑄3 dan jangkauan interkuartil dari data di bawah ini
• Box Plot pertama kali dikenalkan oleh American
Statistician, John Tukey, pada tahun 1977 yg berguna
untuk menampilkan lima summary dalam data yaitu
median, kuartil , data maksimum dan minimum.
• Boxplot merupakan diagram yg terdiri dari box dan
whiskers, sehingga biasa disebut juga dgn box and
whisker plot.
• Box Plot dapat digambarkan dalam posisi vertical
maupun horizontal.
Interpretasi Boxplot:
• Box mengandung 50% dari data. Tepi atas dari box disebut Q3
(75% dari data) dan tepi bawah dari box disebut Q1(25 % dari
data).
• Garis yang terdapat pada box disebut dengan median data
(Q2).
• Titik terakhir dari garis vertical merupakan nilai maksimum dan
minimum.
• Titik yang berada di luar garis tersebut disebut dengan outlier.
Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan
interkuartil dari kuartil pertama dan ketiga.
• Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai
terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil),
dan titik ujung garis whisker kanan adalah nilai tertinggi dari
• Apabila jarak antara tepi bawah dan tepi atas ke median
data tidak sama, berarti distribusi data tersebut tidak
simetris (skewed).
• Misal berikut ini terdapat data tinggi badan siswa dalam cm:
148.7 149.8 147.9 152.1 152.1
147.9 150.4 160.0 150.5 150.4
147.3 142.6 153.4 149.3 153.8
144.7 154.9 152.7 150.5 151.0
149.2 154.0 152.7 147.2 145.8
149.9 151.2 148.0 148.0 153.0
146.3 149.2 149.3 153.0 150.7
152.2 148.7 148.7 146.8 148.9
155.1 151.5 148.9 152.3 156.2
153.3 151.6 154.1 150.3 142.4
Dari data tersebut diperoleh beberapa statistik:
Mean : 150.37 cm
Median : 150.38 cm
SE Mean: 0.46
St. Dev: 3.31
Nilai minimum: 142.4 cm
Nilai maximum: 160 cm
Q1: 148.49 cm
Q3: 152.69 cm
• Boxplot untuk data diatas adalah
(Data maks <
Q3+1.5xIQR) –
Q3
(Data min >
Q1-1.5XIQR)Q1
• Terdapat 1 outlier yaitu 160, karena 160 > 𝑄3 + 1.5 x 4.2
• Ketiga kuartil adalah nilai-nilai yg membagi sekumpulan
data menjadi 4 bagian.
• Persentil merupakan nilai yg membagi data dalam
persentase dalam cara yg sama dgn kuartil.
• Persentil ke-k disimbolkan dgn π‘ƒπ‘˜ adalah nilai pada k%
dari data.
• Jadi 𝑄1 adalah persentil ke-25, 𝑄2 adalah persentil ke-50
dan 𝑄3 adalah persentil ke-75
Jika ingin mencari nilai persentil ke-k dgn banyak data n,
𝑛
pertama hitung π‘˜
, selanjutnya
100
1. Jika hasilnya bilangan bulat, nyatakan dgn i, maka
persentil ke-k adalah rata-rata dari data ke-i dan ke(i+1).
2. Jika hasilnya bukan bilangan bulat, maka posisi
persentil adalah pada hasil pembulatan bilangan
tersebut.
Contoh kita punya 125 data. Untuk mencari persentil ke-10
125
hitung 10
= 12.5. Maka persentil ke-10 adalah data
100
ke-13
• Salah satu cara untuk mengetahui variabilitas data
adalah melalui variansi.
• Variansi juga adalah salah satu cara untuk mengukur
sebaran data.
• Variansi pada populasi disimbolkan dengan 𝜎 2 , dihitung
dengan menggunakan rumus.
𝑓 π‘₯−πœ‡ 2
𝑁
untuk data pada tabel distribusi frekuensi data
tunggal
𝑓 π‘₯𝑖 −πœ‡ 2
𝑁
untuk data pada tabel distribusi frekuensi data
berkelompok, dgn π‘₯𝑖 merupakan titik tengah tiap kelas
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N
adalah banyak data.
Untuk penyederhanaan penghitungan, variansi dapat
dihitung menggunakan rumus
•
𝑓π‘₯ 2
𝑁
−
𝑓π‘₯ 2
,
𝑁
untuk data pada tabel distribusi frekuensi
data tunggal
•
𝑓π‘₯𝑖2
𝑁
−
𝑓π‘₯𝑖 2
,
𝑁
untuk data pada tabel distribusi frekuensi
data berkelompok, dengan π‘₯𝑖 adalah titik tengah tiap
kelas.
dan
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N
adalah banyak data.
Variansi pada sampel disimbolkan dgn 𝑠 2 , dihitung dengan
rumus.
•
𝑓 π‘₯−π‘₯ 2
𝑛−1
untuk data pada tabel distribusi frekuensi data
tunggal
•
𝑓 π‘₯𝑖 −π‘₯ 2
𝑛−1
untuk data pada tabel distribusi frekuensi data
berkelompok, dgn π‘₯𝑖 merupakan titik tengah tiap kelas.
dan
f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n
adalah ukuran sampel.
Penyederhanaan rumus variansi pada sampel
•
𝑛
𝑓π‘₯ 2 − 𝑓π‘₯ 2
,
𝑛 𝑛−1
untuk data pada tabel distribusi frekuensi
data tunggal.
•
𝑛
𝑓π‘₯𝑖2 −
𝑛 𝑛−1
𝑓π‘₯𝑖 2
, untuk data pada tabel distribusi frekuensi
data berkelompok, dengan π‘₯𝑖 merupakan titik tengah tiap
kelas.
dan
f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran
sampel.
• Perhatikan bahwa variansi adalah rataan kuadrat jarak
tiap nilai dari mean.
• Ukuran yg benar-benar menyatakan jarak nilai dari mean
adalah standar deviasi.
• Standar deviasi merupakan akar dari variansi.
• Standar deviasi pada populasi disimbolkan dengan 𝜎 dan
pada sampel disimbolkan dengan s.
𝜎 = π‘‰π‘Žπ‘Ÿπ‘–π‘Žπ‘›π‘ π‘–
• Menunjukkan seberapa nilai menyimpang dari rataannya.
• Standard scores atau bilangan baku merupakan ukuran
yg bersifat individual.
• Bilangan baku untuk setiap nilai/skor π‘₯𝑖 pada sampel
dilambangkan dengan 𝑧𝑖 dicari dgn menggunakan rumus
π‘₯𝑖 − π‘₯
𝑧𝑖 =
𝑠
• Hitung dan bandingkan standard scores dari kedua
pemain basket berikut
• Berikut standard scores dari kedua pemain dalam kurva
• Jika skor kedua pemain distandardize, maka skor dari
pemain kedua lebih tinggi dari pemain pertama.
• Jadi meskipun pencapain skor pemain pertama lebih
tinggi pada suatu pertandingan, tetapi dikatakan bahwa
track record pencapaian prestasi pemain kedua relatif
lebih baik dr pemain pertama.
Download