Ukuran Penyebaran Data

advertisement
Ukuran Penyebaran Data
Arum Handini Primandari, M.Sc.
Ukuran Variasi
• Selain menentukan pemusatan data, suatu aspek studi
deskriptif data harus mengukur variansi di sekitar pusat data.
• Perhatikan dua jenis data berikut yang memiliki pusat data
yang sama:
• Oleh karena mean sampel adalah ukuran pemusatan data  x 
variasi dari setiap data terhadap pusat data (mean sample)
tercermin dari simpangannya (deviasinya) dari mean, yaitu:
deviasi  observasi – mean sampel
xx
• Contoh: terdapat himpunan data: 3, 5, 7, 7, 8, dan memiliki
mean sebesar 6, maka simpangannya adalah:
Data
Deviasi
3
-3
5
-1
7
1
7
1
8
2
• Untuk sembarang himpunan data, jumlah seluruh deviasi
adalah 0.
x  x 
• Untuk mengukur sebaran, kita harus mengeliminasi tanda
negatif (-) sebelum menjumlahkan dan merata-ratakan, yaitu
dengan mengkuadratkan. Ukuran penyebaran data disebut
variansi sampel. Variansi dirumuskan:
n
s2 
x  x 
i1
2
n1
• Variansi disebut juga dengan ragam.
• Untuk memperoleh ukuran variabilitas dengan satuan yang
sama dengan satuan datanya, maka kita ambil akar dari
variansi, yang dinamakan deviasi standar/ simpangan baku,
yaitu:
n
s
x  x 
i1
2
n1
Estimasi Variansi untuk Data Berkelompok
• Jika x1, x2, …, xk adalah titik-titik tengah kelas yang masingmasing memiliki frekuensi f1, f2, …, fk, maka variansi data
tersebut adalah:


n fx    fx
i i
 i1 
s2  i1
nn  1 
k
2
i i
k
2
Ukuran Variasi yang lain
• Ukuran variasi yang lain yang sering digunakan
adalah:
– Rentang sampel
Rentang sampel = data terbesar – data terkecil
– Rentang antar-kuartil sampel
Rentang antarkuartil sampel = Kuartil ketiga – kuartil
pertama
Diagram Kotak (boxplot)
• Boxplot menggambarkan lima serangkai nilai yaitu: data
terkecil, Q1, Q2, Q3, data terbesar.
• Contoh:
Q2
Q1
data terkecil
Q3
data terbesar
Memeriksa Distribusi
• Penyajian data, misalnya dalam histogram, mempunyai tujuan
agar kita data melihat distribusi data tersebut: apakah
distribusi data simetris atau condong (skewed) ke kanan (right
tail) atau kiri (left tail).
• Kita dapat menentukan distribusi dari bentuk, pemusatan,
dan penyebaran nya.
• Kita dapat mendeteksi kecondongan dari statistik 5 serangkai
dengan membandingkan seberapa jauh kuartil pertama dan
data terkecil dari median (left tail) dengan seberapa jauh
kuartil ketiga dan data terbesar dengan median (right tail).
Outliers (Pencilan)
• Outliers adalah observasi yang dianggap luar biasa (ekstrim)
jauh dari sebagian besar data
• Prosedur yang umum dipakai untuk menentukan outliers
adalah dengan rentang antarkuartil.
• Suatu data dicurigai merupakan outliers, jika:
– kurang dari Q1-H, atau
– Lebih dari Q3+H
dengan H = 1.5*(Q3 – Q1)
Latihan 1
Tentukan simpangan baku dari data berikut: persentase
penduduk berumur 10 tahun ke atas yang bekerja menurut
jam kerja selama seminggu:
Jam kerja
Persentase
0–9
2
10 – 19
6
20 – 29
22
30 – 39
27
40 – 49
23
50 – 59
15
60 – 69
5
Latihan 2
• Biaya iklan dari 40 produk sabun (dalam juta rupiah) adalah
sebagai berikut:
138
150
167
111
127
151
177
149
123
148
195
128
124
169
160
161
145
156
173
170
135
163
163
166
159
134
154
155
120
137
122
140
120
112
123
144
159
175
157
183
• Tentukan:
–
–
–
–
Variansi
Standar deviasi
Tentukan Q1, Q2, Q3
Adakah data yang menjadi outliers
Referensi
• Bhattacharya, G. K., dan R. A., Johnson, 1997,
Statistical Concept and Methods, John Wiley and
Sons, New York.
• Soejoeti, Zanzawi, 2014, Metode Statistik 1,
Universitas Terbuka, Tangerang Selatan.
• Walpole, R.E., 1995, Pengantar Statistika Edisi ke3, diterjemahkan oleh: Bambang Sumantri,
Gramedia Pustaka Utama, Jakarta.
Download