Metode Statistika (STK211)

advertisement
25/09/2013
Pertanyaan
Metode Statistika (STK211)
Jika
punya data mengenai daya
hidup dari baterai HP merk “XXX”
Pertemuan III
St ti tik D
Statistika
Dasar (B
(Basic
i Statistics)
St ti ti )
• Dimana “lokasi” atau “pusat” dari data? Æ
ukuran pemusatan
• Seberapa besar variasi dari data Æ ukuran
penyebaran
Ukuran Pemusatan
Modus (Mode)
• Modus (Mode): Nilai pengamatan yang
paling sering muncul
• Merupakan nilai pengamatan yang paling
sering muncul
• Median: Pengamatan yang ditengah-tengah
dari data terurut
• Dalam satu gugus data dapat mengandung
lebih dari satu modus
• Quartil: Nilai
Nilai-nilai
nilai yang membagi data terurut
menjadi 4 bagian yang sama
• Dapat digunakan untuk semua jenis data,
data tapi
paling banyak digunakan untuk data kategorik
atau data diskret dengan hanya sedikit nilai
yang mungkin muncul
• Mean: merupakan pusat massa (centroid)
sehingga simpangan kiri dan simpangan
kanan sama besar
Modus
Median
Cara menghitung median contoh
• Pengamatan yang ditengah-tengah dari data
terurut
Urutkan data dari terkecil sampai
terbesar
• Nama lain dari percentil ke-50
• Nama lain dari kuartil 2 (Q2)
• Digunakan untuk menggambarkan lokasi dari
data numerik
Jika jumlah data ganjil, nilai median
merupakan nilai di tengah
Data I: 2
8
3
4
1
• Kekar terhadap adanya pencilan
Data terurut: 1
2
3
4
8
Median
1
25/09/2013
Cara menghitung median contoh
Urutkan data dari terkecil sampai
terbesar
Perhatikan data I dan data III
Data I terurut: 1
2
Data terurut: 1
2
3
Data III terurut: 1
4
8
4
8
4
100
Median
Jika jumlah data genap, nilai median
merupakan rataan dari dua nilai di tengah
Data II: 2 8 3 4 1 8
3
2
3
8
Median
Median=(3+4)/2 = 3.5
Secara umum langkah teknis untuk
menghitung median contoh
¾Urutkan data dari kecil ke besar
¾Cari posisi median (nmed=(n+1)/2)
¾Nilai median
• Jika nmed bulat, maka Median=X(n+1)/2
• Jika
Jik nmed pecahan,
h
maka
k M
Median=(X
di
(X(n)/2+
X(n)/2+1)/2 (rata-rata dua pengamatan yang
berada sebelum dan setelah posisi
median)
Langkah Teknis memperoleh
Kuartil (Quartile)
Metode Belah dua
¾ Urutkan data dari kecil ke besar
¾ Cari posisi kuartil
• nQ2=(n+1)/2
• nQ1=(nQ2*+1)/2= nQ3, nQ2* posisi kuartil dua
t
terpangkas
k (pecahan
(
h dibuang)
dib
)
¾ Nilai kuartil 2 ditentukan sama seperti
mencari nilai median. Kuartil 1 dan 3
prinsipnya sama seperti median tapi kuartil 1
dihitung dari kiri, sedangkan kuartil 3 dihitung
dari kanan.
Kuartil
•
Nilai-nilai yang membagi data terurut menjadi 4 bagian
yang sama
•
Q0 (dibaca kuartil 0) merupakan nilai minimum dari data
•
Q1(dibaca kuartil 1) merupakan nilai yang membagi data
25% data di kiri dan 75% data di kanan
•
Q2 (dibaca kuartil 2) merupakan median, membagi data
menjadi 50%
•
Q3 (dibaca kuartil 3) merupakan nilai yang membagi data
75% data di kiri dan 25% data di sebelah kanan
•
Q4 (dibaca kuartil 4) merupakan nilai maksimum dari
data
•
Nilai Q1, Q2, dan Q3 kekar terhadap pencilan
Perhatikan ilustrasi data I
• Posisi Q2 = nQ2 = (5+1) / 2 =3
• Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
3
4
8
Median
Q1
Q3
2
25/09/2013
Perhatikan ilustrasi data II
Langkah Teknis memperoleh
Kuartil (Quartile)
• Posisi Q2 = nQ2 = (6+1) / 2 =3.5
Metode Interpolasi
¾ Urutkan data dari kecil ke besar
¾ Cari posisi kuartil
• Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
3
4
8
8
• nq1=(1/4)(n+1)
• nq2=(2/4)(n+1)
• nq3=(3/4)(n+1)
¾ Nilai kuartil dihitung sebagai berikut:
• Xqi=Xa,i + hi (Xb,i-Xa,i)
• Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i
= pengamatan setelah posisi kuartil ke-i dan hi
adalah nilai pecahan dari posisi kuartil
Median
Q1
Q3
Perhatikan ilustrasi data I
Perhatikan ilustrasi data II
• Posisi Q2 = nQ2 = (5+1) / 2 =3
• Posisi Q2 = nQ2 = (6+1) / 2 =3.5
• Posisi Q1 = ¼(5+1) = 1.5
• Posisi Q1 = ¼(6+1) = 1.75
• Posisi Q3 = ¾(5+1) = 4.5
Data terurut: 1
2
• Posisi Q3 = ¾(6+1) = 5.25
3
4
Data terurut: 1
8
2
Median
3
4
8
8
Median
Q1= 1 + 0.5(2-1) = 1.5
Q1= 1 + 0.75(2-1) = 1.75
Q3=4+ 0.5(8-4)=6
Statistik 5 serangkai
Q3=8+ 0.25(8-8)=8
Mean (rataan)
Q2
• Merupakan pusat massa (centroid)
Q1
Q3
Q0
Q4
• Jika menggambarkan populasi di tuliskan
sebagai μ, huruf yunani “mu”
• Jika menggambarkan contoh dituliskan
sebagai x , disebut “xbar”
xbar
Berdasarkan metode Interpolasi
Data I
Data II
• Digunakan untuk tipe data numerik
3.5
3
1.5
6
1.75
6
1
8
1
8
• Tidak bisa digunakan untuk tipe data
kategorik dan diskret
• Sangat resisten terhadap pencilan
3
25/09/2013
Langkah Teknis memperoleh mean
•
Perhatikan data I dan data III
Rata-rata (Mean)
Data I terurut: 1
2
3
4
8
4
100
N
¾ Populasi:
μ=
∑x
i =1
i
N
1+ 2 + 3 + 4 + 8
= 3.6
5
x=
n
¾ Sampel:
x=
∑x
i =1
n
Data I
Median
i
Data III terurut: 1
2
3
(merupakan data contoh):
2
8
3
4
1
x=
2 + 8 + 3 + 4 +1
x=
= 3 .6
5
1 + 2 + 3 + 4 + 100
= 22
5
Median
Jangan dibulatkan!!!!
Kaitan antar bentuk sebaran dengan
ukuran pemusatan
Ukuran Penyebaran
•Menggambarkan suatu UKURAN KUANTITATIF tingkat
penyebaran atau pengelompokan dari data
•Keragaman biasanya didefinisikan dalam bentuk jarak :
•Seberapa jauh jarak antar titik-titik tersebut satu sama lain
•Seberapa jauh jarak antara titik-titik tersebut terhadap
rataannya
y
•Bagaimana tingkat keterwakilan nilai tersebut terhadap
kondisi data keseluruhan
Mean = Median = Mode
Jangkauan antar Kuartil
(Interquartile Range)
Wilayah (Range)
• Merupaka selisih dari nilai terbesar – nilai
terkecil
R=Xmax – Xmin
• Hanya memperhitungkan nilai terkecil dan
terbesar, sedangkan sebaran nilai antara dua
nilai tersebut tidak diperhitungkan
•
Merupakan selisih antara kuartil 3 dengan kuartil 1
IQR = Q3 - Q1
•
Memperhitungkan sebaran antara nilai minimum dan nilai
maksimum
•
Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)
• Resisten
R i t tterhadap
h d nilai
il i yang ekstrim
k ti
Data I terurut: 1 2
R = 8-1 = 7
Data III terurut: 1
3
4
Statistik 5 serangkai dari data I
Statistik 5 serangkai dari data III
(metode belah dua)
(metode belah dua)
8
3
3
2
R = 100-1 = 99
3
4
100
2
4
2
4
1
8
1
100
IQR = 4-2 = 2
IQR = 4-2 = 2
4
25/09/2013
Deviasi
Ragam
Data 1
•
•
Ukuran penyebaran yang lebih kompleks adalah
bagaimana data tersebut mengelompok di sekitar
rataannya
Data
Deviasi merupakan selisih dari data terhadap
rataannya.
•
Ukuran keragaman dari deviasi adalah rataan deviasi =
∑ (x - μ) / n
Data 1
•
∑ (x - μ) / n ≈ 0
Rataan
Data
Rataan
(X-μ)
1
-2.6
6.76
2
-1.6
2.56
3
-0.6
0.36
4
0.4
0.16
8
4.4
19.36
3.6
-2.6
2
-1.6
3
-0.6
4
0.4
8
4.4
3.6
0.000000000000000178
Untuk menghilangan +/maka deviasi
dikuadratkan terlebih
dahulu sebelum dirataratakan.
•
Ukuran semacam ini
disebut ragam = ∑ (x μ)2 / n
•
∑ (x - μ)2 merupakan
jumlah kuadrat dari
deviasi disekitar
rataannya
5.84
Deviasi
1
•
(X-μ)2
Perhatikan permainan berikut
• Ragam (Variance)
N
Banu mengajak Anda main tebak-tebakan. Banu
mempunyai tiga kaleng. Salah satu dari kaleng
tersebut berisi bola. Yang manakah yang berisi
bola?
∑(x −μ)
¾ Populasi
σ2 = i=1
¾ Contoh
s2 = i=1
2
i
N
n
Jika bola tersebut
di
dianggap
sebagai
b
i
rataan sampel
maka ada
sebanyak 3-1 = 2
kaleng yang
ditebak bebas Æ
db = n-1
∑(x −x)
2
i
n−1
Derajat bebas = db
Untuk menghitung ragam contoh maka perlu dihitung
rataan contoh, maka data terakhir tergantung dari datadata sebelumnya. Hanya 1 yang tidak bebas, sedangkan
n-1 data lainnya bebas variasinya
N
Data 1
σ =
2
∑(x −μ)
n
2
i
i=1
N
29.2
=
=5.84
5
s=
2
∑(x −x)
2
i
i=1
n−1
29.2
=
=7.3
4
Jika kaleng I dan II Anda angkat namun tidak
terdapat bola maka sudah pasti kaleng ke-3
yang berisi bola
Latihan :
• Simpangan baku (standard deviation)
¾ Ragam merupakan ukuran jarak kuadrat,
sehingga untuk mendapatkan jarak yang
sebenarnya adalah dengan mengakarkan ragam
Æ simpangan baku
¾ σ simpangan baku populasi dan s simpangan
baku sampel
a. 3 9 7 4 10 3
b. 4 9 3 8 6
Tentukan nilai :
Mean, Median, Q1, Q3, Ragam, Simpangan
Baku, Range, dan IQR
untuk kedua gugus data di atas
5
25/09/2013
Ilustrasi Data
Demo MINITAB
No
Sex
Tinggi
Berat
Agama
1
1
167
63
Islam
2
1
172
74
Islam
3
0
161
53
Kristen
4
0
157
47
Hindu
5
1
165
58
Islam
6
0
167
60
Islam
7
1
162
52
Budha
151
45
Katholik
9
0
158
54
Kristen
10
8
1
0
162
63
Islam
11
1
176
82
Islam
12
1
167
69
Islam
13
0
163
57
Kristen
14
0
158
60
Islam
15
1
164
58
Katholik
16
0
161
50
Islam
17
1
159
61
Kristen
18
1
163
65
Islam
19
1
165
62
Islam
20
0
169
59
Islam
21
1
173
70
Islam
Data pada ilustrasi data diolah menggunakan MINITAB
Diagram Kotak Garis (boxplot)
Descriptive Statistics: Tinggi, Berat
Variable
Tinggi
Berat
N
21
21
Mean
163.81
60.10
Variable
Ti
Tinggi
i
Berat
Range
25
25.00
00
37.00
StDev
5.85
8.86
Variance
34.26
78.49
Minimum
151.00
45.00
Q1
160.00
53.50
Median
163.00
60.00
Q3
167.00
64.00
Maximum
176.00
82.00
IQR
7
7.00
00
10.50
Informasi yang diperoleh dari
diagram kotak garis
Penyajian Dengan Box-plot(1)
Boxplot of data 1
¾ Melihat ukuran penyebaran dan ukuran
pemusatan data
¾ Melihat adanya data pencilan
¾ Sebagai alat pembandingan sebaran dua
kelompok data atau lebih
Q1
Q2
Q3
Min
Max
Interquartli Range
40
45
50
data 1
55
60
6
25/09/2013
Cara membuat box plot
Ilustrasi (1)
Me
•
Hitung Statistik lima serangkai
Q1
Q3
Q0
Q4
•
Hitung Pagar Dalam Atas (PAD1) : Q3 +1.5(Q3-Q1)
•
Hitung Pagar Dalam Atas (PAD2) : Q3 +3(Q3-Q1)
•
Hitung Pagar Dalam Bawah (PBD1): Q1-1.5(Q3-Q1)
•
Hitung Pagar Dalam Bawah (PBD)2: Q1-3(Q3-Q1)
•
Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan
outlier
•
Gambar kotak dengan batas Q1 dan Q3
•
Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan
• Statistik 5 serangkai dari data sbb:
Me
48
Q1
Q3
43
55
Min
Max 40
59
• PDA = 55 + 1.5 (55 – 43) = 73
• PDB = 43 – 1.5 (55 - 43) = 25
• Tidak ada pencilan
•
tarik garis dari Q3 sampai data terbesar
•
Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum
pencilan
•
Pencilan digambarkan dengan asterik
Ilustrasi (4)
B o x p lo t o f d a ta 1
Stem-and-leaf of data 1 N = 23
Leaf Unit = 1.0
40
45
50
data 1
55
60
Sebaran data tidak simetrik, karena nilai median
lebih dekat ke Q1 Æ miring ke kanan
9
(5)
9
7
1
1
1
1
1
4
4
5
5
6
6
7
7
8
Me
002233344
68899
02
556788
48
Q1
Q3
43
55
Min
Max
40
80
PDA = 55 + 1.5 (55 – 43) = 73
PDB = 43 – 1.5 (55 - 43) = 25
Pencilan : 80
0
Tidak ada pencilan
Contoh data:
B o x pl o t o f da ta 1
40
50
60
data 1
70
Sebaran data tidak simetrik, karena nilai median
lebih dekat ke Q1 Æ miring ke kanan
Terdpat nilai pencilan (80)
80
Jawa Barat
No. Kota/Kab
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Pandenglang
Lebak
Bogor
Sukabumi
Cianjur
Bandung
Garut
Tasikmalaya
Ciamis
Kuningan
Cirebon
Majalengka
Sumedang
Indramayu
Subang
Purwakarta
K
Karawang
Bekasi
Tangerang
Serang
Kota Bogor
Kota Sukabumi
Kota Bandung
Kota Cirebon
Rata-Rata:
Jabar
Jateng
Minimum :
Jabar
Jateng
Maksimum:
Jabar
Jateng
Jawa Tengah
Pert. Pend.
2.15
2.48
4.52
2.51
2.33
3.31
2.35
2.15
1.21
1.97
2.73
2.01
1.41
2.53
1.89
2.32
2 31
2.31
3.57
4.04
2.85
2.60
1.48
2.20
2.51
2.48
1.68
1.00
1.00
23.00
34.00
No. Kota/Kab
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Cilacap
Banyumas
Prubalingga
Banjarnegara
Kebumen
Purworejo
Wonosobo
Magelang
Boyolali
Klaten
Sukoharjo
Wonogiri
Karanganyar
Sragen
Grobogan
Blora
R b
Rembang
Pati
Kudus
Jepara
Demak
Semarang
Temanggung
Kendal
Batang
Pekalongan
Pemalang
Tegal
Brebes
Kota Magelang
Kota Surakarta
Kota Slatiga
Kota Semarang
Kota Pekalongan
Kota Tegal
Pert. Pend.
1.28
1.78
1.42
1.49
1.09
0.62
1.64
1.31
1.08
1.19
2.10
0.51
2.07
1.85
1.52
1.27
2 08
2.08
1.62
2.03
1.87
1.38
0.46
1.83
0.83
1.70
1.80
1.79
2.67
2.09
1.25
1.39
2.30
5.21
1.95
2.44
7
25/09/2013
B o x p lo t o f p e r tu m b u h a n p e n d d v s p r o p
K o ta S e m a r a n g
5
pertumbuhan pendd
Bo go r
4
T an g eran g
3
2
1
0
Ja w a B a r a t
Ja w a T e n g a h
prop
Nomor
Skor
Aritmatika
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi
dibandingkan dengan pertumbuhan penduduk di Jawa
Tengah. Secara umum, tingkat keragaman pertumbuhan
penduduk antar kabupaten, di Jawa Tengah sedikit lebih
besar dibanding dengan Jawa Barat. Kab Bogor dan
Tangerang merupakan daerah yang tingkat pertumbuhan
pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang
yang pertumbuhan penduduknya paling tinggi.
1
2
4
5
6
7
8
9
10
11
14
8
19
17
15
13
11
8
0
0
1
0
5
3
4
2
0
2
Skor Aljabar
Nomor
3
11
11
12
13
14
15
16
17
18
19
20
Skor
Aritmatika
9
19
19
18
19
14
14
16
20
16
Skor Aljabar
2
5
7
9
7
0
4
1
9
4
8
Download