Pertemuan III Statistika Dasar (Basic Statistics)

advertisement
Pertemuan III
Statistika Dasar (Basic Statistics)
Jika
punya data mengenai daya
hidup dari baterai HP merk “XXX”
 Dimana “lokasi” atau “pusat” dari data?  ukuran pemusatan
 Seberapa besar variasi dari data  ukuran penyebaran

Modus (Mode): Nilai pengamatan yang paling

Median: Pengamatan yang ditengah-tengah dari

Quartil: Nilai-nilai yang membagi data terurut

Mean: merupakan pusat massa (centroid) sehingga
sering muncul
data terurut
menjadi 4 bagian yang sama
simpangan kiri dan simpangan kanan sama besar
 Merupakan nilai pengamatan yang paling sering muncul
 Dalam satu gugus data dapat mengandung lebih dari satu
modus
 Dapat digunakan untuk semua jenis data, tapi paling banyak
digunakan untuk data kategorik atau data diskret dengan
hanya sedikit nilai yang mungkin muncul
Modus
 Pengamatan yang ditengah-tengah dari data terurut
 Nama lain dari percentil ke-50
 Nama lain dari kuartil 2 (Q2)
 Digunakan untuk menggambarkan lokasi dari data numerik
 Kekar terhadap adanya pencilan
Urutkan data dari terkecil sampai
terbesar
Jika jumlah data ganjil, nilai median
merupakan nilai di tengah
Data I: 2
8
Data terurut: 1
3
2
4
3
1
Median
4
8
Urutkan data dari terkecil sampai
terbesar
Jika jumlah data genap, nilai median
merupakan rataan dari dua nilai di tengah
Data II: 2 8 3 4 1 8
Data terurut: 1
2
3
4
8
8
Median=(3+4)/2 = 3.5
Data I terurut: 1
2
3
4
8
4
100
Median
Data III terurut: 1
2
3
Median
 Urutkan data dari kecil ke besar
 Cari posisi median (nmed=(n+1)/2)
 Nilai median
 Jika nmed bulat, maka Median=X(n+1)/2
 Jika nmed pecahan, maka Median=(X(n)/2+
X(n)/2+1)/2 (rata-rata dua pengamatan yang
berada sebelum dan setelah posisi median)
 Nilai-nilai yang membagi data terurut menjadi 4 bagian yang
sama
 Q0 (dibaca kuartil 0) merupakan nilai minimum dari data
 Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25%
data di kiri dan 75% data di kanan
 Q2 (dibaca kuartil 2) merupakan median, membagi data
menjadi 50%
 Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75%
data di kiri dan 25% data di sebelah kanan
 Q4 (dibaca kuartil 4) merupakan nilai maksimum dari data
 Nilai Q1, Q2, dan Q3 kekar terhadap pencilan
Metode Belah dua
 Urutkan data dari kecil ke besar
 Cari posisi kuartil
 nQ2=(n+1)/2
 nQ1=(nQ2*+1)/2= nQ3, nQ2* posisi kuartil dua terpangkas (pecahan
dibuang)
 Nilai kuartil 2 ditentukan sama seperti
mencari nilai median. Kuartil 1 dan 3
prinsipnya sama seperti median tapi kuartil 1
dihitung dari kiri, sedangkan kuartil 3
dihitung dari kanan.
 Posisi Q2 = nQ2 = (5+1) / 2 =3
 Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
3
4
Median
Q1
Q3
8
 Posisi Q2 = nQ2 = (6+1) / 2 =3.5
 Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
Q1
3
4
8
Median
Q3
8
Metode Interpolasi
 Urutkan data dari kecil ke besar
 Cari posisi kuartil
 nq1=(1/4)(n+1)
 nq2=(2/4)(n+1)
 nq3=(3/4)(n+1)
 Nilai kuartil dihitung sebagai berikut:
 Xqi=Xa,i + hi (Xb,i-Xa,i)
 Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan
setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi
kuartil
 Posisi Q2 = nQ2 = (5+1) / 2 =3
 Posisi Q1 = ¼(5+1) = 1.5
Data terurut: 1
 Posisi Q3 = ¾(5+1) = 4.5
2
3
4
8
Median
Q1= 1 + 0.5(2-1) = 1.5
Q3=4+ 0.5(8-4)=6
 Posisi Q2 = nQ2 = (6+1) / 2 =3.5
 Posisi Q1 = ¼(6+1) = 1.75
 Posisi Q3 = ¾(6+1) = 5.25
Data terurut: 1
2
3
4
8
8
Median
Q1= 1 + 0.75(2-1) = 1.75
Q3=8+ 0.25(8-8)=8
Q1
Q2
Q3
Q0
Q4
Berdasarkan metode Interpolasi
Data I
1.5
1
3
Data II
6
8
1.75
1
3.5
6
8
 Merupakan pusat massa (centroid)
 Jika menggambarkan populasi di tuliskan sebagai ,
huruf yunani “mu”
 Jika menggambarkan contoh dituliskan sebagai
disebut “xbar”
 Digunakan untuk
tipe data numerik
x
,
 Tidak bisa digunakan untuk tipe data kategorik dan
diskret
 Sangat resisten terhadap pencilan
 Rata-rata (Mean)
 Populasi:
 Sampel:

x
N
i 1
x
n
x
N
i
i 1
n
i
Data I
(merupakan data contoh):
2
x
8
3
4
1
2  8  3  4 1
 3.6
5
Jangan dibulatkan!!!!
Data I terurut: 1
x
1 2  3  4  8
 3.6
5
Data III terurut: 1
x
1  2  3  4  100
 22
5
2
3
4
8
4
100
Median
2
3
Median
Mean = Median = Mode
•Menggambarkan suatu UKURAN KUANTITATIF tingkat
penyebaran atau pengelompokan dari data
•Keragaman biasanya didefinisikan dalam bentuk jarak :
•Seberapa jauh jarak antar titik-titik tersebut satu sama lain
•Seberapa jauh jarak antara titik-titik tersebut terhadap
rataannya
•Bagaimana tingkat keterwakilan nilai tersebut terhadap
kondisi data keseluruhan
 Merupaka selisih dari nilai terbesar – nilai terkecil
R=Xmax – Xmin
 Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan
sebaran nilai antara dua nilai tersebut tidak diperhitungkan
 Resisten terhadap nilai yang ekstrim
Data I terurut: 1 2
R = 8-1 = 7
Data III terurut: 1
3
2
R = 100-1 = 99
4
3
8
4
100
 Merupakan selisih antara kuartil 3 dengan kuartil 1
IQR = Q3 - Q1
 Memperhitungkan sebaran antara nilai minimum dan nilai
maksimum
 Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)
Statistik 5 serangkai dari data I
(metode belah dua)
2
3
1
4
8
IQR = 4-2 = 2
Statistik 5 serangkai dari data III
(metode belah dua)
2
1
3
4
100
IQR = 4-2 = 2
 Ukuran penyebaran yang lebih kompleks adalah
bagaimana data tersebut mengelompok di sekitar
rataannya
 Deviasi merupakan selisih dari data terhadap
rataannya.
 Ukuran keragaman dari deviasi adalah rataan deviasi
=  (x - ) / n
  (x - ) / n  0
Data 1
Data
Rataan
Deviasi
1
-2.6
2
-1.6
3
-0.6
4
0.4
8
4.4
3.6
0.000000000000000178
Data 1
Data
1
2
3
4
Rataan
8
3.6
(X-)
-2.6
-1.6
-0.6
0.4
4.4
(X-)2
6.76
2.56
0.36
0.16
19.36
5.84
 Untuk menghilangan +/-
maka deviasi
dikuadratkan terlebih
dahulu sebelum dirataratakan.
 Ukuran semacam ini
disebut ragam =  (x )2 / n
  (x - )2 merupakan
jumlah kuadrat dari
deviasi disekitar
rataannya
 Ragam (Variance)
 Populasi
 
2
 Contoh
 x   
N
2
i
i 1
N
 x  x 
n
s2 
i 1
i
2
n 1
Derajat bebas = db
Untuk menghitung ragam contoh maka perlu dihitung
rataan contoh, maka data terakhir tergantung dari datadata sebelumnya. Hanya 1 yang tidak bebas, sedangkan
n-1 data lainnya bebas variasinya
Data 1
x 
N
2  i1
i
N
2

29.2
5.84
5
x x
n
s2  i1
i
n1
2

29.2
7.3
4
Banu mengajak Anda main tebak-tebakan. Banu mempunyai tiga
kaleng. Salah satu dari kaleng tersebut berisi bola. Yang
manakah yang berisi bola?
Jika bola tersebut
dianggap sebagai
rataan sampel
maka ada
sebanyak 3-1 = 2
kaleng yang
ditebak bebas 
db = n-1
Jika kaleng I dan II Anda angkat namun tidak
terdapat bola maka sudah pasti kaleng ke-3
yang berisi bola
 Simpangan baku (standard deviation)
 Ragam merupakan ukuran jarak kuadrat, sehingga untuk
mendapatkan jarak yang sebenarnya adalah dengan mengakarkan
ragam  simpangan baku
  simpangan baku populasi dan s simpangan baku sampel
a. 3 9 7 4 10 3
b. 4 9 3 8 6
Tentukan nilai :
Mean, Median, Q1, Q3, Ragam, Simpangan
Baku, Range, dan IQR
untuk kedua gugus data di atas
Ilustrasi Data
No
Sex
Tinggi
Berat
Agama
2
1
172
74
Islam
1
3
4
5
6
7
8
9
10
1
0
0
1
0
1
0
0
1
167
161
157
165
167
162
151
158
162
63
Islam
53
Kristen
58
Islam
47
60
52
Hindu
Islam
Budha
45
Katholik
63
Islam
54
Kristen
11
1
176
82
Islam
13
0
163
57
Kristen
58
Katholik
61
Kristen
62
Islam
12
14
15
16
17
18
19
20
21
1
0
1
0
1
1
1
0
1
167
158
164
161
159
163
165
169
173
69
60
50
65
59
70
Islam
Islam
Islam
Islam
Islam
Islam
Data pada ilustrasi data diolah menggunakan MINITAB
Descriptive Statistics: Tinggi, Berat
Variable
Tinggi
Berat
N
21
21
Mean
163.81
60.10
Variable
Tinggi
Berat
Range
25.00
37.00
IQR
7.00
10.50
StDev
5.85
8.86
Variance
34.26
78.49
Minimum
151.00
45.00
Q1
160.00
53.50
Median
163.00
60.00
Q3
167.00
64.00
Maximum
176.00
82.00
 Melihat ukuran penyebaran dan ukuran
pemusatan data
 Melihat adanya data pencilan
 Sebagai alat pembandingan sebaran dua
kelompok data atau lebih
Penyajian Dengan Box-plot(1)
Boxplot of data 1
Q1
Q2
Q3
Min
Max
Interquartli Range
40
45
50
data 1
55
60
CARA MEMBUAT BOX PLOT
 Hitung Statistik lima serangkai
 Hitung Pagar Dalam Atas (PAD1) : Q3 +1.5(Q3-Q1)
Me
Q1
Q0
Q3
Q4
 Hitung Pagar Dalam Atas (PAD2) : Q3 +3(Q3-Q1)
 Hitung Pagar Dalam Bawah (PBD1): Q1-1.5(Q3-Q1)
 Hitung Pagar Dalam Bawah (PBD)2: Q1-3(Q3-Q1)
 Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan outlier
 Gambar kotak dengan batas Q1 dan Q3
 Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan
 tarik garis dari Q3 sampai data terbesar
 Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan
 Pencilan digambarkan dengan asterik
ILUSTRASI (1)
 Statistik 5 serangkai dari data sbb:
Q1
Me
Min
Q3
43
48
Max 40
55
59
 PDA = 55 + 1.5 (55 – 43) = 73
 PDB = 43 – 1.5 (55 - 43) = 25
 Tidak ada pencilan
Boxplot of data 1
40
45
50
data 1
55
Sebaran data tidak simetrik, karena nilai median
lebih dekat ke Q1  miring ke kanan
Tidak ada pencilan
60
Stem-and-leaf of data 1 N = 23
Leaf Unit = 1.0
9
(5)
9
7
1
1
1
1
1
4
4
5
5
6
6
7
7
8
002233344
68899
02
556788
Q1
Me
Min
Q3
Max
40
55
80
PDA = 55 + 1.5 (55 – 43) = 73
PDB = 43 – 1.5 (55 - 43) = 25
Pencilan : 80
0
43
48
Boxplot of data 1
40
50
60
data 1
70
80
Sebaran data tidak simetrik, karena nilai median
lebih dekat ke Q1  miring ke kanan
Terdpat nilai pencilan (80)
Jawa Barat
No. Kota/Kab
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Pandenglang
Lebak
Bogor
Sukabumi
Cianjur
Bandung
Garut
Tasikmalaya
Ciamis
Kuningan
Cirebon
Majalengka
Sumedang
Indramayu
Subang
Purwakarta
Karawang
Bekasi
Tangerang
Serang
Kota Bogor
Kota Sukabumi
Kota Bandung
Kota Cirebon
Rata-Rata:
Jabar
Jateng
Minimum :
Jabar
Jateng
Maksimum:
Jabar
Jateng
Pert. Pend.
2.15
2.48
4.52
2.51
2.33
3.31
2.35
2.15
1.21
1.97
2.73
2.01
1.41
2.53
1.89
2.32
2.31
3.57
4.04
2.85
2.60
1.48
2.20
2.51
2.48
1.68
1.00
1.00
23.00
34.00
Jawa Tengah
No. Kota/Kab
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Cilacap
Banyumas
Prubalingga
Banjarnegara
Kebumen
Purworejo
Wonosobo
Magelang
Boyolali
Klaten
Sukoharjo
Wonogiri
Karanganyar
Sragen
Grobogan
Blora
Rembang
Pati
Kudus
Jepara
Demak
Semarang
Temanggung
Kendal
Batang
Pekalongan
Pemalang
Tegal
Brebes
Kota Magelang
Kota Surakarta
Kota Slatiga
Kota Semarang
Kota Pekalongan
Kota Tegal
Pert. Pend.
1.28
1.78
1.42
1.49
1.09
0.62
1.64
1.31
1.08
1.19
2.10
0.51
2.07
1.85
1.52
1.27
2.08
1.62
2.03
1.87
1.38
0.46
1.83
0.83
1.70
1.80
1.79
2.67
2.09
1.25
1.39
2.30
5.21
1.95
2.44
Boxplot of pertumbuhan pendd vs prop
pertumbuhan pendd
5
4
Kota Semarang
Bogor
Tangerang
3
2
1
0
Jawa Barat
prop
Jawa Tengah
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi
dibandingkan dengan pertumbuhan penduduk di Jawa
Tengah. Secara umum, tingkat keragaman pertumbuhan
penduduk antar kabupaten, di Jawa Tengah sedikit lebih
besar dibanding dengan Jawa Barat. Kab Bogor dan
Tangerang merupakan daerah yang tingkat pertumbuhan
pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang
yang pertumbuhan penduduknya paling tinggi.
Nomor
Skor
Aritmatika
1
2
4
5
6
7
8
9
10
11
11
14
8
19
17
15
13
11
8
0
0
1
0
5
3
4
2
0
2
Skor Aljabar
Nomor
3
11
12
13
14
15
16
17
18
19
20
Skor
Aritmatika
9
19
19
18
19
14
14
16
20
16
Skor Aljabar
2
5
7
9
7
0
4
1
9
4
Download