Ilustrasi Jenis-jenis Statistika

advertisement
Ilustrasi
Data nilai ujian Statistik Dasar dari 15 mahasiswa
Program Studi tertentu semester ganjil tahun 2008:
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
Statdas, Februari 2009
1.
Populasi dan Sampel 2. Statistik dan Statistika
Berapa rata‐
rata nilai
ujian?
3. Jenis‐jenis Observasi 4. Statistika Deskriptif
•Sari Numerik
•Penyajian Data
Statistika
deskriptif
© 2008 by USP & UM ; last edited Feb’09
Apakah rata‐rata nilai tahun ini
lebih baik daripada
tahun lalu?
Seberapa
menyebarnya
kemampuan dari
mahasiswa?
Adakah
mahasiswa yang perlu perhatian
khusus?
Inferensi
statistik
© 2008 by UM
Statistik dan Statistika
Jenis‐jenis Statistika
1. Statistika deskriptif: metode yang berkaitan
Statistik : nilai-nilai ukuran data yang mudah
dimengerti.
Contoh : statistik liga sepak bola Indonesia
dengan pengumpulan dan penyajian data.
2. Statistika inferensi: metode yang berkaitan
dengan analisis sampel untuk penarikan
kesimpulan tentang karakteristik populasi.
(Pokok Bahasan/Bab 9-12)
Statistika : ilmu yang berkaitan dengan cara
pengumpulan, pengolahan, analisis dan pernarikan
kesimpulan atas data.
© 2008 by UM
2
3
© 2008 by UM
4
1
Populasi dan Sampel
Jenis‐jenis Observasi
Populasi
OBSERVASI / DATA
KUALITATIF
Sampel
setiap obyek populasi memiliki
kemungkinan/kesempatan yang
p
sama untuk terpilih
Nominal
Ordinal/Rank Diskrit
Kontinu
Sampel Acak
hasil pengukuran atau pengamatan
Data
© 2008 by UM
5
Tidak mengenal
urutan dan operasi
aritmatika
Mengenal urutan dan
operasi aritmatika
B h b
Berhubungan
d
dengan
‘proses menghitung’, dan
pengamatan atas
himpunan terhitung.
Didasarkan pada suatu
selang/interval
sehingga meliputi semua
bilangan riil
Warna batuan (abuabu, hitam, putih,
coklat, dll), jenis
kelamin , dll
Ukuran baju (S, M, L,
XL), ukuran kepuasan
(tidak suka sama sekali,
tidak suka, biasa saja,
suka, sangat suka)
Banyaknya pekerja yang
dibutuhkan dalam suatu
area pertambangan,
jarak yang dilangkahi
seseorang (bisa mundur,
bisa maju) per 0,5 meter
Berat batuan, luas
area pertambangan,
jarak tempuh truk
pengangkut, suhu,
dll
6
© 2008 by UM
Karakteristik Distribusi
Statistika Deskriptif
1. PARAMETER DISTRIBUSI
Metode yang berkaitan dengan pengolahan dan
penyajian suatu gugus data sehingga memberikan
informasi yang berguna.
Ukuran
Pemusatan
Ukuran
Uk
Penyebaran
2. BENTUK DISTRIBUSI
bentuk distribusi data
© 2008 by UM
KUANTITATIF
7
Berpuncak
Jamak
Berpuncak
Tunggal
# modus > 1
# modus = 1
mean, median, modus,
kuartil atas, kuartil
bawah, dll
Range, simpangan baku, variansi, jangkauan
antar kuartil, dll
Kemencengan
skewness
Kelancipan
kurtosis
Simetris
Menceng/skew Positif
Menceng/skew Negatif
mean = median
mean > median
mean < median
© 2008 by UM
8
2
CONTOH KASUS
Ukuran Pemusatan Data Berikut adalah data nilai ujian Statistik Dasar dari
15 mahasiswa Program
g
Studi tertentu. ((n = 15))
1. Mean (rata-rata)
1
x=
n
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
x1 x2
x9
x12
x15
Data yang diurutkan:
x(9)
x(12)
i
i =1
Contoh :
x1 + x2 + ... + x15
15
87 + 37 + ... + 46
=
= 67, 60
15
x(15)
maksimum
minimum
Adakah perbedaan dari penyajian kedua data di atas?
9
© 2008 by UM
26 37
39 46 49awal)
59 ) 69 76 8350% data (akhir
83 83 87 akhir)
87 95
50 % data (awal
50 % data (
50% data (
) 95
x(8)
3x
2x
© 2008 by UM
10
4. Kuartil
26 37
39 46 49 25 %
59 69 76 8325 %
83 83 87 87
95 95
25 %
25 %
2x
2. Median
Nilai tengah yang membagi dua kelompok data
sama banyak.
q1
q3
q2 = med
™Kuartil bawah (q1) : q1 = x ⎛ n +1 ⎞
q1 = x⎛ 15+1 ⎞ = x(4) = 46
⎜
⎟
⎝ 4 ⎠
med = x(8) = 76
⎜
⎟
⎝ 4 ⎠
™Kuartil tengah
g (q2) : q2 = x⎛ 2(( n +1)) ⎞ = x⎛ n +1 ⎞
⎜
⎝
3. Modus
Nilai yang paling sering muncul.
mod = 83
© 2008 by UM
∑x
x=
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
x(1) x(2)
n
4
⎟
⎠
⎜
⎟
⎝ 2 ⎠
q2 = x⎛ 15+1 ⎞ = x(8) = 76
⎜
⎟
⎝ 2 ⎠
™Kuartil atas (q3) : q3 = x⎛ 3( n +1) ⎞
11
© 2008 by UM
⎜
⎝
4
⎟
⎠
q3 = x⎛ 3(15+1) ⎞ = x(12) = 87
⎜
⎝
4
⎟
⎠
12
3
5. Persentil
Ukuran Penyebaran Data
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
p25
p75
p50 = med
• Persentil ke-i :
1. Jangkauan data (Range)
R = 95 – 26 = 69
R = datamax – datamin
2. Variansi
= x⎛ i ( n +1) ⎞
⎛
1 n
1 ⎜
2
s2 =
x
x
−
=
(
)
∑ i
n − 1 i =1
n − 1 ⎜⎜
⎝
⎜
⎟
⎝ 100 ⎠
• Persentil ke-50 : = x 50( n +1) = x n +1
⎛
⎞
⎛
⎞
⎜
⎝
100
⎟
⎠
⎜
⎟
⎝ 2 ⎠
• Persentil ke-25 dan Persentil ke-75?
kuartil bawah
kuartil atas
13
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
g lain.
yang
data y
Bagaimana mendeteksi data pencilan ??
1. Hitung dq
dq = 41
2. Hitung BBP = q1 – k.dq
BBP = 46 – (1,5)(41) = -15,5
Pilih nilai k = 3/2 (tidak mutlak)
3. Hitung BAP = q3 + k.dq
BAP = 87 + (1,5)(41) = 148,5
4. Pencilan bawah < BBP
tidak ada pencilan bawah
5. Pencilan atas > BAP
© 2008 by UM
2
⎞
⎟
⎟
⎟
⎠
s2 = 529,2571
JKXX
median
© 2008 by UM
⎛ n ⎞
⎜ ∑ xi ⎟
n
⎝ i =1 ⎠
2
x
−
∑
i
n
i =1
tidak ada pencilan atas
15
3. Simpangan Baku (standard deviation)
s = 529, 2571 = 23, 01
s = √s2
4. Jangkauan antar kuartil
dq = q3 – q1
dq = q3 – q1 = 87 – 46 = 41
© 2008 by UM
SARI NUMERIK
Count (banyak data, n)
Sum (jumlah data)
Average (rata-rata)
Median (kuartil tengah)
Mode (modus)
Minimum
Maximum
Range
Standard Deviation
Variance
Skewness
Kurtosis
25th Percentile (persentil-25)
50th Percentile (persentil-50)
75th Percentile (persentil-75)
Interquartile Range (dk)
* Perhitungan dengan Mic. Excel
© 2008 by UM
15
1014
67.6
76
83
26
95
69
23.01
529.2571
-0.50*
-1.23*
46
76
87
41
14
mean < median
Menceng kiri
16
4
Penyajian Data
Pie Chart
1.
1 Pie Chart
9
9%
10%
2. Dot Plot
3. Histogram
23%
58%
4. Diagram Batang – Daun (stem ‐ leaf)
5. Diagram Kotak – Titik (box plot)
6.
y Pie
Pi chart
h t merupakan
k grafik
fik yang b
berbentuk
b t k li
lingkaran
k
yang
dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
© 2008 by UM
mana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%).
y Pemakaian pie chart hanya cocok ketika menyatakan data
dalam bentuk proporsi dari satu kelompok data.
17
© 2008 by UM
18
Histogram
Dot Plot
3.5
3
frekuensi
2.5
2
1.5
1
0.5
0
0
20
40
60
80
100
nilai
y Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutan
y Titik ditumpuk diatas nilai data yang digambarkan.
© 2008 by UM
y Histogram adalah gambar berdasarkan distribusi
frekuensi
y Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
y Daerah setiap rectangle sebanding dengan frekuensinya.
19
© 2008 by UM
20
5
Diagram Batang-Daun
(Stem-Leaf)
Diagram Kotak‐Titik
(Box‐Plot)
100
max
95
90
85
80
q2
76
70
q3
mean
60
50
47.5
40
30
q1
min
26
20
10
y Stem atau batang,
g mirip dengan
g g
grup data pada histogram,
g
0
sedangkan leaf atau daun, mirip dengan frekuensi.
y Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
belakangnya akan merupakan leaf atau daun.
y Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
© 2008 by UM
21
menggunakan grup data seperti pada histogram dan
diagram batang daun.
y Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.
22
© 2008 by UM
Kelemahan dan Keunggulan
Pencilan pada Box Plot
*
y Box
B Plot
Pl t di
digunakan
k untuk
t k menyelidiki
lidiki di
distribusi
t ib i ttanpa
KELEMAHAN
DOT PLOT
pencilan atas
Tidak efektif untuk ukuran data yang besar
Lama
max kedua
q3
q2
HISTOGRAM
Nilai data tidak nampak
mean
BATANG‐DAUN
min ketiga
© 2008 by UM
Nilai data asli dapat diperkirakan
Nil i d li d
di ki k
Histogram peluang dapat memberi gambaran tentang distribusi populasi
Tidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
q1
*
*
Banyak perhitungan
KEUNGGULAN
Cepat pencilan bawah
BOX PLOT
23
© 2008 by UM
Tidak memerlukan perhitungan Menuntut ketelitian mencatat Nilai data asli dapat dilihat
p
daun
Memudahkan perhitungan berbagai parameter
Membutuhkan perhitungan yang panjang
Box plot dapat memberi gambaran tentang bentuk distribusi populasi
Terdiri dari parameter‐
parameter dari data yang sudah diurutkan
Efektif untuk membandingkan bentuk distribusi beberapa kelompok data sekaligus
24
6
Bentuk Distribusi Ideal
Normal
Transformasi Data
y Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih simetris.
y Transformasi Tangga Tukey
-1/x2 -1/x
mean = median
untuk bentuk distribusi : skewness positif
Memiliki bentuk distribusi yang simetris, yaitu :
‰Skewness = 0
‰Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
© 2008 by UM
25
Transformasi Data
Contoh Kasus
x
y = x2
87
37
59
49
69
95
83
87
39
95
83
76
83
26
46
7569
9
1369
3481
2401
4761
9025
6889
7569
1521
9025
6889
5776
6889
676
2116
© 2008 by UM
transformasi
Lebih mendekati simetris (skew = 0)
dibanding sebelum transformasi
(skew = -0,5)
√x
log (x)
x
x2
data awal
x3
10x
untuk bentuk distribusi : skewness negatif
Data contoh kasus : skewness = -0,5 (menceng kiri),
maka transformasi yang mungkin adalah x2, x3, dan 10x.
© 2008 by UM
26
Referensi
y Djauhari,
j
M.A., 2001, Catatan Kuliah Analisis Data.
y Devore, J.L. and Peck, R., Statistics – The Exploration and
Analysis of Data, USA: Duxbury Press, 1997.
y Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang dan
skew = -0,18
** Ketika data ditransformasi, maka satuan
dari data juga akan berubah
27
Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung:
Penerbit ITB, 1995.
y Walpole, Ronald E. et.al, Probability and Statistics for Engineers
and Scientist, 8th Ed., New Jersey: Pearson-Prentice Hall 2007.
y Wild, C.J. and Seber, G.A.F., Chance Encounters – A first Course
in Data Analysis and Inference, USA: John Wiley&Sons,Inc.,
2000.
y Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.
© 2008 by UM
28
7
Download