statistik dan statistika

advertisement
STATISTIK, PENGERTIAN
EKSPLORASI DATA
1
1.
2.
3.
4.
DAN
Populasi dan Sampel
Statistik dan Statistika
Jenis-jenis Observasi
Statistika Deskriptif
•Sari
Numerik
Data
•Penyajian
MA 2181 Analisis Data, Agustus 2010
Utriweni Mukhaiyar
© 2008 by USP & UM ; last edited Aug 10
ILUSTRASI
Data nilai ujian Analisis Data dari 15 mahasiswa
Program Studi Matematika semester ganjil tahun 2008:
87 37
3 59 49 69
9 95 833 87 39 95 833 76 833 26 46
4
Berapa
rata-rata
nilai ujian?
© 2008 by UM
Seberapa
menyebarnya
kemampuan
dari mahasiswa
mahasiswa?
Statistika
deskriptif
STATISTIK
DAN
Adakah
mahasiswa
yang perlu
perhatian
khusus?
khusus
Apakah rata-rata
rata
nilai tahun ini
lebih baik
daripada tahun
lalu?
Inferensi
statistik
2
STATISTIKA
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh : statistik liga sepak bola Indonesia
Statistika : ilmu yang berkaitan dengan cara
pengumpulan, pengolahan, analisis dan pernarikan
kesimpulan atas data.
3
© 2008 by UM
1
JENIS-JENIS STATISTIKA
1.
2.
Statistika deskriptif: metode yang berkaitan
dengan pengumpulan dan penyajian data.
Statistika inferensi: metode yang berkaitan
dengan analisis sampel untuk penarikan
kesimpulan tentang karakteristik populasi.
populasi
4
© 2008 by UM
POPULASI DAN SAMPEL
Populasi
Sampel
setiap obyek populasi memiliki
kemungkinan/kesempatan yang
sama untuk terpilih
Sampel Acak
hasil pengukuran atau pengamatan
Data
5
© 2008 by UM
CONTOH POPULASI DAN SAMPEL

Seluruh
mahasiswa TPB
ITB
?
@ UM
Akan dilakukan penelitian apakah tahun
pertama di ITB (TPB) memberikan pengaruh
terhadap perubahan berat badan mahasiswa.
Untuk itu dilakukan pengambilan data pada hari
j
TPB.
terakhir ujian
Populasi
Kendala: - sangat banyak, -menghabiskan
waktu, -menghabiskan biaya
Keterwakilan sampel
atas populasi ??
Sampel
Kaidah Pengambilan
Sampel (Teknik
Sampling)
6
Contoh: tiap-tiap kelas TPB diambil secara
acak 10 orang mahasiswa.
2
JENIS-JENIS OBSERVASI
OBSERVASI / DATA
KUALITATIF
Nominal
KUANTITATIF
Ordinal/Rank
Diskrit
Kontinu
Tidak mengenal
urutan dan operasi
aritmatika
Mengenal urutan
dan operasi
aritmatika
Berhubungan dengan
‘proses menghitung’,
dan pengamatan atas
himpunan
terhitung.
p
g
Didasarkan pada suatu
selang/interval
sehingga meliputi
g riil
semua bilangan
Warna batuan (abuabu, hitam, putih,
coklat, dll), jenis
kelamin , dll
Ukuran baju (S, M, L,
XL), ukuran kepuasan
(tidak suka sama sekali,
tidak suka, biasa saja,
suka, sangat suka)
Banyaknya pekerja yang
dibutuhkan dalam suatu
area pertambangan,
jarak yang dilangkahi
seseorang (bisa mundur,
bisa maju) per 0,5 meter
Berat batuan, luas
area pertambangan,
7
jarak tempuh truk
pengangkut, suhu,
dll
© 2008 by UM
STATISTIKA DESKRIPTIF
Metode yang berkaitan dengan pengolahan dan
penyajian suatu gugus data sehingga memberikan
informasi yang berguna.
bentuk distribusi data
8
© 2008 by UM
KARAKTERISTIK DISTRIBUSI
1. PARAMETER
DISTRIBUSI
2. BENTUK
DISTRIBUSI
Ukuran
Pemusatan
mean, median, modus,
kuartil atas, kuartil
bawah, dll
Ukuran
Penyebaran
y
Range, simpangan baku,
variansi, jangkauan antar
kuartil, dll
Kemencengan
skewness
Kelancipan
kurtosis
Simetris
Berpuncak
Jamak
Berpuncak
Tunggal
gg
# modus > 1
# modus = 1
Menceng/skew
Positif
Menceng/skew
Negatif
g
mean = median
mean > median
mean < median
9
© 2008 by UM
3
CONTOH KASUS
Berikut adalah data nilai ujian Statistik Dasar dari
15 mahasiswa Program Studi tertentu. (n = 15)
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
x1 x2
x9
x12
x15
Data yang diurutkan:
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
x(1) x(2)
x(9)
x(12)
x(15)
10
maksimum
minimum
Adakah perbedaan dari penyajian kedua data di atas?
© 2008 by UM
UKURAN PEMUSATAN DATA
1.
Mean (rata-rata)
x
1
n
n
x
i
i 1
Contoh :
x1  x2  ...  x15
15
87  37  ...  46

 67, 60
15
x
11
© 2008 by UM
26 50
37 %
39data
46 49
59 )69 76 8350%
83 data
83 87(akhir
87 95) 95
(awal)
(awal
(akhir)
x(8)
3x
2x
2x
2. Median
Nilai tengah yang membagi dua kelompok data sama
banyak.
y
med = x(8) = 76
3. Modus
Nilai yang paling sering muncul.
mod = 83
12
© 2008 by UM
4
4. KUARTIL
26 25
37 %
39 46 49 25
59%69 76 832583% 83 87 87
25 95
% 95
q1
 Kuartil
q3
q2 = med
bawah (q1) : q1  x  n 1 
q1  x 151   x(4)  46


 4 


 4 
Kuartil tengah (q2) : q2  x 2( n 1)   x n 1 


4




 2 
q2  x 151   x(8)  76


 2 
13
q3  x 3(151)   x(12)  87
Kuartil atas (q3) : q3  x 3( n 1) 


© 2008 by UM


4


4


5. PERSENTIL
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
p25
• Persentil ke-i :
p75
p50 = med
 x i ( n 1) 


 100 
• Persentil ke-50 :  x 50( n 1)   x n 1 


100




 2 
median
• Persentil ke-25 dan Persentil ke-75?
14
© 2008 by UM
kuartil bawah
kuartil atas
UKURAN PENYEBARAN DATA
1. Jangkauan data (Range)
R = 95 – 26 = 69
R = datamax – datamin
2. Variansi

1 n
1 
s2 
( xi  x )2 


n  1 i 1
n 1 

 n 
  xi 
 i 1 
2
x


i
n
i 1
n
2





s2  529,2571
529 2571
JKXX
3. Simpangan Baku (standard deviation)
s  529, 2571  23, 01
s = √s2
15
4. Jangkauan antar kuartil
dq = q3 – q1
dq = q3 – q1 = 87 – 46 = 41
© 2008 by UM
5
DATA PENCILAN
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
g dqq
1. Hitung
dqq = 41
2. Hitung BBP = q1 – k.dq
BBP = 46 – (1,5)(41) = -15,5
Pilih nilai k = 3/2 (tidak mutlak)
3. Hitung BAP = q3 + k.dq
BAP = 87 + (1,5)(41) = 148,5
4. Pencilan bawah < BBP
tidak ada pencilan bawah
5. Pencilan atas > BAP
tidak ada pencilan atas
16
© 2008 by UM
SARI NUMERIK
Count (banyak data, n)
15
Sum (jumlah data)
1014
Average (rata-rata)
67.6
Median (kuartil tengah)
76
Mode (modus)
83
Minimum
26
Maximum
95
Range
69
Standard Deviation
23.01
Variance
529.2571
Skewness
-0.50*
Kurtosis
-1.23*
25th Percentile (persentil-25)
46
50th Percentile (persentil-50)
76
75th Percentile (persentil-75)
87
Interquartile Range (dk)
41
mean < median
Menceng kiri
17
* Perhitungan dengan Mic. Excel
© 2008 by UM
PENYAJIAN DATA
1.
2.
3.
4.
5.
6.
Pie Chart
Dot Plot
Histogram
g
Diagram Batang – Daun (stem - leaf)
Diagram Kotak – Titik (box plot)
dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
18
© 2008 by UM
6
PIE CHART
9%
10%
23%
58%
 Pie chart merupakan grafik yang berbentuk lingkaran yang
mana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%).
 Pemakaian pie chart hanya cocok ketika menyatakan data
19
dalam bentuk proporsi dari satu kelompok data.
© 2008 by UM
DOT PLOT
3.5
3
f
frekuensi
2.5
2
1.5
1
0.5
0
0
20
40
60
80
100
nilai
Cara menggambarkan data dalam bentuk
titik, dengan memperhatikan frekuensi dari data
yang bersangkutan
 Titik ditumpuk diatas nilai data yang digambarkan. 20

© 2008 by UM
HISTOGRAM
Histogram adalah gambar berdasarkan distribusi
frekuensi
 Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
21
 Daerah setiap rectangle sebanding dengan frekuensinya.

© 2008 by UM
7
DIAGRAM BATANG-DAUN
(STEM-LEAF)



Stem atau batang, mirip dengan grup data pada
histogram, sedangkan leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
belakangnya akan merupakan leaf atau daun.
22
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
© 2008 by UM
DIAGRAM KOTAK-TITIK
(BOX-PLOT)
max
100
95
90
85
80
76
70
q2
q3
mean
60
50
q1
47.5
40
30
min
26
20
10
0
Box Plot digunakan untuk menyelidiki distribusi tanpa
menggunakan grup data seperti pada histogram dan
diagram batang daun.
 Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
23
datamax yang disusun secara terurut dengan membentuk
kotak.
© 2008 by UM

PENCILAN PADA BOX PLOT
*
pencilan atas
max kedua
q3
q2
mean
q1
min ketiga
*
*
pencilan bawah
24
© 2008 by UM
8
KELEMAHAN DAN KEUNGGULAN
KELEMAHAN
DOT PLOT
HISTOGRAM
KEUNGGULAN
Tidak efektif untuk ukuran
data yang besar
Cepat
Lama
Histogram peluang dapat memberi
gambaran tentang distribusi populasi
Nilai data asli dapat diperkirakan
Banyak perhitungan
Tidak menuntut ketelitian dalam
mencatat
t t setiap
ti nilai
il i data
d t
Nilai data tidak nampak
Cepat
BATANGDAUN
Tidak memerlukan perhitungan
Menuntut ketelitian
mencatat daun
Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai
parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran
yang panjang
tentang bentuk distribusi populasi
BOX PLOT
© 2008 by UM
Terdiri dari parameterparameter dari data yang
sudah diurutkan
Efektif untuk membandingkan
25
bentuk distribusi beberapa kelompok
data sekaligus
BENTUK DISTRIBUSI IDEAL
NORMAL
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal =260
© 2008 by UM
TRANSFORMASI DATA
Transformasi dilakukan untuk mendapatkan bentuk
distribusi yang lebih simetris.
 Transformasi Tangga Tukey

-1/x2 -1/x
untuk bentuk distribusi :
skewness positif
√x
log (x)
x
x2
data awal
Merenggangkan data‐data yang berharga kecil
dan merapatkan data‐data yang berharga besar
x3
10x
untuk bentuk distribusi :
skewness negatif
Merapatkan data‐data yang berharga kecil dan
merenggangkan data‐data yang berharga besar
Data contoh kasus : skewness = -0,5 (menceng kiri),
maka transformasi yang mungkin adalah x2, x3, dan 10x.
27
© 2008 by UM
9
TRANSFORMASI DATA
CONTOH KASUS
x
y = x2
87
37
59
49
69
95
83
87
39
95
83
76
83
26
46
7569
1369
3481
2401
4761
9025
6889
7569
1521
9025
6889
5776
6889
676
2116
© 2008 by UM
transformasi
Lebih mendekati simetris (skew = 0)
dibanding sebelum transformasi
(skew = -0,5)
skew = -0,18
** Ketika data ditransformasi, maka satuan
28
dari data juga akan berubah
REFERENSI
 Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
 Devore, J.L. and Peck, R., Statistics – The Exploration and
Analysis of Data, USA: Duxbury Press, 1997.
 Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang dan
Statistika
S
i ik untukk Insinyur
I i
dan
d Ilmuwan,
Il
Edi i 4,
Edisi
4 Bandung:
B d
Penerbit ITB, 1995.
 Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering,
8th Ed., 2007.
 Wild, C.J. and Seber, G.A.F., Chance Encounters – A first Course
in Data Analysis and Inference, USA: John Wiley&Sons,Inc.,
2000.
29
 Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.
© 2008 by UM
10
Download