Statistika dan Aplikasi Komputer

advertisement
Statistika dan Aplikasi Komputer
Sesi 2: Ukuran Sentral dan
Persebaran
Program Pasca Sarjana Universitas Indonesia
Magister Kajian Kependudukan &
Ketenagakerjaan
Semester Gasal 2012/2013
Garis Besar
• Meninjau tugas pertemuan ke-1
• Ukuran sentral/pemusatan: Rerata/rata-rata,
median, modus
• Ukuran persebaran: range (jangkauan),
deviasi/simpangan rata-rata, varians, standar
deviasi (simpangan baku);
• Ukuran kecondongan (skewness); dan
• Distribusi frekuensi dan latihan
12/09/2012
E. L. Pardede
2
Tugas 1: Populasi & Sampel
di mana:
 =
proporsi populasi
P =
proporsi sampel
n =
besarnya sampel
Untuk tingkat keyakinan 95%
E. L. Pardede
3
Hasil Pilkada Gubernur DKI Jakarta
Sumber:
(3) Diolah dari http://www.republika.co.id/berita/menuju-jakarta1/news/12/07/19/m7ev7i-ini-hasil-resmi-jumlah-suara-pilkada-dki-putaran-satu
12/09/2012
4
Ukuran Pemusatan/Sentral
Ukuran pemusatan: nilai tunggal yang
mewakili suatu kumpulan data yang
menunjukkan (lokasi) pusat dari nilai data
1. Rata-rata hitung (arithmetic mean): rata-rata
hitung populasi dan sampel, rata-rata hitung
tertimbang (weighted mean)
2. Median (nilai tengah)
3. Modus: nilai yang paling sering muncul
12/09/2012
E. L. Pardede
5
Rata-rata Hitung Populasi
Untuk data tidak berkelompok, rata-rata hitung
populasi adalah jumlah seluruh nilai dalam populasi
dibagi dengan jumlah observasi dalam populasi:
di mana
  (myu) rata-rata hitung populasi
N = jumlah observasi dalam populasi
X = nilai tertentu dalam populasi
 = penjumlahan dari....
E. L. Pardede
6
Rata-rata Hitung Sampel
Untuk data tidak berkelompok, rata-rata
hitung sampel adalah jumlah seluruh nilai
dalam sampel dibagi dengan jumlah observasi
dalam sampel:
di mana
 X bar, rata-rata sampel
n = jumlah observasi dalam sampel
E. L. Pardede
7
Rata-rata Hitung Tertimbang
Rata-rata hitung tertimbang dari sekelompok
angka X1, X2, ..., Xn, dengan bobot w1, w2, ...,wn,
dapat dihitung dengan rumus berikut:
E. L. Pardede
8
Latihan 1
E. L. Pardede
9
Ciri-ciri/Sifat dari Rata-rata Hitung
Rata-rata hitung paling sering digunakan;
membutuhkan data dengan skala pengukuran interval
dan rasio. Sifat/ciri utamanya:
– Semua nilai observasi digunakan dalam
penghitungan
– Setiap data memiliki nilai rata-rata hitung yang unik
– Dihitung dengan menjumlahkan semua nilai dibagi
dengan jumlah observasi
– Jumlah simpangan (deviasi) dari nilai rata-rata adalah
nol.
– Nilainya dipengaruhi oleh nilai data yang ekstrim
(besar atau kecil)
12/09/2012
E. L. Pardede
10
Median
Median atau nilai tengah adalah titik tengah
dari nilai-nilai observasi setelah observasi
diurutkan dari nilai terkecil ke nilai terbesar
(membagi observasi menjadi dua atau
masing-masing 50%).
– Nilai di atas dan di bawah median jumlahnya
sama dalam data yang terurut.
– Untuk observasi yang jumlahnya genap, median
adalah rata-rata hitung dari dua nilai di tengah
data terurut.
12/09/2012
E. L. Pardede
11
Ciri-ciri/Sifat Median
• Nilai median unik untuk setiap data.
• Tidak terpengaruh oleh nilai yang ekstrim
(sangat besar atau sangat kecil)  tepat untuk
menggambarkan kecenderungan sentral ketika
ada nilai-nilai ekstrim
• Bisa dicari/dihitung untuk data yang berskala
ukuran rasio, interval, dan ordinal.
• Dapat dihitung untuk distribusi frekuensi
dengan kelas interval yang terbuka jika
mediannya tidak di kelas yang terbuka
tersebut.
12/09/2012
E. L. Pardede
12
Modus
Modus adalah nilai obervasi yang paling sering
muncul.
E. L. Pardede
13
Latihan 2
E. L. Pardede
14
Kapan menggunakan ukuran sentral
tertentu?
• Modus: paling mudah, tetapi paling tidak
cukup untuk menggambarkan ukuran sentral
• Median: lebih berguna dan lebih mudah
dipakai, terutama jika ada nilai ekstrim
• Tetapi Rata-rata hitunglah yang
memperhitungkan semua nilai dalam
observasi dan yang paling sering digunakan
12/09/2012
E. L. Pardede
15
Posisi Relatif dari Rata-rata, Median dan Modus
E. L. Pardede
16
Ukuran persebaran
Untuk apa mempelajari ukuran persebaran?
– Pengukuran seperti rata-rata atau median penting
untuk menggambarkan pusat/sentral dari data,
tetapi ukuran ini tidak menggambarkan apa pun
tentang persebaran data.
– Contoh: kedalaman sungai yang akan diseberangi;
– Persebaran data dapat dibandingkan dengan
melihatnya dalam distribusi tertentu.
12/09/2012
17
E. L. Pardede
Ukuran-ukuran persebaran
• Range
Range = Nilai Terbesar – Nilai Terkecil
(jangkauan)
• Simpangan/Deviasi
Rata-rata
• Varians Populasi
• Standar Deviasi
Populasi
18
Varians & Standar Deviasi Sampel
Faktor
Koreksi
• Varians sampel
• Standar Deviasi
Sampel
E. L. Pardede
19
Latihan 3
E. L. Pardede
20
Rata-rata Hitung untuk Data Berkelompok
di mana:

M
=
f
=
n
=
12/09/2012
rata-rata sampel
nilai tengah dari setiap kelas/kelompok
frekuensi dari tiap kelas
jumlah observasi dalam sampel
21
E. L. Pardede
Standar Deviasi/Simpangan Baku
dari Data Berkelompok
di mana:
s

M
=
f
=
n
=
=
12/09/2012
standar deviasi sampel
nilai tengah dari setiap kelas/kelompok
frekuensi dari tiap kelas
jumlah observasi dalam sampel
rata-rata sampel
22
E. L. Pardede
Median dari Data Berkelompok
di mana:
Md  median sampel
L
= batas bawah/tepi kelas lokasi median
n
= jumlah observasi dalam sampel
Cf
= frekuensi kumulatif sebelum kelas lokasi median
f
= frekuensi dari tiap kelas
i
= besarnya interval kelas
12/09/2012
23
E. L. Pardede
Modus dari Data Berkelompok
di mana:
Mo  modus sampel
L
= batas bawah/tepi kelas lokasi modus
d1
= selisih frekuensi kelas lokasi modus dengan
frekuensi kelas sebelumnya
d2
= selisih frekuensi kelas lokasi modus dengan
frekuensi kelas sesudahnya
i
= besarnya interval kelas
12/09/2012
24
E. L. Pardede
Teorema Chebyshev
• Teorema Chebyshev:
Untuk suatu kelompok data (sampel/populasi),
proporsi nilai-nilai yang berada dalam standar deviasi
dari rata-rata hitung k sekurang-kurangnya 1-1/k2, di
mana k merupakan konstanta bernilai > 1.
• Implikasinya: 75% atau ¾ data berada pada kisaran
± 2s, 89,9% data berada pada kisaran ± 3s, dan
96% data berada pada kisaran ± 5s.
12/09/2012
25
E. L. Pardede
Teorema Chebyshev: Contoh
Nilai rata-rata hitung harga saham ( ) Rp. 490,7
dengan standar deviasi (s) Rp. 144,7. Berapa jumlah
perusahaan dengan harga saham berkisar Rp. 201,3 –
Rp. 780,1?
(210,3; 780,1) = 490,7 ± 2 x 144,7
(210,3; 780,1) = ± 2s, berarti k = 2
Dengan rumus 1-1/k2 = 1-1/22 = 1-1/4=3/4 (75%)
12/09/2012
E. L. Pardede
26
Hukum Empirik Distribusi Simetrik
12/09/2012
27
E. L. Pardede
Ukuran Kecondongan (Skewness)
• Selain ukuran sentral (rata-rata, median, dan modus)
dan ukuran persebaran (range, varians, standar
deviasi), karakteristik lain dari data adalah
bentuknya.
• Berdasarkan pengamatan, ditemukan ada empat
bentuk kecondongan data yang umum:
–
–
–
–
12/09/2012
Simetris (symmetric)
Condong positif (positively skewed)
Condong negatif (negatively skewed)
Bimodal.
E. L. Pardede
28
Bentuk-bentuk Kecondongan Data
12/09/2012
E. L. Pardede
29
Rumus Ukuran Kecondongan
• Nilai koefisien kecondongan
(skewness atau sk):
-3  sk  3.
– Nilai sk yang mendekati -3,
misalnya -2,57: kecondongan
negatif yang besar
– Nilai sk 1,63: kecondongan
positif yang sedang
– Nilai sk 0, yang muncul jika
rata-rata dan median sama:
distribusi simetris dan tidak
terdapat kecondongan.
12/09/2012
30
Pearson’s coefficient
of skewness
E. L. Pardede
Tugas: Ukuran Sentral & Persebaran
1. Berdasarkan data 50 Lansia dari IFLS 2007:
a) Hitung rata-rata, median, dan modus usia untuk
seluruh sampel dan masing-masing untuk lansia
laki-laki dan lansia perempuan!
b) Hitung jangkauan, varians, dan standar deviasi
usia lansia laki-laki dan lansia perempuan! Apa
yang dapat Anda simpulkand dari hasilnya?
c) Sampel mana yang persebaran usianya paling
mendekati simetris? (Hitung kecondongannya!)
12/09/2012
E. L. Pardede
31
Tugas: Ukuran Sentral & Persebaran
2. Pilih sampel acak 3 kali (=3 sampel) dari
populasi tinggi badan mahasiswa S2KK
BKKBN/Reguler (5 orang dari 16 orang).
a) Hitung standar deviasi ketiga sampel tersebut!
b) Apakah terbukti perlunya faktor koreksi (n-1)
untuk standar deviasi sampel (s) agar lebih
mendekati standar deviasi populasi ()?
12/09/2012
E. L. Pardede
32
Tugas: Ukuran Sentral & Persebaran
3. Kelompokkanlah data Lansia dalam 5
tahunan (60-64, 65-69, dst.).
a) Hitung rata-rata, median, modus, varians, dan
standar deviasi data tersebut dengan metode
untuk data berkelompok!
b) Bandingkan hasilnya dengan hasil dalam tugas
no. 1. Apakah rumus data terkelompok tersebut
merupakan aproksimasi yang baik untuk ukuran
sentral dan persebaran?
12/09/2012
E. L. Pardede
33
Download