STATISTIKA-Pengantar

advertisement
STATISTIKA-Pengantar
Pertemuan
Bahan
1
Statistika
Deskriptif;
Ukuran
Pemusatan
dan
Penyebaran
Statistika; Frekuensi data
Dasar-dasar teori peluang; Peluang bersyarat dan
teorema bayes
Konsep sampling dan Populasi; Nilai Ekspektasi ratarata, varian, dan kovarian
Distribusi Teoritis Diskrit; Binom, hipergeometri, poisson
2
3
4
5
6
7
Distribusi Teoritis Kontinu; Normal, Nilai Z, Normal
Baku, membaca tabel distribusi teoritis kontinu
Pendugaan Selang Kepercayaan Satu Sampel; z, t,
dan proporsi
UTS
STATISTIKA-Pengantar
Pertemuan
Bahan
8
Pendugaan Selang Kepercayaan Dua Sampel; z, t,
proporsi, chi-square
Konsep Hipotesis; Pengujian Hipotesis Satu Sampel; z,
t, dan proporsi
Pengujian Hipotesis Lebih dari Satu Sampel; z, t, dan
proporsi
Konsep korelasi dan Skala Ukur Data
Korelasi Kendall, Spearman, Pearson, dan Asosiasi KhiKuadrat
Regresi Linier Sederhana untuk peramalan
Aplikasi Korelasi dan Regresi Linier Sederhada di bid.
Ekonomi
UAS
9
10
11
12
13
14
STATISTIKA-Definisi Statistika
Apakah Statistika itu?
Seni mengumpulkan, mengolah, dan mengintepretasikan data menjadi
informasi yang berguna untuk pengambilan keputusan
Berdasarkan kedalaman pengolahan data/analisis, Statistika
dibedakan menjadi 2; yaitu:
●
●
Statistika Deskriptif: metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan
informasi yang berguna.
Statistika Inferensi: mencakup semua metode yang berhubungan
dengan analisis data untuk kemudian sampai pada peramalan atau
penarikan kesimpulan keseluruhan gugus data induknya.
STATISTIKA-Istilah-istilah umum
●
●
●
Populasi
Keseluruhan pengamatan yang menjadi perhatian si peneliti.
Sampel atau Contoh
Suatu himpunan bagian dari populasi.
Sampel acak sederhana
Suatu sampel acak sederhana n pengamatan adalah suatu contoh acak
sederhana yang dipilih dengan suatu cara tertentu, sehingga tiap
himpunan bagian yang berukuran n dari populasi tersebut memiliki
peluang terpilih yang sama.
Parameter
Sembarang nilai yang menjelaskan ciri-ciri populasi.
● Statistik
Sembarang nilai yang menjelaskan ciri-ciri sampel.
●
STATISTIKA-Ukuran Pemusatan
Apakah Ukuran Pemusatan itu? (center of measurement)
Sembarang ukuran yang menunjukkan pusat dari suatu gugus data yang
umumnya telah diurutkan.
Misalnya: mean atau nilai rata-rata, median, dan modus
STATISTIKA-Mean
Apakah mean atau nilai rata-rata?
Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk
mendapatkan gambaran umum tentang pusat dari suatu gugus data.
●
Mean untuk Populasi
N
Mean untuk Sampel
n
∑x
µ = i =1
N
●
∑x
i
Contoh:
x = i =1
n
X i = {1,3,4,7,5}
n
∑x
x = i =1
n
i
x + x + x + x4 + …+ xn 1+ 3 + 4 + 7 + 5
= 1 2 3
=
=4
n
5
i
STATISTIKA-Median
Apakah median itu?
Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk
mendapatkan gambaran umum tentang pusat dari suatu gugus data;
secara khusus untuk data berskala ukur nominal dan ordinal.
Langkah-langkah Menghitung median...
1. Urutkan data
2. Kalau n ganjil, maka nilai mediannya adalah nilai pengamatan yang tepat
membagi gugus data menjadi dua bagian yang sama besar.
Kalau n genap, maka nilai mediannya adalah rata-rata dua nilai
pengamatan yang paling tengah.
STATISTIKA-Median
Contoh:
Berapakah median dari suatu gugus data X i ={ 1, -2, 8, 2, 2, 5}?
Langkah 1: Urutkan data
-2, 1, 2, 2, 5, 8
Langkah 2: n genap
X3 X4
x Me
2
2 2
2
STATISTIKA-Modus
Apakah Modus itu?
Adalah nilai yang paling sering muncul dari suatu gugus data. Jadi nilai
modus adalah nilai yang memiliki frekuensi yang paling besar dari suatu
gugus data.
Contoh:
X i = {−2,1,2,2,5,5,5,8}
Nilai
-2
1
2
5
Frekuensi
1
1
2
3
Karena nilai 5 memiliki frekuensi yang paling
besar, maka:
Mo 5
STATISTIKA-Ukuran Penyebaran
Apakah ukuran penyebaran/dispersion of measurement itu?
Adalah suatu nilai yang menunjukkan keberagaman nilai dari suatu gugus
data.
Misalnya: range/wilayah, standar deviasi/simpangan baku, varian/ragam
STATISTIKA-Range/Wilayah
Apakah Range/Wilayah itu?
Adalah suatu nilai yang menunjukkan beda antara nilai terbesar dengan
nilai terkecil dari suatu gugus data.
Rumus:
Range = NilaiTerbesar − NilaiTerkecil
Contoh:
X i = {−2,1,2,2,5,5,5,8}
Range = 8 − (−2) = 10
STATISTIKA-Standar Deviasi/Simpangan Baku
Apakah Standar Deviasi itu?
Adalah suatu nilai yang menunjukkan rata-rata, beda nilai-nilai dari suatu
gugus data terhadap mean-nya.
●
St.Dev untuk Populasi
=N
2
(
)
−
Σii=
X
µ
i
1
σ=
N
● St.Dev untuk Sampel
s=
Σ
i= n
i=1
(X
−x
n −1
i
)
2
STATISTIKA-Standar Deviasi/Simpangan Baku
Contoh:
X i = {−2,1,2,2,5,5,5,8}
Carilah standar deviasi dari data di atas!
Ingat untuk mendapatkan St.Dev, maka diperlukan mean-nya!
x = 3.25
s=
(− 2 − 3.25)2 + (1 − 3.25)2 + (2 − 3.25)2 +…+ (8 − 3.25)2
7
7
7
7
= 3.105
STATISTIKA-Varian/Ragam
Apakah varian/ragam itu?
Adalah kuadrat dari nilai standar deviasi.
●
Varian untuk Populasi
σ2 =
●
=N
2
(
)
−
Σ ii=
X
µ
i
1
N
Varian untuk Sampel
(
)
2
i= n
2 Σ i=1 X i − x
s =
n −1
Jadi jika S=3.105, maka variannya adalah S 2 = 3.1052 = 9.641
STATISTIKA-Menggunakan Kalkulator
●
●
Menghitung mean dengan kalkulator
1. Masuk ke mode SD:
Tekan Shift
Mode
SD
2. Masukkan keseluruhan gugus data:
Tekan -2
1
DT
DT
3. Tekan x
Menghitung St.Dev dengan kalkulator
1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean.
2. Tekan x n 1
8
DT
STATISTIKA-Hal lainnya mengenai Ukuran Penyebaran
Nilai Z atau nilai baku...
Adalah nilai pembakuan yang menyatakan jarak suatu pengamatan x dari
mean dalam satuan standar deviasi.
●
●
Nilai Z untuk jika nilai-nilai parameter populasi diketahui
x−µ
z=
σ
Nilai Z untuk jika nilai-nilai parameter populasi tidak diketahui
z=
x−x
s
STATISTIKA-Contoh Nilai Z
Carilah nilai Z dari X=-2
pada gugus data X =
x−µ x−x
z=
=
σ
s
i
{−2,1,2,2,5,5,5,8}!
−2 − 3.25
=
= −1.69
3.105
Tanda negatif menyatakan, nilai -2 ada di sebelah kiri mean dari gugus data, angka
1,69 menunjukkan jarak nilai -2 dari mean dalam satuan standar deviasi.
Dalil Chebyshev:
1
Sekurang-kurangnya 1 −
bagian data,
k2
terletak dalam k standar deviasi dari nilai tengahnya.
STATISTIKA-Ukuran Fraksional
Apakah Ukuran Fraksional itu? (fractional measurement)
Sembarang ukuran yang membagi data menjadi fraksi-fraksi yang sama
range-nya.
Misalnya: kuartil, desil, persentil
Ada lebih dari 1 cara untuk mencari kuartil, desil, dan persentil.
Namun semuanya memiliki satu filosofi:
membagi data menjadi fraksi-fraksi yang memiliki
anggota gugus data yang kira-kira hampir sama banyaknya
STATISTIKA-Contoh Rumus Kuartil
Kuartil membagi data menjadi empat fraksi.
Q1
Q2
Langkah mencari kuartil:
1. cari posisi kuartil tersebut:
i
pQi = x(n + 1)
4
2. cari nilainya berdasarkan rumus:
Qi = jx⏐X pQ − X pQ +1⏐+ X pQ
i
i
i ⏐
⏐
Q3
STATISTIKA-Contoh
Carilah kuartil ke-3 dari gugus data ini:
X i = {−2,1,2,2,5, 8,8}
Langkah mencari kuartil:
1. cari posisi kuartil tersebut:
3
pQ3 = x8 = 6.00
4
2. cari nilainya berdasarkan rumus:
Q3 = 0.00 x⏐X pQ − X pQ +1⏐+ X pQ = 0.00 x|8 − 8|+ 8 = 8
3
⏐ 3
3 ⏐
STATISTIKA-Ingatkah Saudara?
Apakah yang dimaksud center of measurement, dispersion measurement,
dan fractional measurement?
Ukuran apa yang paling sering digunakan?
Mean dan Standar Deviasi.
Bagaimana dengan fractional measurement?
The Pareto principle (also known as the 80-20 rule, the law of the vital few
and the principle of factor sparsity) states that, for many events, 80% of the
effects comes from 20% of the causes.
STATISTIKA-Ingatkah Saudara?
PARETO PRINCIPLE:
Business management thinker Joseph M. Juran suggested the
principle and named it after Italian economist Vilfredo Pareto, who
observed that 80% of income in Italy went to 20% of the
population. It is a common rule of thumb in business; e.g., "80% of
your sales comes from 20% of your clients." (Hukum 80/20)
Thomas Stanley, Ph.D. dan William D.
Dunks, Ph.D. sering menggunakan
ukuran fraksional untuk
menggambarkan perilaku masyarakat
Amerika.
STATISTIKA-Ingatkah Saudara?
BAGAIMANA HUKUM 80/20 DILAHIRKAN? (Sebuah Ilustrasi)
Vilfredo Pareto, mengumpulkan data pendapatan orang-orang di Italia.
Data-data yang didapatkannya diurutkan. Setelah berulang kali
mengulang pengumpulan data, dia mendapati bahwa orang-orang yang
menempati posisi data lebih besar atau sama dengan 80 (persentil
ke-80 dan seterusnya) ternyata memiliki total pendapatan 80% dari
seluruh orang-orang dalam pengamatannya.
80% data; 20% total pendapatan
20% data;
80% total pendapatan
persentil ke-80
S={ 0,1; 0,9; 1; 1; 1; 1; 1; 2; 16; 16}
STATISTIKA-Ingatkah Saudara?
Cobalah menghitung mean dan standar deviasi-nya!
X={2, 3, 1}
Y={3, 1, 4, 10, 2}
Z={1, 45, 28, 2, -10, 35, 29, 50, 98, 100, -35, 18, 1, 1, 5, -9, 10, 7, 4, 19,
3, 12, 5, 10, 19, 20, 32, 67, 8, 9, 12, -1, 0, 2}
STATISTIKA-Menggunakan Kalkulator
●
●
Menghitung mean dengan kalkulator
1. Masuk ke mode SD:
Tekan Shift
Mode
SD
2. Masukkan keseluruhan gugus data:
Tekan -2
1
DT
DT
3. Tekan x
Menghitung St.Dev dengan kalkulator
1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean.
2. Tekan x n 1
8
DT
STATISTIKA-Tabel Frekuensi Sederhana
Tabel Frekuensi Sederhana adalah tabel frekuensi yang terdiri dari kolom-kolom
nilai (xi) dan frekuensi (fi).
Contoh:
Nilai
xi
-2
1
2
5
8
Frekuensi
fi
1
1
2
1
1
Tabel di atas, sama dengan bentuk gugus data sbb:
X = {− 2,1,2,2,5, 8}
i
Pertanyaan yang sering muncul adalah…
Bagaimana menghitung nilai mean dan st. dev
dari data pada tabel frekuensi sederhana
STATISTIKA-Tabel Frekuensi Sederhana (Cont’d)
Contoh:
Nilai
Frekuensi
= {− 2,1,2,2,5, 8}
i
xi
fi
-2
1
1
1
2
2
5
1
8
1
Cara menghitung mean-nya dengan rumus dasar: x =
X
∑ x
−2 1 2 2 5 8
x=
+ + + + +
6 6 6 6 6 6
1
(− 2 + 1 + 2 + 2 + 5 + 8)
6
1
= (1.(−2) + 1.(1) + 2(2) + 1(5) + 1(8) )
6
1
x=
( x1) + f ( x2) + K + f ( xk )
f
1
2
k
6
=
(
)
i=n
i =1
i
n
Sehingga, RUMUSnya menjadi:
1 i =k
x = ∑i =1
n
f x
i
i
STATISTIKA-Tabel Frekuensi Sederhana (Cont’d)
Contoh:
Nilai
xi
-2
1
2
5
8
Frekuensi
fi
1
1
2
1
1
X = {− 2,1,2,2,5, 8}
i
RUMUS St. Dev untuk tabel
frekuensi sederhana menjadi:
s=
(
∑ f xi − x
i =k
i =1
i
n −1
)
2
Cobalah menghitung nilai St. Dev dengan rumus di atas, bandingkan dengan
rumus St. Dev pada pertemuan ke-1!
STATISTIKA-Tabel Frekuensi untuk Data Berkelompok
6 Langkah Menyusun Tabel Frekuensi untuk Data Berkelompok:
1. Tentukan banyaknya selang kelas: (saran: bsk=1+3,3 log n)
2. Tentukan range datanya
3. Bagi range dengan banyaknya selang kelas
4. Tentukan limit kelas dan batas kelas
Ingat batas kelas selalu ± 0,5 digit terakhir limit kelas.
5. Tentukan titik tengah tiap selang kelas:
ttk=(batas atas+batas bawah)/2
6. Tentukan frekuensi masing-masing kelas
STATISTIKA-Tabel Frekuensi untuk Data Berkelompok
Sensus Tahun 1980
Kelompok Umur/
Age Group
(1)
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
+70
Jumlah/
Total
(4)
241655
234916
216003
238054
240501
192932
131065
123921
109978
82086
74411
47917
36340
20137
27611
Dengan mengeluarkan selang kelas +70
dapatkah anda menghitung mean dan
standar deviasi usia penduduk kota
Surabaya tahun 1980?
(petunjuknya: gunakan rumus untuk tabel
frekuensi sederhana tetapi ganti Xi dengan
titik tengah kelas)
STATISTIKA-Istilah Penting pada Himpunan
Ruang Contoh adalah himpunan semua kemungkinan hasil dari suatu
percobaan. Dilambangkan dengan huruf S.
Kejadian adalah himpunan bagian dari ruang contoh. Terbagi atas dua jenis
yaitu Kejadian Sederhana (anggota himpunannya tunggal) dan Kejadian
Majemuk (gabungan beberapa kejadian sederhana).
Ruang Nol/Himpunan Kosong adalah himpunan bagian dari ruang contoh yang
tidak memiliki satu anggota pun. Dilambangkan dengan ø
Ilustrasi Matematis:
φ ⊂ K .Sederhana ⊂ K .Majemuk ⊂ RuangContoh
STATISTIKA-Istilah Penting pada Himpunan (Cont’d)
Bagaimana mendaftarkan anggota dari ruang contoh?
Ada beberapa cara yang populer; antara lain: Diagram Venn, dan Diagram Pohon
Bagaimana jika anggota ruang contoh sangat banyak?
Dapat menggunakan Notasi Pembentuk Himpunan
Contoh:
Kasus nilai yang muncul dari pelemparan sebuah mata dadu.
STATISTIKA-Istilah Penting pada Himpunan (Cont’d)
HIMPUNAN-HIMPUNAN yang mungkin terbentuk adalah:
S = {1,2,3,4,5,6}
A = {1,3,5}
B = {2,4,6}
C = {2,3,5}
D = {2}
E = {}
Notasi Pembangun Himpunan
S={x|x adalah semua nilai mata dadu yang mungkin}
A={x|x adalah mata dadu dengan nilai ganjil}
B={x|x adalah mata dadu dengan nilai genap}
C={x|x adalah mata dadu dengan nilai prima}
D={x|x adalah mata dadu dengan nilai genap sekaligus prima}
E={x|x adalah mata dadu dengan nilai …}
Buatlah Diagram Venn nya!
STATISTIKA-Pengolahan Kejadian
BEBERAPA ISTILAH PENTING DALAM PENGOLAHAN
KEJADIAN:
Irisan: irisan kejadian A dan B dilambangkan dengan A ∩ B ; adalah kejadian
yang terdiri atas semua unsur persekutuan kejadian A dan B.
Saling Asing/Disjoint: disjoin antara kejadian A dan B dilambangkan dengan
A ∩ B = φ ; adalah kejadian di mana kejadian A dan B tidak punya unsur
persekutuan.
Paduan/Union: union kejadian A dan B dilambangkan dengan
kejadian yang mencakup semua unsur kejadian A dan B.
A ∪ B ; adalah
Komplemen: komplemen A dilambangkan dengan A’; adalah himpunan semua
anggota S yang bukan anggota A.
STATISTIKA-Mencacah Titik Contoh
Apakah Titik Contoh itu?
Titik Contoh adalah kejadian sederhana yang mungkin disusun dari anggota
ruang contoh.
Ada beberapa operasi perhitungan/pencacahan pada titik contoh; yaitu:
Kaidah Penggandaan, Kaidah Permutasi, dan Kaidah Kombinasi
STATISTIKA-Kaidah Penggandaan
Apa yang kaidah penggandaan katakan?
Jika suatu operasi dapat dilakukan dengan n1 cara dan operasi kedua dapat
dilakukan dengan n2 cara, maka kedua operasi tersebut dapat dilakukan dengan
n1x n2 cara.
Rumus:
Untuk 2 operasi: n1 x n2
Untuk k operasi: n1 x n2 x … x nk
STATISTIKA-Kaidah Penggandaan (Cont’d)
Contoh:
Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 1 jenis
saham dan 1 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan
8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan
investasinya?
Jawabannya:
n1= banyaknya jenis saham di bursa= 45
n2= banyaknya jenis mata uang= 8
Banyaknya pilihan investasi= n1x n2= 45x 8 = 360 pilihan
STATISTIKA-Permutasi
Apakah yang dimaksud permutasi?
Permutasi adalah susunan yang dapat dibentuk oleh sebagian atau keseluruhan
kumpulan benda dengan urutan yang diperhatikan.
Urutan yang diperhatikan?
Jika susunan A, B dianggap berbeda dengan B,A maka urutan diperhatikan.
Dalil-Dalil Permutasi:
1. Banyaknya permutasi n benda yang berbeda adalah n!
2. Banyaknya permutasi r benda dari n benda yang berbeda adalah
n Pr =
n!
(n − r )!
STATISTIKA-Permutasi (Cont’d)
Dalil-Dalil Permutasi:
3. Banyaknya permutasi n benda yang berbeda yang disusun dalam suatu lingkaran
adalah (n-1)!
4. Banyaknya permutasi yang berbeda dari n benda yang n1 di antaranya berjenis
pertama, n2 berjenis kedua, …, nk berjenis ke-k adalah
n!
n Pr =
n1!n2 !...nk !
STATISTIKA-Kombinasi
Apa yang dimaksud dengan Kombinasi?
Kombinasi adalah susunan banyaknya cara mengambil r benda dari n benda tanpa
memperhatikan urutannya.
RUMUS:
n!
n Cr =
r!(n − r )!
STATISTIKA-Permutasi atau Kombinasi?
Contoh:
Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 3 jenis
saham dan 2 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan
8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan paket
investasinya?
Perpaduan antara Kombinasi dan …
Kaidah Penggandaan
STATISTIKA-Peluang Suatu Kejadian
Apa yang dimaksud dengan Peluang?
Peluang suatu kejadian A adalah jumlah peluang semua titik contoh di dalam A.
Ingat:
0 ≤ P ( A) ≤ 1 P (φ ) = 0
P( S ) = 1
RUMUS:
n
P ( A) =
N
n = banyaknya titik contoh dalam kejadian A
N = banyaknya titik contoh dalam ruang contoh
STATISTIKA-Kaidah Penjumlahan
Hal yang perlu diperhatikan:
1. Bila A dan B adalah dua kejadian sembarang, maka:
P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
2. Bila A dan B adalah dua kejadian yang saling asing, maka:
P( A ∪ B) = P( A) + P( B)
STATISTIKA-Peluang Bersyarat
Dalam suatu kasus, mungkin saja kita mendapati bahwa kita mengetahui sejumlah
informasi awal. Dengan menggunakan informasi awal tersebut, kita dapat
memperkirakan peluang suatu kejadian dengan lebih akurat.
Peluang suatu kejadian terjadi, jika peluang kejadian yang lain diketahui
disebut sebagai PELUANG BERSYARAT.
Peluang bersyarat B, bila A diketahui dilambangkan dengan P(B|A) sbb:
P( A ∩ B)
P( B | A) =
P( A)
Catatan: P(A)>0
STATISTIKA-Peluang Bersyarat_Contoh Soal
SOAL:
Pak Kris menginvestasikan uangnya ke 2 saham yang berbeda. Peluang saham A
meningkat nilainya dalam sebulan ke depan adalah 10% dan peluang saham B
meningkat nilainya dalam sebulan ke depan adalah 15%. Jika bulan berikutnya Pak
Kris mendapat informasi bahwa harga saham turun, berapa peluangnya bahwa
harga saham A yang turun?
JAWABAN:
Umpamakan Pak Kris membeli 100 saham A dan 100 saham B.
Naik
A
B
Total
Turun
10
15
25
Total
90
100
85
100
175
200
STATISTIKA-Peluang Bersyarat_Contoh Soal
JAWABAN:
P(turun ∩ A)
P ( A | turun) =
P(turun)
90
18
200
=
=
175 35
200
Jadi peluang saham A turun nilainya adalah 18/35
STATISTIKA-Peluang Bersyarat_Contoh Soal
SOAL:
Sirkuit Donington Park di Inggris memiliki tipikal cuaca yang unik. Untuk menentukan
setting motoGP yang tepat, tim Ducati memiliki data bahwa peluang dua hari
berturut-turut hujan adalah 30%, sedangkan peluang dua hari berturut-turut cerah
adalah 40%. Peluang mix, hari ini cerah besok hujan adalah 15% demikian juga
dengan peluang hari ini hujan besok cerah adalah 15%. Jika dalam babak kualifikasi
cerah, berapakah peluangnya dalam balapan besok hari juga cerah?
JAWABAN:
Hari ini
Hujan Cerah
Hujan
30
15
Besok Hari Cerah
15
40
Total
45
55
Total
45
55
100
STATISTIKA-Peluang Bersyarat_Hal Lainnya
Bila dua kejadian bebas, maka:
P ( B | A) = P ( B)
P ( A | B ) = P ( A)
Kaidah Penggandaan:
1. Bila dalam suatu percobaan kejadian A dan B dapat terjadi sekaligus,
maka:
P ( A ∩ B) = P( A) P( B | A)
2. Bila Kejadian A dan B bebas; maka:
P ( A ∩ B) = P( A) P ( B)
STATISTIKA-Konsep Sampling dan Populasi
A
A
A
A
A
A
A
A
A
A
A
A
A
POPULASI
SAMPEL
POPULASI adalah keseluruhan pengamatan yang menjadi perhatian si
peneliti.
SAMPEL adalah suatu himpunan bagian dari populasi.
STATISTIKA-Konsep Sampling dan Populasi
MENGAPA STATISTIKA MENGGUNAKAN STATISTIK DARI SAMPEL
UNTUK MENDUGA PARAMETER POPULASI?
Trade-off antara keterbatasan waktu, sumber daya, dan biaya dengan
akurasi hasil penelitian.
Less
Accuracy
Low
Resources
High
Accuracy
High
Resources
STATISTIKA-Konsep Sampling dan Populasi
Cobalah menghitung nilai mean dari gugus data populasi berikut:
51,5514; 49,0151; 48,8834; 44,3441; 48,2312; 46.2880; 46,0068; 53,6238;
50,3008; 49,6371
Secara acak pilihlah sampel berukuran 3, 5, 7, dan 9 dari gugus data
populasi di atas dan hitunglah nilai mean-nya. Bandingkan!
Less
Accuracy
Low
Resources
High
Accuracy
High
Resources
STATISTIKA-Konsep Sampling dan Populasi
TEKNIK SAMPLING:
Probability Sampling
Non-Probability Sampling
1. Simple Random Sampling
1. Convenience Sampling
2. Stratified Random Sampling
2. Judgmental Sampling
3. Cluster Random Sampling
3. Quota Sampling
4. Systematic Random
Sampling
4. Snowball Sampling
STATISTIKA-Nilai Harapan untuk Parameter
NILAI HARAPAN (Expected Value)
Expected Value dari sebuah variabel (peubah acak) adalah jumlah dari
peluang semua kemungkinan yang ada di dalam percobaan atau himpunan
kejadian dikalikan dengan nilainya.
DEFINISI MATEMATIS:
E ( x) = ∫ X .dP
Ω
untuk diskrit:
E ( x ) = ∑i x i
untuk kontinu:
b
p
i
E ( x) = ∫ x. f ( x).dx
a
Catatan:
Definisi diskrit dan kontinu akan dijelaskan pada pertemuan selanjutnya.
STATISTIKA-Mean Variabel
MISAL:
Ruang Contoh untuk pelemparan 2 uang logam, sbb:
S={AA, AG, GA, GG}
Jika dilakukan 16 kali pelemparan ternyata banyaknya muncul sisi gambar (Xi)
sbb:
xi
fi
Maka:
0
4
1
7
2
5
(0).(4) + (1).(7) + (2).(5)
x=
16
= (0).(4 / 16) + (1).(7 / 16) + (2).(5 / 16)
= 1,06
E ( x ) = ∑i x i
p
i
STATISTIKA-Mean Variabel
Mean Variabel x yang memiliki nilai yang sama dengan expected value E(x).
Adalah suatu perhitungan mean populasi menggunakan frekuensi relatif
Variabel Diskrit X:
xi
P(X=x)
x1
f(x1)
x2
f(x2)
…
…
xn
f(xn)
Maka nilai expected value untuk X adalah:
n
µ = E( X ) = ∑ xi . f ( xi)
i =1
Variabel Kontinun X:
µ = E( X ) = ∑ xi . f ( xi)
∞ i =1
µ = E( X ) = ∫ x. f ( x).dx
−∞
Terjadi jika X bilangan riil.
STATISTIKA-Mean Variabel
Bagaimana untuk variabel g(X)?
Variabel Diskrit g(X):
n
µ = E( X ) = ∑ g( xi). f ( xi)
i =1
Variabel Kontinu g(X):
∞
µ = E( X ) = ∫ g( xi). f ( xi).dg( xi)
−∞
STATISTIKA-Varian Variabel
Varian Variabel X
Varian dari 16 kali pelemparan mata uang tersebut adalah:
(0 − 1,06) 2 .(4) + (1 − 1,06) 2 .(7) + (2 − 1,06) 2 .(5)
σ =
16
= 0,5639
2
Secara Umum Variabel X memiliki varian
Diskrit:
2
n
σ 2 = E ( X − µ ) = ∑ ( X − µ ) . f ( x)
2
i =1
Rumus Hitung bagi varian X:
σ 2 = E( X 2 ) − µ 2
Kontinu:
σ 2 = E ( X − µ )2 =
∞
2
∫ ( X − µ ) . f ( x).dx
−∞
Bagaimana dengan
varian dari g(X)?
STATISTIKA-Kovarian Variabel
Kovarian Variabel X dan Y adalah:
σ xy = E (( x − µ x )( y − µ y ) )
ƒ Diskrit:
n
σ xy = ∑ ( xi − µ x )( yi − µ y ). f ( x). f ( y )
i =1
ƒ Kontinu
σ xy =
∞ ∞
∫ ∫ (x − µ
i
x
)( yi − µ y ). f ( x). f ( y ).dx.dy
− ∞− ∞
Catatan:
Semakin kecil nilai kovarian antara variabel x dan y, maka semakin besar
independensi antara kedua variabel tersebut.
STATISTIKA-Sifat-sifat mean dan varian
Sifat-sifat
ƒ Bila a dan b adalah konstanta:
µ ax +b = aµ + b
ƒ Nilai tengah jumlah atau selisih dua atau lebih peubah acak
µ x± y = µ x ± µ y
ƒ Nilai tengah hasil kali dua variabel
µ xy = µ x .µ y
ƒ Ragam jika b konstan
σ x2+b = σ x2 = σ 2
ƒ Ragam jika a konstan
σ ax2 = a 2σ x2 = a 2σ 2
ƒ Jika X dan Y independen maka:
σ x2+ y = σ x2 + σ y2
STATISTIKA - VARIABEL: Peluang Diskrit
VARIABEL ATAU PEUBAH ACAK:
Suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap
unsur dalam ruang contoh.
RUANG CONTOH DIBAGI MENJADI DUA:
1. Diskrit
Jumlah titik contoh TERHINGGA, merupakan hasil membilang.
contoh: tingkat preferensi yang dikodekan menjadi angka 1, 2, 3, 4, atau 5
2. Kontinu
Jumlah titik contoh TAK TERHINGGA, merupakan hasil mengukur.
contoh: tinggi seseorang yang diukur dalam satuan centimeter (174,74cm)
STATISTIKA - VARIABEL: Variabel Diskrit
ILUSTRASI: tinggi badan
Dikrit:
Kontinu: 150cm
180cm
STATISTIKA - VARIABEL: Variabel Diskrit
DISTRIBUSI PELUANG:
Untuk menghitung nilai peluang tertentu selain menggunakan cara mendaftarkan atau
membuat diagram. Ada bentuk-bentuk peluang khusus, yang nilainya dapat dicari dengan
rumus tertentu.
Distribusi peluang adalah fungsi yang digunakan untuk menghitung nilai peluang dari
suatu bentuk peluang-peluang tertentu.
Contoh:
Banyaknya gambar yang muncul dari 3 kali pelemparan 1 mata uang.
(banyaknya gambar yang muncul dari 1 kali pelemparan 3 mata uang)
Distribusi Peluang
BENTUK PELUANG
x
P(X=x)
0
1/8
1
3/8
2
3/8
3
1/8
x = banyaknya sisi gambar yang muncul
⎛ 3⎞
⎜⎜ ⎟⎟
x
f ( x) = ⎝ ⎠
8
; x = 0, 1, 2, 3
x = banyaknya sisi gambar yang muncul
STATISTIKA - VARIABEL: Variabel Diskrit
BEBERAPA DISTRIBUSI PELUANG DISKRIT YG POPULER:
Binominal; Hipergeometrik; Poisson
DISTRIBUSI BINOMINAL
Ciri-ciri:
1.
Percobaan terdiri atas n ulangan
2.
Digolongkan menjadi sukses dan gagal
3.
Nilai peluang untuk setiap ulangan tidak berubah
4.
Pengulangan bersifat bebas
RUMUS:
⎛n⎞
b( x; n, p ) = ⎜⎜ ⎟⎟ p x q n − x
⎝ x⎠
Arti Notasi
n = banyaknya ulangan
x = banyaknya sukses
p = peluang sukses
q =(1-p) =peluang gagal
STATISTIKA - VARIABEL: Variabel Diskrit
CONTOH SOAL:
Dari data di masa lalu, peluang nilai saham A naik dalam tahun tertentu adalah 35%;
Jika Pak Mudahman membeli saham untuk investasi selama 10 tahun. Berapa peluang
nilai sahamnya tidak mengalami kenaikan sama sekali di tiap tahunnya?
Jawaban:
p =35%
x =0
b(0;10,0.35) =0.013
n =10
STATISTIKA - VARIABEL: Variabel Diskrit
DISTRIBUSI HIPERGEOMETRIK
Ciri-ciri:
1.
Suatu percobaan yang terdiri atas contoh acak atau random sampel berukuran n diambil dari
populasi berukuran N
2.
Dengan k dari N benda diklasifikasikan sebagai berhasil dan N-k benda sebagai gagal.
RUMUS:
⎛ k ⎞⎛ N − k ⎞
⎜⎜ ⎟⎟⎜⎜
⎟⎟
x n−x ⎠
h( x; N , n, k ) = ⎝ ⎠⎝
⎛N⎞
⎜⎜ ⎟⎟
⎝n⎠
Arti Notasi
k = banyaknya semesta sukses
x = banyaknya sukses
N = banyaknya semesta
n = banyaknya percobaan
STATISTIKA - VARIABEL: Variabel Diskrit
CONTOH SOAL:
Sebuah perusahaan reksadana menginvestasikan dananya pada beberapa saham.
Berdasarkan pengalaman di masa lalu dari 45 saham aktif dipasarkan di pasar modal
biasanya hanya 5 saham yang berkinerja positif di akhir tahun (asumsi 5 saham yang
berkinerja positif ini random). Jika perusahaan tersebut memiliki kebijakan untuk selalu
memecah investasinya ke dalam 3 saham. Berapa peluangnya semua sahamnya
berkinerja negatif?
Jawaban:
k =5
N =45
n =3
h(0;45,3,5) =0,696
x=0
STATISTIKA - VARIABEL: Variabel Diskrit
DISTRIBUSI POISSON
Ciri-ciri:
1.
Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu tertentu atau wilayah, tidak
tergantung pada banyaknya hasil percobaan pada selang waktu atau wilayah yang berbeda.
2.
Peluang terjadinya satu hasil percobaan selama selang waktu yang singkat atau dalam wilayah yang
kecil, sebanding dengan panjang selang waktu atau besarnya wilayah tersebut
3.
Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat atau
wilayah yang kecil dapat diabaikan.
(Distribusi Poisson selalu berkenaan dengan peluang selang waktu atau wilayah)
RUMUS:
e−µ µ x
p ( x; µ ) =
x!
Arti Notasi
e =bilangan natural =2.718…
x =banyaknya sukses
µ =mean populasi (sbg pendekatan binominal jika p sangat kecil; µ=np)
STATISTIKA - VARIABEL: Variabel Diskrit
CONTOH SOAL:
Pasar modal mempublikasikan bahwa setiap hari dari 45 saham yang aktif dipasarkan,
ada 10 saham yang tidak bergerak nilainya. Jika pada suatu hari Pak Mudahman
sedang mengamati pasar modal, berapa peluang Pak Mudahman mendapatkan ada 8
saham yang tidak mengalami pergerakan?
Jawaban:
µ =10
x =8
p(8;10) =0.113
STATISTIKA - VARIABEL: Peluang Kontinu
Distribusi Peluang Kontinu:
Peluang variabel random kontinu bernilai tepat di suatu titik adalah nol.
P( X = a) = 0
Perhatikan bahwa jika x kontinu, maka:
P ( a < X ≤ b) = P ( a < X < b) + P ( X = b)
= P ( a < X < b) + 0
STATISTIKA - VARIABEL: Peluang Kontinu
Fungsi Kepekatan Peluang:
Fungsi f disebut fungsi kepekatan peluang bagi variabel random kontinu X bila luas daerah di
bawah kurva dan di atas sumbu x sama dengan 1, dan bila luas antara a dan b dibawah kurva
menyatakan peluang X untuk x=a sampai x=b.
Maka: P( - ~ < X < + ~ )=1
P( a < X < b )<1
STATISTIKA - VARIABEL: Peluang Kontinu
Sebaran Normal/Gauss
Bentuk Grafis Lonceng
x
µ
Rumus Kurva Normal:
n( x; µ , σ ) =
1
2πσ
2
e
1 ⎛ x−µ ⎞
− ⎜
⎟
2⎝ σ ⎠
2
STATISTIKA - VARIABEL: Peluang Kontinu
Ilustrasi Grafis:
ƒ Kurva Normal dengan µ1<µ2; σ1=σ2
σ1
σ2
µ1
µ2
ƒ Kurva Normal dengan µ1=µ2; σ1<σ2
σ1
σ2
µ1=µ2
STATISTIKA - VARIABEL: Peluang Kontinu
Ilustrasi Grafis:
ƒ Kurva Normal dengan µ1<µ2; σ1<σ2
σ1
σ2
µ1
µ2
Kesimpulan dari Ilustrasi Grafik
• Semakin kecil σ semakin tinggi puncak dari kurva normal
• Semakin besar µ semakin ke kanan posisi dari kurva normal
STATISTIKA - VARIABEL: Peluang Kontinu
Sifat Kurva Normal:
1. Fungsi mencapai maksimum jika Me=µ
2. Kurva setangkup pada suatu garis tegak yang melewati µ
P(− ~ < x) = P( x < + ~) = 0.5
3. Kurva asimptotik terhadap sumbu datar
4. Luas kurva adalah 1.
P(− ~ < x < + ~) = 1
STATISTIKA - VARIABEL: Peluang Kontinu
Luas daerah di bawah kurva normal:
Dibakukan sebagai distribusi normal baku.
Distribusi Normal Baku:
Adalah distribusi variabel random normal dengan nilai tengah nol dan ragam bernilai satu.
(normal baku; n(x;0,1))
Rumus Pembakuan:
z=
x−µ
σ
Ilustrasi Grafik:
z1
z2
STATISTIKA - VARIABEL: Peluang Kontinu
Hampiran distribusi normal terhadap:
A. Distribusi Binominal
Bila X adalah suatu sampel random binominal dengan mean µ=np dan varian
σ2=npq; maka untuk n Æ ~ berlaku:
Z =
x − np
npq
B. Distribusi Penarikan Sampel
Distribusi penarikan sampel adalah distribusi peluang suatu statistik mengikuti dalil
limit pusat.
DALIL LIMIT PUSAT
Bila sampel random berukuran n ditarik dari suatu populasi tak hingga atau besar
dengan mean µ dan varian σ2, maka mean sampel x akan menyebar
menghampiri distribusi normal dengan mean µ x = µ dan standar deviasi σ x = σ / n
Z =
x − µ
σ / n
STATISTIKA - VARIABEL: Peluang Kontinu
Dalil limit pusat juga berlaku jika:
Sampel random berukuran n diambil dari populasi berhingga berukuran N dengan pemulihan.
Bagaimana jika sampel berukuran kecil (n<30)?
Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel
n<30 dan atau σ tidak diketahui. Koreksi bias ini dinamakan distribusi t.
STATISTIKA - VARIABEL: Peluang Kontinu
Distribusi t (ditemukan oleh W.S. Gosset – student t)
Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel
n<30 dan atau σ tidak diketahui. Koreksi bias ini dinamakan distribusi t.
Distribusi t. Bila x dan s2 adalah mean dan varians dari suatu sampel random berukuran n
uang diambil dari suatu populasi normal dengan mean µ dan σ2; maka:
x−µ
t=
s/ n
Dimana, t merupakan variabel yang terdistribusi sesuai distribusi t dengan derajat bebas
(v=n-1).
STATISTIKA - VARIABEL: Peluang Kontinu
Ilustrasi grafis untuk distribusi t:
•Kurva distribusi t untuk v= 2, 5, dan ~
v= ~
v= 5
v= 2
•Kurva distribusi t adalah setangkup
α
t1- α
0
α
tα
STATISTIKA - VARIABEL: Peluang Kontinu
Distribusi F:
Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random.
Statistik F:
s12 / σ 12
f = 2 2
s2 / σ 2
Dengan derajat bebas (degree of freedom)
v1=n1-1; v2=n2-1
Ingat. Jika fα(v1,v2) untuk fα dengan v1 dan v2 derajat bebas maka::
f1−α ( v1 , v 2 ) =
1
ILUSTRASI DISTRIBUSI F
f α ( v1 , v 2 )
f0.01(3, 8) = 7,59
f0.05(5, 11) = 3,20
0
α
STATISTIKA – Parameter Estimator
Pendugaan parameter atau parameter estimation adalah metode statistika
yang digunakan untuk menduga parameter menggunakan statistik.
Beberapa alasan untuk melakukan estimasi:
1. Keterbatasan waktu
2. Keterbatasan tenaga; dan
3. Keterbatasan biaya
Statistika menggunakan data yang berasal dari sampel untuk menduga
parameter dari populasi.
STATISTIKA – Parameter Estimator
Apa yang dimaksud dengan estimator?
Menurut Yitnosumarto (1990), estimator adalah suatu nilai variabel dari
statistik yang mungkin untuk sebuah parameter.
Apa yang dimaksud dengan nilai duga/estimation value?
Menurut Yitnosumarto (1990), estimation value adalah nilai dari estimator
yang didapat dengan menganalisis data dari suatu sampel.
Contoh:
Mean dari Ujian Akhir Nasional adalah 5,11 dan Varian sebesar 1,89.
STATISTIKA – Parameter Estimator
Point Estimator/Penduga Titik:
Pada point estimator, estimation value yang dihasilkan hanya berupa titik
pada suatu garis bilangan.
Misal:
X=x1, x2, x3, …, xn
Jika peluang x1 hingga xn untuk terpilih adalah sama, maka:
∑ x
i=n
x=
i =1
i
n
… yang adalah point estimator dari mean populasi.
STATISTIKA – Parameter Estimator
Sifat-sifat Parameter Estimator:
1. Unbias Estimator (tidak berbias)
Estimator haruslah mampu mendekati nilai sebenarnya dari parameter
yang diduga.
2. Efisien
Memiliki varian yang efisien.
)
V (Θ1 )
) < 1; Varian pertama, lebih efisien dibanding varian yang kedua
V (Θ 2 )
3. Konsisten
Jika selisih antara estimator dan parameter selalu mendekati nol, maka
suatu estimator memiliki sifat konsisten.
STATISTIKA – Parameter Estimator
Interval Estimator:
Point estimator tidak memberikan informasi yang cukup mengenai parameter
populasi, karena nilainya tergantung pada data dari sampel yang diambil.
Selanjutnya dikembangkan Interval Estimator dan Interval Estimation Value.
Catatan: Interval Estimator disebut sebagai Confidence Interval.
Contoh Notasi Estimasi:
b1 < Θ < b2
P(b1 < Θ < b2 ) = (1 − α )
Significance Level
Confidence Interval
STATISTIKA – Selang Kepercayaan
Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang
akan digunakan?
1. Identifikasi banyaknya populasi
2. Identifikasi parameter apa yang ditanyakan pada populasi
3. Identifikasi banyaknya sampel yang diambil
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk satu populasi, parameter mean µ, banyak sampel
n>=30 atau standar deviasi-nya σ diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi normal)
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
P( x − zα / 2
σ
n
< µ < x + zα / 2
σ
n
) = 1−α
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk satu populasi, parameter mean µ, banyak sampel
n<30 dan atau standar deviasi-nya σ tidak diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi t)
V=?
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
P( x − tα / 2,v
s
s
< µ < x + tα / 2,v
) = 1−α
n
n
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk satu populasi, parameter proporsi p, banyak
sampel n>=30.
Ilustrasi grafis untuk CI:
(mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal)
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
)
P( p − zα / 2
))
pq
)
< p < p + zα / 2
n
))
pq
) = 1−α
n
STATISTIKA – Selang Kepercayaan
Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang
akan digunakan?
1. Identifikasi banyaknya populasi
2. Identifikasi parameter apa yang ditanyakan pada populasi
3. Identifikasi banyaknya sampel yang diambil
Jika CI untuk satu populasi digunakan untuk menguji: apakah BESARnya ukuran-ukuran
pada sampel sama dengan nilai tertentu pada populasi,
Maka CI untuk dua populasi digunakan untuk menguji: apakah BEDA ukuran-ukuran pada
sampel sama dengan nilai tertentu pada populasi.
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak
sampel n>=30 atau standar deviasi-nya σ1 dan σ2 diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi normal)
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
P(( x1 − x2 ) − zα / 2 (σ 12 / n1 ) + (σ 22 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + zα / 2 (σ 12 / n1 ) + (σ 22 / n2 ) ) = 1 − α
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak
sampel n<30 atau standar deviasi-nya σ1 dan σ2 tidak diketahui; tetapi σ1=σ2
Ilustrasi grafis untuk CI: (mengikuti distribusi t)
V=?
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
P(( x1 − x2 ) − tα / 2,v .s p (1 / n1 ) + (1 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + tα / 2,v .s p (1 / n1 ) + (1 / n2 ) ) = 1 − α
(n1 − 1) s12 + (n2 − 1) s22
Hal lain yang perlu diketahui: s =
n1 + n2 − 2
2
p
v = n1 + n2 − 2
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak
sampel n<30 atau standar deviasi-nya σ1 dan σ2 tidak diketahui; tetapi σ1≠σ2
Ilustrasi grafis untuk CI: (mengikuti distribusi t)
α/2
V=?
α/2
CI=1-α
Bentuk Confidence Interval:
P(( x1 − x2 ) − tα / 2,v ( s12 / n1 ) + ( s22 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + tα / 2,v . ( s12 / n1 ) + ( s22 / n2 ) ) = 1 − α
( s12 / n1 + s22 / n2 ) 2
Hal lain yang perlu diketahui: v = 2
( s1 / n1 ) 2 ( s22 / n2 ) 2
v selalu dibulatkan ke atas
+
n1 − 1
n2 − 1
STATISTIKA – Selang Kepercayaan
Bagaimana saya dapat mengetahui apakah σ1=σ2 atau σ1≠σ2 ?
Bandingkanlah varian-nya sbb:
Ingat!!! Distribusi F:
Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random.
Statistik F:
s12
f = 2 ~ Fα ,v1 ,v2
s2
Dengan derajat bebas (degree of freedom)
v1=n1-1; v2=n2-1
Jika f<F, maka σ1=σ2, Jika f>F, maka σ1≠σ2
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk data berpasangan, parameter mean µd
Kata kunci: sebelum-sesudah, satu unit pengamatan diamati dua kali.
Ilustrasi grafis untuk CI: (mengikuti distribusi t)
α/2
V=?
α/2
CI=1-α
Bentuk Confidence Interval:
P( xd − tα / 2,v .sd / n < µ d < xd + tα / 2,v .sd / n = 1 − α
STATISTIKA – Selang Kepercayaan
Confidence Interval untuk dua populasi, parameter proporsi p1-p2, banyak
sampel n>=30.
Ilustrasi grafis untuk CI:
(mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal)
α/2
α/2
CI=1-α
Bentuk Confidence Interval:
) )
P(( p1 − p2 ) − zα / 2
))
) )
p1q1 p2 q2
) )
+
< p1 − p2 < ( p1 − p2 ) + zα / 2
n1
n2
))
) )
p1q1 p2 q2
+
) = 1−α
n1
n2
STATISTIKA – PENGUJIAN HIPOTESIS
“Sering kali untuk menarik suatu kesimpulan kita tidak mungkin meneliti
keseluruhan populasi karena kendala waktu, tenaga, dan biaya.
Statistika memberikan solusi untuk penarikan kesimpulan
menggunakan data-data yang kita dapatkan dari sampel. Penarikan
kesimpulan secara demikian dinamakan pengujian hipotesis”
STATISTIKA – PENGUJIAN HIPOTESIS
Hipotesis Statistik:
Pernyataan atau dugaan mengenai ciri-ciri atau sifat dari satu atau lebih
populasi
Catatan: benar atau salahnya suatu hipotesis tidak penah diketahui
kecuali kita memeriksa seluruh populasi.
Ada 2 Macam Hipotesis:
Hipotesis Nol:
Hipotesis yang dirumuskan dengan harapan akan ditolak.
Hipotesi Alternatif:
Hipotesis yang dirumuskan dengan harapan akan diterima
STATISTIKA – PENGUJIAN HIPOTESIS
Mengapa harus dilakukan PENGUJIAN HIPOTESIS?
Untuk mendapatkan cukup fakta yang dapat membantu kita menilai
derajat kebenaran suatu hipotesis.
KENYATAAN
DUGAAN
H0 benar H1 benar
H0 benar
ok
α
H1 benar
β
ok
Power of Test (Kekuatan Uji) = 1 - β
STATISTIKA – PENGUJIAN HIPOTESIS
Ilustrasi Grafis untuk
α dan β:
µ1
µ2
=β
=α
Catatan:
Peluang β tidak mungkin dihitung kecuali kita memiliki hipotesis
alternatif yang spesifik. (ditandai dengan “ = “)
STATISTIKA – PENGUJIAN HIPOTESIS
Contoh perhitungan
α dan β:
Seorang meneliti vaksin influensa jenis baru. Jika 25% penerima
vaksin masih memiliki ketahanan terhadap influensa lebih dari 2
tahun, maka vaksin tersebut dinyatakan lebih baik dari vaksin yang
lama.
Data yang didapatkan (9 dari 20 penerima vaksin masih memiliki ketahanan terhadap influensa
lebih dari 2 tahun)
Hipotesis:
H0: p = 25%
H1: p > 25%
STATISTIKA – PENGUJIAN HIPOTESIS
Perhitungan
α:
α = P(error jenis 1)
= P(X>=9 jika p=25%)
=
20
∑ b( x;20;0.25)
x =9
8
= 1 − ∑ b( x;20;0.25)
x =0
= 0,0409
Perhitungan
β: jika p=50%
β = P(error jenis 2)
= P(X<9 jika p=50%)
8
Catatan:
Untuk memperkecil α dan β
maka n harus diperbesar
= ∑ b( x;20;0.25)
x =0
= 0,2517
STATISTIKA – PENGUJIAN HIPOTESIS
Uji 1 arah (one tail test) dan uji 2 arah (two tail test):
Bersifat 1 arah:
H0: Ө = Ө0
atau
H1: Ө > Ө0
H0: Ө = Ө0
H1: Ө < Ө0
α
α
Bersifat 2 arah:
H0: Ө = Ө0
H1: Ө ≠ Ө0
α/2
α/2
STATISTIKA – PENGUJIAN HIPOTESIS
Contoh kasus:
Bersifat 1 arah:
Perusahaan rokok menyatakan bahwa kadar nikotin rokoknya TIDAK
MELEBIHI 2,5 mg
Bersifat 2 arah:
Perusahan rokok menyatakan bahwa kadar nikotin rokoknya
ADALAH 2,5 mg
Sifat 1 arah dan 2 arah, ditentukan dari kejelasan ARAH PERNYATAAN.
Sifat 1 arah; TIDAK LEBIH, KURANG DARI, LEBIH DARI
Sifat 2 arah; ADALAH, SAMA DENGAN
STATISTIKA – PENGUJIAN HIPOTESIS
Uji Hipotesis:
6 Langkah Menguji Statistik:
1. Nyatakan hipotesis nol-nya H0 bahwa Ө = Ө0
2. Pilihlah hipotesis alternatif H1 yang sesuai diantara Ө > Ө0, Ө < Ө0,
atau Ө ≠ Ө0
3. Tentukan taraf nyata (significance)
4. Pilih statistik uji (statistical test) yang sesuai dan tentukan wilayah
kritiknya
5. Hitung nilai statistik uji berdasarkan data pada contoh
6. KEPUTUSAN: Tolak H0 bila nilai uji statistik tersebut jatuh pada
wilayah kritik.
Saya akan membantu anda!!!
Setiap kali anda diminta untuk menduga suatu
hipotesis; tanyakanlah Hal-hal berikut!!!
Pendugaan
Hipotesis
Mean
1 Populasi
Varian
2 Populasi
1 Populasi
2 Populasi
Proporsi
1 Populasi
2 Populasi
Saya akan membantu anda!!!
Jika bertanya tentang Mean???
Mean
1 Populasi
n>=30, atau
σ diketahui
Nilainya; Rumus 1
n<30; dan
σ tidak diketahui
Nilainya;
Rumus 2
2 Populasi
Tidak
Berpasangan
Berpasangan;
Rumus 6
Saya akan membantu anda!!!
Jika bertanya tentang Mean 2 Populasi Tidak
Berpasangan???
Tidak
Berpasangan
n<30;
n>=30;
atau σ1 dan σ2
diketahui nilainya;
Rumus 3
n<30;
atau σ1 dan σ2
tidak diketahui nilainya; σ1=σ2;
Rumus 4
atau σ1 dan σ2
tidak diketahui nilainya; σ1≠σ2;
Rumus 5
Saya akan membantu anda!!!
Jika bertanya tentang Varians???
Varians
1 Populasi;
Rumus 7
2 Populasi;
Rumus 8
Jika bertanya tentang Proporsi???
Proporsi
1 Populasi;
Rumus 9
2 Populasi;
Rumus 10
STATISTIKA – TABEL STATISTIK UJI
Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
SATU POPULASI:
H0
µ= µ0
RUMUS 1
µ= µ0
RUMUS 2
KRITERIA
n>=30; atau σ
diketahui nilainya
n<30; dan σ nilainya
tidak diketahui
RUMUS
uji z :
x − µ0
z=
σ/ n
uji t :
x − µ0
t=
s/ n
STATISTIKA – TABEL STATISTIK UJI
Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
DUA POPULASI:
H0
µ1-µ2=d0
RUMUS 3
µ1-µ2=d0
RUMUS 4
KRITERIA
n>=30; atau σ1 dan σ2
diketahui nilainya
RUMUS
uji z :
z=
n<30; atau σ1 dan σ2
diketahui tidak
nilainya; σ1=σ2
( x1 − x 2 ) − d 0
(σ 12 / n1 ) + (σ 22 / n2 )
uji t :
t=
( x1 − x 2 ) − d 0
s p (1 / n1 ) + (1 / n2 )
(n1 − 1) s12 + (n2 − 1) s22
s =
n1 + n2 − 2
2
p
v = n1 + n2 − 2
STATISTIKA – TABEL STATISTIK UJI
Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
DUA POPULASI:
H0
µ1-µ2=d0
RUMUS 5
KRITERIA
n<30; atau σ1 dan σ2
diketahui tidak
nilainya; σ1≠σ2
RUMUS
uji t :
t=
( x1 − x 2 ) − d 0
( s12 / n1 ) + ( s22 / n2 )
( s12 / n1 + s22 / n2 ) 2
v= 2
( s1 / n1 ) 2 ( s22 / n2 ) 2
+
n1 − 1
n2 − 1
µd=d0
RUMUS 6
pengamatan
berpasangan
uji t :
t=
d − d0
sd / n
STATISTIKA – TABEL STATISTIK UJI
Tabel pengujian HIPOTESIS untuk Varian
H0
σ2= σ02
KRITERIA
Tidak ada
RUMUS 7
σ12= σ22
RUMUS 8
RUMUS
uji χ 2 :
χ =
2
Jika s1>s2 gunakan
rumus 1.
Jika s1<s2 gunakan
rumus 2
(n − 1) s 2
σ
2
0
; v = n −1
uji F : (rumus 1)
s12 (v , v )
F= 2; 1 2
s2
uji F : (rumus 2)
s22
F = 2 ; (v2 , v1 )
s1
STATISTIKA – TABEL STATISTIK UJI
Tabel pengujian HIPOTESIS untuk Proporsi
H0
p= p0
KRITERIA
n>=30
RUMUS 10
uji z :
z=
RUMUS 9
p1-p2= d0
RUMUS
n>=30
x − np0
np0 q0
uji z :
( pˆ − pˆ 2 ) − ( p1 − p2 )
z= 1
pˆ qˆ[(1 / n1 ) + (1 / n2 )]
STATISTIKA – CONTOH PENGUJIAN
Halaman 344 no. 6
Jaringan restoran MacBurger mengklaim bahwa rata-rata waktu tunggu pelanggan adalah 3
menit dengan standar deviasi populasi 1 menit. Departemen quality assurance menemukan
bahwa dari 50 pelanggan di cabang Warren Road MacBurger memiliki rata-rata waktu
tunggu 2,75. Dengan taraf nyata (level of significance) 0,05; dapatkah disimpulkan bahwa
rata-rata waktu tunggu kurang dari 3 menit?
Langkah menjawab:
1. Menentukan Hipotesis Null
2. Menentukan Hipotesi Alternatif
H0: µ = 3 menit
H1: µ < 3 menit
3. Tentukan taraf signifikansi: α =5%
STATISTIKA – CONTOH PENGUJIAN
Halaman 344 no. 6
4. Tentukan statistik uji yang sesuai dan wilayah kritiknya: Rumus 1.
Z = -1,64
5. Hitung statistik uji-nya
x − µ 0 2.75 − 3
z=
=
= −1,768
σ / n 1 / 50
Tolak H0
Terima H0
6. Kesimpulan:
Tolak H0: Cukup bukti untuk menyatakan bahwa waktu tunggu pelanggan kurang dari
3 menit.
STATISTIKA – Latihan
Try This (don’t be fooled by a complex story)
Secara teoritis, chip micro processor yang diproduksi dengan cara baru
mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut
perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata
dari 10 chip micro processor prototype tersebut mampu berfungsi normal
rata-rata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut
dapat dinyatakan benar pada taraf signifikansi 5%?
STATISTIKA – Latihan
Latihan Bab 11:
3. Gibbs Baby Food Company ingin membandingkan berat
bayi yang menggunakan produknya dibanding dengan
kompetitornya. Suatu sampel yang terdiri dari 40 bayi yang
mengkonsumsi Gibbs Baby Food memiliki berat rata-rata 7,6
pounds dengan standar deviasi 2,3 pounds. Suatu sampel
yang lain terdiri dari 55 bayi yang mengkonsumsi makanan
merek kompetitor memiliki berat rata-rata 8,1 pounds dengan
standar deviasi 2,9 pounds. Pada taraf signifikansi 0,05,
dapatkah kita menyimpulkan bahwa bayi yang mengkonsumsi
Gibbs Baby Food memiliki berat badan lebih rendah 0,5
pounds dibanding yang mengkonsumsi produk kompetitor?
STATISTIKA – Latihan
Latihan Bab 11:
4. Departemen riset yang berkantor di New Hampshire
Insurance menyusun sebuah riset berkelanjutan tentang
penyebab kecelakaan mobil, karakteristik pengemudi, dan
lainnya. Suatu sampel random yang terdiri 400 catatan
kepolisian menemukan bahwa 120 orang yang berstatus
single mengalami kecelakaan setidaknya satu kali dalam tiga
tahun terakhir. Sedangkan dari sampel random yang terdiri
600 catatan kepolisian menemukan,150 orang yang berstatus
menikah mengalami kecelakaan setidaknya satu kali dalam
tiga tahun terakhir. Dengan taraf signifikansi 0,05, apakah
dapat disimpulkan bahwa proporsi orang yang single dan
yang menikah yang mengalami kecelakaan setidaknya satu
kali dalam tiga tahun terakhir adalah berbeda?
STATISTIKA – Latihan
Latihan Bab 11:
17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk
Nexus Media, Inc. Dia ingin membandingkan antara
pengeluaran perjalanan harian antara staf penjualan dan staf
pemeriksa anggaran. Dia mengumpulkan data sebagai
berikut.
Sales 131
135
146
165
136
142
Audit 130
102
129
143
149
120
139
Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan
bahwa rata-rata pengeluaran perjalanan harian staf penjualan
lebih besar dibanding staf pemeriksa anggaran?
STATISTIKA – Latihan
Latihan Bab 11:
21. Suatu artikel akhir di The Wall Street Journal
membandingkan antara biaya untuk mengadopsi anak dari
China dan Rusia. Dari 16 sampel kasus adopsi anak dari
China membutuhkan biaya rata-rata $11.045 dengan standar
deviasi $835. Sedangkan dari 18 kasus adopsi anak dari
Rusia membutuhkan biaya rata-rata $12.840 dengan standar
deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah
disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia
lebih tinggi?
STATISTIKA – Latihan
Latihan Bab 11:
26. Pemerintah federal akhir-akhir ini mengadakan program
pendanaan khusus untuk menurunkan angka kejahatan di
daerah yang rawan. Suatu penelitian di 8 daerah rawan di
Miami Florida menemukan data sebagai berikut.
A
B
C
D
E
F
G
H
Sblm 14
7
4
5
17
12
8
9
Ssdah 2
7
3
6
8
13
3
5
Dapatkah program pemerintah tersebut dikatakan berhasil?
Gunakan taraf signifikansi 0,01.
STATISTIKA – Latihan
Try This (don’t be fooled by a complex story)
Secara teoritis, chip micro processor yang diproduksi dengan
cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk
menguji teori tersebut perusahaan memproduksi 10 prototype
chip micro processor. Jika ternyata dari 10 chip micro
processor prototype tersebut mampu berfungsi normal ratarata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori
tersebut dapat dinyatakan benar pada taraf signifikansi 5%?
STATISTIKA – Latihan
Latihan Bab 11:
17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk
Nexus Media, Inc. Dia ingin membandingkan antara
pengeluaran perjalanan harian antara staf penjualan dan staf
pemeriksa anggaran. Dia mengumpulkan data sebagai
berikut.
Sales 131
135
146
165
136
142
Audit 130
102
129
143
149
120
139
Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan
bahwa rata-rata pengeluaran perjalanan harian staf penjualan
lebih besar dibanding staf pemeriksa anggaran?
STATISTIKA – Latihan
Latihan Bab 11:
21. Suatu artikel akhir di The Wall Street Journal
membandingkan antara biaya untuk mengadopsi anak dari
China dan Rusia. Dari 16 sampel kasus adopsi anak dari
China membutuhkan biaya rata-rata $11.045 dengan standar
deviasi $835. Sedangkan dari 18 kasus adopsi anak dari
Rusia membutuhkan biaya rata-rata $12.840 dengan standar
deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah
disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia
lebih tinggi?
STATISTIKA – Latihan
Latihan Bab 11:
26. Pemerintah federal akhir-akhir ini mengadakan program
pendanaan khusus untuk menurunkan angka kejahatan di
daerah yang rawan. Suatu penelitian di 8 daerah rawan di
Miami Florida menemukan data sebagai berikut.
A
B
C
D
E
F
G
H
Sblm 14
7
4
5
17
12
8
9
Ssdah 2
7
3
6
8
13
3
5
Dapatkah program pemerintah tersebut dikatakan berhasil?
Gunakan taraf signifikansi 0,01.
STATISTIKA – Latihan
CHAPTER TEST:
Chapter 10; No. 50
Berdasarkan hasil penelitian American Pet Food Dealer Association, 63% rumah
tangga di Amerika, memiliki hewan peliharaan. Sebuah laporan yang sedang
disusun untuk editorial San Fransisco Chronicle. Sebagai bagian dari editorial,
suatu sampel acak yang terdiri dari 300 rumah tangga, didapati 210 di antaranya
memiliki hewan peliharaan. Apakah data tersebut bertentangan dengan data yang
dimiliki American Pet Food Dealer Association? Jika diberikan level of significance
5%
STATISTIKA – Latihan
CHAPTER TEST:
Chapter 11; No. 32
Suatu perusahaan pembuat komputer memiliki layanan hotline untuk customernya.
Perusahaan tersebut menyadari bahwa kemampuan teknisi mereka untuk
menyelesaikan masalah secara tepat dan tepat melalui layanan hotline
berhubungan erat dengan citra perusahaan. Dari 35 telepon yang diterima
berkaitan dengan masalah software, dibutuhkan waktu rata-rata 18 menit dengan
standar deviasi 4,2 menit untuk memberikan solusi kepada customer. Sedangkan
dari 45 telepon yang diterima berkaitan dengan masalah hardware, dibutuhkan
waktu rata-rata 15,5 menit dengan standar deviasi 3,9 menit untuk memberikan
solusi kepada customer. Pada taraf signifikansi 5%, dapatkan disimpulkan bahwa
waktu yang dibutuhkan untuk menyelesaikan masalah yang berkaitan dengan
software lebih lama dibandingkan untuk menyelesaikan masalah hardware?
Berapakan nilai p-value nya?
P-Value adalah peluang menolak H0 berdasarkan hasil observasi,
padahal pada kenyataannya H0 adalah benar.
STATISTIKA – Latihan
CHAPTER TEST:
Chapter 11; No. 33
Perusahaan Advil yang membuat obat pereda sakit kepala, meneliti formula baru
yang diklaim lebih efektif. Untuk mengevaluasinya, formula baru tersebut
dicobakan kepada 200 orang responden. Setelah satu bulan penggunaan, 180
orang responden berpendapat bahwa formula baru tersebut lebih efektif. Pada saat
yang bersamaan, 300 orang responden diminta untuk menguji obat yang lama
tetapi diberi tahu bahwa obat yang sedang mereka coba adalah “formula baru”.
Dari kelompok responden ini, 261 responden menyatakan bahwa obat yang
mereka coba lebih ampuh. Dengan level signifikansi 5%, dapatkah disimpulkan
bahwa obat yang baru lebih efektif!
STATISTIKA – Latihan Pengembangan
LATIHAN PENGEMBANGAN: (Perhatikan Bagaimana Para Peneliti Menggunakan Cara
Sederhana untuk Menguji Hal Berikut)
Seorang Psikolog berpendapat bahwa kondisi stress akan memperlemah ingatan
jangka pendek seseorang. Percobaan dilakukan terhadap 100 mahasiswa yang
dipilih secara acak yang terbagi menjadi 2 kelompok, masing-masing 50
mahasiswa. Percobaan dilakukan dengan memperkenalkan 2 buah simpul tali A
dan B untuk kegunaan yang sama dan sama dalam hal kesulitan pembuatannya.
Dua minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan
dengan simpul tali A, sedangkan mahasiswa pada kelompok kedua diperkenalkan
dengan simpul tali B. Satu minggu sebelum UAS, mahasiswa pada kelompok
pertama diperkenalkan dengan simpul tali B, dan sebaliknya. Setelah UAS yang
stress, 100 Mahasiswa tersebut diminta untuk membuat simpul dengan kegunaan
tersebut. Jika hasilnya adalah sebagai berikut:
Membuat dengan cara
Lama
Baru
62
38
Dapatkah disimpulkan bahwa pendapat Psikolog tersebut benar? Sig. 0,05
STATISTIKA-Skala Ukur Data dan Korelasi
T I PE S K A L A U K U R D A T A
Skala Ukur Data
Non-metric
nominal
ordinal
metric
interval
ratio
STATISTIKA-Skala Ukur Data dan Korelasi
Skala Ukur Nominal
Angka yang diberikan kepada obyek
hanya sebagai label atau nama saja.
Contoh:
Nomor Telepon dan Nomor Pemain Sepak
Bola
STATISTIKA-Skala Ukur Data dan Korelasi
Skala Ukur Ordinal
Angka yang diberikan kepada suatu
obyek memiliki urutan.
Contoh:
Pemenang Lomba F1 atau MotoGP,
urutan juara kelas.
STATISTIKA-Skala Ukur Data dan Korelasi
Skala Ukur Interval
Angka yang diberikan kepada objek
memiliki semua sifat skala ukur ordinal,
ditambah dengan sifat kesamaan jarak
antara masing-masing pengukuran.
TETAPI RASIO antar angka-angka
tersebut tidak memiliki arti.
Contoh:
Derajat celcius atau fahreinheit, dan tanggal
dalam kalender
STATISTIKA-Skala Ukur Data dan Korelasi
Skala Ukur Rasio
Angka yang diberikan kepada obyek
memiliki semua sifat dari skala ukur
interval dan rasio antara angka-anka
tersebut memiliki arti
Contoh:
Jarak dalam kilometer
STATISTIKA-Skala Ukur Data dan Korelasi
Skala Ukur Data
Deskripsi
Urutan
Jarak
Rasio
Nominal
Ya
Tidak
Tidak
Tidak
Ordinal
Ya
Ya
Tidak
Tidak
Interval
Ya
Ya
Ya
Tidak
Ratio
Ya
Ya
Ya
Ya
STATISTIKA-Skala Ukur Data dan Korelasi
Seringkali orang
membicarakan
keterkaitan antara
suatu hal dengan hal
lainnya. Korelasi
adalah cara ilmiah
yang akan
memberikan informasi
mengenai hubungan
antara dua buah
variabel.
STATISTIKA-Skala Ukur Data dan Korelasi
Berdasarkan Gambar Ilustrasi tersebut. Apa yang dapat
anda katakan tentang korelasi:
1. Korelasi menyatakan kekuatan hubungan antara dua buah
variabel.
2. Semakin kuat hubungan antara dua buah variabel, semakin tinggi
nilai korelasinya.
STATISTIKA-Skala Ukur Data dan Korelasi
KORELASI SESUAI SKALA UKUR DATA
Nominal:
Phi coefficient
Ordinal:
Spearman’s correlation, Kendall’s
correlation
Interval-Ratio:
Pearson Correlation
STATISTIKA-Skala Ukur Data dan Korelasi
NILAI KORELASI DATA
-1.0
Nominal
Ordinal
Interval
Ratio
-0.6
-0.3 -0.1 0 +0.1 +0.3
+0.6
+1.0
Catatan
Tanda – dan +
menandakan
arah hubungan.
(+) semakin tinggi
nilai suatu variabel
semakin tinggi juga
nilai variabel lainnya
(-) semakin tinggi
nilai suatu variabel
semakin rendah
nilai variabel lainnya
STATISTIKA-Skala Ukur Data dan Korelasi
Nominal: Phi coefficient
Langkah menghitung Phi-Coefficient:
1. Buat Tabel Kontingensi
2. Hitung Nilai Chi-Square tabel tersebut dgn rumus:
k
χ2 =
l
∑∑ (O
i =1 j =1
ij
− Eij )
2
Eij
3. Hitung Phi-Coefficient menggunakan rumus:
ϕ=
χ
2
n
Catatan:
Oij = frekuensi observasi
Eij = (ni. x n.j)/n
frekuensi ekspektasi
n = banyaknya sampel
STATISTIKA-Skala Ukur Data dan Korelasi
Nominal: Phi coefficient
Contoh Kasus:
Seorang ahli pemasaran ingin meneliti apakah co-hort (generasi) tertentu
memiliki kecendrungan tertentu dalam jenis musik yang disukainya.
---adakah hubungan antara co-hort dan jenis musik tertentu---
Data yang dikumpulkan sbb:
Musik
Rock
Non-Musik TOTAL
Rock
80-an
43
9
52
90-an
44
4
48
13
100
TOTAL 87
STATISTIKA-Skala Ukur Data dan Korelasi
Nominal: Phi coefficient
Langkah Pengerjaannya:
1. Buat Tabel Kontingesi
2. Hitung nilai Chi-Squarenya:
E11 = (n1. x n.1)/n = (52 x 87)/100 = 45.24
E21 = (n2. x n.1)/n = (48 x 87)/100 = 41.76
E12 = (n1. x n.2)/n = (52 x 13)/100 = 6.76
E22 = (n2. x n.2)/n = (48 x 13)/100 = 6.24
Chi-Square: χ
2
χ 2 = (43 − 45.24)2 / 45.24 + (44 − 41.76)2 / 41.76
+ (9 − 6.76)2 / 6.76 + (4 − 6.24)2 / 6.24
= 1.778
STATISTIKA-Skala Ukur Data dan Korelasi
Nominal: Phi coefficient
Langkah Pengerjaannya:
3. Hitung phi-coefficient nya:
ϕ=
1.778
= 0.133
100
Kesimpulannya:
Ada hubungan yang lemah antara co-hort dan jenis musik tertentu
STATISTIKA-Skala Ukur Data dan Korelasi
Ordinal: Spearman Correlation
Rumus rho-coefficient:
n
ρ = 1−
6∑ d i2
i =1
2
n(n − 1)
;
d = different / beda ranking
Contoh kasus:
Seorang ahli pendidikan ingin mengetahui adakah hubungan antara IQ dan
lamanya jam yang dihabiskan untuk menonton televisi dalam seminggu.
Berikut adalah datanya:
IQ (i)
Hours of TV
per week (t)
86 97 99 100 100 103 106 110 113 113
0 20 28
50
28
28
7
17
7
12
STATISTIKA-Skala Ukur Data dan Korelasi
Ordinal: Spearman Correlation
Langkah pengerjaan:
Hours of
TV per
week (t)
IQ (i)
86
97
99
100
100
103
106
110
113
113
0
20
28
50
28
28
7
17
7
12
rank (i)
rank (t)
1
2
3
4.5
4.5
6
7
8
9.5
9.5
1
6
8
10
8
8
2.5
5
2.5
4
d2
d
0
4
5
5.5
3.5
2
4.5
3
7
5.5
0
16
25
30.25
12.25
4
20.25
9
49
30.25
Hitung Rumus:
ρ = 1−
6(196)
= −0.188
10(99)
STATISTIKA-Skala Ukur Data dan Korelasi
Ordinal: Spearman Correlation
Langkah pengerjaan:
Hitung Rumus:
ρ = 1−
6(196)
= −0.188
10(99)
Kesimpulan:
Terdapat korelasi yang lemah dan negatif antara IQ dan lamanya jam yang
dihabiskan untuk menonton televisi selama seminggu
STATISTIKA-Skala Ukur Data dan Korelasi
Ordinal: Kendall Correlation
Rumus tau-coefficient:
τ=
2P
1
n(n − 1)
2
−1
Contoh kasus:
Seorang ahli geniologi ingin meneliti, apakah ada hubungan antara tinggi dan
berat badan seseorang. Data yang didapat ternyata tidak sempurna sehingga
hanya mendapat data berbentuk ranking.
Person
A B C D E F G H
Rank by Height 1 2
3 4 5
6 7
8
Rank by Weight 3 4
1 2 5
7 8
6
STATISTIKA-Skala Ukur Data dan Korelasi
Ordinal: Kendall Correlation
Langkah pengerjaan:
P = 5 + 4 + 5 + 4 + 3 + 1 + 0 + 0 = 22
2(22)
− 1 = 0.57
τ=
1
(8)(7)
2
Kesimpulan:
Terdapat korelasi yang sedang antara tinggi dan berat badan seseorang
STATISTIKA-Skala Ukur Data dan Korelasi
Rasio: Pearson Correlation
Rumus r coefficient:
rxy =
S xy
S x .S y
Catatan:
n
Sx =
∑ (x − x)
i =1
n
2
i
; St.Dev. x
n −1
n
S xy =
∑ ( x − x )( y
i =1
i
n −1
i
Sy =
∑(y
i =1
i
− y)2
n −1
− y)
Kovarian antara x dan y
; St.Dev. y
STATISTIKA-Skala Ukur Data dan Korelasi
Rasio: Pearson Correlation
Contoh kasus:
Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu.
Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah)
dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:
Merk
Biaya Iklan
Nilai Penjualan
A
40
385
B
20
400
C
25
395
D
20
365
E
30
475
F
50
440
G
40
490
H
20
420
Apakah ada hubungan antara biaya iklan dan nilai penjualan?
I
50
560
J
40
525
K
25
480
L
50
510
STATISTIKA-Skala Ukur Data dan Korelasi
Rasio: Pearson Correlation
Langkah Pengerjaannya:
Merk
A
B
C
D
E
F
G
H
I
J
K
L
Biaya Iklan
40
20
25
20
30
50
40
20
50
40
25
50
Nilai
Penjualan
385
400
395
365
475
440
490
420
560
525
480
510
(x − x)
5.83
-14.17
-9.17
-14.17
-4.17
15.83
5.83
-14.17
15.83
5.83
-9.17
15.83
Total
( x − x )2
( y − y)
34.03
-68.75
200.69
-53.75
84.03
-58.75
200.69
-88.75
17.36
21.25
250.69
-13.75
34.03
36.25
200.69
-33.75
250.69
106.25
34.03
71.25
84.03
26.25
250.69
56.25
1641.67 Total
( y − y)2
4726.56
2889.06
3451.56
7876.56
451.56
189.06
1314.06
1139.06
11289.06
5076.56
689.06
3164.06
42256.25
STATISTIKA-Skala Ukur Data dan Korelasi
Rasio: Pearson Correlation
Langkah Pengerjaannya:
Merk
A
B
C
D
E
F
G
H
I
J
K
L
Biaya Iklan
40
20
25
20
30
50
40
20
50
40
25
50
Nilai
( x − x )( y − y )
Penjualan
385
-401.04
400
761.46
395
538.54
365
1257.29
475
-88.54
440
-217.71
490
211.46
420
478.13
560
1682.29
525
415.63
480
-240.63
510
890.63
5287.50
Total
Hitung Rumus:
Sxy= (5287.50)/11
Sx = sqrt(1641.67/11)
Sy = sqrt(42256.25/11)
r = 0.635
Kesimpulan:
Ada hubungan yang kuat dan positif antara biaya iklan dan nilai penjualan
STATISTIKA-Skala Ukur Data dan Korelasi
Contoh kasus:
Pikirkanlah kasus-kasus pemasaran di bawah ini, tentukan dengan skala ukur apa
variabel-variabelnya dapat diukur dan korelasi apa yang tepat untuk variabelvariabel tersebut.
- Market Share ada hubungannya dengan Brand Share
- Kepuasan berhubungan dengan kualitas layanan
- Preferensi berhubungan dengan keputusan membeli
STATISTIKA-Regresi Linier Sederhana
Jika analisis korelasi digunakan untuk mengukur arah dan kekuatan
hubungan antara dua buah variabel. Maka kemudian muncul pertanyaan,
apakah mungkin untuk menduga nilai dari suatu variabel, jika nilai
variabel lainnya diketahui?
ANALISIS
REGRESI LINIER
ADALAH
JAWABANNYA
STATISTIKA-Regresi Linier Sederhana
ANALISIS REGRESI LINIER SEDERHANA
Digunakan untuk menduga nilai suatu variabel, jika nilai variabel lainnya diketahui.
Analisis regresi linier sederhana hanya melibatkan satu buah variabel independen
(x), dan satu variabel dependen (y).
VARIABEL INDEPENDEN
Variabel yang menentukan nilai dari variabel dependen.
BAGAIMANA DENGAN ARTI VARIABEL DEPENDEN?
Catatan:
Jika banyaknya variabel independen yang digunakan untuk menduga nilai variabel
dependen banyaknya lebih dari satu maka digunakan analisis regresi linier berganda.
STATISTIKA-Regresi Linier Sederhana
Contoh kasus:
Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu.
Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah)
dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:
Merk
Biaya Iklan
Nilai Penjualan
A
40
385
B
20
400
C
25
395
D
20
365
E
30
475
F
50
440
G
40
490
H
20
420
I
50
560
J
40
525
K
25
480
Jika Equitas Merk dari masing-masing merk dianggap sama kuatnya, tentukan:
variabel independen, variabel dependen, dan alasannya!
L
50
510
STATISTIKA-Regresi Linier Sederhana
BENTUK FUNGSI MATEMATIS DARI REGRESI LINIER SEDERHANA:
ƒ UNTUK POPULASI
Y = α + βX
ƒ UNTUK SAMPEL
Y = a + bx + e
ƒ UNTUK MODEL PENDUGAAN
yˆ = a + bx
Y=variabel dependen
X; x=variabel independen
α;a=konstanta
β;b=koefisien
e=error fungsi
ŷ =nilai duga dari variabel dependen
STATISTIKA-Regresi Linier Sederhana
BAGAIMANA MENDAPATKAN NILAI untuk konstanta (a) dan
koefisien (b)?
a = y − bx
b=
S xy
S x2
y
x
= Mean dari y
= Mean dari x
S xy = Kovarian antara x dan y
S x2 = Varian dari x
STATISTIKA-Regresi Linier Sederhana
UNTUK KASUS MUDAHMAN, BERAPAKAH NILAI konstanta (a) dan
koefisien (b)?
a = y − bx
b=
n
S xy =
S xy
S x2
a = (453.750) − (3.221)(34.167)
= 343.706
∑ ( xi − x )( yi − y )
i =1
n −1
n
S x2 =
∑ ( xi − x )
i =1
2
n −1
440.625
b = 149
.242
= 3.221
STATISTIKA-Regresi Linier Sederhana
UNTUK KASUS MUDAHMAN, BAGAIMANAKAH MODEL PENDUGAAN
(Estimation Model) –nya?
ŷ = nilai duga dari nilai penjualan
yˆ = 343.706 + 3.221x
x = biaya iklan
SEHINGGA:
Merk
Biaya Iklan
Nilai Penjualan
Nilai Duga dari Nilai Penjualan
Merk
Biaya Iklan
Nilai Penjualan
Nilai Duga dari Nilai Penjualan
A
B
C
D
E
F
40
20
25
20
30
50
385
400
395
365
475
440
472.546 408.126 424.231 408.126 440.336 504.756
G
H
I
J
K
L
40
20
50
40
25
50
490
420
560
525
480
510
472.546 408.126 504.756 472.546 424.231 504.756
STATISTIKA-Regresi Linier Sederhana
MENGUJI MODEL REGRESI LINIER SEDERHANA – Uji Serentak
Digunakan untuk menguji: apakah model regresi linier sederhana tepat
digunakan sebagai model pendugaan?
H0 = model regresi linier sederhana tidak tepat digunakan sebagai model pendugaan
H1 = model regresi linier sederhana tepat digunakan sebagai model pendugaan
STATISTIKA-Regresi Linier Sederhana
UJI SERENTAK: Menggunakan tabel ANOVA (Analysis of Varian)
Source
Sum of
Degree of
Mean Square
Square (SS) Freedom (DF)
(MS)
∑ (yˆ − yˆ )
n
Regresi
2
i −1
1
n
Error
2
(
)
e
−
e
∑
i−1
n-2
n
Total
2
(
)
y
−
y
∑
i −1
n-1
F
SSregresi MSregres
MSerror
1
SSerror
n−2
STATISTIKA-Regresi Linier Sederhana
UJI SERENTAK: Untuk kasus Mudahman
Source
Sum of
Degree of
Mean Square
Square (SS) Freedom (DF)
(MS)
Regresi
17031.74
1
17031.74
Error
25224.51
10
2522.45
Total
42256.25
11
F
6.75
Selanjutnya:
F∞F(αv1 ,v2 )
05
6.75∞F(10,.10
) = 4.96
∴ tolak H 0
model regresi linier sederhana tepat digunakan
sebagai model pendugaan
STATISTIKA-Regresi Linier Sederhana
MENGUJI MODEL REGRESI LINIER SEDERHANA – Uji Parsial
Jika dari ANOVA diketahui bahwa:
model regresi linier sederhana tepat digunakan sebagai model pendugaan
Maka, muncul pertanyaan:
Apakah konstanta (a) dan koefisien (b) signifikan?
“Everything should be made as simple as possible, but not
simpler” Albert Einstein
STATISTIKA-Regresi Linier Sederhana
UJI PARSIAL untuk Konstanta:
t=
(a − α )S x
n(n − 1)
n
Se
∞
∑x
i =1
(b − β )S x
Se
vs
H1 : α ≠ 0
tα ,n −1
2
i
UJI PARSIAL untuk Koefisien:
t=
H0 : α = 0
n −1
∞
Catatan:
Sx adalah standar deviasi bagi x
Se adalah standar deviasi bagi error
H0 : β = 0
tα ,n −1
vs
H1 : β ≠ 0
STATISTIKA-Regresi Linier Sederhana
UJI PARSIAL - konstanta: Untuk kasus Mudahman
t=
(343.706 − 0)(12.216)
12(11)
∞
t0.05,11
t = 7.675
∞
t0.05,11 = 2.228
50.224 15650
∴ tolak H 0 Nilai konstanta signifikan berbeda dari nilai 0
UJI PARSIAL - koefisien: Untuk kasus Mudahman
t=
(3.221 − 0)(12.216) 11
50.224
t = 2.598
∞
t0.05,11
∞
t0.05,11 = 2.228
∴ tolak H 0 Nilai koefisien signifikan berbeda dari nilai 0
Sehingga Model Regresi Linier Sederhana-nya adalah
yˆ = 343.706 + 3.221x
STATISTIKA-Regresi Linier Sederhana
Sehingga Model Regresi Linier Sederhana-nya adalah
yˆ = 343.706 + 3.221x
Selanjutnya:
Mudahman ingin membuat merk sepatu yang baru. Jika Mudahman memiliki pos
biaya iklan sebesar 50 juta rupiah. Ramalkanlah nilai penjualan yang mungkin
didapatkan oleh Mudahman!
yˆ = 343.706 + 3.221x
yˆ = 343.706 + 3.221(50)
= 504.756
Nilai penjualan yang mungkin didapatkan oleh Mudahman adalah 504.706
juta rupiah.
Download