Analisa Data Statistik

advertisement
Analisa Data Statistik
Ratih Setyaningrum , MT
Referensi

Agoes Soehianie, Ph.D
Daftar Isi

Inferensi Statistik
Hipotesa Statistik : Konsep Umum
Hipotesa statistik adalah sebuah klaim/pernyataan atau conjecture
tentang populasi.
Contoh masalah yg akan dijawab dengan hipotesa statistik:
Apakah merokok menaikkan resiko kanker?
Apakah tipe darah ada hubungannya dengan berat badan?
Berapa persen pemilih yg akan memilih calon A sebagai
presiden?
Benar atau tidaknya sebuah hipotesa statistik secara mutlak hanya
akan diperoleh bilamana seluruh populasi dipelajari. Hal ini sulit
atau tidak mungkin pada banyak kasus. Sehingga diambil sampel
saja, berdasarkan data dari sampel kemudian diambil keputusan
untuk menerima atau menolak hipotesa tentang populasi.
Situasi Yang Mungking Dalam Test Hipotesa Statistik
H0 benar
H0 salah
H0 Tidak ditolak Keputusan Benar Error Tipe II (β)
H0 Ditolak
Error Tipe I (α)
Keputusan Benar
Error tipe I adalah situasi dimana H0 benar tetapi ditolak (berarti H1
diterima)
Besarnya probabilitas ( α) untuk melakukan error tipe I disebut juga
tingkat signifikan (level of significance) dari test statistik.
Error tipe II adalah situasi dimana H0 salah tetapi tidak ditolak,
sehingga H1 tidak diterima
Daerah Kritis dan Nilai Kritis
Daerah kritis adalah luas ekor di kurva normal, yang menyatakan
probabilitas untuk mendapatkan nilai rata-rata sampel lebih besar atau
lebih kecil dari nilai kritis tertentu, walaupun nilai rata-rata populasinya
sebesar X=X0. Luas daerah kritis ini mencerminkan probabilitas untuk
menolak H0 walaupun sebenarnya H0 benar.
Nilai kritis
Daerah kritis
Test 1 Ekor dan 2 Ekor
Jika Hipotesa Alternatif berupa ketidaksamaan disebut test 1 ekor:
H0 : X = X0
H1 : X > X0
Atau
H0 : X = X0
H1 : X < X0
Sedangkan jika H1 berupa ketidaksamaan disebut test 2 ekor:
H0 : X = X0
H1 : X ≠ X0
Prosedur Testing Hipotesis Dengan Error Tipe I
ditentukan dulu (α Fixed)
1.
2.
3.
4.
5.
6.
Tuliskan H0 dan H1
Pilih tingkat signifikan yaitu α (biasanya 5% atau 10%)
Pilih test statistik yg sesuai dan nilai kritis yg membatasi daerah
kritis sesuai dengan tingkat signifikan yg dipilih
Hitung statistik yg bersesuaian dengan (3) di atas berdasarkan
sampel data.
Ambil keputusan : H0 ditolak jika hasil hitung test statistik masuk
di daerah kritis, kalau tidak H0 tidak bisa ditolak (atau terima H1)
Buat kesimpulan
Test STatistik Berkenaan dengan Rata-Rata 1 Populasi
(Variansi Populasi diketahui)
Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi
(σ) diketahui . Dari sampel yg diambil berukuran n diketahui ratarata sampelnya xs.
Test – 1 ekor
1. Tuliskan H0 dan H1
H0 : μ = μ0
H1 : μ ≠ μ0
2. Pilih tingkat signifikan : α (misal 5%)
3. Test statistik bagi rata-rata adalah nilai Z dari rata-rata, karena
α=5% maka nilai kritis yg bersesuaian dari tabel adalah Z0.025 =
1.96 dan –Z0.025 (test 2 ekor).
Daerah kritis adalah Z>1.96 atau Z<-1.96.
4. Hitung Z dari sampel
x
Z hitung 
/ n
5. Ambil keputusan berdasarkan (4) dan (3)
Contoh
Sebuah pabrik senar pancing mengklaim produk barunya memiliki
kekuatan rata-rata 8kg dan standard deviasi 0.5kg. Sampel
random 50 buah senar baru tsb menghasilkan rata-rata kekuatan
7.8kg. Periksalah hipotesa μ=8kg tsb dengan alternative μ≠8kg
dengan tingkat signifikan 1%.
Solusi
1. H0: μ=8 dan H1: μ≠8
2. α = 0.01
3. Daerah kritis
Z0.005 = 2.575
Tolak H0 jika Z < -2.575 atau Z > 2.575, dengan
Z
x
/ n
4. Hitung statistik:
Z hitung 
x
/ n
Z hitung 
8  7.8
 2.83
0.5 / 50
5. Keputusan : Tolak H0 sebab Zhitung < -2.575
6. Kesimpulan: kekuatan rata-rata senar tidak 8 kg (kenyataannya < 8 kg)
Soal: test 1 ekor
Sampel random 100 catatan kematian di USA tahun lalu menyatakan
umur rata-rata penduduknya 71.8 tahun. Misalkan diketahui
standard deviasi populasi adalah 8.9 tahun, apakah hasil ini
mendukung dugaan bahwa umur rata-rata penduduk USA lebih
dari 70 tahun? Pergunakan tingkat signifikan 5%.
Test STatistik Berkenaan dengan Rata-Rata 1 Populasi
(Variansi Populasi Tidak diketahui)
Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi
(σ) TIDAK diketahui tetapi populasi dianggap normal. Dari sampel
yg diambil berukuran n diketahui rata-rata sampelnya xs. Maka
statistik yg bersesuaian adalah student-t statistik:
x  0
t
S/ n
Dengan derajat kebebasan v=n-1
Contoh
Hasil studi tentang konsumsi listrik berbagai peralatan rumah tangga
mengklaim bahwa vacuum cleaner rata-rata mengkonsumsi 46
KwH/tahun. Sampel random 12 rumah tangga yg memiliki
vacuum cleaner menghasilkan rata-rata 42 KwH/tahun dengan
standard deviasi sampel 11.9 KwH. Apakah hasil ini menyarankan
bahwa sebenarnya vacuum cleaner mengkonsumsi listrik ratarata di bawah 46 KwH /tahun? Pergunakanlah tingkat signifikan
5% dan asumsikan populasimnya terdistribusi normal.
Solusi
1. H0: μ=46 dan H1: μ < 46
2. α = 0.05
3. Daerah kritis (1 ekor, student-t)
n= 12, derajat kebebasan v=n-1=11
t0.05 =-1.796 (ekor kiri)
Tolak H0 jika t < -1.796
4. Hitung statistik:
x
42  46
thitung 

 1.16
S / n 11.9 / 12
5. Keputusan : Tidak bisa menolak H0 sebab thitung > -1.796
6. Kesimpulan: rata-rata konsumsi listrik vacuum cleaner tidak secara
signifikan kurang dari 46 KwH/tahun
Test STatistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi diketahui)
Situasi : berdasarkan 2 set sampel dengan rata-rata xSA dan xSB yg
berasal dari dua populasi, ingin diketahui perbedaan rata-rata dari
dua buah populasi asal sampel diambil. Jika variansi populasi (σ1
dan σ2 ) diketahui, maka variabel statistik:
Z
( x1  x2 )  ( 1   2 )
 12
n1

Akan terdistribusi normal standard.
 22
n2
Contoh
Pabrik benang mengklaim bahwa rata-rata kekuatan benang tipe A
paling tidak 12 kg lebih besar dibandingkan benang tipe B. Untuk
memeriksa klaim tersebut diambil sampel 50 buah dari tiap-tiap
tipe benang. Ternyata sampel benang A memiliki rata-rata
kekuatan 86.7 kg, standard deviasi populasi dari benang tipe A
diketahui 6.26 kg. Sedangkan rata-rata kekuatan sampel benang
B adalah 77.8 kg, dan dari data-data sebelumnya diketahui
standard deviasi kekuatan benang B adalah 5.61. Periksalah
klaim pabrik tsb pada tingkat signifikan 5%.
Solusi
Diketahui:
Benang A
nA = 50
xsA = 86.7
σA = 6.26
α=5%
Klaim : xSA-xsB > 12
1.
Benang B
nB=50
xsB = 77.8
σB = 5.61
Hipotesa
H0: μA- μB ≤ 12
H1: μA- μB> 12
2.
3.
Tingkat signifikansi α=5%
Daerah kritis
Solusi
3. Daerah kritis
Test statistik untuk kasus ini adalah Z, :
Z
( x1  x2 )  ( 1   2 )
 12
n1

 22
n2
dengan nilai kritis Z0.05 = 1.65.
Tolak H0 jika Z > 1.65
4.
Hitung statistik
Z hitung 
( x1  x2 )  ( 1   2 )

2
1
n1
5.


2
2
n2

(86.7  77.8)  (12)
6.26
50
2
2

 2.608
5.61
50
Keputusan
Karena Zhitung = -2.608 < 1.65, maka
Tidak bisa menolak H0, jadi μA-μB ≤ 12
Test STatistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi TIDAK diketahui TAPI SAMA)
Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA
dan xSB serta standard deviasi sampel SA dan SB yang berasal
dari dua populasi normal, ingin diketahui perbedaan rata-rata dari
dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan
σ2 ) TIDAK diketahui tapi dapat dianggap SAMA, maka variabel
statistik:
( x1  x2 )  ( 1   2 )
t
1 1
SP

n1 n1
S 2P
(n1  1) S12  (n2  1) S 22

n1  n2  2
Akan terdistribusi menurut student t dengan derajat kebebasan
v=n1+n2-2
Contoh
Kecepatan penipisan lapisan pelindung produksi dari sebuah pabrik
ditest secara statistik. Pabrik tsb ingin mengetahui perbedaan
kecepatan penipisan lapisan pelindung yg terbuat dari bahan A dan
dari bahan B. 12 sampel dari bahan A dicek, dan didapati rata-rata
penipisan 85 unit dan standard deviasi 4. Sedangkan 10 buah sampel
dari bahan B memiliki rata-rata 81 dengan sampel standard deviasi 5.
Dapatkah disimpulkan bahwa rata-rata penipisan bahan A lebih besar
dari 2 unit dibandingkan penipisan bahan B? Asumsikan populasi
keduanya normal, dan variansi kedua populasi sama. Pergunakan
tingkat signigikan 5%
Solusi
Diketahui:
Sampel A
Sampel B
nA = 12
nB = 10
xsA = 85
xSB = 81
SA = 4
SB = 5.
σ tidak diketahui, tapi dianggap sama. Populasi normal.
α= 5%
Klaim μA – μB > 2
Solusi
1. Hipotesa
H0: μA – μB ≤ 2
H1: μA – μB > 2
2. Tingkat signifikan α = 5%
3. Daerah kritis
Test statistik yg dipakai adalah student t, dengan derajat kebebasan
v=nA+nB – 2 = 12+10-2 = 20, dengan t adalah
( x  x )  ( 1   2 )
t 1 2
1 1
SP

n1 n1
S
2
P
(n1  1) S12  (n2  1) S 22

n1  n2  2
Nilai kritis t0.05 = 1.725 (untuk v=20).
Tolak H0 jika t > t0.05 = 1.725
Solusi
4. Hitung statistik:
S
2
P
(n1  1) S12  (n2  1) S 22 (12  1) * 42  (10  1) * 52


 4.478
n1  n2  2
12  10  2
t hitung 
( x1  x2 )  ( 1   2 ) (85  81)  (2)

 1.04
1 1
1 1
SP

4.478

n1 n1
12 10
5. Keputusan:
Karena thitung < 1.725, maka H0 tak dapat ditolak,
Berarti μA – μB ≤ 2, tak dapat disimpulkan rata-rata penipisan bahan
A tak dapat disimpulkan lebih dari 2 unit dibandingkan dari bahan B
Test Statistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi TIDAK diketahui TAPI BEDA)
Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA
dan xSB serta standard deviasi sampel SA dan SB yang berasal
dari dua populasi normal, ingin diketahui perbedaan rata-rata dari
dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan
σ2 ) TIDAK diketahui tapi dapat dianggap BEDA, maka variabel
statistik:
t
( x1  x2 )  ( 1   2 )
S12 S 22

n1 n2
dengan derajat kebebasan v:
2
S
S 
  
n1 n2 

 2
2
2
S1 / n1
S 22 / n2

n1  1
n2  1
2
1

 
2
2

Contoh
Berikut ini adalah data lama waktu pemutaran film yg diproduksi oleh
dua buah rumah produksi:
Rumah
Produksi
LAMA WAKTU (menit)
A
102 80
B
81
98 109 92
165 97 134 92 87 114
Hipotesanya adalah rata-rata lama waktu film produksi B lebih lama 10
menit dibandingkan rumah produksi A, dengan alternatif hipotesanya
adalah lama waktu film dari A kelebihannya < 10 menit dibandingkan
dengan film produksi B. Pergunakan tingkat signifikansi 10% dan
asumsikan distribusi populasi A dan B normal dengan variansi yang
tidak sama!
Solusi
Perhitungan rata-rata dan variansi
XA
102
80
98
109
92
XB
N
dA=XA-Xsa
dB=XB-Xsb
dA2
dB2
81
5.8
-29
33.64
841
-16.2
55
262.4
3025
x
x
j
j
N
165
97
1.8
-13
3.24
169
12.8
24
163.8
576
-4.2
-18
17.64
324
134
92
87
481
770
Rata
96.2
110
S2 
 (x
j
 x )2
j
N 1
x A  96.2
xB  110
-23
529
S A2  480.8 / 4  120.2
4
16
S B2  5480 / 6  913.3
114
Sum
N
480.8
5480
Solusi
Variabel t :
t
( xB  x A )  (  B   A )
S A2 S B2

n A nB

(110  96.2)  (10)
 0.306
120.2 / 5  913.3 / 7
Derajat kebebasan v:
2
2
 S12 S 22 
120
.
2
913
.
3


  



n1 n2 
5
7 


 2

 8.00
2
2
2
2
2




120
.
2
/
5
913
.
3
/
7
S1 / n1
S /n

 2 2
5 1
7 1
n1  1
n2  1

 

Solusi
1. Hipotesa
H0: μB – μA ≥ 10
H1: μB – μA <10
2. Tingkat signifikan α = 0.1
3. Daerah kritis
Test statistik yg dipakai adalah variabel t:
t
( x1  x2 )  ( 1   2 )
S12 S 22

n1 n2
Nilai kritis -t0.1 = -1.397 untuk derajat kebebasan v=8
Tolak H0 jika t < -1.397
Solusi
4. Perhitungan statistik:
thitung 
( xB  x A )  (  B   A )
S A2 S B2

n A nB

(110  96.2)  (10)
 0.306
120.2 / 5  913.3 / 7
5. Keputusan:
Karena thitung > -1.397 maka H0 tak bisa ditolak atau lama waktu film
A memang lebih dari 10 menit dari pada film B
Test Statistik Berkenaan dengan Pengamatan
Pasangan Data
Situasi : Pengamatan pasangan data, dengan d1, d2 dst adalah
selisih dari data-data hasil pengamatan yang diambil dari populasi
normal. Ingin diketahui apakah rata-rata selisihnya sama dengan
nilai tertentu. Dari sampel-sampel diketahui rata-rata dan
standard deviasi selisih sampel sebagai D dan SD. Variabel
statistik yg diperiksa adalah:
t
d  D
SD / n
dimana μD adalah rata-rata populasi yang memiliki distribusi
student t dengan derajat kebebasan v=n-1
Download