Confidence interval

advertisement
STATISTICS
Confidence Intervals
(Rentang Keyakinan)
Confidence Intervals
(1)
• Estimasi Parameter
– Distribusi probabilitas memiliki sejumlah parameter.
– Parameter-parameter tsb umumnya tak diketahui.
– Nilai parameter tersebut diperkirakan (di-estimasikan) berdasarkan nilai yang diperoleh dari
pengolahan data.
– Estimasi
• Estimasi tunggal (point
(point estimates)
estimates)
• Rentang keyakinan (confidence
(confidence intervals)
intervals)
Statistika
Confidence Intervals
2
1
Confidence Intervals
(2)
• Estimasi Tunggal
– Contoh
• Nilai ratarata-rata sampel sbg estimasi nilai ratarata-rata populasi.
X →μ
• Nilai simpangan baku sampel sbg estimasi nilai simpangan
baku populasi.
sX → σ X
Statistika
Confidence Intervals
3
Confidence Intervals
(3)
• Estimasi parameter θ
θ{ˆ →
estimasi
θ{
parameter
Dicari suatu interval [L
[L,U] yang memiliki probabilitas (1 – α)
bahwa interval tsb mengandung θ.
prob(L < θ < U) = (1 – α)
Æ Pers (1)
L = batas bawah rentang keyakinan.
U = batas atas rentang keyakinan.
(1 – α) = tingkat keyakinan (confidence
(confidence level,
level, confidence coefficient).
coefficient).
L dan U = variabel random
Statistika
Confidence Intervals
4
2
Confidence Intervals
(4)
• Contoh
– Data debit Sungai A selama tahun 1981 s.d. 2000
menunjukkan bahwa debit rata-rata adalah 77 m3/s.
• Kita dapat memperkirakan debit ratarata-rata Sungai A adalah
3
77 m /s.
• Kita menyadari bahwa perkiraan tsb dapat salah; bahkan
dari sisi pengertian probabilitas, kita tahu bahwa debit
ratarata-rata sama dengan 77 m3/s adalah hampir tidak
mungkin terjadi:
(
)
prob Q = 77 m 3 s = 0
Statistika
Confidence Intervals
5
Batas Bawah dan Atas
(1)
• Metode Ostle: method of pivotal quantities
– Dicari variabel random V yang merupakan fungsi
parameter θ (θ = unknown), tetapi distribusi V ini
tidak bergantung pada parameter yang tidak
diketahui.
– Ditentukan v1 dan v2 sedemikian hingga:
prob(v1 < V < v2 ) = 1 − α
Statistika
Confidence Intervals
Æ Pers (2)
6
3
Batas Bawah dan Atas
(2)
• Metode Ostle: method of pivotal quantities
prob(v1 < V < v2 ) = 1 − α
– Persamaan di atas diubah kedalam bentuk
prob(L < θ < U) = 1-α
– L dan U adalah variabel random dan fungsi V, tetapi
bukan fungsi θ.
Statistika
Confidence Intervals
7
Confidence interval:
µ suatu distribusi normal
• Mencari interval [L,U] yang mengandung µ,
prob(L < µ < U) = 1 – α
• Misal variabel random V:
V=
X −μ
sX
– V berdistribusi t dengan (n – 1) degrees of fredom
– n adalah jumlah sampel yang dipakai untuk
menghitung nilai rata-rata sampel, X
Statistika
Confidence Intervals
8
4
V=
X −μ
Æ berdistribusi t?
sX
• Bukti
ν
, ν = degree of freedom
U
(X − μ ) σ = (X − μ ) ⋅ 1
X −μ
X −μ
=
=
V=
sX
σ n
s 2X n
s 2X σ n
s 2X σ 2
Distribusi t: X = Y
=
(X − μ ) ⋅
n −1
=Y ⋅
∑ (X i − X ) σ 2
2
(
Xi − X )
X −μ
∑
→Y =
, U=
,
σ
2
n
ν
σ2
n
Statistika
ν
U
ν = n −1
Confidence Intervals
• Pers (2):
prob(v1 < V < v2 ) = 1 − α
9
⎛
⎞
X −μ
⇒ prob⎜⎜ v1 <
< v2 ⎟⎟ = 1 − α
sX
⎝
⎠
αa + αb = α
prob(t
prob(t < v1) = αa
dengan (n
(n – 1) degrees of freedom
prob(t
prob(t > v2) = αb
luas = (1 – α)
luas = αa
luas = αb
tα a
Statistika
t1−αb
Confidence Intervals
10
5
⎞
⎛
X −μ
prob⎜⎜ v1 <
< v2 ⎟⎟ = 1 − α
sX
⎠
⎝
⎛
⎞
X −μ
< tαb ,n −1 ⎟⎟ = 1 − α
prob⎜⎜ tα a ,n−1 <
sX
⎝
⎠
prob X + tα a ,n−1 ⋅ s X < μ < X + tαb ,n −1 ⋅ s X = 1 − α
(
)
u
ℓ
Jadi, confidence limits:
l = X + tα a ,n −1 ⋅ s X
sX = sX
u = X + tαb ,n −1 ⋅ s X
tα a ,n−1 → tabel distribusi t
Statistika
n
Confidence Intervals
11
• Jika dikehendaki probabilitas confidence interval simetris, maka
v1 dan v2 dipilih sedemikian hingga prob(t
prob(t < v1) = prob(t
prob(t > v2).
• Karena simetri, maka αa = αb = α/2
• Yang dicari adalah (1 – α) = 100(1 – α)% confidence interval Æ
maka: prob(t
prob(t < v1) = α/2 = prob(t
prob(t > v2)
luas = (1 – α)/2
luas = (1 – α)/2
luas = α/2
luas = α/2
tα 2 = −t1−α 2
Statistika
t1−α 2
Confidence Intervals
12
6
Distribusi t
luas = α/2
luas = α/2
luas = 1 – α/2
luas = 1 – α/2
tα 2
t1−α 2
luas = α/2
luas = 1 – α
tα 2
− t1−α 2
Statistika
luas = α/2
t1−α 2
Confidence Intervals
13
• Dengan demikian, confidence limits jika probabilitas
confidence interval simetri adalah:
l = X − t1−α 2,n −1 ⋅ s X
u = X + t1−α 2,n−1 ⋅ s X
Statistika
Confidence Intervals
14
7
• Kadang dikehendaki probabilitas confidence interval
satu sisi
– batas bawah
– batas atas
Æ
Æ
prob(t
prob(t < v1) = α
prob(t
prob(t > v2) = α
⎛ X −μ
⎞
prob(V > v1 ) = 1 − α ⇒ prob⎜⎜
> v1 ⎟⎟ = 1 − α
⎝ sX
⎠
⎛ X −μ
⎞
prob(V < v2 ) = 1 − α ⇒ prob⎜⎜
< v2 ⎟⎟ = 1 − α
⎝ sX
⎠
luas = α
luas = α
luas = 1 – α
luas = 1 – α
tα
Statistika
t1−α
Confidence Intervals
15
Distribusi t
• Notasi
– tγ,n = nilai t sedemikian hingga probabilitas variabel
random t dengan n degrees of freedom adalah lebih
kecil daripada γ.
– misal:
t0.95,50 = nilai t sedemikian hingga prob(t < t0.95,50) =
0.95 untuk t yang memiliki 50 degrees of freedom.
Statistika
Confidence Intervals
16
8
Distribusi t
• Dapat dibaca di tabel distribusi t
– Tabel Distribusi t
• Dapat dihitung dengan perintah/fungsi MSExcel
– TDIST(t,ν
TDIST(t,ν,tails)
•
•
•
•
•
menghitung nilai prob(T > t)
untuk menghitung nilai prob(T < t) Æ 1 – TDIST(t,ν
TDIST(t,ν,tails)
t = nilai yang diinginkan untuk dicari distribusinya
ν = degree of freedom
tails = 1 (one(one-tailed distribution) atau 2 (two(two-tailed distribution)
– TINV(p,ν
TINV(p,ν)
• mencari nilai t jika nilai p = prob(T > t) diketahui
• twotwo-tailed distribution
• jika ingin mencari nilai t untuk oneone-tailed distribution, p diganti dengan 2p
Statistika
Confidence Intervals
17
Distribusi t
untuk 50 degrees of freedom
0.95
t
t = 1.6
prob(T < 1.6) = 1 – TDIST(1.6,50,1) = 0.942
prob(T < t ) = 0.95
t = TINV(2*(1TINV(2*(1-0.95),50) Æ t = 1.68
0.95
t = –1.6
–t
t = 1.6
prob(–1.6 < T < 1.6) = 1 – TDIST(1.6,50,2) = 0.884
Statistika
Confidence Intervals
t
prob(prob(-t < T < t ) = 0.95
t = TINV(1TINV(1-0.95,50) Æ t = 2
18
9
Confidence interval:
µ suatu distribusi normal
• Apabila varian populasi diketahui, maka variabel
random V didefinisikan sbb.:
V=
X −μ
,
σX
σX = σX
n
Æ V berdistribusi normal
Statistika
Confidence Intervals
19
Confidence interval:
µ suatu distribusi normal, σ diketahui
• Confidence limits
l = X + za ⋅ s X
u = X + zb ⋅ s X
αa
αb
1− α
za
zb
– Jika probabilitas rentang keyakinan diinginkan simetri, maka
confidence limits nilai ratarata-rata populasi µ adalah sbb:
l = X − z1−α 2 ⋅ s X
u = X + z1−α 2 ⋅ s X
α 2
1− α
zα 2 = − z1−α 2
Statistika
Confidence Intervals
α 2
z1−α 2
20
10
Confidence interval:
σ2 suatu distribusi normal
• Mencari interval [L,U] yang mengandung σ2 dengan
peluang prob(L < σ2 < U) = 1 – α.
• Didefinisikan variabel random V:
(
n − 1) s X 2
V=
σX 2
Æ V berdistribusi chi-squared dengan
(n – 1) degrees of freedom.
Statistika
Confidence Intervals
21
prob(v1 < V < v2 ) = 1 − α
⎛
(n − 1) s X 2 < v ⎞⎟ = 1 − α
prob⎜ v1 <
2⎟
⎜
σX 2
⎝
⎠
Pilih:
v1 = χ α2 2,n−1
v2 = χ12−α 2,n−1
⎛
⎞
(n − 1) s X 2 < χ 2
⎟ = 1− α
sehingga: prob⎜ χ α2 2,n−1 <
n
1
2
,
1
−
α
−
2
⎜
⎟
σ
X
⎝
⎠
⎛ (n − 1) s 2
(n − 1) s X 2 ⎞⎟ = 1 − α
X
atau:
prob⎜ 2
< σX 2 < 2
⎜χ
χ α 2,n−1 ⎟⎠
⎝ 1−α 2,n−1
Statistika
Confidence Intervals
22
11
Jadi batas bawah dan batas atas rentang yang
mengandung σX2 dengan tingkat keyakinan (1 – α)
adalah:
• batas bawah:
(
n − 1) s X 2
l=
• batas atas:
(
n − 1) s X 2
u=
χ12−α 2,n−1
χ α2 2,n−1
Catatan: X berdistribusi normal
χ2 berdistribusi chi-squared
Statistika
Confidence Intervals
23
Distribusi chi-squared tidak simetris:
sX 2 − l ≠ u − sX 2
n » → (n – 1) » → distribusi mendekati distribusi
simetris,
sX2 berada kira-kira di tengahtengah rentang [L,U].
1− α
χ α2 2
Statistika
χ12−α 2
Confidence Intervals
24
12
One-sided confidence intervals
• Hanya diinginkan satu sisi rentang keyakinan
saja
– batas bawah saja untuk rentang keyakinan µ
prob (L < θ ) = 1 − α ⇒ l = X − t1−α ,n −1
– batas atas saja untuk rentang keyakinan µ
prob(θ < U ) = 1 − α ⇒ u = X + t1−α,n−1
Statistika
Confidence Intervals
25
13
Download