STATISTICS Confidence Intervals (Rentang Keyakinan) Confidence Intervals (1) • Estimasi Parameter – Distribusi probabilitas memiliki sejumlah parameter. – Parameter-parameter tsb umumnya tak diketahui. – Nilai parameter tersebut diperkirakan (di-estimasikan) berdasarkan nilai yang diperoleh dari pengolahan data. – Estimasi • Estimasi tunggal (point (point estimates) estimates) • Rentang keyakinan (confidence (confidence intervals) intervals) Statistika Confidence Intervals 2 1 Confidence Intervals (2) • Estimasi Tunggal – Contoh • Nilai ratarata-rata sampel sbg estimasi nilai ratarata-rata populasi. X →μ • Nilai simpangan baku sampel sbg estimasi nilai simpangan baku populasi. sX → σ X Statistika Confidence Intervals 3 Confidence Intervals (3) • Estimasi parameter θ θ{ˆ → estimasi θ{ parameter Dicari suatu interval [L [L,U] yang memiliki probabilitas (1 – α) bahwa interval tsb mengandung θ. prob(L < θ < U) = (1 – α) Æ Pers (1) L = batas bawah rentang keyakinan. U = batas atas rentang keyakinan. (1 – α) = tingkat keyakinan (confidence (confidence level, level, confidence coefficient). coefficient). L dan U = variabel random Statistika Confidence Intervals 4 2 Confidence Intervals (4) • Contoh – Data debit Sungai A selama tahun 1981 s.d. 2000 menunjukkan bahwa debit rata-rata adalah 77 m3/s. • Kita dapat memperkirakan debit ratarata-rata Sungai A adalah 3 77 m /s. • Kita menyadari bahwa perkiraan tsb dapat salah; bahkan dari sisi pengertian probabilitas, kita tahu bahwa debit ratarata-rata sama dengan 77 m3/s adalah hampir tidak mungkin terjadi: ( ) prob Q = 77 m 3 s = 0 Statistika Confidence Intervals 5 Batas Bawah dan Atas (1) • Metode Ostle: method of pivotal quantities – Dicari variabel random V yang merupakan fungsi parameter θ (θ = unknown), tetapi distribusi V ini tidak bergantung pada parameter yang tidak diketahui. – Ditentukan v1 dan v2 sedemikian hingga: prob(v1 < V < v2 ) = 1 − α Statistika Confidence Intervals Æ Pers (2) 6 3 Batas Bawah dan Atas (2) • Metode Ostle: method of pivotal quantities prob(v1 < V < v2 ) = 1 − α – Persamaan di atas diubah kedalam bentuk prob(L < θ < U) = 1-α – L dan U adalah variabel random dan fungsi V, tetapi bukan fungsi θ. Statistika Confidence Intervals 7 Confidence interval: µ suatu distribusi normal • Mencari interval [L,U] yang mengandung µ, prob(L < µ < U) = 1 – α • Misal variabel random V: V= X −μ sX – V berdistribusi t dengan (n – 1) degrees of fredom – n adalah jumlah sampel yang dipakai untuk menghitung nilai rata-rata sampel, X Statistika Confidence Intervals 8 4 V= X −μ Æ berdistribusi t? sX • Bukti ν , ν = degree of freedom U (X − μ ) σ = (X − μ ) ⋅ 1 X −μ X −μ = = V= sX σ n s 2X n s 2X σ n s 2X σ 2 Distribusi t: X = Y = (X − μ ) ⋅ n −1 =Y ⋅ ∑ (X i − X ) σ 2 2 ( Xi − X ) X −μ ∑ →Y = , U= , σ 2 n ν σ2 n Statistika ν U ν = n −1 Confidence Intervals • Pers (2): prob(v1 < V < v2 ) = 1 − α 9 ⎛ ⎞ X −μ ⇒ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎝ ⎠ αa + αb = α prob(t prob(t < v1) = αa dengan (n (n – 1) degrees of freedom prob(t prob(t > v2) = αb luas = (1 – α) luas = αa luas = αb tα a Statistika t1−αb Confidence Intervals 10 5 ⎞ ⎛ X −μ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎠ ⎝ ⎛ ⎞ X −μ < tαb ,n −1 ⎟⎟ = 1 − α prob⎜⎜ tα a ,n−1 < sX ⎝ ⎠ prob X + tα a ,n−1 ⋅ s X < μ < X + tαb ,n −1 ⋅ s X = 1 − α ( ) u ℓ Jadi, confidence limits: l = X + tα a ,n −1 ⋅ s X sX = sX u = X + tαb ,n −1 ⋅ s X tα a ,n−1 → tabel distribusi t Statistika n Confidence Intervals 11 • Jika dikehendaki probabilitas confidence interval simetris, maka v1 dan v2 dipilih sedemikian hingga prob(t prob(t < v1) = prob(t prob(t > v2). • Karena simetri, maka αa = αb = α/2 • Yang dicari adalah (1 – α) = 100(1 – α)% confidence interval Æ maka: prob(t prob(t < v1) = α/2 = prob(t prob(t > v2) luas = (1 – α)/2 luas = (1 – α)/2 luas = α/2 luas = α/2 tα 2 = −t1−α 2 Statistika t1−α 2 Confidence Intervals 12 6 Distribusi t luas = α/2 luas = α/2 luas = 1 – α/2 luas = 1 – α/2 tα 2 t1−α 2 luas = α/2 luas = 1 – α tα 2 − t1−α 2 Statistika luas = α/2 t1−α 2 Confidence Intervals 13 • Dengan demikian, confidence limits jika probabilitas confidence interval simetri adalah: l = X − t1−α 2,n −1 ⋅ s X u = X + t1−α 2,n−1 ⋅ s X Statistika Confidence Intervals 14 7 • Kadang dikehendaki probabilitas confidence interval satu sisi – batas bawah – batas atas Æ Æ prob(t prob(t < v1) = α prob(t prob(t > v2) = α ⎛ X −μ ⎞ prob(V > v1 ) = 1 − α ⇒ prob⎜⎜ > v1 ⎟⎟ = 1 − α ⎝ sX ⎠ ⎛ X −μ ⎞ prob(V < v2 ) = 1 − α ⇒ prob⎜⎜ < v2 ⎟⎟ = 1 − α ⎝ sX ⎠ luas = α luas = α luas = 1 – α luas = 1 – α tα Statistika t1−α Confidence Intervals 15 Distribusi t • Notasi – tγ,n = nilai t sedemikian hingga probabilitas variabel random t dengan n degrees of freedom adalah lebih kecil daripada γ. – misal: t0.95,50 = nilai t sedemikian hingga prob(t < t0.95,50) = 0.95 untuk t yang memiliki 50 degrees of freedom. Statistika Confidence Intervals 16 8 Distribusi t • Dapat dibaca di tabel distribusi t – Tabel Distribusi t • Dapat dihitung dengan perintah/fungsi MSExcel – TDIST(t,ν TDIST(t,ν,tails) • • • • • menghitung nilai prob(T > t) untuk menghitung nilai prob(T < t) Æ 1 – TDIST(t,ν TDIST(t,ν,tails) t = nilai yang diinginkan untuk dicari distribusinya ν = degree of freedom tails = 1 (one(one-tailed distribution) atau 2 (two(two-tailed distribution) – TINV(p,ν TINV(p,ν) • mencari nilai t jika nilai p = prob(T > t) diketahui • twotwo-tailed distribution • jika ingin mencari nilai t untuk oneone-tailed distribution, p diganti dengan 2p Statistika Confidence Intervals 17 Distribusi t untuk 50 degrees of freedom 0.95 t t = 1.6 prob(T < 1.6) = 1 – TDIST(1.6,50,1) = 0.942 prob(T < t ) = 0.95 t = TINV(2*(1TINV(2*(1-0.95),50) Æ t = 1.68 0.95 t = –1.6 –t t = 1.6 prob(–1.6 < T < 1.6) = 1 – TDIST(1.6,50,2) = 0.884 Statistika Confidence Intervals t prob(prob(-t < T < t ) = 0.95 t = TINV(1TINV(1-0.95,50) Æ t = 2 18 9 Confidence interval: µ suatu distribusi normal • Apabila varian populasi diketahui, maka variabel random V didefinisikan sbb.: V= X −μ , σX σX = σX n Æ V berdistribusi normal Statistika Confidence Intervals 19 Confidence interval: µ suatu distribusi normal, σ diketahui • Confidence limits l = X + za ⋅ s X u = X + zb ⋅ s X αa αb 1− α za zb – Jika probabilitas rentang keyakinan diinginkan simetri, maka confidence limits nilai ratarata-rata populasi µ adalah sbb: l = X − z1−α 2 ⋅ s X u = X + z1−α 2 ⋅ s X α 2 1− α zα 2 = − z1−α 2 Statistika Confidence Intervals α 2 z1−α 2 20 10 Confidence interval: σ2 suatu distribusi normal • Mencari interval [L,U] yang mengandung σ2 dengan peluang prob(L < σ2 < U) = 1 – α. • Didefinisikan variabel random V: ( n − 1) s X 2 V= σX 2 Æ V berdistribusi chi-squared dengan (n – 1) degrees of freedom. Statistika Confidence Intervals 21 prob(v1 < V < v2 ) = 1 − α ⎛ (n − 1) s X 2 < v ⎞⎟ = 1 − α prob⎜ v1 < 2⎟ ⎜ σX 2 ⎝ ⎠ Pilih: v1 = χ α2 2,n−1 v2 = χ12−α 2,n−1 ⎛ ⎞ (n − 1) s X 2 < χ 2 ⎟ = 1− α sehingga: prob⎜ χ α2 2,n−1 < n 1 2 , 1 − α − 2 ⎜ ⎟ σ X ⎝ ⎠ ⎛ (n − 1) s 2 (n − 1) s X 2 ⎞⎟ = 1 − α X atau: prob⎜ 2 < σX 2 < 2 ⎜χ χ α 2,n−1 ⎟⎠ ⎝ 1−α 2,n−1 Statistika Confidence Intervals 22 11 Jadi batas bawah dan batas atas rentang yang mengandung σX2 dengan tingkat keyakinan (1 – α) adalah: • batas bawah: ( n − 1) s X 2 l= • batas atas: ( n − 1) s X 2 u= χ12−α 2,n−1 χ α2 2,n−1 Catatan: X berdistribusi normal χ2 berdistribusi chi-squared Statistika Confidence Intervals 23 Distribusi chi-squared tidak simetris: sX 2 − l ≠ u − sX 2 n » → (n – 1) » → distribusi mendekati distribusi simetris, sX2 berada kira-kira di tengahtengah rentang [L,U]. 1− α χ α2 2 Statistika χ12−α 2 Confidence Intervals 24 12 One-sided confidence intervals • Hanya diinginkan satu sisi rentang keyakinan saja – batas bawah saja untuk rentang keyakinan µ prob (L < θ ) = 1 − α ⇒ l = X − t1−α ,n −1 – batas atas saja untuk rentang keyakinan µ prob(θ < U ) = 1 − α ⇒ u = X + t1−α,n−1 Statistika Confidence Intervals 25 13