Analisa Data Statistik Chap 6: Distribusi Probabilitas Kontinu

advertisement
Analisa Data Statistik
Chap 6: Distribusi Probabilitas
Kontinu
Agoes Soehianie, Ph.D
Daftar Isi





DIstribusi Uniform Kontinu
Distribusi Normal
Hubungan Distribusi Normal dan Binomial
Distribusi Gamma dan Exponential
Distribusi Chi-Squared
Distribusi Uniform Kontinu
Fungsi rapat probabilitas dari distribusi variabel random X yang
bersifat uniform dan kontinu dalam interval [A,B] diberikan oleh:
 1

f ( x; A, B)   ( B  A)

 0
A x B
lainnya
f(x)
Mean atau rata-rata:
1/(B-A)

A B
2
Variansinya:
A
B
x
2


B

A
2 
12
Contoh.
Sebuah ruang rapat di suatu perusahaan hanya bisa dipakai tak lebih
dari 4 jam. Pemakaian ruang tsb untuk rapat singkat maupun
panjang sama seringnya. Bisa diasumsikan bahwa jika X
menyatakan lamanya sebuah rapat di ruang tsb, maka
distribusinya uniform.
a) Turunkan fungsi rapat probabilitasnya
b) Berapa probabilitasnya sebuah rapat di ruang tsb akan
berlangsung paling lama 3 jam?
c) Berapakah lama rata-rata rapat di ruang tsb?
Jawab:
a) B = 4 dan A=0, maka (B-A) = 4 dan fungsi rapat probabilitasnya
adalah: f(x) = ¼ untuk 0≤x ≤4 dan f(x)=0 untuk x di luar itu.
b) Probabilitas lama rapat kurang dari 3 jam: P(x<3)
3
3
1
P( x  3)   f ( x;0,4)dx   dx  3 / 4
4
0
0
Distribusi Normal
Distribusi probabilitas yg terpenting dalam statistik adalah distribusi
normal atau Gaussian.
Fungsi rapat probabilitas variabel random X dengan mean μ dan
variansi σ2 yang memiliki distribusi normal adalah:
1
n( x;  ,  ) 
e
2 

1
2
2
( x )2
n(x)
0.3
0.25
σ
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
μx
2
4
6
Distribusi Normal : Sifat
Contoh variabel random yg memiliki distribusi normal misalnya:
distribusi error dalam pengukuran
pengukuran dalam meteorologi
pengukuran curah hujan
sebagai pendekatan bagi distribusi binomial
dan distribusi hipergeometrik, dan lainnya
Sifat-Sifat Distribusi Normal:
1. Rata-ratanya (mean) μ dan standard deviasinya = σ
2. Mode (maximum) terjadi di x=μ
3. Bentuknya simetrik thd x=μ
4. Titik belok tepat di x=μ±σ
5. Kurva mendekati nol secara asimptotis semakin x jauh dari x=μ
6. Total luasnya = 1
Distribusi Normal : Sifat
Bentuk distribusi normal ditentukan oleh μ dan σ.
2
1
1
2
μ1 < μ2 σ 1 = σ 2
μ1 = μ2 σ 1 > σ 2
2
1
μ1 < μ2 σ 1 < σ 2
Luas di Bawah Kurva dan Probabilitas
P(x1<x<x2) = probabilitas variabel random x memiliki nilai antara x1
dan x2
P(x1<x<x2) = luas di bawah kurva normal antara x=x1 dan x=x2
x1
μ
x2
Oleh karena perhitungan integral normal tsb sulit, maka disusunlah
tabel nilai rapat probabilitas. Akan tetapi karena nilai rapat
probabilitasnya tergantung pada μ dan σ maka sangatlah tidak
mungkin mentabelkan untuk semua nilai μ dan σ
Kurva DIstribusi Normal Standard
Distribusi normal standard adalah distribusi normal dengan mean μ=0
dan standard deviasi σ=1.
Transformasi
z
x

memetakan distribusi normal menjadi
distribusi normal standard, sebab distribusi normal dengan variabel z ini
memiliki mean =0 dan standard deviasi = 1.
Transformasi ini juga mempertahankan luas dibawah kurvanya, artinya:
Luas dibawah kurva
distribusi normal antara
x1 dan x2
=
Luas dibawah kurva
distribusi normal
standard antara z1 dan
z2
Dengan z1 = (x1-μ)/σ dan z2 = (x2-μ)/σ.
Sehingga cukup dibuat tabel distribusi normal standard kumulatif saja!
Tabel Distribusi Normal Standard Kumulatif
Z
-3.4
-3.3
-3.2
-3.1
-3.0
Contoh: Hitung Luas
Pergunakanlah tabel distribusi normal standard untuk menghitung luas
daerah :
a) Di sebelah kanan z=1.84
b) Antara z=-1.97 s/d z=0.86
Jawab.
Ingat bahwa luas yg diberikan dalam tabel distribusi normal kumulatif
adalah luas dari z=-∞ s/d z0 tertentu: P(z<z0).
a) P(z>1.84) = 1 – P(z≤1.84) = 1 -0.9671 = 0.0329
b) P(-1.97 <z<0.86) = P(z<0.86) – P(z<-1.97) = 0.8051 – 0.0244 =
0.7807
Contoh: Cari z
Carilah nilai z=k di distribusi normal standard sehingga
a) P(Z>k) = 0.3015
b) P(k<z<-0.18) =0.4197
Jawab:
a) P(Z>k) = 0.3015 berarti P(Z<k) = 1- P(z>k) = 1 – 0.3015 = 0.6985
Dari tabel terbaca luas ke kiri = 0.6985 adalah untuk z=0.52.
b) P(k<z<-0.18) = P(z<-0.18) – P(z<k) = 0.4197
= 0.4286 – P(z<k) = 0.4197
Jadi P(z<k) = 0.4286- 0.4197 = 0.0089
Dari tabel z = -2.37
Contoh: Luas di bawah kurva normal non
standard
Contoh.
Variaber X terdistribusi normal dengan mean 50 dan standard deviasi
=10. Carilah probabilitas untuk menemukan X bernilai antara 45 dan
62?
Jawab.
Dalam soal ini μ = 50 dan σ=10. x1 = 45 dan x2 =62
Pertama kita mapping x ke z (melakukan normalisasi atau
standardisasi):
z1 = (x1 -μ)/σ  z1 = (45-50)/10 = -0.5
z2 = (x2 -μ)/σ  z2 = (62-50)/10 = 1.2
Sehingga
P(45 <x< 62) = P(-0.5<z<1.2)
P(-0.5<z<1.2) = P(z<1.2) – P(z<-0.5) = 0.8849-0.3085=0.5764
Memakai Distribusi Normal Dalam Arah
Kebalikan
Diketahui luas dibawah distribusi normal yg diinginkan yang terkait
dengan besar probabilitas, ingin dicari nilai variabel random X yg
terkait.
Contoh.
Misalkan distribusi normal memiliki μ=40 σ=6, carilah nilai x0 sehingga:
a) P(x<x0) = 45%
b) P(x>x0)=14%
Jawab.
a) Kita mulai dengan mencari nilai Z yg sama luasnya.
P(z<z0) = 45% = 0.45  dari tabel z0 = -0.13
z0 = (x0-μ)/σ  x0 = μ + σz0 = 40 +6*(-0.13) = 39.22
Memakai Distribusi Normal Dalam Arah
Kebalikan
Jawab.
b) Kita mulai dengan mencari nilai Z yg sama luasnya.
P(z>z0) = 14%  P(z<z0) = 1- P(z>z0) = 1-0.14 = 0.86
P(z<z0) = 0.86  dari tabel z0 = 1.08
z0 = (x0-μ)/σ  x0 = μ + σz0 = 40 +6*(1.08) = 46.48
Contoh Penerapan Distribusi Normal
Sebuah perusahaan bolam lampu mengetahui bahwa umur lampunya
(sebelum putus) terdistribusi secara normal dengan rata-rata umurnya
800 jam dan standard deviasinya 40 jam. Carilah probabilitas bahwa
sebuah bolam produksinya akan:
 Berumur antara 778 jam dan 834 jam
 Berumur kurang dari 750 jam atau lebih dari 900 jam
Jawab.
μ= 800 σ=40.
 P(778<x<834)
x1=778  z1 = (x1-μ)/σ = (778-800)/40 = -0.55
x2=834  z2 = (x2-μ)/σ = (834-800)/40 = 0.85
P(778<x<834) = P(-0.55<z<0.85) = P(z<0.85)-P(z<-0.55)
= 0.8023 – 0.2912 = 0.5111
Contoh Penerapan Distribusi Normal
b) Berumur kurang dari 750 jam atau lebih dari 900 jam
μ= 800 σ=40.
P(x< 750 atau x>900)
x1=750  z1 = (x1-μ)/σ = (750-800)/40 = -1.25
x2=900  z2 = (x2-μ)/σ = (900-800)/40 = 2.5
P(x< 750 atau x>900) = P(z<-1.25) + P(z>2.5)
= P(z<-1.25) + 1- P(z<2.5)
= 1 + P(z<-1.25) - P(z<2.5)
= 1 + 0.1056-0.9938 = 0.1118
Soal
Diameter ball-bearing yg diproduksi sebuah pabrik memiliki mean 3cm
dengan standard deviasi 0.005 cm. Pembeli hanya mau menerima
jikalau ball bearingnya memiliki diameter 3.0±0.01cm.
a) berapakah persenkah dari produksi pabrik tersebut yg tidak bisa
diterima pembeli?
b) jikalau dalam sebulan pabrik tsb memproduksi 10000 ball-bearing,
berapa banyak yg harus dibuang tiap bulan karena ditolak pembeli?
Soal
Sebuah pengukur diameter bola besi dipasang secara otomatis dalam
sebuah pabrik. Pengukur tsb hanya akan meloloskan diameter bola
1.50±d cm. Diketahui bahwa bola produksi pabrik tersebut memiliki
diameter yg terdistribusi normal dengan rata-rata 1.50 dan standard
deviasi 0.2 cm. Jikalau diinginkan bahwa 95% produksinya lolos
seleksi berapakah nilai d harus ditetapkan?
Soal
Rata-rata nilai kuliah statistik diketahui 65 dengan standard deviasi 15. a)
Jikalau diinginkan 15% murid mendapat nilai A dan diketahui distribusi
nilai normal, berapakah batas bawah nilai agar mendapat A? (b)
Selanjutanya diinginkan yg mendapat B adalah sebanyak 25%.
Berapakah batas bawah B? (c) Seandainya diinginkan yg tidak lulus
paling banyak 25%, berapakah batas bawah agar siswa lulus?
Normal Approximation to Binomial
Jika X adalah variabel random dengan rata-rata μ=np dan variansi
σ2=npq, maka jika n  ∞ dan p tidak terlalu dekat dengan 0 atau 1,
maka bentuk distribusi variabel Z :
x  np
Z
npq
adalah distribusi normal standard. Contoh berikut ini untuk n=15, p=0.4
Distribusi Normal-Binomial
0.25
0.2
0.15
Binom
normal
0.1
0.05
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16
Contoh
Probabilitas seorang pasien sembuh dari sebuah penyakit adalah 0.4.
Jika 100 orang menderita sakit tsb, berapakah probabilitasnya bahwa
yg sembuh kurang dari 30 orang?
Jawab.
Ini adalah distribusi binomial, dengan n=100, p=0.4, q=1-0.4=0.6, jika x
adalah jumlah orang yg sembuh, maka ingin dicari adalah:
P(x<30) = B(r=30;n=100, p=0.4).
Atau karena n besar dan p tidak terlalu kecil atau dekat 1, maka
distribusi binomial akan didekati dengan distribusi normal dengan
rata-rata μ=np=100*0.4=40 dan σ=√(npq)= √(100*0.4*0.6)=4.899.
Hitung dulu
z = (x-μ)/σ= (30-40)/4.899 = -2.04
Berarti P(x<30) = P (z< -2.04) = 0.0207
Distribus Gamma

Definisi fungsi gamma :
( )   x 1e  x dx
0
Dengan sifat Γ(α)= (α-1) Γ(α-1) untuk α>1, sehingga untuk α=n yg
berupa bilangan bulat positif, maka Γ(n) = (n-1)!
Definisi distribusi gamma:
Variabel random X memiliki distribusi gamma dengan parameter α dan
β, jika fungsi rapat probabilitasnya diberikan oleh:
 1
x 1e  x / 
 
f ( x; ,  )    ( )

0

x0
lainnya
Distribus Gamma : Ilustrasi
Distribusi Gamma
1.2
1
0.8
alfa=1 beta=1
0.6
alfa=2 beta=1
alfa=4 beta=1
0.4
0.2
0
0
1
2
3
x
4
5
Tabel : Fungsi Gamma Tak Lengkap
Distribus Gamma : Ilustrasi
Perhatikan kecuali untuk α=1 dan β=1 distribusi gamma berawal dari
x=0. Untuk α=1 distribusi gamma dikenal dengan nama distribusi
exponensial. Secara eksplisit untuk α=1, berarti : Γ(1)=0!=1, dan
distribusinya adalah:
 1 x / 
 e
f ( x;  )   

 0
x0
lainnya
Mean dan variansi dari distribusi gamma adalah:
μ= αβ
σ2= αβ2
Sehingga untuk kasus distribusi exponensial mean dan variansinya:
μ= β
σ2= β2
Β memiliki interpretasi sebagai waktu rata-rata antara 2 kejadian
berturut-turut
Hubungan dengan Distribusi Poisson
Distribusi Poisson memiliki satu parameter λ yg diartikan rata-rata
kejadian per unit waktu atau area. Menurut distribusi Poisson bahwa
tidak terjadi sesuatu (berarti x=0) selama waktu t akan diberikan
oleh:
e  t ( t ) 0
p(0; t ) 
 e  t
0!
Jika didefiniskan variabel random X yang menyatakan lamanya waktu
yg diperlukan untuk terjadinya peristiwa Poisson pertama kali,
tentunya probabilitasnya = probabilitas tidak terjadi sesuatu selama
x: P (X>x) = e-λt
Dengan distribusi kumulatifnya:
P(0≤ X ≤x) = 1 - e-λt
Turunan dari distribusi kumulatif ini = distribusi Poisson!
Aplikasi Distribusi Gamma & Eksponensial
Komponen elektronik di sebuah komputer mempunyai lama waktu
sebelum rusak selama T tahun. Diketahui variabel random T dapat
dimodelkan dengan distribusi eksponensial dengan waktu rata-rata
sebelum rusak (mean time before failure = MTBF) β=5. Sebanyak 5
komponen dipakai dalam 5 komputer berbeda, berapakah
probabilitasnya bahwa setelah 8 tahun paling tidak 2 buah
komponen masih baik berfungsi?
Jawab:
Probabilitas sebuah komponen masih berfungsi setelah 8 tahun
diberikan oleh:

P(T  8)  
8
1

e
t / 

1 t / 5
dt   e dt  0.2
5
8
Selanjutnya, misalkan X menyatakan jumlah komponen yg masih
berfungsi setelah 8 tahun.
Aplikasi Distribusi Gamma & Eksponensial
Sekarang persoalan adalah distribusi binomial, dengan probabilitas
“sukses” p=0.2 (berfungsi setelah 8 tahun), banyak percobaan (yaitu
banyak komponen yg diuji n=5, dan yg ingin diketahui adalah
sebanyak 5 “sukses”, x=5.
Jadi probabilitas bahwa setelah 8 tahun, sebanyak paling tidak 2
komponen masih berfungsi diberikan :
5
1
x2
x 0
P( X  2)   b( x; n  5, p  0.2)  1   b( x;5,0.2)  1  0.7373  0.2627
Aplikasi Distribusi Gamma & Eksponensial
Dalam studi thd tikus, dipelajari efek racun thd waktu survival-nya.
Diketahui bahwa untuk dosis tertentu racun, waktu survivalnya
mengikuti pola distribusi gamma dengan α=5 dan β=10 dalam
satuan minggu. Berapakah probabilitasnya bahwa seekor tikus akan
masih selamat (survive) tak lebih dari 60 minggu.
Jawab:
Misal X adalah variabel random yg menyatakan waktu hidup
(survival time), berarti probabilitasnya bahwa X≤60 adalah:
60
60
1
1
P( X  60;  5,   10)   
x 1e  x /  dx   5
x 4e  x /  dx
 ( )
 (5)
0
0
Integral ini sulit dievaluasi secara langsung. Akan tetapi dapat
dievaluasi dengan perantaraan tabel fungsi gamma tak lengkap F:
y 1e  y
F ( x; )  
dy
( )
0
x
Aplikasi Distribusi Gamma & Eksponensial
Jadi didefinisikan x/β=y, berarti x= βy dx= βdy dan x=60 jadi y= 60/10=6
sehingga:
1
6
6
6
1 4 x / 
1
1
1 4 y
P( X  60)  5 
x e dx  5 
( y) 4 e  y  dy  
y e dy
 0 (5)
 0 (5)
(5)
0
Dengan definisi fungsi gamma tak lengkap F(x;α) jadi:
P (X≤60)= F(x=6; α=5) = 0.715
Aplikasi Distribusi Gamma & Eksponensial
Jadi didefinisikan x/β=y, berarti x= βy dx= βdy dan x=60 jadi y= 60/10=6
sehingga:
Download