2.3.Fungsi Kepadatan Kumulatif 2.4.Ekspektasi Matematika

advertisement
BABA 2 TEORI PROBABILITAS
2.1.Ruang Solusi dan Kejadian
Dalam suatu percobaan, semua kejadian yang mungkin
dinamakan sebagai ruang solusi dan dituliskan dengan:
S={semua kejadian si yang muncul}
Misalkan pengambilan kelereng pada sebuah kantong,
dimana dalam kantong terdapat 8 kelereng yang sudah
diberi nomor 1 sampai dengan 8, maka pengambilan 1
kelereng akan meng-hasilkan ruang solusi:
S={1,2,3,4,5,6,7,8}
Sebagai contoh lain dinyatakan bahwa jumlah mobil yang
lewat di depan toko XYZ setiap menitnya pada siang hari
maksimal 5 buah mobil, tetapi terkadang tidak ada yang
lewat. Maka ruang solusi yang diperoleh adalah:
S={0,1,2,3,4,5}
BABA 2 TEORI PROBABILITAS
2.1.Ruang Solusi dan Kejadian
Kemunculan setiap kejadian si di dalam ruang solusi S dinama-kan dengan
frekwensi kejadian. Frekwensi kejadian untuk semua kejadian dalam ruang
solusi S akan menghasilkan histogram. Sebagai contoh diketahui data jumlah
mobil yang melintasi gerbang tol untuk setiap menit adalah sebagai berikut:
Maka ruang solusi dari kejadian ini adalah:
S={0,1,2,3,4,5}
Histogram yang menyatakan frekwensi setiap kejadian adalah:
Artinya 0 buah mobil yang lewat setiap menitnya terjadi 1 kali, 1 buah mobil yang
lewat setiap menitnya terjadi 1 kali, 2 buah mobil yang lewat setiap menitnya
terjadi 2 kali, 3 buah mobil yang lewat setiap menitnya terjadi 3 kali, 4 buah mobil
yang lewat setiap menitnya terjadi 0 kali dan 5 buah mobil yang lewat setiap
menitnya terjadi 1 kali.
2 Teori Probabilitas
3
2.5
2
1.5
1
0.5
0
0
1
2
3
4
5
Histogram contoh 1
Implementasi dari penentuan histogram ini menggunakan MATLAB adalah sebagai
berikut
% Mendefinisikan data
% Pada baris ini data bisa diganti-ganti
x=[3 5 3 3 2 0 1 2];
% Menentukan ukuran data
n=size(x,2);
% Menentukan ruang solusi
% dimana ruang solusi dari minimun data
% sampai dengan maksimum data
s=min(x):max(x);
% Menghitung histogram
h=hist(x,s);
% Menggambar histogram
bar(s,h), grid
2.2.Fungsi Kepadatan Probabilitas
Fungsi kepadatan probabilitas (probabilty density function)
adalah suatu fungsi yang menyatakan nilai kemungkinan
terjadinya kejadian tertentu (si) dan dituliskan dengan:
f(s) = P(S=si)
Fungsi kepadatan probabilitas mempunyai beberapa sifat,
antara lain:
0 ≤ f(si) ≤ 1, hal ini disebabkan nilai kemungkinan berada
dalam range 0 s/d 1, dimana 0 berarti tidak akan terjadi
dan 1 berarti pasti terjadi
Jumlah fungsi dari seluruh kejadian adalah 1 (pasti
n
terjadi), dan dituliskan dengan:
 f (s )  1
i 1
i
2.2.Fungsi Kepadatan Probabilitas
Contoh 2.1.
Bila sebuah mata uang dilempar maka kejadian yang akan
muncul adalah gambar (G) atau angka (A). Ruang
solusinya adalah:
S={G,A}
Kemungkinan munculnya gambar adalah ½ dan
kemungkinan munculnya angka adalah ½. Sehingga fungsi
kepadatan probabilitas sebagai berikut:
p(S=G) = 1/2
p(S=A) = 1/2
2.2.Fungsi Kepadatan Probabilitas
Contoh 2.2.
Tiga buah mata uang dilempar, maka kejadian yang akan
muncul adalah kombinasi antara gambar (G) dan angka (A),
dengan ruang solusi sebagai berikut:
S={AAA, AAG, AGA, AGG, GAA, GAG, GGA, GGG}
Bila ruang solusi diambil tanpa memperhitungkan urutan,
maka ruang solusi yang ada adalah:
S = { 3G, 2G1A, 1G2A, 3A}
Fungsi probabilitas yang diperoleh adalah:
f(3G) = 1/8
f(2G1A) = 3/8
f(1G2A) = 3/8
f(3A) = 1/8
2.2.Fungsi Kepadatan Probabilitas
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
3G
2G1A
1G2A
3A
Gambar 2.2. Grafik fungsi
kepadatan probabilitas untuk
pelemparan 3 mata uang.
Perhatikan pada contoh di atas, bahwa fungsi kepadatan probabilitas merupakan
perwujudan lain dari histogram, dimana fungsi kepadatan probabilitas ini adalah
histogram dengan setiap nilainya dibagi dengan jumlah semua kejadian.
Pada histogram :
Pada fungsi kepadatan prob. :
H(3G) = 1
f(3G) = 1/8
H(2G1A) = 3
f(2G1A) = 3/8
H(1G2A) = 3
f(1G2A) = 3/8
H(3G) = 1
f(3G) = 1/8
Dengan jumlah semua kejadian adalah 8.
2.2.Fungsi Kepadatan Probabilitas
Contoh 2.2.
Diketahui data jumlah panggilan telepon setiap detiknya yang diambil
pada 16 detik sebagai berikut:
6717436115572432
Implementasi dengan menggunakan MATLAB:
(1) Menuliskan data sebagai x
>> x=[6 7 1 7 4 3 6 1 1 5 5 7 2 4 3 2];
(2) Menghitung jumlah data
>> n=size(x,2)
n=
16
(3) Mendefinisikan ruang solusi (kejadian)
>> s=min(x):max(x)
s=
1 2 3 4 5 6 7
2.2.Fungsi Kepadatan Probabilitas
(3) Menghitung histogram
>> h=hist(x,s)
h=
3 2 2 2 2 2 3
(3) Menghitung fungsi kepadatan probabilitas dengan histogram
dibagi dengan jumlah kejadian
>> f=h/sum(h)
f=
0.1875 0.1250 0.1250 0.1250 0.1250 0.1250 0.1875
(3) Menggambarkan fungsi kepadatan probabilitas
>> bar(s,f), grid
Gambar 2.3. contoh fungsi
kepadatan probabilitas
2.2.Fungsi Kepadatan Probabilitas
Untuk membuktikan bahwa f adalah suatu fungsi kepadatan
probabilitas, harus memenuhi syarat:
semua nilai f lebih antara 0 sampai dengan 1, atau nilai
minimumnya lebih besar sama dengan 0 dan nilai
maksimumnya lebih kecil dari 1.
>> min(f)
ans =
0.1250
>> max(f)
ans =
0.1875
Terlihat bahwa min(f) di atas 0 dan max(f) di bawah 1
Bila dijumlahkan semua nilai f dan hasilnya harus 1.
>> sum(f)
ans =
1
2.3.Fungsi Kepadatan Kumulatif
Fungsi kepadatan kumulatif (Cumulative Density Function) adalah suatu
fungsi yang menyatakan probabilitas terjadinya kejadian sampai
kejadian tertentu, dan didefinisikan fungsi kepadatan kumulatif F(si)
adalah probabilitas terjadinya semua kejadian S mulai dari s1
sampai dengan si, dan dituliskan:
F(si) = p(S  si)
= p(S=s1) + p(S=s2) + … + p(S=si)
= f(s1) + f(s2) + … + f(si)
Dengan mengambil contoh 2.2. di atas dengan pdf diketahui sebagai
berikut:
f=
0.1875 0.1250 0.1250 0.1250 0.1250 0.1250 0.1875
Maka fungsi kedapatan kumulatif diperoleh dengan:
2.3.Fungsi Kepadatan Kumulatif
>> for i=1:size(f,2)
F(i)=sum(f(1:i));
end
>> disp(F)
Columns 1 through 5
0.1875 0.3125 0.4375 0.5625
Columns 6 through 7
0.8125 1.0000
>> subplot(2,1,1), bar(f), grid
>> title(’pdf’)
>> subplot(2,1,2), bar(F), grid
>> title(’cdf’)
0.6875
2.3.Fungsi Kepadatan Kumulatif
Hasil
grafik
berikut
membedakan
fungsi
kepadatan
probabilitas
(pdf)
dan
fungsi
kepadatan
kumulatif
(cdf).
2.4.Ekspektasi Matematika
Nilai ekspektasi matematik adalah suatu nilai yang dapat digunakan untuk
mewakili kualitas data dalam bentuk range nilai. Ekspektasi matematika
dibagai menjadi dua bagian yaitu:
1. Ekspektasi pertama, yang berupa nilai pemusatan. Dalam hal ini ekspektasi
pertama ini dinyatakan sebagai nilai rata-rata, dan dituliskan dengan:
1 n
E ( x )   xi
n i 1
Selain rata-rata, nilai pemusatan yang banyak diguna-kan adalah nilai median
(nilai tengah). Median ini dapat ditentukan dengan menggunakan aturan
sebagai berikut:
m
1
f
(
s
)


i
2
i 1
dimana m adalah nilai median
Atau bisa dikatakan bahwa median (m) adalah suatu nilai dimana nilai fungsi
kepadatan kumulatifnya
F(m) = ½.
2.4.Ekspektasi Matematika
2. Ekspektasi kedua, yang berupa nilai penyebaran. Dalam hal ini
ekspektasi kedua ini dinyatakan sebagai nilai varians. Dengan istilah
lain ekspektasi kedua ini adalah rata-rata penyebaran di sekitar nilai
rata-rata dan dituliskan dengan:
1 n
2
2


E ( x) 
x

x

n  1 i 1
Contoh 2.3.
Diketahui data dari jumlah pelanggan yang melakukan transaksi
pembelian komputer setiap harinya di toko XYZ selama 10 hari adalah
sebagai berikut:
1430321123
Nilai rata-rata:
Varians:
x
1
1  4  3  0  3  2  1  1  2  3  2
10
1 10
1
2
s    x i  2   1  4  1  4  1  0  1  1  0  1  1.56
9 i 1
9
2
2.4.Ekspektasi Matematika
Ruang solusinya adalah:
S = {0,1,2,3,4}
Histogram dari data tersebut adalah:
H(0) = 1
H(1) = 3
H(2) = 2
H(3) = 3
H(4) = 1
Median dapat dihitung:
f(0) + f(1) = 0.4
f(0) + f(1) + f(2) = 0.6
Maka mediannya adalah 2
Funsi kepadatan probabilitasnya adalah:
f(0) = 1/10
f(1) = 3/10
f(2) = 2/10
f(3) = 3/10
f(4) = 1/10
Cara lain penentuan median, adalah dengan mengurutkan data kemudian data
yang berada di posisi tengah adalah median:
2.4.Ekspektasi Matematika
Implementasi persoalan di atas menggunakan MATLAB adalah sebagai berikut:
Mendefinisikan data
>> x=[1 4 3 0 3 2 1 1 2 3];
Menentukan ukuran data
>> n=size(x,2)
n=
10
Menentukan rata-rata data
>> xr=mean(x)
xr =
2
Menentukan varians
>> s2=var(x)
s2 =
1.5556
Menentukan ruang solusi (kejadian)
>> s=min(x):max(x)
s=
0 1 2 3 4
2.4.Ekspektasi Matematika
Menentukan ruang solusi (kejadian)
>> h=hist(x,s)
h=
1 3 2 3 1
>> bar(s,h), grid
Menentukan median
>> xmed=median(x)
xmed =
2
2.4.Ekspektasi Matematika
Contoh 2.4.
Diketahui transkrip nilai seorang mahasiswa pada semester 5 sebagai berikut:
Nilai rata-rata dapat dihitung dengan :
 N  K  44
xr 

 3.1429
14
K
i
i
i
i
i
2.4.Ekspektasi Matematika
Nilai ekspektasi range IP dari mahasiswa tersebut adalah:
3.14 – 0.34 = 2.80 sampai dengan 3.14 + 0.34 = 3.48
Implementasi dengan MATLAB untuk contoh 2.4 ini adalah sebagai berikut:
(1) Memasukkan data dalam array n (nilai) dan k(sks)
>> k=[1 2 2 1 2 1 2 1 2]
k=
Columns 1 through 8
1 2 2 1 2 1 2 1
Column 9
2
>> n=[4 3 3 3 2 3 3.5 4 3.5]
n=
Columns 1 through 5
4.0000 3.0000 3.0000 3.0000 2.0000
Columns 6 through 9
3.0000 3.5000 4.0000 3.5000
2) Menghitung rata-rata sebagai nilai Indeks prestasi
>> xr=sum(n.*k)/sum(k)
xr =
3.1429
>> s2=sum(k.*(n-xr).^2)/sum(k)
s2 =
0.3367
2.5.Probabilitas Bersyarat
Terkadang dalam suatu permasalahan, suatu keadaan tidak hanya
dipengaruhi oleh satu kejadian, tetapi bisa lebih dari satu kejadian.
Sehingga diperoleh suatu ruang solusi yang merupakan kombinasi
dari sejumlah kejadian yang ada. Misalkan terdapat dua kejadian si
dan ri, maka ruang solusinya dinyatakan sebagai berikut:
S = { (si,rj) | sis dan rir }
Atau ditulis:
S = { (si,rj) | sis  rir }
Sedangkan ruang solusi untuk n macam kejadian adalah :


S  si1 , si2 ,...sin sik  s k

2.5.Probabilitas Bersyarat
Contoh 2.5.
Diketahui dua macam kejadian yaitu nilai mahasiswa (N) yang berupa baik,
cukup dan kurang, dengan kejadian kecerdasan mahasiswa (C) yang berupa
cerdas dan tidak.
Probabilitas seorang mahasiswa yang cerdas memiliki nilai yang baik dituliskan
dengan:
p(C=cerdas,N=baik)
Probabilitas seorang mahasiswa yang cerdas memiliki nilai cukup atau kurang
dituliskan dengan:
p(C=cerdas,N=cukup  N=kurang)
Probabilitas seorang mahasiswa mendapatkan nilai baik bila diketahui dia cerdas
dituliskan dengan:
p(N=baik|C=cerdas)
Aksioma Probabilitas Bersyarat
Bila diketahui probabilitas dengan dua macam kejadian S dan R dinamakan
dengan probabilitas bersama yang dituliskan dengan p(R,S), maka :
P(R,S) = p(RS)
Probabilitas Bersama dan Probabilitas Marginal
Bila diketahui nilai probabilitas bersama p(R,S), maka p(R) dan p(S) dikatakan
probabilitas marginal.
2.5.Probabilitas Bersyarat
Contoh 2.6.
Dilakukan survey terhadap 100 orang untuk menghubungkan faktor usia dan
kemungkinan pikun. Hasil surveynya diperoleh sebagai berikut:
Maka probabilitas bersama dari data tersebut adalah, setiap nilai dibagi dengan
100 dan dijumlahkan untuk setiap baris dan setiap kolom.
2.5.Probabilitas Bersyarat
Probabilitas seseorang berusia dewasa dan pikun adalah :
p(U=Dewasa, P=Pikun) = 0.01
Probabilitas seseorang belum dewasa dan pikun adalah :
p(U=Anak2  U=Remaja, P=pikun)
= p(U=Anak2, P=pikun) + p(U=Remaja, P=pikun)
= 0 + 0.01
= 0.01
Probabilitas seseorang pikun adalah :
p(P=Pikun) = 0.26
Fungsi kepadatan untuk usia adalah :
f(Anak2) = 0.2
f(Dewasa) = 0.3
f(Remaja) = 0.2
f(Tua) = 0.3
Fungsi kepadatan untuk pikun adalah :
f(pikun) = 0.26
f(tidak pikun) = 0.74
2.5.Probabilitas Bersyarat
RUANG SOLUSI BAYES
Diketahui suatu ruang solusi fungsi probabilitas bersama
f(x1,x2,...,xn)
mempunyai n himpunan bagian solusi yang dinamakan dengan fungsi
probabilitas marginal f(x1), f(x2), ...., f(xn) dan digambarkan
dengan:Ss1s2s3sn…
Gambar 2.5. Ruang Solusi Bayes
Ruang solusi di atas didefinisikan dengan:
p(s) = p(s1)  p(s2)  p(s3)  ...  p(sn)
dan
p(sisj) =p(si)  p(sj) = 0 untuk i  j.
2.5.Probabilitas Bersyarat
THEOREMA BAYES
Probabilitas suatu kejadian A dengan diketahui kejadian yang lain misalkan B
didefinisikan sebagai nilai perbandingan nilai probabilitas bersama dari A dan
B dengan nilai probabilitas B, dan dituliskan dengan:
p( A | B) 
p( A, B)
p( B)
Theorema Bayes ini menggambarkan suatu nilai probabilitas kejadian dengan
diketahui kejadian sebelumnya atau dengan kata lain menjelaskan keadaan
posterioi dengan diketahui keadaan prior.
Perhatikan pada contoh 2.6, diketahui P adalah pikun dan U adalah usia.
Diketahui bahwa probabilitas seseorang pikun dan berusia dewasa adalah
p(P=pikun, U=dewasa) = 0.05, dan probabilitas dewasa adalah p(U=dewasa)
= 0.3, maka probabilitas seseorang akan pikun bila diketahui usianya dewasa
adalah:
p( P  pikun,U  dewasa )
p( P  pikun | U  dewasa ) 

0.05 1
  0.1667
0.3 6
p(U  dewasa )
2.5.Probabilitas Bersyarat
Atau probabilitas seseorang tidak pikun bila diketahui usianya belum tua.
p ( P  tidak pikun | U  tua) 
0.2  0.19  0.25
0.2  0.2  0.3
0.63

 0.9
0.7

p ( P  tidak pikun , U  tua)
p (U  tua)
2.6.Ketidak-tergantungan Stokastik
Ketidak-tergantungan stokastik (stochastic independent) merupakan suatu
pernyataan hubungan bebas antar dua distribusi data. Untuk dapat mengukur
ketidak-tergantungan stokastik ini dapat digunakan nilai kovarian dan korelasi.
Kovarian
Kovarian antara dua distribusi yang dinyatakan oleh fungsi kepadatan
probabilitas x dan y didefinisikan sebagai:
1 n
cov( x, y )    xi  x  y i  y 
n i 1
Kovarian ini merupakan suatu nilai hubungan range dan arah range sekitar ratarata dari distribusi x dan y.
Korelasi
Korelasi antara dua distribusi x dan y adalah nilai koefisien satuan dari hubungan
antara distribusi x dan y, dan didefinisikan sebagai nilai kovarian dibagi
dengan perkalian sebaran (standard deviasi) masing-masing distribusi, ditulis:
corr ( x, y) 
cov( x, y)
 x y
2.6.Ketidak-tergantungan Stokastik
atau dituliskan dengan:
n
corr ( x, y ) 
 x
i 1
i
 x  y i  y 
n x y
Hubungan antara distribusi x dan y berdasarkan nilai korelasinya dinyatakan
sebagai grafik berikut ini:
Gambar 2.5. Gambaran hubungan dua
distribusi dengan nilai korelasinya
Corr(x,y) > 0
Corr(x,y) = 0
Corr(x,y) < 0
2.6.Ketidak-tergantungan Stokastik
Grafik 2.5 menyatakan hubungan distribusi x dan y adalah sebagai berikut:
Bila corr(x,y) > 0, maka distribusi x dan y berbanding lurus, artinya bahwa
kenaikan pada x akan mengakibatkan kenaikan pada y.
Bila corr(x,y) = 0, maka distribusi x dan y tidak saling bergantung, keadaan inilah
yang dinamakan dengan ketidak-tergantungan stokastik.
Bila corr(x,y) < 0, maka distribusi x dan y berbanding terbalik, artinya kenaikan
pada x akan mengakibatkan penurunan pada y dan sebaliknya.
Ada satu hal yang menarik bahwa nilai korelasi berada dalam range –1 < corr <
1, sehingga dapat dikatakan bahwa korelasi adalah suatu koefisien normal
dari kovarian.
Contoh 2.8.
Diketahui dua distribusi yang berupa data penjualan baju anak-anak (B) dan
penjualan mainan (M) yang dilihat pada setiap hari sebagai berikut.
2.6.Ketidak-tergantungan Stokastik
Nilai Rata-rata:
Rata-rata penjualan baju anak-anak adalah 3.6.
Rata-rata penjualan mainan adalah 3.6.
Nilai Standard Deviasi
Standard deviasi penjualan baju anak-anak = 1.897
Standard deviasi penjualan mainan = 0.994
Kovarian dari penjualan baju anak-anak dan penjualan mainan adalah :
1 10
cov( B, M )   bi  3.6mi  3.1  0.24
10 i 1
Korelasi dari penjualan baju anak-anak dan penjualan mainan adalah:
corr ( B, M ) 
cov( B, M )
 B M

0.24
 0.127
1.897 0.994
2.6.Ketidak-tergantungan Stokastik
Ternyata masih ada hubungan lurus antara penjualan baju anak-anak dan
penjualan mainan. Artinya kenaikan penjualan baju anak-anak akan
menaikkan juga penjualan mainan anak-anak.
Implementasi dengan MATLAB untuk contoh 2.8. ini adalah sebagai berikut:
(1) Menuliskan data penjualan baju anak-anak (b) dan data penjualan mainan (m)
>> b=[2 4 3 6 5 3 7 1 3 2]
b=
Columns 1 through 8
2 4 3 6 5 3 7
Columns 9 through 10
3 2
>> m=[4 5 2 3 3 2 3 2 4 3]
m=
Columns 1 through 8
4 5 2 3 3 2 3
Columns 9 through 10
4 3
1
2
2.6.Ketidak-tergantungan Stokastik
(2) Menghitung nilai rata-rata penjualan baju anak-anak dan mainan
>> br=mean(b)
br =
3.6000
>> mr=mean(m)
mr =
3.1000
(3) Menghitung nilai standard deviasi penjualan baju anak-anak dan mainan
>> sb=std(b)
sb =
1.8974
>> sm=std(m)
sm =
0.9944
(4) Menghitung nilai kovarian antara penjualan baju anak-anak dan mainan
>> kovarian=sum((b-br).*(m-mr))/10
kovarian =
0.2400
2.6.Ketidak-tergantungan Stokastik
(5) Menghitung nilai korelasi antara penjualan baju anak-anak dan mainan
>> korelasi=kovarian/(sb*sm)
korelasi =
0.1272
Perhatikan bila kedua data ini digambarkan secara bersama dengan
dihubungkan setiap titiknya pada satu grafik maka terlihat seperti berikut:
>> t=1:size(m,2);
>> plot(t,b,'.-',t,m,'o:'), grid
Grafik 2.6.
Grafik data
penjualan
baju dan
mainan
Pada grafik 2.6. di atas terlihat adanya kesamaan pola gerakan, ketika data
penjualan baju anak-anak naik, maka data pen-jualan mainan naik, dan ketika
data penjualan baju anak-anak turun maka data penjualan mainan juga turun
Download