BABA 2 TEORI PROBABILITAS 2.1.Ruang Solusi dan Kejadian Dalam suatu percobaan, semua kejadian yang mungkin dinamakan sebagai ruang solusi dan dituliskan dengan: S={semua kejadian si yang muncul} Misalkan pengambilan kelereng pada sebuah kantong, dimana dalam kantong terdapat 8 kelereng yang sudah diberi nomor 1 sampai dengan 8, maka pengambilan 1 kelereng akan meng-hasilkan ruang solusi: S={1,2,3,4,5,6,7,8} Sebagai contoh lain dinyatakan bahwa jumlah mobil yang lewat di depan toko XYZ setiap menitnya pada siang hari maksimal 5 buah mobil, tetapi terkadang tidak ada yang lewat. Maka ruang solusi yang diperoleh adalah: S={0,1,2,3,4,5} BABA 2 TEORI PROBABILITAS 2.1.Ruang Solusi dan Kejadian Kemunculan setiap kejadian si di dalam ruang solusi S dinama-kan dengan frekwensi kejadian. Frekwensi kejadian untuk semua kejadian dalam ruang solusi S akan menghasilkan histogram. Sebagai contoh diketahui data jumlah mobil yang melintasi gerbang tol untuk setiap menit adalah sebagai berikut: Maka ruang solusi dari kejadian ini adalah: S={0,1,2,3,4,5} Histogram yang menyatakan frekwensi setiap kejadian adalah: Artinya 0 buah mobil yang lewat setiap menitnya terjadi 1 kali, 1 buah mobil yang lewat setiap menitnya terjadi 1 kali, 2 buah mobil yang lewat setiap menitnya terjadi 2 kali, 3 buah mobil yang lewat setiap menitnya terjadi 3 kali, 4 buah mobil yang lewat setiap menitnya terjadi 0 kali dan 5 buah mobil yang lewat setiap menitnya terjadi 1 kali. 2 Teori Probabilitas 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 Histogram contoh 1 Implementasi dari penentuan histogram ini menggunakan MATLAB adalah sebagai berikut % Mendefinisikan data % Pada baris ini data bisa diganti-ganti x=[3 5 3 3 2 0 1 2]; % Menentukan ukuran data n=size(x,2); % Menentukan ruang solusi % dimana ruang solusi dari minimun data % sampai dengan maksimum data s=min(x):max(x); % Menghitung histogram h=hist(x,s); % Menggambar histogram bar(s,h), grid 2.2.Fungsi Kepadatan Probabilitas Fungsi kepadatan probabilitas (probabilty density function) adalah suatu fungsi yang menyatakan nilai kemungkinan terjadinya kejadian tertentu (si) dan dituliskan dengan: f(s) = P(S=si) Fungsi kepadatan probabilitas mempunyai beberapa sifat, antara lain: 0 ≤ f(si) ≤ 1, hal ini disebabkan nilai kemungkinan berada dalam range 0 s/d 1, dimana 0 berarti tidak akan terjadi dan 1 berarti pasti terjadi Jumlah fungsi dari seluruh kejadian adalah 1 (pasti n terjadi), dan dituliskan dengan: f (s ) 1 i 1 i 2.2.Fungsi Kepadatan Probabilitas Contoh 2.1. Bila sebuah mata uang dilempar maka kejadian yang akan muncul adalah gambar (G) atau angka (A). Ruang solusinya adalah: S={G,A} Kemungkinan munculnya gambar adalah ½ dan kemungkinan munculnya angka adalah ½. Sehingga fungsi kepadatan probabilitas sebagai berikut: p(S=G) = 1/2 p(S=A) = 1/2 2.2.Fungsi Kepadatan Probabilitas Contoh 2.2. Tiga buah mata uang dilempar, maka kejadian yang akan muncul adalah kombinasi antara gambar (G) dan angka (A), dengan ruang solusi sebagai berikut: S={AAA, AAG, AGA, AGG, GAA, GAG, GGA, GGG} Bila ruang solusi diambil tanpa memperhitungkan urutan, maka ruang solusi yang ada adalah: S = { 3G, 2G1A, 1G2A, 3A} Fungsi probabilitas yang diperoleh adalah: f(3G) = 1/8 f(2G1A) = 3/8 f(1G2A) = 3/8 f(3A) = 1/8 2.2.Fungsi Kepadatan Probabilitas 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 3G 2G1A 1G2A 3A Gambar 2.2. Grafik fungsi kepadatan probabilitas untuk pelemparan 3 mata uang. Perhatikan pada contoh di atas, bahwa fungsi kepadatan probabilitas merupakan perwujudan lain dari histogram, dimana fungsi kepadatan probabilitas ini adalah histogram dengan setiap nilainya dibagi dengan jumlah semua kejadian. Pada histogram : Pada fungsi kepadatan prob. : H(3G) = 1 f(3G) = 1/8 H(2G1A) = 3 f(2G1A) = 3/8 H(1G2A) = 3 f(1G2A) = 3/8 H(3G) = 1 f(3G) = 1/8 Dengan jumlah semua kejadian adalah 8. 2.2.Fungsi Kepadatan Probabilitas Contoh 2.2. Diketahui data jumlah panggilan telepon setiap detiknya yang diambil pada 16 detik sebagai berikut: 6717436115572432 Implementasi dengan menggunakan MATLAB: (1) Menuliskan data sebagai x >> x=[6 7 1 7 4 3 6 1 1 5 5 7 2 4 3 2]; (2) Menghitung jumlah data >> n=size(x,2) n= 16 (3) Mendefinisikan ruang solusi (kejadian) >> s=min(x):max(x) s= 1 2 3 4 5 6 7 2.2.Fungsi Kepadatan Probabilitas (3) Menghitung histogram >> h=hist(x,s) h= 3 2 2 2 2 2 3 (3) Menghitung fungsi kepadatan probabilitas dengan histogram dibagi dengan jumlah kejadian >> f=h/sum(h) f= 0.1875 0.1250 0.1250 0.1250 0.1250 0.1250 0.1875 (3) Menggambarkan fungsi kepadatan probabilitas >> bar(s,f), grid Gambar 2.3. contoh fungsi kepadatan probabilitas 2.2.Fungsi Kepadatan Probabilitas Untuk membuktikan bahwa f adalah suatu fungsi kepadatan probabilitas, harus memenuhi syarat: semua nilai f lebih antara 0 sampai dengan 1, atau nilai minimumnya lebih besar sama dengan 0 dan nilai maksimumnya lebih kecil dari 1. >> min(f) ans = 0.1250 >> max(f) ans = 0.1875 Terlihat bahwa min(f) di atas 0 dan max(f) di bawah 1 Bila dijumlahkan semua nilai f dan hasilnya harus 1. >> sum(f) ans = 1 2.3.Fungsi Kepadatan Kumulatif Fungsi kepadatan kumulatif (Cumulative Density Function) adalah suatu fungsi yang menyatakan probabilitas terjadinya kejadian sampai kejadian tertentu, dan didefinisikan fungsi kepadatan kumulatif F(si) adalah probabilitas terjadinya semua kejadian S mulai dari s1 sampai dengan si, dan dituliskan: F(si) = p(S si) = p(S=s1) + p(S=s2) + … + p(S=si) = f(s1) + f(s2) + … + f(si) Dengan mengambil contoh 2.2. di atas dengan pdf diketahui sebagai berikut: f= 0.1875 0.1250 0.1250 0.1250 0.1250 0.1250 0.1875 Maka fungsi kedapatan kumulatif diperoleh dengan: 2.3.Fungsi Kepadatan Kumulatif >> for i=1:size(f,2) F(i)=sum(f(1:i)); end >> disp(F) Columns 1 through 5 0.1875 0.3125 0.4375 0.5625 Columns 6 through 7 0.8125 1.0000 >> subplot(2,1,1), bar(f), grid >> title(’pdf’) >> subplot(2,1,2), bar(F), grid >> title(’cdf’) 0.6875 2.3.Fungsi Kepadatan Kumulatif Hasil grafik berikut membedakan fungsi kepadatan probabilitas (pdf) dan fungsi kepadatan kumulatif (cdf). 2.4.Ekspektasi Matematika Nilai ekspektasi matematik adalah suatu nilai yang dapat digunakan untuk mewakili kualitas data dalam bentuk range nilai. Ekspektasi matematika dibagai menjadi dua bagian yaitu: 1. Ekspektasi pertama, yang berupa nilai pemusatan. Dalam hal ini ekspektasi pertama ini dinyatakan sebagai nilai rata-rata, dan dituliskan dengan: 1 n E ( x ) xi n i 1 Selain rata-rata, nilai pemusatan yang banyak diguna-kan adalah nilai median (nilai tengah). Median ini dapat ditentukan dengan menggunakan aturan sebagai berikut: m 1 f ( s ) i 2 i 1 dimana m adalah nilai median Atau bisa dikatakan bahwa median (m) adalah suatu nilai dimana nilai fungsi kepadatan kumulatifnya F(m) = ½. 2.4.Ekspektasi Matematika 2. Ekspektasi kedua, yang berupa nilai penyebaran. Dalam hal ini ekspektasi kedua ini dinyatakan sebagai nilai varians. Dengan istilah lain ekspektasi kedua ini adalah rata-rata penyebaran di sekitar nilai rata-rata dan dituliskan dengan: 1 n 2 2 E ( x) x x n 1 i 1 Contoh 2.3. Diketahui data dari jumlah pelanggan yang melakukan transaksi pembelian komputer setiap harinya di toko XYZ selama 10 hari adalah sebagai berikut: 1430321123 Nilai rata-rata: Varians: x 1 1 4 3 0 3 2 1 1 2 3 2 10 1 10 1 2 s x i 2 1 4 1 4 1 0 1 1 0 1 1.56 9 i 1 9 2 2.4.Ekspektasi Matematika Ruang solusinya adalah: S = {0,1,2,3,4} Histogram dari data tersebut adalah: H(0) = 1 H(1) = 3 H(2) = 2 H(3) = 3 H(4) = 1 Median dapat dihitung: f(0) + f(1) = 0.4 f(0) + f(1) + f(2) = 0.6 Maka mediannya adalah 2 Funsi kepadatan probabilitasnya adalah: f(0) = 1/10 f(1) = 3/10 f(2) = 2/10 f(3) = 3/10 f(4) = 1/10 Cara lain penentuan median, adalah dengan mengurutkan data kemudian data yang berada di posisi tengah adalah median: 2.4.Ekspektasi Matematika Implementasi persoalan di atas menggunakan MATLAB adalah sebagai berikut: Mendefinisikan data >> x=[1 4 3 0 3 2 1 1 2 3]; Menentukan ukuran data >> n=size(x,2) n= 10 Menentukan rata-rata data >> xr=mean(x) xr = 2 Menentukan varians >> s2=var(x) s2 = 1.5556 Menentukan ruang solusi (kejadian) >> s=min(x):max(x) s= 0 1 2 3 4 2.4.Ekspektasi Matematika Menentukan ruang solusi (kejadian) >> h=hist(x,s) h= 1 3 2 3 1 >> bar(s,h), grid Menentukan median >> xmed=median(x) xmed = 2 2.4.Ekspektasi Matematika Contoh 2.4. Diketahui transkrip nilai seorang mahasiswa pada semester 5 sebagai berikut: Nilai rata-rata dapat dihitung dengan : N K 44 xr 3.1429 14 K i i i i i 2.4.Ekspektasi Matematika Nilai ekspektasi range IP dari mahasiswa tersebut adalah: 3.14 – 0.34 = 2.80 sampai dengan 3.14 + 0.34 = 3.48 Implementasi dengan MATLAB untuk contoh 2.4 ini adalah sebagai berikut: (1) Memasukkan data dalam array n (nilai) dan k(sks) >> k=[1 2 2 1 2 1 2 1 2] k= Columns 1 through 8 1 2 2 1 2 1 2 1 Column 9 2 >> n=[4 3 3 3 2 3 3.5 4 3.5] n= Columns 1 through 5 4.0000 3.0000 3.0000 3.0000 2.0000 Columns 6 through 9 3.0000 3.5000 4.0000 3.5000 2) Menghitung rata-rata sebagai nilai Indeks prestasi >> xr=sum(n.*k)/sum(k) xr = 3.1429 >> s2=sum(k.*(n-xr).^2)/sum(k) s2 = 0.3367 2.5.Probabilitas Bersyarat Terkadang dalam suatu permasalahan, suatu keadaan tidak hanya dipengaruhi oleh satu kejadian, tetapi bisa lebih dari satu kejadian. Sehingga diperoleh suatu ruang solusi yang merupakan kombinasi dari sejumlah kejadian yang ada. Misalkan terdapat dua kejadian si dan ri, maka ruang solusinya dinyatakan sebagai berikut: S = { (si,rj) | sis dan rir } Atau ditulis: S = { (si,rj) | sis rir } Sedangkan ruang solusi untuk n macam kejadian adalah : S si1 , si2 ,...sin sik s k 2.5.Probabilitas Bersyarat Contoh 2.5. Diketahui dua macam kejadian yaitu nilai mahasiswa (N) yang berupa baik, cukup dan kurang, dengan kejadian kecerdasan mahasiswa (C) yang berupa cerdas dan tidak. Probabilitas seorang mahasiswa yang cerdas memiliki nilai yang baik dituliskan dengan: p(C=cerdas,N=baik) Probabilitas seorang mahasiswa yang cerdas memiliki nilai cukup atau kurang dituliskan dengan: p(C=cerdas,N=cukup N=kurang) Probabilitas seorang mahasiswa mendapatkan nilai baik bila diketahui dia cerdas dituliskan dengan: p(N=baik|C=cerdas) Aksioma Probabilitas Bersyarat Bila diketahui probabilitas dengan dua macam kejadian S dan R dinamakan dengan probabilitas bersama yang dituliskan dengan p(R,S), maka : P(R,S) = p(RS) Probabilitas Bersama dan Probabilitas Marginal Bila diketahui nilai probabilitas bersama p(R,S), maka p(R) dan p(S) dikatakan probabilitas marginal. 2.5.Probabilitas Bersyarat Contoh 2.6. Dilakukan survey terhadap 100 orang untuk menghubungkan faktor usia dan kemungkinan pikun. Hasil surveynya diperoleh sebagai berikut: Maka probabilitas bersama dari data tersebut adalah, setiap nilai dibagi dengan 100 dan dijumlahkan untuk setiap baris dan setiap kolom. 2.5.Probabilitas Bersyarat Probabilitas seseorang berusia dewasa dan pikun adalah : p(U=Dewasa, P=Pikun) = 0.01 Probabilitas seseorang belum dewasa dan pikun adalah : p(U=Anak2 U=Remaja, P=pikun) = p(U=Anak2, P=pikun) + p(U=Remaja, P=pikun) = 0 + 0.01 = 0.01 Probabilitas seseorang pikun adalah : p(P=Pikun) = 0.26 Fungsi kepadatan untuk usia adalah : f(Anak2) = 0.2 f(Dewasa) = 0.3 f(Remaja) = 0.2 f(Tua) = 0.3 Fungsi kepadatan untuk pikun adalah : f(pikun) = 0.26 f(tidak pikun) = 0.74 2.5.Probabilitas Bersyarat RUANG SOLUSI BAYES Diketahui suatu ruang solusi fungsi probabilitas bersama f(x1,x2,...,xn) mempunyai n himpunan bagian solusi yang dinamakan dengan fungsi probabilitas marginal f(x1), f(x2), ...., f(xn) dan digambarkan dengan:Ss1s2s3sn… Gambar 2.5. Ruang Solusi Bayes Ruang solusi di atas didefinisikan dengan: p(s) = p(s1) p(s2) p(s3) ... p(sn) dan p(sisj) =p(si) p(sj) = 0 untuk i j. 2.5.Probabilitas Bersyarat THEOREMA BAYES Probabilitas suatu kejadian A dengan diketahui kejadian yang lain misalkan B didefinisikan sebagai nilai perbandingan nilai probabilitas bersama dari A dan B dengan nilai probabilitas B, dan dituliskan dengan: p( A | B) p( A, B) p( B) Theorema Bayes ini menggambarkan suatu nilai probabilitas kejadian dengan diketahui kejadian sebelumnya atau dengan kata lain menjelaskan keadaan posterioi dengan diketahui keadaan prior. Perhatikan pada contoh 2.6, diketahui P adalah pikun dan U adalah usia. Diketahui bahwa probabilitas seseorang pikun dan berusia dewasa adalah p(P=pikun, U=dewasa) = 0.05, dan probabilitas dewasa adalah p(U=dewasa) = 0.3, maka probabilitas seseorang akan pikun bila diketahui usianya dewasa adalah: p( P pikun,U dewasa ) p( P pikun | U dewasa ) 0.05 1 0.1667 0.3 6 p(U dewasa ) 2.5.Probabilitas Bersyarat Atau probabilitas seseorang tidak pikun bila diketahui usianya belum tua. p ( P tidak pikun | U tua) 0.2 0.19 0.25 0.2 0.2 0.3 0.63 0.9 0.7 p ( P tidak pikun , U tua) p (U tua) 2.6.Ketidak-tergantungan Stokastik Ketidak-tergantungan stokastik (stochastic independent) merupakan suatu pernyataan hubungan bebas antar dua distribusi data. Untuk dapat mengukur ketidak-tergantungan stokastik ini dapat digunakan nilai kovarian dan korelasi. Kovarian Kovarian antara dua distribusi yang dinyatakan oleh fungsi kepadatan probabilitas x dan y didefinisikan sebagai: 1 n cov( x, y ) xi x y i y n i 1 Kovarian ini merupakan suatu nilai hubungan range dan arah range sekitar ratarata dari distribusi x dan y. Korelasi Korelasi antara dua distribusi x dan y adalah nilai koefisien satuan dari hubungan antara distribusi x dan y, dan didefinisikan sebagai nilai kovarian dibagi dengan perkalian sebaran (standard deviasi) masing-masing distribusi, ditulis: corr ( x, y) cov( x, y) x y 2.6.Ketidak-tergantungan Stokastik atau dituliskan dengan: n corr ( x, y ) x i 1 i x y i y n x y Hubungan antara distribusi x dan y berdasarkan nilai korelasinya dinyatakan sebagai grafik berikut ini: Gambar 2.5. Gambaran hubungan dua distribusi dengan nilai korelasinya Corr(x,y) > 0 Corr(x,y) = 0 Corr(x,y) < 0 2.6.Ketidak-tergantungan Stokastik Grafik 2.5 menyatakan hubungan distribusi x dan y adalah sebagai berikut: Bila corr(x,y) > 0, maka distribusi x dan y berbanding lurus, artinya bahwa kenaikan pada x akan mengakibatkan kenaikan pada y. Bila corr(x,y) = 0, maka distribusi x dan y tidak saling bergantung, keadaan inilah yang dinamakan dengan ketidak-tergantungan stokastik. Bila corr(x,y) < 0, maka distribusi x dan y berbanding terbalik, artinya kenaikan pada x akan mengakibatkan penurunan pada y dan sebaliknya. Ada satu hal yang menarik bahwa nilai korelasi berada dalam range –1 < corr < 1, sehingga dapat dikatakan bahwa korelasi adalah suatu koefisien normal dari kovarian. Contoh 2.8. Diketahui dua distribusi yang berupa data penjualan baju anak-anak (B) dan penjualan mainan (M) yang dilihat pada setiap hari sebagai berikut. 2.6.Ketidak-tergantungan Stokastik Nilai Rata-rata: Rata-rata penjualan baju anak-anak adalah 3.6. Rata-rata penjualan mainan adalah 3.6. Nilai Standard Deviasi Standard deviasi penjualan baju anak-anak = 1.897 Standard deviasi penjualan mainan = 0.994 Kovarian dari penjualan baju anak-anak dan penjualan mainan adalah : 1 10 cov( B, M ) bi 3.6mi 3.1 0.24 10 i 1 Korelasi dari penjualan baju anak-anak dan penjualan mainan adalah: corr ( B, M ) cov( B, M ) B M 0.24 0.127 1.897 0.994 2.6.Ketidak-tergantungan Stokastik Ternyata masih ada hubungan lurus antara penjualan baju anak-anak dan penjualan mainan. Artinya kenaikan penjualan baju anak-anak akan menaikkan juga penjualan mainan anak-anak. Implementasi dengan MATLAB untuk contoh 2.8. ini adalah sebagai berikut: (1) Menuliskan data penjualan baju anak-anak (b) dan data penjualan mainan (m) >> b=[2 4 3 6 5 3 7 1 3 2] b= Columns 1 through 8 2 4 3 6 5 3 7 Columns 9 through 10 3 2 >> m=[4 5 2 3 3 2 3 2 4 3] m= Columns 1 through 8 4 5 2 3 3 2 3 Columns 9 through 10 4 3 1 2 2.6.Ketidak-tergantungan Stokastik (2) Menghitung nilai rata-rata penjualan baju anak-anak dan mainan >> br=mean(b) br = 3.6000 >> mr=mean(m) mr = 3.1000 (3) Menghitung nilai standard deviasi penjualan baju anak-anak dan mainan >> sb=std(b) sb = 1.8974 >> sm=std(m) sm = 0.9944 (4) Menghitung nilai kovarian antara penjualan baju anak-anak dan mainan >> kovarian=sum((b-br).*(m-mr))/10 kovarian = 0.2400 2.6.Ketidak-tergantungan Stokastik (5) Menghitung nilai korelasi antara penjualan baju anak-anak dan mainan >> korelasi=kovarian/(sb*sm) korelasi = 0.1272 Perhatikan bila kedua data ini digambarkan secara bersama dengan dihubungkan setiap titiknya pada satu grafik maka terlihat seperti berikut: >> t=1:size(m,2); >> plot(t,b,'.-',t,m,'o:'), grid Grafik 2.6. Grafik data penjualan baju dan mainan Pada grafik 2.6. di atas terlihat adanya kesamaan pola gerakan, ketika data penjualan baju anak-anak naik, maka data pen-jualan mainan naik, dan ketika data penjualan baju anak-anak turun maka data penjualan mainan juga turun