Teorema Bayes - #4 PAC175 (3 sks) DATA MINING Nurdin Bahtiar, S.Si, MT 4.1 Ide Dasar Misalkan ada dua jenis ikan (bandeng dan kakap) yang berjalan melalui conveyor. Kita diminta mengamati objek-objek tersebut lewat di conveyor secara random dan memprediksi ikan apa yang akan lewat selanjutnya. Akan ada dua kemungkinan: misalkan h1 mewakili ikan bandeng dan h2 mewakili ikan kakap. Jika sebelumnya diketahui bahwa jumlah ikan bandeng dan kakap yang ditangkap sama banyak, maka peluang munculnya kedua ikan tersebut sama besar. 4.1 Ide Dasar (cont’d) Selanjutnya didefinisikan suatu Probabilitas Prior: » P(h1) : Peluang munculnya ikan bandeng » P(h2) : Peluang munculnya ikan kakap Probabilitas prior tersebut menyatakan perkiraan kita akan jenis ikan apa yang muncul berikutnya sebelum ada ikan yang benar-benar lewat di conveyor itu. Misal N adalah jumlah total ikan yang tertangkap, N1 dan N2 menyatakan jumlah ikan bandeng dan jumlah ikan kakap, maka: » » P(h1) = N1 / N P(h2) = N2 / N 4.2 Formula Bentuk umum teorema Bayes: atau Dimana Probabilitas Bersyarat: P(x | h) menyatakan peluang munculnya x jika diketahui h. dan: Contoh 1 Diketahui suatu kondisi sbb: Peluang munculnya cacat jika diambil produk dari pabrik A adalah: Jika secara random diambil dan ternyata hasilnya cacat, maka peluang barang yang terambil tsb dari pabrik A adalah: Contoh 2 Terdapat dua hipotesis: 1. Pasien mengidap kanker 2. Pasien tidak mengidap kanker Data yang tersedia dari uji lab memiliki 2 kemungkinan, yaitu positif (+) dan negatif (-). Terdapat informasi prior bahwa untuk keseluruhan populasi hanya 0.008 yang menderita kanker. Uji lab menunjukkan bahwa dari seluruh keluaran positif, yang benar mengidap kanker 98%. Sedangkan dari seluruh keluaran negatif, yang benar tidak mengidap kanker 97%. Contoh 2 lanj Dari situasi tersebut dapat kita rangkum: P(cancer) = 0.008 --> P(~ cancer) = 0.992 P(+ | cancer) = 0.98 --> P(- | cancer) = 0.02 P(- | ~ cancer) = 0.97 --> P(+ | ~ cancer) = 0.03 Jika disajikan dalam bentuk tabel: Uji Lab cancer ~ cancer + 0.98 0.03 - 0.02 0.97 0.008 0.992 Misalkan ada uji lab baru dan hasilnya positif. Apa kesimpulan kita akan pasien yang bersangkutan (cancer / tidak)? Contoh 2 lanj Sehingga probabilitas posterior dapat dihitung sebagai berikut: LATIHAN Suatu generator telekomunikasi nirkabel mempunyai 3 pilihan tempat untuk membangun pemancar sinyal yaitu di daerah tengah kota, daerah kaki bukit , dan tepi pantai, dengan masing-masing mempunyai peluang 0.2, 0.3, dan 0.5. Bila pemancar dibangun di tengah kota, peluang terjadi ganguan sinyal adalah 0.05. Bila pemancar dibangun dikaki bukit, peluang terjadinya ganguan sinyal adalah 0.06. Bila pemancar dibangun ditepi pantai, pelaung ganguan sinyal adalah 0.08 Pertanyaan: A. Berapakah peluang terjadinya ganguan sinyal? B. Bila diketahui telah terjadinya gangguan pada sinyal, berapa peluang bahwa operator tsb ternyata telah membangun pemancar di tepi pantai? LATIHAN Jawaban: Tengah Kota Kaki Bukit Tepi Pantai Pasang 0.2 0.3 0.5 Gangguan Sinyal 0.05 0.06 0.08 A. P(GS) = 0.2x0.05 + 0.3x0.06 + 0.5x0.08 = 0.068 B. Peluang terpasang di Tepi Pantai jika terjadi gangguan sinyal: End Of File