klasifikasi pendonor darah dengan metode naive bayes

advertisement
KLASIFIKASI CALON PENDONOR DARAH
DENGAN METODE NAIVE BAYES CLASIFIER
Sukma Nur Fais A, Muhammad Aditya D*, Satria Mulya I,
Donny Ramadien, Askia Sani
Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya,
Malang, 65418, Indonesia
*)E-mail: [email protected]
Abstrak
Untuk mempermudah kinerja PMI dalam mengklasifikasikan calon pendonor darah
apakah termasuk ke dalam kelas pendonor ataupun kelas non pendonor maka kami
membuat inovasi yaitu dengan membuat aplikasi klasifikasi calon pendonor darah
dengan metode Klasifikasi Naive Bayes berbasis pemrograman PHP. Dengan cara
komputerisasi inilah diharapkan dapat membantu kinerja PMI agar lebih cepat dan
tepat dalam mengklasifikasikan calon pendonor darah. Penggunaan metode naïve bayes
sebagai metode utama dalam pengklasifikasian karena metode ini merupakan
pengklasifikasi paling sederhana dari model pengklasifikasian dengan peluang.
Terdapat dua jenis atribut data set yaitu kontinu dan diskrit. Kedua jenis data ini lah
yang nantinya kami gunakan dalam menentukan peluang dengan menggunakan metode
Klasifikasi Naive Bayes.
Kata Kunci: klasifikasi naive bayes, kontinu, diskrit
Abstract
To facilitate the performance of PMI in classifying prospective blood donors are
included in the class donors or non-donors classes we create innovation is to make an
application to the classification of prospective blood donors Clasifier Naive Bayes
method based PHP programming. By way of computerization is expected to help the
performance of the PMI to be faster and more accurate in classifying the prospective
blood donors. The use of naïve bayes method as the main method of classification as it
is the simplest classifiers of classification models by chance. There are two types of
attribute data set that continues and discrete. Both types of data is the one which we will
use in determining the chances of using the Naive Bayes Clasifier.
Keywords: naïve bayes clasifier, continues, discrete.
1
Classifier untuk menentukan peluang
1. PENDAHULUAN
Donor darah merupakan proses
pengambilan
darah
dari
kemungkinan besar seseorang dapat
seseorang
mendonorkan darah.
secara sukarela untuk disimpan di bank
Terlepas dari desain yang naif dan
darah untuk kemudian dipakai pada
asumsi yang tampak disederhanakan,
transfusi
pengklasifikasian naive bayes telah
darah
bagi
pasien
yang
membutuhkan.[1]
Untuk
bekerja cukup baik di banyak situasi
dapat
menyumbangkan
yang kompleks yang ada di dunia nyata.
darah, seorang donor darah harus
Pada tahun 2004, analisis masalah
memenuhi syarat sebagai berikut [2]:
klasifikasi bayesian telah menunjukkan
1. calon donor harus berusia 18-60
bahwa ada beberapa alasan teoritis
tahun,
keberhasilan yang tampaknya tidak
2. berat badan minimal 45 kg
masuk akal dari pengklasifikasian naif
3. kadar hemoglobin >12,5 gr %
bayes [3].
4. tensi atas 100-150 (sistole)
Metode
5. tensi bawah 70-100 (diastole).
metode yang digunakan memprediksi
6. tidak pernah memiliki penyakit
probabilitas.
menular.
Naive
Bayes
merupakan
Sedangkan
klasifikasi
Bayes adalah klasifikasi statistik yang
7. interval dibolehkan donor kembali
dapat memprediksi kelas suatu anggota
selama 3 bulan.
probabilitas. Untuk klasifikasi Bayes
Selama ini PMI (Palang Merah
sederhana yang lebih dikenal sebagai
Indonesia) masih menggunakan metode
naïve
yang manual
dalam penentuan calon
diasumsikan bahwa efek dari suatu nilai
pendonor darah. Oleh karena itu kami
atribut sebuah kelas yang diberikan
menawarkan sebuah inovasi dengan
adalah bebas dari atribut-atribut lain.
menggunakan aplikasi berbasis PHP
Naïve
dengan menggunakan metode Naive
sebuah metoda klasifikasi yang berakar
Bayes
menentukan
pada teorema Bayes. Ciri utama dari
seorang calon pendonor termasuk kelas
Naïve Bayes Classifier ini adalah
pendonor atau non pendonor.
asumsi yang sangat kuat (naif) akan
Clasifier
untuk
Bayesian
Bayes
independensi
Classifier
Classifier
dari
dapat
merupakan
masing-masing
2. METODE PENELITIAN
kondisi/kejadian[4],dimana diasumsikan
Dalam pembuatan aplikasi ini, kita
bahwa setiap atribut
menggunakan
sampel) bersifat saling lepas satu sama
teknik
Naïve
Bayes
2
contoh (data
lain berdasarkan atribut kelas. Naive
untuk
bayes categorial adalah naive bayes
persamaan.
dengan data static berupa kategori atau
Mean(µ) merupakan
merupakan data pasti, sehingga dalam
diperoleh dari atribute yang memiliki
pengerjaannya sudah didapatkan hasil
data continue.
yang pasti juga. Naive bayes merupakan
Dengan rumus sebagai berikut:
metode dengan rumus dasar bayesian,
atribut
Xi

Mean   
Pada teorema Bayes, bila terdapat dua
kejadian yangterpisah (misalkan A dan
n
i 1
dinyatakan
rata-rata
yang
xi
n
B), maka teorema Bayes dirumuskan
(pers 2)
sebagai berikut:
P A | B  
pada
Sedangkan untuk parameter kedua yaitu
variansi (σ2) didapat dari rumus sebagaii
P  B | A  P  A 
P B 
berikut:
(pers 1)
2 
Dimana probabilitas dari A dengan
1
2
n

i  n  xi   
n 1
ketentuan B didapat dari probabilitas
(pers3)
data B terhadap A dikali kemudian
Dari parameter-parameter yang sudah
dibagi peluang B.
kita temukan akan didapat fungsi
Untuk memperkirakan parameter pada
densitas mengekspresikan probabilitas
distribusi fitur ini, seseorang harus
relatif. fungsi densitas probabilitasnya
mengasumsikan
adalah sebagai berikut:
menghasilkan
distribusi
model
atau
nonparametrik
  , x  
untuk fitur dari training data set [5].
Jika berhadapan dengan atribut bertipe

1
2 2
e
 x   2
2 2
data kontinu, sebuah asumsi yang khas
(pers 4)
adalah bahwa nilai-nilai terus menerus
Sedangkan untuk atribut yang bertipe
berhubungan dengan kelasnya masing-
discrete dengan mencari masing-masing
masing yang didistribusikan menurut
likelihood
metode distribusi Gaussian. Distribusi
pendonor dan non pendonor. Dan hasil
ini dikarakterisasi dengan dua parameter
keseluruhannya dikalikan dengan prior
2
yaitu mean (μ), dan variansi(σ ), untuk
suatu
fitur
dari
kelas
nya masing-masing dari setiap kelas.
setiap kelas yj, peluang kelas bersyarat
3
3. PEMBAHASAN
Kami
Untuk pengujian klasifikasi naive bayes
pemrograman php dalam pembuatan
dengan data kontinyu dan data discrete
aplikasi ini. Yang ditampilkan seperti
yaitu
gambar berikut
dilakukan
percobaan
dengan
mengggunakan
bahasa
menggunakan data dari pendonor dan
non pendonor. Contoh data yang kami
gunakan dalam melakukan percobaan ,
dijabarkan pada tabel dibawah ini :
Data Training
Pendonor
Non
Pendonor
200
Data Testing
Pendonor
150
Non
Pendonor
25
25
Gambar 1.
Tabel 1. Jumlah
data
training
datatesting Percobaan 4
dan
Tampilan
Interface
Aplikasi
Klasifikasi Donor Darah.
Pada percobaan keempat kami
melakukan pengujian terhadap 350 data
training yang terdiri dari 250 data
pendonor dan 150 data non pendonor.
Diuji dengan 50 buah data testing.
Dengan rincian 25 pendonor dan 25 non
pendonor. Untuk menentukan seseorang
Gambar 2.
calon pendonor masuk kelas pendonor
Contoh menginputkan data
testing ke dalam program.
atau kelas non pendonor. Kemudian 8
fitur yang nantinya akan digunakan
adalah sebagai berikut :
1. HB
2. Tensi atas
3. Tensi bawah
4. Berat badan
5. Umur
6. Jenis Kelamin
Gambar 3. Contoh hasil program
7. Riwayat Penyakit Menular
Ketika
8. Interval Donor
telah
diproses
menunjukan
bahwa hasil percobaan tersebut adalah
4
boleh donor dan termasuk kedalam
ini adalah dengan hasil Prosentase
kelas Pendonor.
keakuratan:
4. SIMPULAN
keakuratan 
Penggunaan
clasifier
metode
dalam
naive
bayes
296
100 %
4
 74 %
Akurasi atau ketepatan program yang
pengklasifikasian

pendonor dan non pendonor merupakan
langkah
yang
paling
efektif
dan
produktif dalam proses pembelajaran
telah kami buat dengan penggunaan
pada sebuah program. Dikarenakan
metode
dapat mempermudah dalam penentuan
calon
dengan
pendonor
cara
memperhatikan
karena
dengan
syarat-syarat
dalam
“bahwa program klasifikasi donor yang
kami
buat
sangat
Data
Testing Prosentase
gunakan.
P
P
DAFTAR PUSTAKA
75
bergantung dan
terpengaruh oleh data set yang kami
Data
Training
N
mengalami
demikian kami mengambil kesimpulan,
melakukan 4 kali percobaan :
1
bayes
training yang kami gunakan. Dengan
melakukan donor darah. Kami telah
Percobaan
naive
perbedaan di setiap perubahan data
dikerjakan
komputerisasi
84  58  78  76
 100 %
4
N
100 25 25
[1] Rhesus
84%
Negatif
Indonesia.
“DONOR DARAH (SYARAT &
2
125 100 25 25
58%
3
125 125 25 25
78%
KEUNTUNGAN)”,
Januari
Senin
2012,
16
URL:
http://rhesusnegatif.com/article_det
4
200 150 25 25
76%
ail.php?id=50,
Diakses
pada
tanggal 10 November 2012
Tabel 2.
Jumlah Data Training dan Data
Testing 4 kali percobaan
[2] Widjaya
Din’yar
Supiadi
.”Transfusi & Bank Darah” , URL:
Keterangan :
http://xa.yimg.com/kq/groups/2161
P = Pendonor
2083/1478830814/name/Transfusi+
N = Non Pendonor
Darah+FK+Unjani+(Dinyar+S,+dr,
+SpPK).pdf Diakses pada tanggal
Dimana hasil prosentase akhir dari
10 November 2012.
keakuratan dari keberhasilan program
[3] Zhang Harry.”The Optimality of
Naive Bayes”.FLAIRS2004, URL:
5
http://www.cs.unb.ca/profs/hzhang/
publications/FLAIRS04ZhangH.pd
f Diakses pada tanggal 10
November 2012.
[4] Natalius Samuel. “Metode Naive
Bayes Classifier dan Penggunaanya
pada Klasifikasi Dokumen”. April
2010,URL:http://xa.yimg.com/.../Tr
ansfusi+Darah+FK+Unjani+(Dinya
r+S,+dr,+SpPK)hProbstat2010017.pdf Diakses pada tanggal 10
November 2012.
[5] George H. John and Pat Langley
(1995).
“Estimating
Distributions
Classifiers.
Eleventh
Continuous
in
Bayesian
Proceedings
of
Conference
Uncertainty
in
the
on
Artificial
Intelligence”. pp. 338-345. Morgan
Kaufmann,
San
Mateo,
URL:
http://www.cs.iastate.edu/~jtian/cs5
73/Papers/John-UAI-95.pdf
Diakses pada tanggal 13November
2012.
6
Download