KLASIFIKASI CALON PENDONOR DARAH DENGAN METODE NAIVE BAYES CLASIFIER Sukma Nur Fais A, Muhammad Aditya D*, Satria Mulya I, Donny Ramadien, Askia Sani Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65418, Indonesia *)E-mail: [email protected] Abstrak Untuk mempermudah kinerja PMI dalam mengklasifikasikan calon pendonor darah apakah termasuk ke dalam kelas pendonor ataupun kelas non pendonor maka kami membuat inovasi yaitu dengan membuat aplikasi klasifikasi calon pendonor darah dengan metode Klasifikasi Naive Bayes berbasis pemrograman PHP. Dengan cara komputerisasi inilah diharapkan dapat membantu kinerja PMI agar lebih cepat dan tepat dalam mengklasifikasikan calon pendonor darah. Penggunaan metode naïve bayes sebagai metode utama dalam pengklasifikasian karena metode ini merupakan pengklasifikasi paling sederhana dari model pengklasifikasian dengan peluang. Terdapat dua jenis atribut data set yaitu kontinu dan diskrit. Kedua jenis data ini lah yang nantinya kami gunakan dalam menentukan peluang dengan menggunakan metode Klasifikasi Naive Bayes. Kata Kunci: klasifikasi naive bayes, kontinu, diskrit Abstract To facilitate the performance of PMI in classifying prospective blood donors are included in the class donors or non-donors classes we create innovation is to make an application to the classification of prospective blood donors Clasifier Naive Bayes method based PHP programming. By way of computerization is expected to help the performance of the PMI to be faster and more accurate in classifying the prospective blood donors. The use of naïve bayes method as the main method of classification as it is the simplest classifiers of classification models by chance. There are two types of attribute data set that continues and discrete. Both types of data is the one which we will use in determining the chances of using the Naive Bayes Clasifier. Keywords: naïve bayes clasifier, continues, discrete. 1 Classifier untuk menentukan peluang 1. PENDAHULUAN Donor darah merupakan proses pengambilan darah dari kemungkinan besar seseorang dapat seseorang mendonorkan darah. secara sukarela untuk disimpan di bank Terlepas dari desain yang naif dan darah untuk kemudian dipakai pada asumsi yang tampak disederhanakan, transfusi pengklasifikasian naive bayes telah darah bagi pasien yang membutuhkan.[1] Untuk bekerja cukup baik di banyak situasi dapat menyumbangkan yang kompleks yang ada di dunia nyata. darah, seorang donor darah harus Pada tahun 2004, analisis masalah memenuhi syarat sebagai berikut [2]: klasifikasi bayesian telah menunjukkan 1. calon donor harus berusia 18-60 bahwa ada beberapa alasan teoritis tahun, keberhasilan yang tampaknya tidak 2. berat badan minimal 45 kg masuk akal dari pengklasifikasian naif 3. kadar hemoglobin >12,5 gr % bayes [3]. 4. tensi atas 100-150 (sistole) Metode 5. tensi bawah 70-100 (diastole). metode yang digunakan memprediksi 6. tidak pernah memiliki penyakit probabilitas. menular. Naive Bayes merupakan Sedangkan klasifikasi Bayes adalah klasifikasi statistik yang 7. interval dibolehkan donor kembali dapat memprediksi kelas suatu anggota selama 3 bulan. probabilitas. Untuk klasifikasi Bayes Selama ini PMI (Palang Merah sederhana yang lebih dikenal sebagai Indonesia) masih menggunakan metode naïve yang manual dalam penentuan calon diasumsikan bahwa efek dari suatu nilai pendonor darah. Oleh karena itu kami atribut sebuah kelas yang diberikan menawarkan sebuah inovasi dengan adalah bebas dari atribut-atribut lain. menggunakan aplikasi berbasis PHP Naïve dengan menggunakan metode Naive sebuah metoda klasifikasi yang berakar Bayes menentukan pada teorema Bayes. Ciri utama dari seorang calon pendonor termasuk kelas Naïve Bayes Classifier ini adalah pendonor atau non pendonor. asumsi yang sangat kuat (naif) akan Clasifier untuk Bayesian Bayes independensi Classifier Classifier dari dapat merupakan masing-masing 2. METODE PENELITIAN kondisi/kejadian[4],dimana diasumsikan Dalam pembuatan aplikasi ini, kita bahwa setiap atribut menggunakan sampel) bersifat saling lepas satu sama teknik Naïve Bayes 2 contoh (data lain berdasarkan atribut kelas. Naive untuk bayes categorial adalah naive bayes persamaan. dengan data static berupa kategori atau Mean(µ) merupakan merupakan data pasti, sehingga dalam diperoleh dari atribute yang memiliki pengerjaannya sudah didapatkan hasil data continue. yang pasti juga. Naive bayes merupakan Dengan rumus sebagai berikut: metode dengan rumus dasar bayesian, atribut Xi Mean Pada teorema Bayes, bila terdapat dua kejadian yangterpisah (misalkan A dan n i 1 dinyatakan rata-rata yang xi n B), maka teorema Bayes dirumuskan (pers 2) sebagai berikut: P A | B pada Sedangkan untuk parameter kedua yaitu variansi (σ2) didapat dari rumus sebagaii P B | A P A P B berikut: (pers 1) 2 Dimana probabilitas dari A dengan 1 2 n i n xi n 1 ketentuan B didapat dari probabilitas (pers3) data B terhadap A dikali kemudian Dari parameter-parameter yang sudah dibagi peluang B. kita temukan akan didapat fungsi Untuk memperkirakan parameter pada densitas mengekspresikan probabilitas distribusi fitur ini, seseorang harus relatif. fungsi densitas probabilitasnya mengasumsikan adalah sebagai berikut: menghasilkan distribusi model atau nonparametrik , x untuk fitur dari training data set [5]. Jika berhadapan dengan atribut bertipe 1 2 2 e x 2 2 2 data kontinu, sebuah asumsi yang khas (pers 4) adalah bahwa nilai-nilai terus menerus Sedangkan untuk atribut yang bertipe berhubungan dengan kelasnya masing- discrete dengan mencari masing-masing masing yang didistribusikan menurut likelihood metode distribusi Gaussian. Distribusi pendonor dan non pendonor. Dan hasil ini dikarakterisasi dengan dua parameter keseluruhannya dikalikan dengan prior 2 yaitu mean (μ), dan variansi(σ ), untuk suatu fitur dari kelas nya masing-masing dari setiap kelas. setiap kelas yj, peluang kelas bersyarat 3 3. PEMBAHASAN Kami Untuk pengujian klasifikasi naive bayes pemrograman php dalam pembuatan dengan data kontinyu dan data discrete aplikasi ini. Yang ditampilkan seperti yaitu gambar berikut dilakukan percobaan dengan mengggunakan bahasa menggunakan data dari pendonor dan non pendonor. Contoh data yang kami gunakan dalam melakukan percobaan , dijabarkan pada tabel dibawah ini : Data Training Pendonor Non Pendonor 200 Data Testing Pendonor 150 Non Pendonor 25 25 Gambar 1. Tabel 1. Jumlah data training datatesting Percobaan 4 dan Tampilan Interface Aplikasi Klasifikasi Donor Darah. Pada percobaan keempat kami melakukan pengujian terhadap 350 data training yang terdiri dari 250 data pendonor dan 150 data non pendonor. Diuji dengan 50 buah data testing. Dengan rincian 25 pendonor dan 25 non pendonor. Untuk menentukan seseorang Gambar 2. calon pendonor masuk kelas pendonor Contoh menginputkan data testing ke dalam program. atau kelas non pendonor. Kemudian 8 fitur yang nantinya akan digunakan adalah sebagai berikut : 1. HB 2. Tensi atas 3. Tensi bawah 4. Berat badan 5. Umur 6. Jenis Kelamin Gambar 3. Contoh hasil program 7. Riwayat Penyakit Menular Ketika 8. Interval Donor telah diproses menunjukan bahwa hasil percobaan tersebut adalah 4 boleh donor dan termasuk kedalam ini adalah dengan hasil Prosentase kelas Pendonor. keakuratan: 4. SIMPULAN keakuratan Penggunaan clasifier metode dalam naive bayes 296 100 % 4 74 % Akurasi atau ketepatan program yang pengklasifikasian pendonor dan non pendonor merupakan langkah yang paling efektif dan produktif dalam proses pembelajaran telah kami buat dengan penggunaan pada sebuah program. Dikarenakan metode dapat mempermudah dalam penentuan calon dengan pendonor cara memperhatikan karena dengan syarat-syarat dalam “bahwa program klasifikasi donor yang kami buat sangat Data Testing Prosentase gunakan. P P DAFTAR PUSTAKA 75 bergantung dan terpengaruh oleh data set yang kami Data Training N mengalami demikian kami mengambil kesimpulan, melakukan 4 kali percobaan : 1 bayes training yang kami gunakan. Dengan melakukan donor darah. Kami telah Percobaan naive perbedaan di setiap perubahan data dikerjakan komputerisasi 84 58 78 76 100 % 4 N 100 25 25 [1] Rhesus 84% Negatif Indonesia. “DONOR DARAH (SYARAT & 2 125 100 25 25 58% 3 125 125 25 25 78% KEUNTUNGAN)”, Januari Senin 2012, 16 URL: http://rhesusnegatif.com/article_det 4 200 150 25 25 76% ail.php?id=50, Diakses pada tanggal 10 November 2012 Tabel 2. Jumlah Data Training dan Data Testing 4 kali percobaan [2] Widjaya Din’yar Supiadi .”Transfusi & Bank Darah” , URL: Keterangan : http://xa.yimg.com/kq/groups/2161 P = Pendonor 2083/1478830814/name/Transfusi+ N = Non Pendonor Darah+FK+Unjani+(Dinyar+S,+dr, +SpPK).pdf Diakses pada tanggal Dimana hasil prosentase akhir dari 10 November 2012. keakuratan dari keberhasilan program [3] Zhang Harry.”The Optimality of Naive Bayes”.FLAIRS2004, URL: 5 http://www.cs.unb.ca/profs/hzhang/ publications/FLAIRS04ZhangH.pd f Diakses pada tanggal 10 November 2012. [4] Natalius Samuel. “Metode Naive Bayes Classifier dan Penggunaanya pada Klasifikasi Dokumen”. April 2010,URL:http://xa.yimg.com/.../Tr ansfusi+Darah+FK+Unjani+(Dinya r+S,+dr,+SpPK)hProbstat2010017.pdf Diakses pada tanggal 10 November 2012. [5] George H. John and Pat Langley (1995). “Estimating Distributions Classifiers. Eleventh Continuous in Bayesian Proceedings of Conference Uncertainty in the on Artificial Intelligence”. pp. 338-345. Morgan Kaufmann, San Mateo, URL: http://www.cs.iastate.edu/~jtian/cs5 73/Papers/John-UAI-95.pdf Diakses pada tanggal 13November 2012. 6