aplikasi data mining untuk pola permintaan darah di

advertisement
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH
DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA
MENGGUNAKAN METODE APRIORI
Budanis Dwi Meilani, dan Dermawan Cahyo Utomo
Jurusan Teknik Informatika, Fakultas Teknologi Informasi
Insitut Teknologi Adhi Tama Surabaya
Jl. Arief Rahman Hakim 100 – Surabaya 60117
E-mail : [email protected], [email protected]
ABSTRAK
Palang Merah Indonesia (PMI) khususnya bagian UDD (Unit Donor Darah) berusaha
memenuhi permintaan darah oleh pasien yang membutuhkan. Namun tidak semua
permintaan darah dapat terpenuhi. Untuk mengatasi masalah tersebut dibutuhkan suatu
analisa pola data transaksi permintaan darah. Dengan mengetahui pola permintaan darah
oleh pasien, maka UDD dapat meminimalisir jumlah permintaan darah yang tidak dapat
terpenuhi. Pola asosiasi menggunakan algoritma apriori adalah salah satu algoritma
data mining untuk mencari pola frekuensi tinggi, pola frekuensi tinggi adalah pola-pola
item di dalam suatu database yang memiliki frekuensi di atas ambang batas tertentu
yang disebut minimum support. Dengan menghasilkan pola permintaan darah
menggunakan algoritma apriori, maka dapat disimpulan dari hasil uji yang telah
dilakukan adalah penentuan nilai minimum support akan memberikan hasil pola
permintaan darah yang berbeda-beda sesuai dengan nilai supportnya, dengan
mempertimbangkan juga nilai confidence. Kombinasi pola itemset yang memiliki nilai
support dan confidence lebih besar dari pola lainnya dapat dikatakan sebagai pola
permintaan darah yang paling baik dan sebagai bahan pertimbangan dalam pengambilan
keputusan. Pola permintaan darah yang terjadi di PMI pada kondisi tidak menghasilkan
pola pada minimum support 67%.
Kata kunci: PMI, Data Mining, Pola Asosiasi, Algoritma Apriori, Minimum Support,
Minimum Confidence.
PENDAHULUAN
Palang Merah Indonesia (PMI) merupakan sebuah organisasi perhimpunan
nasional di Indonesia yang bergerak dalam bidang sosial kemanusiaan, salah satu tugas
dari PMI adalah melayani permintaan darah oleh masyarakat yang membutuhkan.
Permintaan akan darah berbeda-beda tiap tahun nya di tiap daerah di Surabaya maupun
di luar daerah lain, untuk itu dibutuhkan suatu aplikasi yang dapat mengantisipasi
permintaan darah berdasarkan data yang di peroleh PMI kota Surabaya dari tahun ke
tahun. Dari data tersebut dapat dicari informasi penting yang di gunakan untuk
menunjang kegiatan pengambilan keputusan yang strategis tentang pola permintaan
darah, distribusi darah dan jumlah persediaan darah.
Untuk mengatasi masalah tersebut dibutuhkan suatu analisa pola data transaksi
permintaan darah untuk mengetahui pola permintaan darah oleh pasien atau rumah sakit
sehingga UDD PMI dapat mengantisipasi jumlah permintaan darah dan meminimalisir
ISBN: 978-602-70604-1-8
C-8-1
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
jumlah permintaan darah yang tidak dapat terpenuhi. Dengan demikian PMI kota
Surabaya di harapkan dapat mengantisipasi masalah tersebut.
DASAR TEORI
Secara sederhana data mining adalah penambangan atau penemuan informasi
baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar.
Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah
berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan
data. Data mining, sering juga disebut sebagai knowledge discovery in database (KDD).
KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.
Data mining adalah kegiatan menemukan pola yang menarik dari data dalam
jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan
informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti
database sistem, data warehousing, statistik, machine learning, information retrieval,
dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti
neural network, pengenalan pola, spatial data analysis, image database, signal
processing . Data mining didefinisikan sebagai proses menemukan pola-pola dalam
data. Proses ini otomatis atau seringnya semiotomatis. Pola yang ditemukan harus
penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara
ekonomi. Data yang dibutuhkan dalam jumlah besar.
Karakteristik data mining sebagai berikut:
 Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data
tertentu yang tidak diketahui sebelumnya.
 Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar
digunakan untuk membuat hasil lebih dipercaya.
 Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.
METODE APRIORI
Metode Apriori diperkenalkan oleh Agrawal dan Srikant pada tahun 1994.
Sampai saat ini algoritma tersebut merupakan algoritma asosiasi yang telah banyak
digunakan dan dikembangkan oleh para peneliti. Dalam asosiasi terdapat istilah
antecedent dan consequent, antecedent untuk mewakili bagian “jika” dan consequent
untuk mewakili bagian “maka”. Dalam analisis ini, antecedent dan consequent adalah
sekelompok item yang tidak punya hubungan secara bersama (Santoso, 2007).
Untuk mengukur kekuatan aturan asosiasi ini, digunakan ukuran support dan
confidence. Support adalah rasio antara jumlah transaksi yang memuat antecedent dan
consequent dengan jumlah transaksi. Confidence adalah rasio antara jumlah transaksi
yang meliputi semua item dalam antecedent dan consequent dengan jumlah transaksi
yang meliputi semua item dalam antecedent.
Langkah pertama algoritma apriori adalah, support dari setiap item dihitung
dengan men-scan database. Setelah support dari setiap item didapat, item yang
memiliki support lebih besar dari minimum support dipilih sebagai pola frekuensi tinggi
dengan panjang 1 atau sering disingkat 1-itemset. Singkatan k-itemset berarti satu set
yang terdiri dari k item. Iterasi kedua menghasilkan 2-itemset yang tiap set-nya
memiliki dua item. Pertama dibuat kandidat 2-itemset dari kombinasi semua 1-itemset.
Lalu untuk tiap kandidat 2-itemset ini dihitung support-nya dengan men-scan database.
ISBN: 978-602-70604-1-8
C-8-2
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
Support artinya jumlah transaksi dalam database yang mengandung kedua item dalam
kandidat 2-itemset. Setelah support dari semua kandidat 2-itemset didapatkan, kandidat
2-itemset yang memenuhi syarat minimum support dapat ditetapkan sebagai 2-itemset
yang juga merupakan pola frekuensi tinggi dengan panjang 2. (Pramudiono, 2007)
Untuk selanjutnya iterasi iterasi ke-k dapat dibagi lagi menjadi beberapa bagian:
1. Pembentukan kandidat itemset
Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi
sebelumnya. Satu ciri dari algoritma apriori adalah adanya pemangkasan kandidat kitemset yang subset-nya yang berisi k-1 item tidak termasuk dalam pola frekuensi
tinggi dengan panjang k-1.
2. Penghitungan support dari tiap kandidat k-itemset
Support dari tiap kandidat k-itemset didapat dengan men-scan database untuk
menghitung jumlah transaksi yang memuat semua item di dalam kandidat k-itemset
tersebut. Ini adalah juga ciri dari algoritma apriori yaitu diperlukan penghitungan
dengan scan seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi
Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari kandidat kitemset yang support-nya lebih besar dari minimum support. Kemudian dihitung
confidence masing-masing kombinasi item. Iterasi berhenti ketika semua item telah
dihitung sampai tidak ada kombinasi item lagi. (Pramudiono, 2007)
HASIL DAN PEMBAHASAN
Aplikasi yang dibuat bertujuan untuk mendapatkan pola assosiasi permintaan
darah yang terjadi di UDD PMI kota Surabaya berdasarkan data yang tersimpan di
UDD PMI untuk meminimalisir jumlah permintaan darah yang tidak terpenuhi.
Sumber Data
Sumber data yang digunakan terdiri dari satu sumber data, yaitu data permintaan
darah di UDD PMI kota Surabaya.Data Permintaan darah adalah data yang diperoleh
dari pasien saat pasien tersebut mengajukan permintaan darah di UDD PMI kota
Surabaya. Data yang dicatat terdiri dari tanggal transaksi, nama pasien, nama rumah
sakit pasien, golongan darah yang diminta, jenis-jenis darah yang dibutuhkan.
Transformasi data
Berikut adalah contoh data permintaan darah.
Tabel 1 . Contoh Data Transaksi Permintaan Darah
ISBN: 978-602-70604-1-8
C-8-3
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
Ditranformasikan sebagai berikut:
Tabel 2. Transformasi Golongan Darah
Tabel 3. Tabel Transformasi Jenis Darah
Berikut adalah data permitaan darah yang telah di tranformasi.
Tabel 4. Contoh Data Transaksi Permintaan Darah (Transformasi)
Analisa Metode Apriori
Dalam proses analisa penulis menggunakan data transaksi permintaan darah
pada bulan Oktober 2011.
1) Misal ditentukan minimum support 27% dari 15 transaksi kemudian sistem
menscan database untuk mendapatkan kandidat 1-itemset.
Tabel 5. Candidat 1-itemset
Item yang tidak memenuhi minimum support, maka di eleminasi kemudian
dimasukan kedalam tabel large 1-itemset.
ISBN: 978-602-70604-1-8
C-8-4
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
Tabel 6. Large 1-itemset
Sistem menscan untuk mendapatkan 2-itemset
Tabel 7. Candidat 2-itemset
Item yang tidak memenuhi minimum support, maka di eleminasi kemudian
dimasukan kedalam tabel large 2-itemset.
Tabel 8. Large 2-itemset
2) Sistem menscan untuk mendapatkan 3-itemset
Tabel 9. Candidat 3-itemset
Item yang tidak memenuhi minimum support, maka di eleminasi kemudian
dimasukan kedalam tabel large 3-itemset.
Tabel 10. Large 3-itemset
ISBN: 978-602-70604-1-8
C-8-5
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
3) Sistem menscan untuk mendapatkan 4-itemset
Tabel 11. Candidat 4-itemset
Dapatkan tabel kandidat 4-itemset terdapat himpunan { A2, B1, B2,B6} tetapi
karena {A2,B1,B2} tidak terdapat dalam tabel Large 3 Itemset, maka himpunan itu
dipangkas. Sehingga hasil dari C4= φ, Dan sistem berhenti men-scan.
4) Setelah sistem berhenti menscan kemudian sistem menampilkan tabel assosiasi
rule.
Tabel 12. Assosiation rule
Implementasi Sistem
Menu help pada menu ini user dibantu untuk menggunakan aplikasi ini mulai
dari memasukan parameter yang dibutuhkan untuk proses mining serta batas range
tanggal data yang akan di mining.
Gambar 2. Menu Help
Gambar 3. Menu Analysis Apriori
Menu Analysis Apriori pada menu ini digunakan user untuk mencari pola assosiasi dari
data permintaan darah.
ISBN: 978-602-70604-1-8
C-8-6
Prosiding Seminar Nasional Manajemen Teknologi XXII
Program Studi MMT-ITS, Surabaya 24 Januari 2015
KESIMPULAN DAN SARAN
Dari hasil analisa dan pembahasan yang dibuat, maka dapat disimpulkan bahwa:
1. Penentuan nilai minimum support akan memberikan hasil pola permintaan darah
yang berbeda-beda sesuai dengan nilai supportnya, dengan mempertimbangkan juga
nilai confidence pada setiap pola yang dihasilkan.
2. Kombinasi pola itemset yang memiliki nilai support dan confidence lebih besar dari
pola lainnya dapat dikatakan sebagai pola permintaan darah yang paling baik dan
sebagai bahan pertimbangan dalam pengambilan keputusan.
3. Aplikasi data mining PMI dapat digunakan untuk menganalysis pola permintaan
darah yang terjadi di PMI. Pada kondisi tidak menghasilkan pola pada minimum
support 67%.
DAFTAR PUSTAKA
Apriori
algorithm.
3 November 2012.
From
http://en.wikipedia.org/wiki/Apriori_algorithm,
Darmayuda, Ketut (2010). “Pemrograman Aplikasi Database dengan Microsoft Visual
Basic.NET”. Bandung: Penerbit Informatika.
Endros Isnento Wijoto.2011 “Sistem Penunjang Keputusan Penempatan Produk Di
Pasar Swalayan Menggunakan Algoritma Apriori”.
Kusrini, dan Emha Taufik Luthfi (2009). “Algoritma Data Mining”, Penerbit Andi,
Yogyakarta.
Muhammad Afif Syaifullah.2010 “Implementasi Data Mining Algoritma Apriori Pada
Sistem Penjualan”.
Nugroho, Aryo (2009) “Menguasai T-SQL Query dan Programing SQL Server 2008”.
Yogyakarta: Penerbit Andi Publisher.
PMI Cabang Surabaya. From http://www.pmiutdsby.org/, 3 November 2012.
UDD (Unit Donor Darah) Provinsi Jawa Timur Jln. Embong Ploso No. 7-15
Surabaya.
Yogi Yusuf W., F. Rian Pratikto, Gerry T. 2006 “Jurnal Penerapan Data Mining dalam
Penentuan Aturan Asosiasi Antar Jenis Item”.
ISBN: 978-602-70604-1-8
C-8-7
Download