penerapan data mining untuk mengolah data penempatan buku di

advertisement
PENERAPAN DATA MINING UNTUK MENGOLAH DATA PENEMPATAN
BUKU DI PERPUSTAKAAN SMK TI PAB 7 LUBUK PAKAM
DENGAN METODE ASSOCIATION RULE
Dian Wirdasari#1 dan Ahmad Calam*2
#
Program Studi Ilmu Komputer, Universitas Sumatera Utara
*
Program Studi Sistem Informasi, STMIK Triguna Dharma
1
dianws, [email protected]
ABSTRAK: Pertumbuhan yang pesat dari akumulasi data telah menciptakan kondisi
kaya akan data tapi minim informasi. Data mining merupakan penambangan atau penemuan
informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar
yang diharapkan dapat mengatasi kondisi tersebut. Dengan memanfaatkan data kunjungan
perpustakaan, dapat menggali informasi tentang buku-buku apa yang sering dipinjam oleh siswa
dan keterkaitan antar masing – masing peminjaman sehingga dapat melakukan penyusunan buku
sesuai dengan tingkat support dan confidence. Kemudian setelah itu dibuat suatu aplikasi yang
dapat menujukkan lokasi buku secara lebih spesifik sehingga memudahkan pencarian bagi para
pengunjung.
Penelitian yang dibuat di SMK TI PAB 7 Lubuk Pakam ini dibuat dengan menggunakan
beberapa software seperti XL Miner untuk data mining dan Visual Basic 6.0 untuk aplikasi pencari
buku. Sementara untuk basis data digunakan Microsoft Access dan software – software pendukung
lainnya.Hasil penelitian ini adalah, pertama, dalam tumpukan data kunjungan perpustakaan,
terdapat pengetahuan yang bermanfaat bagi perpustakaan itu dan para pengunjung perpustakaan
tersebut, kedua, hasil mining data kunjungan perpustakaan SMK TI PAB 7 Lubuk Pakam
didapatkan informasi bahwa buku yang paling sering dipinjam oleh siswa dengan nilai support 9
adalah buku Biologi Kelas X, ketiga, terdapat beberapa aturan asosiasi yang memiliki nilai
confidence 100% misalnya jika meminjam Conversation dan matematika bilingual maka meminjam
Matematika X. Artinya jika meminjam buku Conversation dan matematika maka kemungkinan
meminjam matematika bilingual adalah 100%.
Kata kunci : data mining, association rules, support, confidence.
A. PENDAHULUAN
Dengan kemajuan teknologi informasi
dewasa ini, kebutuhan akan informasi yang
akurat sangat dibutuhkan dalam kehidupan
sehari-hari, sehingga informasi akan menjadi
suatu elemen penting dalam perkembangan
masyarakat saat ini dan waktu mendatang.
Namun kebutuhan informasi yang tinggi kadang
tidak diimbangi dengan penyajian informasi
yang memadai, sering kali informasi tersebut
masih harus digali ulang dari data yang
jumlahnya
sangat besar. Kemampuan
teknologi informasi untuk mengumpulkan dan
menyimpan
berbagai
tipe
data
jauh
meninggalkan
kemampuan
untuk
menganalisis, meringkas dan mengekstrak
pengetahuan dari data. Metode tradisional untuk
menganalisis data yang ada, tidak dapat
menangani data dalam jumlah besar.
Pemanfaatan data yang ada di dalam
sistem informasi untuk menunjang kegiatan
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
pengambilan keputusan, tidak cukup hanya
mengandalkan
data operasional saja,
diperlukan suatu analisis data untuk menggali
potensi-potensi informasi yang
ada. Para
pengambil
keputusan
berusaha
untuk
memanfaatkan gudang data yang sudah
dimiliki untuk menggali informasi yang
berguna membantu mengambil keputusan, Hal
ini mendorong munculnya cabang ilmu baru
untuk mengatasi masalah penggalian informasi
atau pola yang penting atau menarik dari data
dalam jumlah besar, yang disebut dengan Data
Mining. Penggunaan teknik data
mining
diharapkan dapat memberikan pengetahuanpengetahuan yang sebelumnya tersembunyi
di dalam gudang data sehingga menjadi
informasi yang berharga.
Di SMK TI PAB 7 Lubuk Pakam, sebagai
sekolah Teknologi Informasi dilengkapi dengan
fasilitas berupa perpustakaan. Perpustakaan ini
memiliki koleksi buku yang cukup banyak dari
mulai buku pelajaran sampai buku – buku
ensiklopedi. Pengunjung perpustakaan pun
cukup banyak. Setiap akhir semester diberikan
penghargaan kepada siswa- siswa yang paling
sering mengunjungi perpustakaan. Hal ini tentu
saja mendorong siswa untuk lebih sering
mengunjungi perpustakaan.
1.1 Rumusan Masalah
Permasalahan yang akan dibahas dalam hal
ini adalah :
1. Bagaimana mengolah data peminjaman
buku diperpustakaan sehingga menjadi
informasi yang berguna.
2. Bagaimana mengukur tingkat support
dan confidence dari peminjaman buku
sehingga dapat dilakukan penyusunan
buku dengan lebih baik.
1.2 Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian
ini adalah:
1. Mengolah data peminjaman buku
diperpustakaan
sehingga
menjadi
informasi yang berguna.
2. Mengukur
tingkat
support
dan
confidence dari peminjaman buku
138
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
sehingga dapat dilakukan penyusunan
buku dengan lebih baik.
B. DATA WAREHOUSE
Data warehouse adalah sebuah sistem yang
mengambil dan menggabungkan data secara
periodik dari sistem sumber data ke
penyimpanan data bentuk dimensional atau
normal (Reinardi, 2008). Data
warehouse
merupakan penyimpanan data yang berorientasi
objek,
terintegrasi,
mempunyai
variant
waktu,dan menyimpan data dalam bentuk
nonvolatile sebagai pendukung manejemen
dalam proses pengambilan keputusan.(Han.
2006)
Data
warehouse
menyatukan
dan
menggabungkan
data
dalam
bentuk
multidimensi. Pembangunan data warehouse
meliputi pembersihan data, penyatuan data dan
transformasi data dan dapat dilihat sebagai
praproses yang penting untuk digunakan dalam
data mining. Selain itu
data warehouse
mendukung
On-line Analitycal Processing
(OLAP), sebuah kakas yang digunakan untuk
menganalisis secara interaktif dari bentuk
multidimensi yang mempunyai data yang
rinci. Sehingga dapat memfasilitasi secara
efektif data generalization dan data mining.
Banyak metode-metode data mining yang
lain seperti asosiasi, klasifikasi, prediksi, dan
clustering,
dapat
diintegrasikan
dengan
operasi OLAP untuk meningkatkan proses
mining yang interaktif dari beberapa level dari
abstraksi. Oleh karena itu data warehouse
menjadi platform yang penting untuk data
analisis dan OLAP untuk dapat menyediakan
platform yang efektif untuk proses data mining.
Empat karakteristik dari data warehouse
meliputi :
1. Subject oriented : sebuah data warehouse
disusun dalam subjek utama, seperti
pelanggan, suplier, produk, dan sales.
Meskipun data warehouse terkonsentrasi
pada operasi harian dan proses
transaksi
dalam
perusahaan,
data
warehouse fokus pada pemodelan dan
analisis data untuk pembuat keputusan.
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
Oleh karena itu
data
warehouse
mempunyai
karakter
menyediakan
secara singkat dan sederhana gambaran
seputar subjek lebih detail yang dibuat
dari data luar yang tidak berguna dalam
proses pendukung keputusan.
2.
Integrated : Data warehouse biasanya
dibangun dari bermacam-macam sumber
yang
berbeda,
seperti
database
relasional, flat files, dan on-line
transaction records. Pembersihan dan
penyatuan
data
diterapkan
untuk
menjamin konsistensi dalam penamaan,
struktur kode, ukuran atribut, dan yang
lainnya.
3.
Time Variant : data disimpan untuk
menyajikan informasi dari sudut pandang
masa lampau (misal 5 – 10 tahun yang
lalu). Setiap struktur kunci dalam data
warehouse mempunyai elemen waktu baik
secara implisit maupun eksplisit
4. Nonvolatile : sebuah data warehouse secara
fisik selalu disimpan terpisah dari data
aplikasi operasional. Penyimpanan yang
terpisah ini, data warehouse tidak
memerlukan proses transaksi, recovery
dan
mekanisme
pengendalian
konkurensi.
Biasanya
hanya
membutuhkan dua operasi dalam akses
data yaitu initial load of data dan access
of data
Dari pengertian tersebut, sebuah data
warehouse merupakan penyimpanan data tetap
sebagai implementasi fisik dari pendukung
keputusan model data. Data warehouse juga
biasanya
dilihat
sebagai
arsitektur,
pembangunan
dan
penyatuan data dari
bermacam macam sumber data yang berbeda
untuk mendukung struktur dan atau query
tertentu, laporan analisis, dan pembuatan
keputusan.
Extract, transform, dan load (ETL)
merupakan sebuah sistem yang dapat
membaca data dari suatu data store, merubah
bentuk data, dan menyimpan ke data store yang
lain. Data store yang dibaca ETL disebut Data
Source, sedangkan data store yang disimpan
ETL disebut Target. Proses pengubahan data
digunakan agar data sesuai dengan format
dan kriteria, atau sebagai validasi data dari
source system. Proses ETL tidak hanya
menyimpan data ke data warehouse, tetapi
juga digunakan
untuk
berbagai proses
pemindahan data. Kebanyakan ETL mempunya
mekanisme untuk membersihkan data dari
source
system
sebelum
disimpan
ke
warehouse. Pembersihan data merupakan proses
identifikasi dan koreksi data yang kotor. Proses
pembersihan ini menerapkan aturan-aturan
tertentu yang mendefinisikan data bersih.
C. DATA MINING
Secara sederhana data mining adalah
penambangan atau penemuan informasi baru
dengan mencari pola atau aturan tertentu dari
sejumlah data yang sangat besar (Davies.
2004). Data mining juga disebut sebagai
serangkaian proses untuk menggali nilai
tambah berupa pengetahuan yang selama ini
tidak diketahui secara manual dari suatu
kumpulan data (Pramudiono, 2007).
Data mining, sering juga disebut Sebagai
Knowledge Discovery In Database (KDD).
KDD
adalah
kegiatan yang
meliputi
pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan
dalam set data berukuran besar (Santoso, 2007).
Data mining adalah kegiatan menemukan
pola yang menarik dari data dalam jumlah
besar, data dapat disimpan dalam database,
data warehouse, atau penyimpanan informasi
lainnya. Data mining berkaitan dengan bidang
ilmu – ilmu lain, seperti database system,
data
warehousing,
statistik,
machine
learning, information retrieval, dan komputasi
tingkat tinggi. Selain itu, data mining
didukung oleh ilmu lain seperti neural
network, pengenalan pola, spatial data
analysis, image database, signal processing
(Han, 2006).
Data mining didefinisikan sebagai proses
menemukan pola-pola dalam data. Proses ini
otomatis atau seringnya semiotomatis (Witten,
2005).. Pola yang ditemukan harus penuh
139
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
arti dan pola tersebut memberikan keuntungan,
biasanya keuntungan secara ekonomi.
Karakteristik data mining sebagai berikut
1. Data
mining
berhubungan
dengan
penemuan sesuatu yang tersembunyi dan
pola data tertentu yang tidak diketahui
sebelumnya.
2. Data mining biasa menggunakan data yang
sangat besar. Biasanya data yang besar
digunakan untuk membuat hasil lebih
dipercaya.
3. Data mining berguna untuk membuat
keputusan yang kritis, terutama dalam
strategi (Davies, 2004).
Berdasarkan beberapa pengertian tersebut
dapat ditarik kesimpulan bahwa data mining
adalah suatu teknik menggali informasi
berharga yang terpendam atau tersembunyi
pada suatu koleksi data (database) yang
sangat besar sehingga ditemukan suatu pola
yang menarik yang sebelumnya
tidak
diketahui. Datamining sendiri berarti usaha
untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Karena itu
data mining sebenarnya memiliki akar yang
panjang dari bidang ilmu seperti kecerdasan
buatan
(artificial
intelligent), machine
learning, statistik dan
database. Beberapa
metode yang sering disebut-sebut dalam
literatur data mining antara lain clustering,
classification, association rules mining, neural
network,
genetic algorithm dan lain-lain
(Pramudiono, 2007).
D. TAHAP-TAHAP DATA MINING
Sebagai suatu rangkaian proses, data
mining dapat dibagi menjadi beberapa tahap
yang diilustrasikan di Gambar . Tahap-tahap
tersebut bersifat interaktif, pemakai terlibat
langsung atau dengan perantaraan knowledge
base.
Tahap-tahap data mining ada 6 yaitu :
1. Pembersihan data (data cleaning)
Pembersihan data merupakan
proses
menghilangkan noise dan data yang tidak
konsisten atau data tidak relevan. Pada
140
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
umumnya data yang diperoleh, baik dari
database suatu perusahaan maupun hasil
eksperimen, memiliki isian-isian yang tidak
sempurna seperti data yang hilang, data yang
tidak valid atau juga hanya sekedar salah ketik.
Selain itu, ada juga atribut-atribut data yang
tidak relevan dengan hipotesa data mining yang
dimiliki. Data-data yang tidak relevan itu juga
lebih baik dibuang. Pembersihan data juga akan
mempengaruhi performasi dari teknik data
mining karena data yang ditangani akan
berkurang jumlah dan kompleksitasnya.
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan
data dari berbagai database ke dalam satu
database baru. Tidak
jarang data yang
diperlukan untuk data mining tidak hanya
berasal dari satu database tetapi juga berasal
dari beberapa database atau file teks. Integrasi
data dilakukan pada atribut-aribut yang
mengidentifikasikan entitas-entitas yang unik
seperti atribut nama, jenis produk, nomor
pelanggan dan lainnya. Integrasi data perlu
dilakukan secara cermat karena kesalahan pada
integrasi data bisa menghasilkan hasil yang
menyimpang
dan
bahkan menyesatkan
pengambilan aksi nantinya. Sebagai contoh
bila integrasi data berdasarkan jenis produk
ternyata menggabungkan produk dari kategori
yang berbeda maka akan didapatkan korelasi
antar produk yang sebenarnya tidak ada.
3. Seleksi Data (Data Selection)
Data yang ada pada database sering kali
tidak semuanya dipakai, oleh karena itu hanya
data yang sesuai untuk dianalisis yang akan
diambil dari database. Sebagai contoh,
sebuah
kasus
yang
meneliti
faktor
kecenderungan orang membeli dalam kasus
market
basket
analysis,
tidak
perlu
mengambil nama pelanggan, cukup dengan id
pelanggan saja.
4. Transformasi data (Data Transformation)
Data diubah atau digabung ke dalam
format yang sesuai untuk diproses dalam data
mining. Beberapa metode data mining
membutuhkan format data yang khusus
sebelum bisa diaplikasikan. Sebagai contoh
beberapa metode standar seperti analisis
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
asosiasi dan clustering hanya bisa menerima
input data kategorikal. Karenanya data berupa
angka numerik yang berlanjut perlu dibagi-bagi
menjadi beberapa interval. Proses ini sering
disebut transformasi data.
5. Proses mining,
Merupakan suatu proses
utama saat
metode
diterapkan
untuk
menemukan
pengetahuan berharga dan tersembunyi dari
data.
6. Evaluasi pola (pattern evaluation),
Untuk
mengidentifikasi
pola-pola
menarik kedalam knowledge based yang
ditemukan. Dalam tahap ini hasil dari teknik
data mining berupa pola-pola yang khas
maupun model prediksi dievaluasi untuk
menilai apakah hipotesa yang ada memang
tercapai. Bila ternyata hasil yang diperoleh
tidak sesuai hipotesa ada beberapa alternatif
yang dapat diambil seperti menjadikannya
umpan balik untuk memperbaiki proses data
mining, mencoba metode data mining lain yang
lebih sesuai, atau menerima hasil ini sebagai
suatu hasil yang di luar dugaan yang
mungkin bermanfaat.
7. Presentasi
pengetahuan
(Knowledge
Presentation),
Merupakan visualisasi dan penyajian
pengetahuan mengenai
metode yang
digunakan untuk memperoleh pengetahuan
yang diperoleh pengguna. Tahap terakhir dari
proses data mining adalah bagaimana
memformulasikan keputusan atau aksi dari hasil
analisis yang didapat. Ada kalanya hal ini harus
melibatkan orang-orang yang tidak memahami
data mining. Karenanya presentasi hasil data
mining dalam bentuk pengetahuan yang bisa
dipahami semua orang adalah satu tahapan
yang diperlukan dalam proses data mining.
Dalam presentasi ini, visualisasi juga bisa
membantu mengkomunikasikan hasil Data
Mining (Han, 2006)
E. SUPPORT DAN CONFIDENCE
a.
b.
Support, suatu ukuran yang menunjukkan
seberapa besar tingkat dominasi suatu item
atau itemset dari keseluruhan transaksi.
Confidence,
suatu
ukuran
yang
menunjukkan hubungan antar dua item
secara conditional.
F. METODE ASSOCIATION RULES
Association rules (aturan asosiasi) atau
affinity analysis (analisis afinitas) berkenaan
dengan studi tentang “apa bersama apa”.
Sebagai contoh dapat berupa studi transaksi di
supermarket, misalnya seseorang yang membeli
susu bayi juga membeli sabun mandi. Pada
kasus ini berarti susu bayi bersama dengan
sabun mandi. Karena awalnya berasal dari
studi tentang database transaksi pelanggan
untuk menentukan kebiasaan suatu produk
dibeli bersama produk apa, maka aturan asosiasi
juga sering dinamakan market basket analysis
(Santoso,2007).
Aturan
asosiasi
ingin
memberikan
informasi tersebut dalam bentuk hubungan “ifthen” atau “jika-maka”. Aturan ini dihitung dari
data yang sifatnya probabilistik Analisis
asosiasi dikenal juga sebagai salah satu
metode data mining yang menjadi dasar dari
berbagai metode data mining lainnya.
Khususnya salah satu tahap dari analisis
asosiasi yang disebut analisis pola frekuensi
tinggi
(frequent pattern mining) menarik
perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien. Penting tidaknya suatu
aturan assosiatif dapat diketahui dengan dua
parameter, support (nilai penunjang) yaitu
prosentase kombinasi item tersebut. Dalam
database dan confidence (nilai kepastian) yaitu
kuatnya hubungan antar item dalam aturan
assosiatif. Analisis asosiasi didefinisikan
suatu proses untuk menemukan semua aturan
assosiatif yang memenuhi syarat minimum
untuk support (minimum support) dan syarat
minimum
untuk
confidence
(minimum
confidence) (Pramudiono, 2007)
Ada beberapa algoritma yang sudah
dikembangkan mengenai aturan asosiasi,namun
141
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
ada satu algoritma klasik yang sering
dipakai yaitu algoritma apriori. Ide dasar dari
algoritma ini adalah dengan mengembangkan
frequent itemset. Dengan menggunakan satu
item dan secara rekursif mengembangkan
frequent itemset dengan dua item, tiga item
dan seterusnya hingga frequent itemset dengan
semua ukuran.
Untuk mengembangkan
frequent
set
dengan dua item, dapat menggunakan frequent
set item. Alasannya adalah bila set satu item
tidak
melebihi
support minimum, maka
sembarang ukuran itemset yang lebih besar
tidak
akan melebihi support
minimum
tersebut. Secara umum, mengembangkan set
dengan fc-item menggunakan frequent set
dengan k – 1 item yang dikembangkan dalam
langkah sebelumnya.
Setiap
langkah
memerlukan sekali pemeriksaan ke seluruh
isi database.
Dalam asosiasi terdapat istilah antecedent
dan consequent, antecedent untuk mewakili
bagian
“jika”
dan
consequent
untuk
mewakili bagian “maka”. Dalam analisis ini,
antecedent dan consequent adalah sekelompok
item yang
tidak punya hubungan secara
bersama (Santoso, 2007) .
Dari jumlah besar aturan yang mungkin
dikembangkan, perlu memiliki aturan-aturan
yang cukup kuat tingkat ketergantungan antar
item dalam antecedent dan consequent. Untuk
mengukur kekuatan aturan asosiasi ini,
digunakan ukuran support dan confidence.
Support adalah rasio antara jumlah transaksi
yang memuat antecedent dan consequent
dengan jumlah transaksi. Confidence adalah
rasio antara jumlah transaksi yang meliputi
semua item
dalam antecedent dan
consequent dengan jumlah transaksi yang
meliputi semua item dalam antecedent.
 (Ta  Tc) ........................
T
Σ T = Jumlah transaksi
C
 (Ta  Tc)
 Ta
................................. (2.2)
Keterangan :
C = Confidence
∑ (Ta+Tc)= Jumlah transaksi yang
mengandung antecedent dan
consequencent
Σ(Ta) = Jumlah transaksi yang
mengandung antecedent
G. ANALISA DAN PERANCANGAN
Tabel 1 berikut ini adalah tabel contoh
transaksi
peminjaman
buku
dengan
menggunakan data fiktif. Hal ini dimaksudkan
untuk memberikan gambaran bagaimana
melakukan mining data sehingga menghasilkan
aturan asosiasi.
Tabel 1. Tabel Transaksi Peminjaman Buku
No
1
2
Nama
AYU
WANDIRA
ARYA
KAMANDAKA
3
BIMA ARYA
4
KHAIRUN
NISA
5
SATRIA
WALJUKA
6
GLADYS
AMELIA
7
8
HARYA
ADITYA
HENI
PASARIBU
Buku Yang di Pinjam
Biologi
X
Bahasa
Inggris X
Bahasa
Inggris X
Bahasa
Indonesia
X
Biologi
X
Fisika X
Bahasa
Inggris X
Bahasa
Inggris X
Biologi
X
9
JENNY
Keterangan :
10
FANDY
APRIANTO
Fisika X
S = Support
∑ (Ta + Tc) = Jumlah transaksi yang
mengandung antecedent dan
consequencent
11
GAMAL FUAD
RIZA
ANANDA
FACHRY
Kimia X
Bahasa
Inggris X
Fisika X
S
142
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
(2.1)
12
13
Kamus
B.Inggris
Kamus
B.Inggris
Kamus
B.Inggris
Fisika X
Hello
Magazine
Menanam
Jamur
Bahasa
Inggris x
Kehidupan
Bakteri
Kehidupan
Bakteri
Kumpulan
Rumus
Fisika
Kamus B.
Inggris
Kamus B.
Inggris
Kehidupan
Bakteri
Kumpulan
Rumus
Fisika
Biologi X
Kamus
B.Inggris
Kumpulan
Hello
Magazine
Menanam
Jamur
Jakarta
Post
Hello
Magazine
Jakarta
Post
Kamus B.
Inggris
Fisika X
Helo
Magazine
Kamus B.
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
HASIHOLAN
Rumus
Fisika
14
HERU
APRIANDI
Fisika X
15
NANA
ZAIRINA
Bahasa
Inggris X
Inggris
Kimia X
Kimia X
item yang memenuhi minimum support disebut
frequent 1-item set. Daftar frequent 1-itemset
Kumpulan
dapat dilihat pada Table 3 berikut ini.
Rumus
Fisika
Kamus B.
Inggris
No
Untuk melakukan penggalian dari data
transaksi peminjaman buku diatas, penulis
menggunakan sebuah algoritma yang menjadi
dasar dari algoritma – algoritma yang lain yaitu
algoritma Market Basket Analysis (MBA). Ada
tiga langkah besar
1) Langkah Besar Pertama Algoritma MBA
(Market Basket Analysis )
Langkah pertama dalam algoritma MBA
(Market Basket
Analysis ) yaitu
menetapkan besarnya besaran
nilai
minimum support dan confidence. Dalam
hal ini penulis menetapkan besaran, support
= 3 dan confidence =50%.
2. Langkah Besar Kedua Algoritma MBA
(Market Basket Analysis )
Langkah kedua yaitu dengan menyusun
semua frequent itemset yaitu itemset yang
memiliki minimum support=3 yang telah
ditetapkan sebelumnya.
Kita akan memulai dengan membahas
setiap frequent 1 – Itemset yaitu terdapat pada
Tabel 2 berikut ini.
Tabel 2. Daftar 1 Item Set
No
1
2
3
4
5
6
7
8
9
10
11
ItemSet
Biologi X
Kamus B.Inggris
Fisika X
Hello Magazine
Menanam Jamur
Kehidupan Bakteri
Jakarta Post
Kumpulan
rumus–rumus
Fisika
Bahasa Inggris X
Kimia X
Bahasa Indonesia
Support
4
9
6
4
2
3
2
4
7
3
1
Dari Tabel 2 di atas dapat dilihat item apa
saja yang memiliki minimum support =3. Item–
1
2
3
4
5
6
7
8
Tabel 3. Daftar Frequent 1- Item Set
ItemSet
Support
Biologi X
4
Kamus B.Inggris
9
Fisika X
6
Hello Magazine
4
Kehidupan Bakteri
3
Kumpulan rumus –rumus
4
fisika
Bahasa Inggris X
7
Kimia X
3
Dari daftar frequent 1-itemset di atas, dibuat
menjadi daftar calon frequent 2-itemset, maka
akan didapat hasil seperti pada Table 4 berikut
ini.
Tabel 4. Daftar calon frequent 2-itemset
No
ItemSet
1
Biologi
X,
Kamus
B.Inggris
2
Biologi X, Fisika X
3
Biologi
X,
Hello
Magazine
4
Biologi X, Kehidupan
Bakteri
5
Biologi X, Kumpulan
rumus –rumus fisika
6
Biologi X, Bahasa Inggris
X
7
Biologi X, Kimia X
8
Kamus B.Inggris, Fisika X
9
Kamus B.Inggris, Hello
Magazine
10 Kamus
B.Inggris,
Kehidupan Bakteri
11 Kamus
B.Inggris,
Kumpulan rumus –rumus
fisika
12 Kamus B.Inggris, Bahasa
Inggris X
13 Kamus B.Inggris, Kimia
X
14 Fisika X, Hello Magazine
Support
1
1
0
2
0
0
1
1
3
0
0
6
1
0
143
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Fisika X,
Kehidupan
Bakteri
Fisika
X,
Kumpulan
rumus –rumus fisika
Fisika X, Bahasa Inggris
X
Fisika X, Kimia X
Hello
Magazine,
Kehidupan Bakteri
Hello
Magazine,
Kumpulan rumus –rumus
fisika
Hello Magazine, Bahasa
Inggris X
Hello Magazine, Kimia X
Kehidupan
Bakteri,
Kumpulan rumus –rumus
fisika
Kehidupan
Bakteri,
Bahasa Inggris X
Kehidupan Bakteri, Kimia
X,
Kumpulan rumus –rumus
fisika, Kimia X
Kumpulan rumus –rumus
fisika, Bahasa Inggris X
Bahasa Inggris X, Kimia
X
0
4
0
0
1
0
4
1
1
1
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
No
ItemSet
1
Kamus B.Inggris, Hello
Magazine, Bahasa Inggris X
2
Kamus B.Inggris, Hello
Magazine, Fisika X
3
Kamus B.Inggris, Hello
Magazine, Kumpulan rumus
–rumus fisika
4
Kamus B.Inggris, Bahasa
Inggris X, Fisika X
5
Kamus B.Inggris, Bahasa
Inggris X, Kumpulan rumus
–rumus fisika
Support
3
0
0
0
0
Dari table di atas, dapat dilihat bahwa yang
berhak menjadi frequent 3-itemset adalah
seperti terlihat pada Tabel 7 berikut.
0
Tabel 7. Daftar frequent 3-itemset
1
0
Tabel 5. Daftar frequent 2-itemset
144
Tabel 6. Daftar calon frequent 3-itemset
1
Dari table diatas dapat dilihat bahwa yang
memenuhi syarat minimum support atau yang
berhak menjadi frequent 2-itemset adalah
seperti terlihat pada Tabel 5 berikut.
No
ItemSet
1
Kamus B.Inggris, Hello
Magazine
2
Kamus B.Inggris, Bahasa
Inggris X
3
Fisika X, Kumpulan rumus
–rumus fisika
4
Hello Magazine, Bahasa
Inggris X
Kemudian daftar frequent 2-itemset diatas
dibuat menjadi daftar calon frequent 3-itemset
yaitu seperti terlihat pada Tabel 6 berikut.
Support
3
6
4
4
No
ItemSet
1
Kamus B.Inggris, Hello
Magazine, Bahasa Inggris X
Support
3
Kemudian frequent 3-itemset = frequent 4itemset = frequent 5-iteset
Setelah itu kita hitung nilai confidence dari
masing – masing frequent itemset sehingga
muncul calon aturan asosiasi.
Untuk
menghitung nilai confidence digunakan rumus
sebagai berikut:
 (Ta  Tc )
C
 Ta
Keterangan :
C = Confidence
∑ (Ta+Tc) = Jumlah transaksi yang
mengandung
antecedent
dan
consequencent
Σ(Ta) = Jumlah transaksi yang
mengandung antecedent
Misalnya untuk itemKamus B.Inggris,
Hello Magazine dihasilkan calon aturan asosiasi
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
“Jika pinjam Kamus B.Inggris maka pinjam
Hello Magazine” didapatkan nilai confidence
yaitu sebagai berikut :
 (Ta  Tc )
C
 Ta
3
  0,33  33%
9
Untuk aturan asosiasi Jika pinjam Hello
Magazine maka pinjam Kamus B.Inggris
didaptkan nilai confidence yaitu sebagai berikut:
C
 (Ta  Tc )
 Ta
9
10
11
12
3
 0,75  75%
4
Untuk daftar calon aturan asosiasi yang lain
dapat dilihat pada daftar calon aturan asosiasi di
tabel 8 berikut ini.

13
Tabel 8. Daftar calon aturan asosiasi
14
N
o
1
Dari
Frequent
ItemSet
Kamus
B.Inggris,
Hello
Magazine
2
3
Kamus
B.Inggris,
Bahasa
Inggris X
4
5
Fisika X,
Kumpulan
rumus –
rumus
fisika
6
7
8
Hello
Magazine,
Bahasa
Inggris X
Dihasilkan aturan
asosiasi
Jika pinjam Kamus
B.Inggris
maka
pinjam
Hello
Magazine
Jika pinjam Hello
Magazine
maka
pinjam
Kamus
B.Inggris
Jika pinjam Kamus
B.Inggris
maka
pinjam Bahasa Inggris
X
Jika pinjam Bahasa
Inggris X, Maka
pinjam
Kamus
B.Inggris
Jika pinjam Fisika X,
maka
pinjam
Kumpulan rumus rumus Fisika
Jika
pinjam
Kumpulan rumus rumus Fisika maka
pinjam Fisika X
Jika pinjam Hello
Magazine
maka
pinjam Bahasa Inggris
X
Jika pinjam Bahasa
Inggris
X
maka
pinjam
Hello
Magazine.
Sup
port
Confidence
3/9
3
33%
3
3/4
75%
6
6/9
67%
15
16
17
6
6/7
86%
18
4
4/6
67%
4
4/4
100
%
3
3/4
75%
19
3
3/7
43%
20
Kamus
B.Inggris,
Hello
Magazine,
Bahasa
Inggris X
Jika pinjam Kamus
B.Inggris dan Hello
Magazine,
maka
pinjam Bahasa Inggris
X
Jika pinjam Bahasa
Inggris
X,
maka
pinjam
Kamus
B.Inggris dan Hello
Magazine
Jika pinjam Kamus
B.Inggris dan Bahasa
Inggris
X,
maka
pinjam
Hello
Magazine
Jika pinjam Hello
Magazine,
maka
pinjam
Kamus
B.Inggris dan Bahasa
Inggris X
Jika pinjam Hello
Magazine dan Kamus
B.Inggris
maka
pinjam Bahasa Inggris
X
Jika pinjam Bahasa
Inggris
X
maka
pinjam
Hello
Magazine dan Kamus
B.Inggris
Jika pinjam Hello
Magazine dan Bahasa
Inggris
X
maka
pinjam Kamus B.
Inggris
Jika pinjam Kamus
B.Inggris
maka
pinjam
Hello
Magazine dan Bahasa
Inggris X
Jika pinjam Bahasa
Inggris X dan Kamus
B.Inggris
maka
pinjam
Hello
Magazine
Jika pinjam Hello
Magazine
maka
pinjam Bahasa Inggris
dan Kamus B.Inggris
Jika pinjam Bahasa
Inggris X dan hello
magazine
maka
pinjam
Kamus
B.Inggris
Jika pinjam Kamus
B.Inggris
maka
pinjam Bahasa Inggris
X
dan
Hello
Magazine
0
0/3
-
3
3/7
43%
0
0/6
-
0
0/4
-
3
3/3
100
%
0
0/7
-
0
0/1
-
1
1/9
11%
3
3/6
50%
3
3/4
75%
3
3/3
100
%
0
0/9
-
145
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
3.
Pilih aturan asosiasi yang memenuhi
minimum support dan minimum confidence
Dari table daftar calon asosiasi di atas, kita
pilih yang memenuhi nilai minimum support
dan minimum confidence untuk menjadi aturan
asosiasi. Daftar aturan asosiasi dapat dilihat
pada table 9 berikut ini.
7
8
Tabel 9. Daftar aturan asosiasi
N
o
Dari
Frequent
ItemSet
1 Hello
Magazine,
Bahasa
Inggris X
2 Kamus
B.Inggris,
Bahasa
Inggris X
3
4 Fisika X,
Kumpulan
rumus
–
rumus
fisika
5
6 Hello
Magazine,
Bahasa
Inggris X
Dihasilkan
aturan asosiasi
Jika pinjam Hello
Magazine maka
pinjam
Kamus
B.Inggris
Jika
pinjam
Kamus B.Inggris
maka
pinjam
Bahasa Inggris X
Jika
pinjam
Bahasa Inggris X,
Maka
pinjam
Kamus B.Inggris
Jika pinjam Fisika
X, maka pinjam
Kumpulan rumus
-rumus Fisika
Jika
pinjam
Kumpuan rumus rumus
Fisika
maka
pinjam
Fisika X
Jika pinjam Hello
Magazine maka
pinjam
Bahasa
Inggris X
146
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Sup
por
t
3
Confidenc
e
3/4
9
75
%
1
0
6
6/9
67
%
6
6/7
86
%
4
4/6
67
%
4
4/4
100
%
3
3/4
75
%
Kamus
B.Inggris,
Hello
Magazine,
Bahasa
Inggris X
Jika pinjam Hello
Magazine
dan
Kamus B.Inggris
maka
pinjam
Bahasa Inggris X
Jika
pinjam
Bahasa Inggris X
dan
Kamus
B.Inggris
maka
pinjam
Hello
Magazine
Jika pinjam Hello
Magazine maka
pinjam
Bahasa
Inggris
dan
Kamus B.Inggris
Jika
pinjam
Bahasa Inggris X
dan
hello
magazine maka
pinjam
Kamus
B.Inggris
3
3/3
100
%
3
3/6
50
%
3
3/4
75
%
3
3/3
100
%
Proses diatas adalah proses mining data
secara manual dengan menggunakan data fiktif.
Untuk perpustakaan SMK TI PAB 7 Lubuk
Pakam, diambil data peminjaman buku untuk
kelas X dari mulai 7 April 2010 sampai dengan
12 Juni 2010. Data peminjaman buku tersebut
penulis dapatkan dari petugas perpustakaan
Dari data yang ada, setelah dilakukan
mining dengan menggunakan XL Miner dengan
tingkat minimum support =3 dan minimum
confidence = 50% maka menghasilkan beberapa
aturan asosiasi seperti pada Gambar 1 berikut.
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
Gambar 1. Hasil mining dengan menggunakan XL Miner
147
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
Untuk menu utama , rancangan formnya seperti pada Gambar 2 berikut.
Menu Utama
Input Data
Program
Data Rak
Atur Password
Data Buku
Log Out
Keluar
Gambar 2. Rancangan Menu Utama
H. PENGUJIAN DAN IMPLEMENTASI
Kegiatan uji coba program dengan cara
memasukkan data sampel ke dalam sistem dan
memperhatikan output-output yang dihasilkan.
Adapun tahapan yang dilakukan adalah :
1. Melakukan
kompile
program untuk
mengetahui kesalahan penulisan pada
program tersebut.
2. Melakukan run program untuk mengetahui
hasil dari pada eksekusi program, sehingga
dapat diketahui apakah program telah benar
atau masih salah. Untuk mengetahui
program sudah benar maka, dapat dilakukan
dengan menguji coba dengan beberapa
tahapan, adapun tahapan yang dilakukan
anatara lain :
a. Melakukan perekaman data, dalam hal
ini perekaman data untuk:
1. Data buku
2. Data Rak
b. Melakukan perbaikan data untuk
menghindari apabila ada data yang
direkam tidak benar maka, dapat
dilakukan
sesuai
dengan
yang
sebenarnya
c. Melakukan penghapusan data bila data
yang direkam tidak dibutuhkan lagi atau
148
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
data yang direkam tidak sesuai dengan
data yang sebenarnya.
Aplikasi pencari buku ini apabila dijalankan
memiliki tampilan menu utama seperti pada
Gambar 3 berikut.
Gambar Menu Utama
Menu Gambar
utama 3.memiliki
dua menu utama
yaitu menu Input Data dan menu Program. Input
data memiliki dua submenu yaitu Data Buku
dan Data Rak. Sementara menu Program
memiliki tiga submenu yaitu Pengaturan
Password, Log Out dan Keluar.
Dalam aplikasi ini, sebelum kita dapat
menginputkan data, terlebih dahulu kita Log in.
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
Kita dapat log in sebagai user ataupun sebagai
admin. Perbedaannya kalau kita masuk sebagai
user, beberapa tombol dalam form input data
akan dibekukan. Hal ini dilakukan untuk
menghindari pemodifikasian oleh orang – orang
yang tidak berhak. Tetapi kalau kita masuk
sebagai admin semua form akan berfungsi
normal tanpa ada tombol yang dalam keadaan
beku.
Untuk masuk sebagai user cukup diketikan
”user” kemudian masukkan passwordnya
kemudian klik tombol log in. Untuk masuk
sebagai admin, ketik pada kolom user ”admin”
kemudian ketikkan passwordnya kemudian klik
log in.
Untuk mengganti password dapat dilakukan
dengan mengklik menu program pilih
pengaturah password. Kemudian form untuk
mengatur password akan ditampilkan seperti
pada Gambar 4 berikut.
Untuk menginputkan data rak, dapat kita
lakukan dengan mengklik menu Data kemudian
kita pilih Data Rak. Kemudian form input data
rak akan tampil (Gambar 6).
Gambar 6. Form Input Data Rak
Gambar 4. Form Pengaturan Password
Form pencarian buku berfungsi untuk
melakukan pencarian buku berdasarkan fieldfield tertentu. Dengan menggunakan form ini
pengguna bisa mengetahui letak buku secara
spesifik. Untuk membuka form pencarian buku
dapat kita lakukan dengan mengklik menu Data
pilih Data Buku kemudian form pencarian buku
akan terbuka (Gambar 7).
Untuk memasukkan data buku, dapat kita
lihat pada Gambar 5, klik menu Data kemudian
pilih Data Buku. Kemudian kotak form Input
Data Buku akan ditampilkan.
Gambar 7. Form Pencarian Buku
Gambar 5. Form Input Data Buku
149
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Dian Wirdasari dan Ahmad Calam: Penerapan Data Mining…
I.
SIMPULAN
Adapun kesimpulan yang diperoleh dari
penelitian ini adalah :
1. Dari
tumpukan
data
kunjungan
perpustakaan, terdapat pengetahuan yang
bermanfaat bagi perpustakaan itu sendiri
dan para pengunjung perpustakaan tersebut.
2. Dari hasil mining data kunjungan
perpustakaan SMK TI PAB 7 Lubuk Pakam
didapatkan informasi bahwa buku yang
paling sering dipinjam oleh siswa dengan
nilai support 9 adalah buku Biologi Kelas
X.
3. Terdapat beberapa aturan asosiasi yang
memiliki nilai confidence 100% misalnya
jika
meminjam
Conversation
dan
matematika bilingual maka meminjam
Matematika X. Artinya jika memnjam buku
Conversation dan matematika maka
kemungkinan
meminjam
matematika
bilingual adalah 100%.
J.
DAFTAR PUSTAKA
Arhami, Muhammad. 2005. Konsep Dasar
Sistem Pakar. Yogyakarta: Penerbit Andi.
Hartati, Iswanti. 2008. Sistem Pakar dan
Pengembangannya. Yogyakarta: Graha
Ilmu.
http://journal.unair.ac.id/filerPDF/PERPUSTAK
AAN%20DIGITAL.pdf
diakses pada
9/01/2011 11:00
http://blogs.msdn.com/azazr/archive/2008/05/09
/populate-time-dimension-of
adventureworksdw-sample-database-anduse-it-in-your-datawarehouse-cube.aspx.
Diakses pada 12/10/2011 08:25
Jogiyanto H. M. 1999. Analisa dan Desain.
Yogyakarta: Andi Offset.
Kusrini, Emha Taufiq Luthfi. 2009. Algoritma
Data Mining. Yogyakarta : Penerbit Andi
Kusrini. 2008. Aplikasi Sistem Pakar,
Yogyakarta: Penerbit Andi.
----. 2006. Sistem Pakar Teori dan Aplikasi.
Yogyakarta: Penerbit Andi.
150
Jurnal SAINTIKOM
Vol. 10 / No. 2 / Mei 2011
Laboratorim Data Mining. 2011. Klasifikasi
Decision Tree dalam “http://datamininglab.com”. Yogyakarta : Fakultas Teknologi
Industri Universitas Islam Indonesia
Larose, Daniel T. 2005. Discovering Knowledge
in Data: An Introduction to Data Mining.
John Willey & Sons, Inc.
Santosa, Budi. 2007. Data Mining Teknik
Pemanfaatan Data untuk Keperluan Bisnis.
Yogyakarta: Graha Ilmu.
Susanto, Sani., dan Suryadi, Dedy. 2010.
Pengantar Data Mining. Yogyakarta:
Penerbit Andi Yogyakarta.
Download