PENERAPAN ASSOCIATION RULE MINING UNTUK

advertisement
PENERAPAN ASSOCIATION RULE MINING UNTUK REKOMENDASI
PENELUSURAN BUKU DENGAN ALGORITMA CT-PRO
Dwi Maryati Suryana, Sri Setyaningsih, Lita Karlitasari
e-mail : [email protected]
Program Studi Ilmu Komputer Universitas Pakuan
Jl. Pakuan PB 452, Bogor, Jawa Barat 16143
Abstrak
Perpustakaan Fakultas Matematika dan Ilmu Pengetahuan (FMIPA), memiliki sejumlah
koleksi buku maupun media cetak lainnya, yang jumlahnya mencapai 2.632 buku. Sistem
penelusuran buku yang tersedia sangat membantu pengunjung untuk mencari buku yang
dibutuhkan. Terutama jika sistem tersebut memiliki fitur rekomendasi buku. Dalam
pemberian rekomendasi buku digunakan salah satu teknik data mining, yaitu teknik
association rule mining atau penggalian aturan asosiasi. Dalam pembangunan sistem
rekomendasi ini, digunakan model KDD (Knowledge Discovery from Database). Data
yang digunakan adalah data transaksi histori peminjaman buku dengan kategori “kimia”,
selama 5 (lima) bulan terakhir, yaitu September 2014 – Februari 2015. Teknik penggalian
aturan asosiari ini, memiliki 2 (dua) proses utama, yaitu : pencarian pola item yang sering
muncul (frequent patterns) dan penentuan aturan (rule). Untuk menemukan frequent
patterns, digunakan Algoritma CT-PRO. Nilai minimum support yang digunakan sebesar
1 dan 2. Setelah pola ditemukan, dihitung nilai confidence dari setiap pola tersebut. Nilai
minimum confidence yang digunakan berkisar dari 10% sampai 100%. Aturan pemberian
rekomendasi, didasarkan pada perhitungan nilai confidence ini. Perbandingan nilai
minimum support menunjukkan, bahwa semakin besar nilai minimum support, maka
semakin sedikit pola peminjaman yang dihasilkan, begitupun sebaliknya. Dalam
perbandingan nilai minimum confidence menunjukkan, bahwa semakin besar nilai
minimum confidence, maka semakin sedikit aturan rekomendasi yang diberikan.
Kata kunci : Perpustakaan, Sistem Rekomendasi, Knowledge Discovery from Database
(KDD), Association Rule Mining, Algoritma CT-PRO
konsep data mining. Data mining
adalah sebuah proses dasar dimana
metode kecerdasan digunakan untuk
menghasilkan pola data (Jiawei Han,
2012).
Perpustakaan
Fakultas
Matematika dan Ilmu Pengetahuan
Alam (MIPA) di Universitas Pakuan,
memiliki statistik pengunjung 30
orang perhari pada tahun 2014.
Jumlah buku yang tersedia mencapai
2.632 buku. Bagi pengunjung yang
bertujuan mencari referensi dari suatu
topik, sistem penelusuran buku yang
telah tersedia di perpustakaan ini
menjadi sasaran utama. Karena dalam
1. Pendahuluan
Data selalu menjadi bagian dari
setiap aktivitas yang kita lakukan saat
ini. “We’re living in data age” (Jiawei
Han, 2012). Akibatnya, pertumbuhan
data menjadi hal yang tak terelakkan
lagi. Dari yang ukurannya byte hingga
ke petabyte. Untuk mengolah jutaan,
bahkan milyaran data yang tersimpan
dalam suatu penyimpanan data
elektronik, dibutuhkan tools yang
sesuai. Pengolahan data disini
bertujuan
untuk
menghasilkan
informasi yang bisa membantu
manajemen
dalam
mengambil
keputusan. Dari dasar inilah, lahir
1
mencari
referensi
biasanya
dibutuhkan lebih dari satu buku, maka
suatu fasilitas rekomendasi buku dari
sistem akan sangat membantu
pengunjung.
Metode
penggalian
aturan
asosiasi (association rule mining)
merupakan salah satu metode dalam
konsep data mining, yang bertujuan
untuk mencari pola yang menarik
dalam sejumlah transaksi. Pada
umumnya algoritma yang digunakan
dalam metode asosiasi ini adalah
Apriori dan FP Growth. Algoritma FP
Growth merupakan perbaikan dari
algoritma Apriori dari segi kecepatan
eksekusi. Namun, algoritma FP
Growth
membutuhkan
banyak
memori, sehingga muncul beberapa
algoritma hasil pengembangan dari
FP Growth. CT-PRO merupakan
salah satunya. Pada penelitian ini,
digunakan
algoritma
CT-PRO.
Algoritma ini digunakan untuk
mencari pola frekuensi (frequent
pattern) dari transaksi peminjaman
buku (buku apa saja yang dipinjam
dalam suatu transaksi peminjaman).
Dari
pola
frekuensi
tersebut,
dihasilkan rekomendasi buku lainnya
dari suatu buku yang dicari user
dalam sistem penelusuran buku.
Penelitian ini bertujuan untuk
menerapkan metode association rule
mining
untuk
rekomendasi
penelusuran
buku
dengan
menggunakan algoritma CT-PRO.
Manfaat
dalam
penelitian
ini
diharapkan :
a. Sebagai
rujukan
untuk
menambah fitur rekomendasi
pada sistem penelusuran buku
yang
telah
ada,
agar
mempermudah
pengunjung
dalam mencari referensi yang
berkaitan.
b. Memberikan
pengetahuan
mengenai penggunaan data
mining
dengan
teknik
association
rule
untuk
memberikan rekomendasi buku
melalui transaksi peminjaman.
2. Tinjauan Pustaka
Ada 2 (dua) proses utama dalam
penggalian aturan asosiasi, yaitu :
a. pencarian
pola
(frequent
pattern)
dari
sejumlah
transaksi
b. penentuan
kuatnya
rule
(aturan) dari pola yang
dihasilkan.
Dalam association rule mining ada
2 (dua) hal yang mempengaruhi :
a. Support
Support adalah proporsi suatu
item dalam semua transaksi.
Support dirumuskan sebagai
berikut :
∑
( )
∑
b. Confidence
Confidence adalah hal yang
mendasari aturan asosiasi,
dengan konsep implikasi (x =>
y), atau “if ... then ...”.
Besarnya nilai confidence
suatu aturan (rule) dirumuskan
sebagai berikut :
∑
(
)
∑
Nilai minimum support dan
minimum confidence bisa diatur oleh
pengguna ataupun ahli yang berkaitan
(Han, Jiawei. 2012).
Sucahyo, Gopalan (2004) telah
melakukan penelitian yang berjudul
CT-PRO:
A
Bottom-Up
Non
Recursive Frequent Itemset Mining
Algorithm Using Compressed FPTree Data Structure. Pada penelitian
ini, diperkenalkan algoritma baru
sebagai pengembangan dari algoritma
FP Growth, yaitu CT-PRO. Penulis
juga melakukan perbandingan waktu
eksekusi antara algoritma CT-PRO,
2
FP Growth dan Apriori. Pada
perbandingan
waktu
tersebut
menunjukkan, bahwa algoritma CTPRO mempunyai waktu eksekusi
paling sedikit.
Gupta (2011) telah melakukan
penelitian yang berjudul FP-Tree
Based
Algorithms
Analysis:
FPGrowth, COFI-Tree and CT-PRO.
Pada
penelitian
ini,
penulis
membandingkan ketiga algoritma
yang berbasis FP Tree, yaitu
algoritma FP Growth, COFI-Tree dan
CT-PRO. COFI-Tree dan CT-PRO
merupakan
pengembangan
dari
algoritma FP Growth. Langkah –
langkah
ketiga
algoritma
ini
dijelaskan melalui studi kasus yang
sama. Perbandingan ketiga algoritma
ini dinilai dari aspek struktur,
pendekatan, teknik, utilisasi memori
dan basis data.
Wandi,
Hendrawan
dan
Mukhlason (2012) telah melakukan
penelitian
yang
berjudul
Pengembangan Sistem Rekomendasi
Penelusuran
Buku
dengan
Penggalian
Association
Rule
Menggunakan Algoritma Apriori
(Studi Kasus Badan Perpustakaan
dan Kearsipan Provinsi Jawa Timur).
Pada penelitian ini, pemberian
rekomendasi buku menggunakan
aturan asosiasi dengan algoritma
Apriori. Nilai minimum support
1,2,3,4 dan nilai minimum confidence
10% - 100%. Nilai minimum support
dan confidence yang beragam itu
digunakan
untuk
melihat
perbandingan eksekusi waktu.
pengujian
pola
dan
penyajian
pengetahuan.
Berikut penjabaran untuk setiap
fase dalam penelitian ini.
a. Pembersihan Data (Data
Cleaning)
Pada tahap ini, dilakukan
penghapusan untuk data yang
mengganggu (noise) dan yang
ridak relevan. Tahap ini sangat
penting, karena hasil dati
proses data
mining
ini
tergantung pada kualitas data
yang dipilih. Contoh hal yang
dilakukan
pada
tahap
pembersihan data adalah :
menghapus
record
yang
duplikat, atau record yang
banyak mengandung missing
value.
b. Penyatuan Data (Data
Integration)
Tahap ini dilakukan untuk
menyatukan data, apabila data
tersebut berada dari berbagai
lokasi
penyimpanan
data
(database
atau
data
warehouse).
c. Pemilihan Data (Data
Selection)
Pada tahap ini dilakukan
pemilihan data dari sejumlah
data yang sudah dilakukan
proses penyatuan data. Data
yang dipilih adalah data yang
berhubungan untuk proses data
mining selanjutnya. Data yang
tidak
dibutuhkan
bisa
dihilangkan.
3. Metode Penelitian
Untuk penelitian ini digunakan
model KDD (Knowledge Discovery
from Database). Model ini memiliki 7
(tujuh) fase, yaitu : pembersihan data,
penyatuan data, pemilihan data,
transformasi data, penggalian data,
d. Transformasi Data (Data
Transformation)
Pada tahap ini dilakukan
penyesuaian
format
data
dengan tahap selanjutnya yaitu
penggalian
data.
Seperti
mengubah format salah satu
3
bagian data atau mengubah
format
data
secara
keseluruhan,
agar
sesuai
dengan tools yang akan
digunakan pada saat proses
perhitungan
data
mining.
Dengan berakhirnya tahap ini,
maka data sudah siap untuk
diolah.
4. Hasil dan Pembahasan
Data yang dibutuhkan terdapat
pada database perpustakan FMIPA
UNPAK.
Untuk
pemberian
rekomendasi buku, dibutuhkan data
peminjaman dan data buku, atau tabel
peminjaman dan tabel buku dari
database untuk 5 (lima) bulan terakhir,
yaitu September 2014 – Februari
2015.
Data yang tidak sesuai (missing
values) dihilangkan, agar tidak
menganggu keakuratan perhitungan.
Pembersihan data yang dilakukan pada
tabel peminjaman. Pada tabel tersebut
terdapat 13% (23 records) dari total
178 records, yang tidak memiliki
value pada field buku. Sehingga
record tersebut dihilangkan. Untuk
field
buku
tidak
dilakukan
pembersihan data.
Selanjutnya,
dilakukan
penyeleksian
data
pada
tabel
peminjaman dan buku. Field yang
tidak dibutuhkan pada kedua tabel
tersebut akan dihapus. Berikut
merupakan daftar field yang dihapus :
a. Tabel peminjaman : npm,
tgl_tempo,
tgl_perpanjang,
kembali, id_petugas, telat,
denda, bayar, sisa, angkatan
dan kode_prodi.
b. Tabel buku : keterangan,
kode_prodi, bahan_pustaka,
stok_rusak,
tanggal,
sumber_buku, barcode.
Daftar buku dan peminjaman yang
digunakan hanya yang berasal dari
program studi kimia. Total buku ada
220 buku dan total peminjaman
sebanyak 155 transaksi.
Penambahan
data
dilakukan
dengan
menambah
tabel
borrow_book. Tabel ini digunakan
untuk merelasikan tabel peminjaman
(borrows) dan tabel buku (books),
karena pada tabel peminjaman yang
diisi adalah kode buku. Sehingga
e. Penggalian Data (Data
Mining)
Pada tahap ini, dilakukan
pemilihan teknik data mining
yang sesuai dengan tujuan
penggalian data. Setelah itu,
teknik tersebut diterapkan pada
data yang sudah disiapkan
sebelumnya. Hasil dari tahap
ini berupa pola – pola data
yang menarik.
f. Pengujian Pola (Pattern
Evaluation)
Pada tahap ini, dilakukan
pengujian terhadap pola – pola
data yang ditemukan pada
proses
penggalian
data.
Karena, bisa jadi tidak semua
pola benar – benar “menarik”
jika berdasarkan suatu ukuran
(measure). Jika memenuhi
standar ukuran, maka pola
tersebut digunakan sebagai
pengetahuan (knowledge).
g. Penyajian Pengetahuan
(Knowledge Presentation)
Pada tahap ini, dirancang
teknik – teknik visual untuk
menyajikan pengetahuan dari
proses data mining¸ agar
mudah
dimengerti
oleh
pengguna. Pada tahap ini pula,
dilakukan
implementasi
terhadap perancangan tersebut
ke dalam basis teknologi.
4
untuk mendapatkan judul buku harus
melihat dari tabel buku.
Penyusunan (format) data juga
perlu dilakukan untuk menyesuaikan
tools yang digunakan dengan format
data yang tersedia. Format database
perpustakaan ini sudah dalam bentuk
SQL (Structured Query Language),
sesuai dengan tools database yang
digunakan pada penelitian ini, yaitu
MySQL.
Selanjutnya, dilakukan pemilihan
teknik data mining. Teknik data
mining
yang digunakan yaitu
association rule mining, untuk
melihat hubungan menarik antar buku
yang dipinjam. Hubungan yang
menarik tersebut akan memberikan
informasi berupa kecenderungan
peminjam untuk meminjam buku A
biasanya akan meminjam pula buku
B. Dari situlah rekomendasi buku
diberikan.
Secara umum, proses association
rule mining terbagi 2 (dua), yaitu :
pemilihan frequent patterns dan
penentuan kuatnya suatu rule. Untuk
menentukan
frequent
patterns,
digunakan algoritma CT-PRO. Dan
untuk menentukan kuatnya suatu rule,
digunakan rumus nilai confidence.
Agar pemahaman teknik ini lebih
baik, dijabarkan langkah – langkah
perhitungan
menggunakan
data
sampel sebanyak 15 transaksi
peminjaman dan nilai minimum
support sebesar 2 (dua).
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1476, 1478
1476, 1478
1722
1699, 1476
1699, 1478
1699, 1476
1699, 1478
1722, 1715
1722, 1715
1722, 1730
1722, 1730
1512, 1722
1512, 1602
1512, 1516
1512, 1552
1512, 1722
1516
1699
Berikut merupakan langkah –
langkah algoritma CT-PRO :
1. Hitung frekuensi item dari
semua transaksi.
item
frequency
5
1476
4
1478
9
1512
5
1516
1
1552
1
1602
7
1699
2
1715
8
1722
2
1730
Tabel 1. Daftar Transaksi
Peminjaman
No
Item
1
1512
2
1512
3
1476, 1516
4
1512, 1722
5
1512
6
1699, 1516
7
1699, 1516
2. Hilangkan item yang nilanya
dibawah min_sup. Item 1552
dan 1602 dieliminasi karena
nilainya < min_sup.
3. Masukkan item ke dalam tabel
global header. Disusun dari
item frekuensi terbesar ke
terkecil.
5
Tabel 2. Global Header
index item frequency
1
1512
9
2
1722
8
3
1699
7
4
1476
5
5
1516
5
6
1478
4
7
1715
2
8
1730
2
5. Lakukan pencarian frequent
itemset secara lokal dari indeks
terakhir, yaitu indeks 8.
5.1.Pilih
transaksi
yang
mengandung indeks 8
(1730 = 2).
No. Transaksi
18
19
Item
2, 8
2, 8
5.2.Hitung jumlah frekuensi
indeks lain selain indeks 8.
4. Urutkan item dalam setiap
transaksi menurut indeks.
index item frequency
2
1722
2
Tabel 3. Item Transaksi
Diurutkan
No
Item
1
1
2
1
3
4, 5
4
1, 2
5
1
6
3, 5
7
3, 5
8
4, 6
9
4, 6
10
2
11
3, 4
12
3, 6
13
3, 4
14
3, 6
15
2, 7
16
2, 7
17
2, 8
18
2, 8
19
1, 2
20
1, 10
21
1, 5
22
1, 9
1, 2
23
5
24
25
3
5.3.Hilangkan\ item
yang
jumlahnya
dibawah
min_sup. Buat tabel lokal
indeks. Item disusun dari
frekuensi
terbesar
ke
terkecil. Item indeks 8
menjadi indeks 0.
index item frequency
0
1730
2
1
1722
2
5.4.Jika ada item lain selain
indeks 0, gabungkan untuk
mendapatkan
frequent
patterns lainnya.
frequent patterns :
index
item
frequency
0,1 1730, 1722
2
5.5.Lakukan
pencarian
frequent patterns untuk
indeks selanjutnya, yaitu
indeks 7. Item indeks
sebelumnya (item 1720)
tidak dapat dibawa lagi ke
pencarian selanjutnya.
6. Berikut hasil frequent patterns
dari semua pencarian lokal :
6
Tabel 4. Hasil Frequent
Patterns
no
item
frequency
1 1730, 1722
2
2 1715, 1722
2
3 1478, 1699
2
4 1478, 1476
2
5 1516, 1699
2
6 1476, 1699
2
7 1722, 1512
3
c.
)
d.
∑
∑
∑
1 x 100% = 100%
∑
(
)
∑
(
)
0.25 x 100% = 25% (tidak
memenuhi nilai min_conf). Dan
seterusnya.
Maka, pola (patterns) yang
memenuhi nilai min_conf menjadi
aturan (rule) dan dijadikan dasar
pemberian rekomendasi. Sehingga
bisa
disimpulkan
untuk
hasil
perhitungan ini :
a. Jika
meminjam
Kimia
Lingkungan (1730), maka juga
meminjam Analisis Anorganik
Kualitatif Makro dan Semikro
(1722).
b. Jika
meminjam
Kimia
Lingkungan (1715), maka juga
meminjam Kimia Anorganik
Dasar (1722).
c. Dan seterusnya.
Tahap terakhir dari KDD adalah
menerapkan aplikasi data mining
yang telah dibuat ke lingkungan yang
membutuhkan, agar dapat disajikan
dengan tampilan yang memudahkan
pengguna untuk memahami hasil
pengetahuan (knowledge). Dalam
studi kasus ini, hasil pengetahuan
disajikan melalui media web, dalam
bentuk sistem penelusuran buku yang
memuat
fitur
rekomendasi
penelusuran. Berikut merupakan
penggambaran sistem dan teknik
association rule mining dalam bentuk
diagram alur (flowchart) :
Nilai
minimum
confidence
(min_conf) untuk penelitian ini
berkisar dari 10% - 100%. Untuk
contoh perhitungan ini, misal nilai
minimum confidence adalah 60%.
Berikut merupakan hasil perhitungan
nilai confidence untuk beberapa
patterns :
(
)
a.
b.
(
1 x 100% = 100%
Selanjutnya dilakukan pengujian
untuk pola (patterns) yang ditemukan
apakah benar – benar dapat
digunakan
untuk
pemberian
rekomendasi
buku.
Untuk
menentukan kuat tidaknya suatu rule
digunakan rumus confidence :
(
∑
)
0.25 x 100% = 25% (tidak
memenuhi nilai min_conf)
7
Gambar 1. Diagram Alur Sistem
Gambar 2. Diagram Alur Algoritma CT-PRO
8
Gambar 3. Diagram Alur Algoritma CT-PRO (lanjutan)
9
Gambar 4. Diagram Alur Perhitungan Nilai Confidence
halaman pencarian, hasil pencarian,
detail pencarian dan hasil perhitungan
salah satu buku :
Berikut merupakan tampilan dari
sistem rekomendasi buku, dari
Gambar 5. Halaman Pencarian
Gambar 6. Halaman Hasil Pencarian
10
Gambar 7. Informasi buku
Gambar 8. Hasil perhitungan
Gambar 9. Rekomendasi buku
support yang digunakan adalah 1 dan
2. Nilai minimum support didapat
dari persebaran data transaksi
peminjaman. Berikut merupakan hasil
perbandingan nilai minimum support
:
Proses pencarian frequent patterns
digunakan untuk mencari buku –
buku
yang
sering
dipinjam
bersamaan, dengan menggunakan
algoritma CT-PRO. Nilai minimum
11
90%
100%
Tabel 5. Perbandingan jumlah
item yang memenuhi nilai minimum
confidence
Minimum
Jumlah
Persent
Support
Item
ase
1
112
62%
2
42
38%
3
3
Dari tabel minimum confidence
menunjukkan bahwa, semakin besar
nilai minimum confidence, maka
semakin sedikit rules yang dihasilkan,
begitupun
sebaliknya.
Artinya,
semakin sedikit rules yang dihasilkan,
maka
semakin
sedikit
pula
rekomendasi
buku
yang
bisa
diberikan dan sebaliknya.
Uji coba validasi ini dilakukan
dengan
membandingkan
data
peminjaman buku yang asli dengan
hasil rekomendasi buku yang
diberikan sistem. Berikut beberapa
sampel buku yang direkomendasikan
:
Tabel dan grafik perbandingan
minimum
support
tersebut
menunjukkan bahwa semakin besar
nilai minimum support, maka semakin
sedikit
item
yang
dihasilkan.
Begitupun sebaliknya.
Untuk proses penentuan aturan
(rules), digunakan rumus nilai
confidence.
Nilai
confidence
digunakan
untuk
menentukan
seberapa besar kecenderungan suatu
item yang muncul bersamaan dengan
item
lainnya. Nilai minimum
confidence yang digunakan berkisar
antara 10% - 100%. Penentuan nilai
minimum confidence ini berdasarkan
penelitian yang dilakukan oleh
Wandi, Hendrawan dan Mukhlason
(2012) dengan studi kasus yang sama
(lihat Daftar Pustaka). Berikut
merupakan hasil perbandingan nilai
confidence terhadap jumlah rules
yang dihasilkan :
No.
1
2
Tabel 6. Perbandingan total
aturan yang memenuhi nilai
minimum confidence
Minimum
Jumlah
Confidence
rules
10%
13
20%
13
30%
10
30%
7
40%
5
50%
3
60%
3
70%
3
80%
3
3
4
12
Tabel 7. Hasil uji coba validasi
Buku yang
Tanggal
direkomendasikan Peminjaman
Jika meminjam
31-10-2014
Kimia Universitas
Asas & Struktur E5
(1699),
maka meminjam
FESSENDEN
FESSENDEN
Kimia Organik
(1516)
Jika meminjam
23-09-2014
Kimia Lingkungan 05-01-2015
(1730),
maka meminjam
Kimia Anorganik
Dasar (1715)
Jika meminjam
31-12-2014
Prinsip - Prinsip
07-01-2015
Kimia Modern
(2741),
maka meminjam
Kimia Universitas
Asas & Struktur E5
(1699)
Jika meminjam
17-12-2014
Analisa Kimia
29-12-2014
Kuantitatif (2757),
5
maka meminjam
Konsep Dasar
Kimia Analitik
(1478)
Jika meminjam
dasar-dasar kimia
organik (2759),
maka meminjam
Fessenden &
Fessenden Kimia
Organik E3 (1552)
confidence, maka semakin sedikit
aturan rekomendasi yang diberikan.
Penerapan algoritma CT-PRO
lebih efektif apabila diterapkan pada
data yang mempunyai item lebih
banyak pada setiap transaksi (item >
10
).
Sebagai
pengembangan
penelitian,
dapat
dilakukan
perbandingan terhadap algoritma
dalam association rules mining
lainnya, seperti algoritma Apriori dan
algoritma FP Growth terhadap studi
kasus yang sama.
22-10-2014
30-10-2014
Berdasarkan data peminjaman di
perpustakaan FMIPA UNPAK, buku
yang paling banyak dipinjam adalah
buku Konsep Dasar Kimia Analitik
(1478), dengan frekuensi peminjaman
sebanyak 12 kali.
6. Ucapan Terima Kasih
Penulis mengucapkan terima kasih
yang sebesar – besarnya kepada
Perpustakaan
Fakultas
MIPA
Universitas Pakuan, yang telah
mengizinkan
untuk
melakukan
penelitian. Penulis juga mengucapkan
terima kasih kepada Ibu Sri
Setyaningsih dan Ibu Lita Karlitasari,
selaku dosen pembimbing. Juga
kepada Bapak Soewarto Hardhienata,
Ibu Eneng Tita Tosida, Bapak Iyan
Mulyana, Ibu Arie Qur’ania, Ibu
Prihastuti Harsani dan Ibu Tjut
Awaliyah, sebagai dosen penguji.
5. Simpulan dan Saran
Penggalian
aturan
asosiasi
(association rule mining) digunakan
untuk melihat hubungan yang menarik
diantara sejumlah transaksi. Proses
dalam association rule mining ada 2
(dua), yaitu : pencarian pola dan
menghitung kuatnya suatu aturan.
Algoritma CT-PRO ini berguna untuk
mencari buku saja yang sering
dipinjam secara bersamaan. Untuk
menyeleksi
buku
yang
sering
dipinjam, digunakan nilai minimum
support. Selain, mencari pola buku
yang dipinjam bersamaan, dihitung
pula nilai confidence, untuk mengukur
besar kecenderungan peminjaman
suatu buku bersamaan dengan buku
yang lainnya. Jika nilai confidence
suatu pola memenuhi nilai minimum
confidence, maka buku tersebut layak
direkomendasikan.
Perbandingan
nilai
minimum
support menunjukkan, bahwa semakin
besar nilai minimum support, maka
semakin sedikit pola peminjaman yang
dihasilkan, begitupun sebaliknya.
Dalam perbandingan nilai minimum
confidence menunjukkan, bahwa
semakin
besar
nilai
minimum
7. Daftar Pustaka
1) Ahlemeyer-Stubbe, Andrea. Coleman,
Shirley. 2014. A Practical Guide to
Data
Mining for Business and
Industry. WILEY, United Kingdom.
2) Bell, Jason. 2015. Machine Learning:
Hands-On for Developers and
Technical Professionals. John Wiley
& Sons, Inc, Indiana Polis, Canada.
3) Brown, Meta S. 2014. Data Mining
For Dummies. John Wiley & Sons,
Inc, New Jersey, Canada.
4) Gupta, Bharat. 2011. FP-Tree Based
Algorithms Analysis: FPGrowth,
COFI-Tree and CT-PRO. International
Journal on Computer Science and
Engineering (IJCSE). 3 : 2691 – 2699.
5) Han, Jiawei. Kamber, Micheline. Pei,
Jian. 2012. Data Mining Concepts and
Techniques 3rd Edition. Morgan
Kaufmann, USA.
13
6) Harrington, Peter. 2012. Machine
Learning in Action. Manning, Shelter
Island, New York.
7) Sucahyo, Yudho Giri. Gopalan, Raj.
P. 2004. CT-PRO: A Bottom-Up Non
Recursive Frequent Itemset Mining
Algorithm Using Compressed FP-Tree
Data Structure.
8) Wandi, Nugroho. Hendrawan, Rully
A. Mukhlason, Ahmad. 2012.
Pengembangan Sistem Rekomendasi
Penelusuran Buku dengan Penggalian
Association
Rule
Menggunakan
Algoritma Apriori (Studi Kasus Badan
Perpustakaan dan Kearsipan Provinsi
Jawa Timur). Jurnal Teknik Institut
Teknologi Sepuluh November (ITS). 1
: A445 – A449.
9) http://www.sqldatamining.com/datawarehousing/steps-of-the-knowledgediscovery-in-databases-process
14
Download