Pembentukan Minimal Non-Redundant Association

advertisement
7
Penelitian ini melakukan pencarian
minimal non-redundant association rules
(MNRAA) berdasarkan urutan proses dalam
bagan alir minimal non-redundant association
rules mining yang ditampilkan pada Gambar 3.
Penelitian ini menggunakan hasil praproses
yang telah dihasilkan penelitian sebelumnya
(Widodo 2004).
Pada penelitian Widodo (2004), data
praproses menghasilkan 35 jenis kelompok
barang (Lampiran 2) dan 23.631 record.
Pencarian minimal non-redundant association
rules dilakukan melalui dua tahap, yaitu:
Gambar 3 Bagan alir minimal non- redundant
association rules mining.
1 Pembentukan Frequent Closed itemsets
Pembentukan frequent closed itemsets
(FC) dilakukan dengan membentuk kandidat
frequent closed itemsets (FCC). FCC yang
memenuhi nilai minsup akan menjadi FC.
Pada penelitian ini dilakukan pembentukan
FC dengan menggunakan empat nilai minsup,
yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631
transaksi yang ada. Empat nilai minsup
tersebut dipilih untuk mendapatkan variasi
jumlah kandidat FC dan FC.
2 Pembentukan Minimal Non-Redundant
Association Rules
Setelah
diperoleh
frequent
closed
itemsets, kemudian dilakukan pembentukan
minimal non-redundant association rules.
Pembentukan
minimal
non-redundant
association rules dilakukan menggunakan 11
nilai mincof, yaitu 75 %, 70 %, 65 %, 60 %,
55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan
10 %. Nilai–nilai mincof tersebut digunakan
untuk mengetahui nilai maksimum confidence
dari aturan asosiasi pada empat nilai minsup
yang telah dicobakan.
Penelitian membandingkan minimal nonredundant association rules mining dengan
association rules mining pada penelitian
sebelumnya (Widodo 2004). Perbandingan
dilakukan
terhadap
waktu
eksekusi
pembentukan dan jumlah kandidat FC dan FC
yang memenuhi minsup dengan waktu
eksekusi pembentukan dan jumlah kandidat
itemset dan large itemset yang memenuhi
minsup pada penelitian Widodo (2004).
Perbandingan juga dilakukan pada proses
pembentukan aturan asosiasi. Waktu eksekusi
pembentukan dan jumlah minimal nonredundant association rules yang memenuhi
mincof dengan waktu eksekusi pembentukan
dan jumlah aturan asosiasi yang memenuhi
mincof pada penelitian sebelumnya (Widodo
2004).
Percobaan terhadap kedua pendekatan ini
(association rules mining dan minimal nonredundant association rules mining) dilakukan
di lingkungan sistem dan data transaksi yang
sama. Nilai-nilai minsup dan mincof yang
akan dicobakan juga sama.
Pembentukan Frequent Closed Itemsets
Jumlah kandidat FC dan FC yang
memenuhi empat nilai minsup yang dicobakan
menggunakan Algoritma Close, disajikan pada
Tabel 2. Data generator, closed itemset
(closure) dan support dari closure dalam
pembentukan kandidat FC dan FC yang
8
memenuhi empat nilai minsup yang dicobakan
dapat dilihat pada Lampiran 3.
Tabel 2 Pembentukan frequent closed
itemsets (FC)
Parameter
5
35
13
78
2
-
Kandidat FC1
FC1
Kandidat FC2
FC2
Kandidat FC3
FC3
Kandidat FC4
FC4
Minsup (%)
2
1
35 35
19 24
171 276
11 37
5
93
5
-
0,5
35
30
435
87
407
34
22
-
Hasil pembentukan kandidat FC dan FC
dibandingkan dengan hasil pembentukan
kandidat
itemset
dan
large
itemset
menggunakan
algoritma
Apriori
dari
penelitian sebelumnya (Widodo 2004). Jumlah
kandidat itemset dan large itemset yang
memenuhi empat nilai minsup yang dicobakan
dapat dilihat pada Tabel 3.
Tabel 3 Pembentukan large itemset
Parameter
5
35
13
78
2
-
Kandidat 1-itemset
Large 1-itemset
Kandidat 2-itemset
Large 2-itemset
Kandidat 3-itemset
Large 3-itemset
Kandidat 4-itemset
Large 4-itemset
Minsup (%)
2
1
35 35
19 24
171 276
11 37
5
93
5
-
0,5
35
30
435
87
407
34
23
-
Grafik waktu eksekusi pembentukan
kandidat FC dan FC (algoritma Close), dan
pembentukan kandidat itemset dan large
itemset (algoritma Apriori) untuk empat nilai
minsup yang dicobakan, dapat dilihat pada
Gambar 4.
600
Waktu (detik)
500
400
300
200
100
0
5
2
1
0,5
Minsup (%)
Apriori
Close
Gambar 4 Grafik waktu eksekusi.
Berdasarkan data pada Tabel 2 dan Tabel 3
dapat dapat dinyatakan bahwa jumlah
kandidat FC dan kandidat itemset yang
terbentuk sama kecuali pada minsup 0,5 %.
Algoritma Close membentuk 22 kandidat FC4
sedangkan algoritma Apriori menghasilkan 23
kandidat 4-itemset.
Perbedaan hasil pada kandidat FC4,
disebabkan proses pemangkasan (pruning)
kedua pada generator dalam pembentukan
kandidat FC4. Generator {003, 008, 009, 025}
adalah subset dari atau sama dengan closed
itemset dari generator {003, 009, 025} dalam
FC3.
Jumlah FC dari kandidat FC dan jumlah
large itemset dari kandidat itemset yang
memenuhi keempat nilai minsup sama.
Algoritma Close menghasilkan FC yang
identik dengan hasil large itemset dari
algoritma Apriori.
Hasil algoritma Close berupa kandidat FC
dan FC identik dengan hasil algoritma Apriori
berupa kandidat itemset dan large itemset. Hal
ini disebabkan data transaksi yang ditambang
bersifat sparse (jarang) atau tidak padat. Data
transaksi yang digunakan dalam penelitian ini
bersifat
tidak
padat
karena
banyak
mengandung nilai null. Data transaksi yang
jarang mengakibatkan korelasi dalam data
lemah.
Data transaksi yang bersifat jarang dan
berkorelasi rendah mempengaruhi hasil dari
algoritma Close dimana hasil closed itemsets
dari generator adalah generator itu sendiri.
Oleh sebab itu, kedua proses pruning dalam
algoritma Close tidak bisa memperkecil iterasi
proses pembentukan set FC dan memperkecil
jumlah kandidat FC dan FC yang terbentuk.
Grafik pada Gambar 4 menunjukkan
waktu eksekusi algoritma Close lebih lama
dibandingkan waktu eksekusi algoritma
Apriori. Algoritma Close membutuhkan waktu
lebih untuk proses akses pada basis data
selama proses pembentukan kandidat FC dan
FC. Hal ini juga disebabkan waktu yang
digunakan dua proses pruning dalam
algoritma Close untuk memperkecil iterasi
pembentukan set FC menjadi tidak berguna.
Oleh sebab itu, waktu eksekusi algoritma
Close menjadi lebih lama.
Berdasarkan data pada Tabel 2 dan Tabel 3,
semakin tinggi nilai minsup, maka semakin
kecil jumlah FC dan large itemset yang
diperoleh dari masing-masing kandidat.
Berdasarkan grafik pada Gambar 3, semakin
kecil nilai minsup maka semakin lama waktu
eksekusi untuk algoritma Close dan Apriori.
9
Minsup (%)
2
1
0
0
0
1
0
2
0
3
0
5
1
8
1
8
3
10
5
19
14
44
19
77
0,5
1
2
4
10
15
25
26
39
73
128
226
Berdasarkan data hasil large itemset yang
memenuhi empat nilai minsup yang telah
dicobakan, dilakukan pembentukan aturan
asosiasi menggunakan aplikasi penelitian
sebelumnya (Widodo 2004). Jumlah aturan
asosiasi terhadap 11 nilai mincof yang
dicobakan dapat dilihat pada Tabel 5.
Tabel 5 Jumlah aturan asosiasi
Mincof
(%)
75
70
65
60
55
50
45
40
30
20
10
5
0
0
0
0
0
0
0
1
1
2
2
Minsup (%)
2
1
0
0
0
1
0
1
0
2
0
4
0
4
0
4
2
6
3
7
9
16
11
34
0,5
0
1
2
3
5
8
9
15
22
39
71
Pembentukan aturan asosiasi untuk empat
nilai minsup yang dicobakan dengan nilai
mincof > 78,67 % tidak lagi menghasilkan
aturan asosiasi.
Grafik waktu eksekusi pembentukan
minimal non-redundant association rules
Waktu (detik)
10
8
6
4
2
0
75 70 65 60 55 50 45 40 30 20 10
Mincof (%)
MNRAA
AA
(a)
50
Waktu (detik)
5
0
0
0
0
0
0
0
1
1
4
4
12
40
30
20
10
0
75 70 65 60 55 50 45 40 30 20 10
Mincof (%)
MNRAA
AA
(b)
200
Waktu (detik)
Mincof
(%)
75
70
65
60
55
50
45
40
30
20
10
(MNRAA) pada penelitian ini dan aturan
asosiasi (AA) pada penelitian Widodo (2004)
untuk empat nilai minsup dan 11 nilai mincof
yang dicobakan, dapat dilihat pada Gambar 5.
160
120
80
40
0
75 70 65 60 55 50 45 40 30 20 10
Mincof (%)
MNRAA
AA
(c)
1200
1000
Waktu (detik)
Pembentukan Minimal Non-Redundant
Association Rules
Minimal non-redundant association rules
dibentuk menggunakan data hasil generators
dan frequent closed itemsets yang memenuhi
empat nilai minsup yang telah dicobakan.
Jumlah minimal non-redundant association
rules terhadap 11 nilai mincof yang dicobakan
dapat dilihat pada Tabel 4. Jumlah minimal
non-redundant association rules untuk nilai
minsup dan mincof yang dicobakan terdapat
pada Lampiran 4.
Tabel 4 Jumlah minimal non-redundant
associaton rules
800
600
400
200
0
75 70 65 60 55 50 45 40 30 20 10
Mincof (%)
MNRAA
AA
(d)
Gambar 5 Waktu eksekusi pembentukan
MNRAA dan AA dari (a)
minsup 5 %, (b) minsup 2 %, (c)
minsup 1 %, dan (d) minsup
0,5 %
10
Berdasarkan data hasil pada Tabel 4 dan
Tabel 5, semakin kecil nilai minsup dan
mincof maka jumlah aturan asosiasi yang
dihasilkan semakin banyak. Untuk setiap nilai
minsup dan mincof yang dicobakan, jumlah
minimal non-redundant association rules yang
dihasilkan lebih banyak dari jumlah aturan
asosiasi.
Pada nilai minsup 2 % dengan nilai mincof
50 % dan 45 %, aturan asosiasi tidak
menghasilkan aturan sedangkan minimal nonredundant
association
rules
telah
menghasilkan aturan asosiasi, yaitu aturan 026
→ 013 (pasta gigi → sabun) dengan support
2,67 % dan confidence 53,64 %. Hal ini
berarti 2,67 % dari konsumen akan membeli
pasta gigi dan sabun bersamaan dan 53,64 %
dari konsumen yang membeli pasta gigi akan
selalu diikuti dengan pembelian sabun.
Untuk nilai minsup 0,5 % dan mincof
75 % aturan asosiasi tidak menghasilkan
aturan sedangkan minimal non-redundant
association rules dapat menghasilkan aturan,
yaitu aturan 003, 009 → 008 (susu, pelengkap
roti → snack) dengan support 0,7 % dan
confidence 78,67 %. Hal ini berarti 0,7 % dari
konsumen akan membeli susu, pelengkap roti
dan snack bersamaan dan 78,67 % dari
konsumen yang membeli susu dan pelengkap
roti akan selalu diikuti dengan pembelian
snack.
Data minimal non-redundant association
rules dengan nilai confidence terbesar dari
empat nilai minsup yang telah dicobakan dapat
dilihat pada Tabel 6. Data minimal nonredundant association rules yang memiliki
korelasi positif dan korelasi negatif terdapat
pada Lampiran 5 dan 6.
Tabel 6 Minimal non-redundant association
rules dengan nilai confidence terbesar
Minsup
Aturan
Support Confidence
(%)
Asosiasi
(%)
(%)
5
susu → snack
6,54
44,64
2
pasta gigi →
2,67
53,64
sabun
1
susu, permen → 1,21
70,44
snack
0,5 susu, pelengkap
0,7
78,67
roti → snack
Data aturan asosiasi dengan nilai
confidence terbesar dari empat nilai minsup
yang telah dicobakan pada penelitian
sebelumnya (Widodo 2004) dapat dilihat pada
Tabel 7.
Tabel
7
Aturan asosiasi dengan
confidence terbesar
Minsup
Aturan
(%)
Asosiasi
5
susu → snack
2
susu → snack
1
susu, permen
→ snack
0,5 susu, permen
→ snack
nilai
Support Confidence
(%)
(%)
6,54
44,64
6,54
44,64
1,21
70,44
1,21
70,44
Berdasarkan data hasil pada Tabel 6 dan
Tabel 7, mining minimal non-redundant
association rules
menghasilkan aturan
asosiasi dengan nilai confidence tertinggi yang
berbeda-beda untuk empat nilai minsup yang
dicobakan. association rules mining pada
penelitian Widodo (2004) menghasilkan
aturan asosiasi dengan confidence tertinggi
yang sama untuk minsup 5% dan 2 %, begitu
juga untuk minsup 1 % dan 0,5 %
Minimal non-redundant association rules
menghasilkan aturan asosasi yang lebih
banyak mengandung informasi dibandingkan
aturan asosiasi yang dihasilkan pada
penelitian sebelumnya (Widodo 2004). Jika
penelitian Widodo (2004) menghasilkan
aturan asosiasi (013 → 026) untuk minsup
1 % dan mincof 10 %,
maka selain
menghasilkan aturan asosasi yang sama,
minimal non-redundant association rules juga
menghasilkan aturan asosasi (026 → 013)
dengan informasi nilai support yang sama,
yaitu 2,67 % tetapi nilai confidence yang
berbeda. Nilai confidence aturan asosiasi (013
→ 026) adalah 26,7 % sedangkan aturan
asosiasi (026 → 013) adalah 53,64 %.
Selain membentuk aturan asosiasi yang
berbeda, waktu eksekusi pembentukan aturan
asosiasi juga memiliki perbedaan yang cukup
signifikan. Berdasarkan grafik waktu eksekusi
pembentukan
minimal
non-redundant
association rules dan aturan asosiasi dari
penelitian sebelumnya (Widodo 2004) untuk
empat nilai minsup yang ditunjukkan pada
Gambar 5, semakin kecil nilai minsup, maka
waktu eksekusi untuk pembentukan minimal
non-redundant association rules dan aturan
asosiasi semakin lama.
Rataan
perbedaan
waktu
eksekusi
pembentukan aturan asosiasi untuk masingmasing nilai minsup berbeda-beda. Untuk
minsup 5 %, rataan perbedaan waktu eksekusi
adalah 9 detik, minsup 2 % adalah 40,45 detik,
minsup 1% adalah 192 detik (sekitar 3,5
menit), dan minsup 0,5 % adalah 1035 detik
(sekitar 17,25 menit).
11
Waktu (detik)
600
500
400
300
200
100
0
5
2
1
Minsup (%)
0,5
MNRAA
Close
Gambar 6 Total waktu eksekusi minimal
non-redundant association
rules mining.
Grafik total waktu eksekusi association
rules mining, meliputi waktu pembentukan
large itemsets (algoritma Apriori) dan waktu
rata-rata pembentukan aturan asosiasi (AA)
pada penelitian Widodo (2004) dapat dilihat
pada Gambar 7.
1200
Waktu (detik)
Hasil Perbandingan Mining Minimal NonRedundant Association Rules dengan
Mining Association Rules pada Penelitian
Widodo (2004)
Algoritma Apriori yang digunakan pada
penelitian Widodo (2004), membentuk large
itemset dengan membangkitkan itemset lattice
yang ada dalam basis data. Secara umum
proses
pembangkitan
itemset
lattice
memerlukan waktu penelusuran basis data dan
penggunaan sumberdaya komputasi yang
besar.
Algoritma Close menggunakan closed
itemset lattice yang merupakan sub-order dari
itemset lattice untuk membentuk generators
dan frequent closed itemsets. Penggunaan
closed itemset lattice bisa mengurangi waktu
penelusuran basis data dan penggunaan
sumberdaya komputasi yang besar.
Generators dan frequent closed itemsets
yang dihasilkan algoritma Close sangat
mempengaruhi pembentukan minimal nonredundant association rules. Proses pruning
kedua dalam algoritma Close bertujuan
menghilangkan frequent closed itemsets yang
berulang, sehingga tidak terjadi pembentukan
aturan asosiasi yang berulang dalam minimal
non-redundant association rules.
Grafik total waktu eksekusi minimal nonredundant association rules mining, meliputi
waktu pembentukan frequent closed itemsets
(algoritma Close) dan waktu rata-rata
pembentukan
minimal
non-redundant
association rules (MNRAA) pada penelitian
ini dapat dilihat pada Gambar 6.
1000
800
600
400
200
0
5
2
1
Minsup (%)
Gambar
7
0,5
AA
Apriori
Total waktu eksekusi
association rules mining.
Grafik pada Gambar 6 dan Gambar 7
menunjukkan pada minsup 5 % dan 2 %,
minimal non-redundant association rules
mining membutuhkan waktu eksekusi lebih
lama. Minimal non-redundant association
rules mining membutuhkan waktu lebih lama
untuk eksekusi algoritma Close, sedangkan
association rules mining membutuhkan waktu
lebih lama untuk pembentukan aturan asosiasi.
Pada minsup 1 % dan 0,5 %, association
rules mining membutuhkan waktu eksekusi
lebih lama. Association rules mining
membutuhkan waktu lebih lama untuk
pembentukan aturan asosiasi, sedangkan
minimal non-redundant association rules
mining membutuhkan waktu lebih lama untuk
eksekusi algoritma Close.
Penelitian ini menggunakan data
transaksi yang bersifat tidak padat sehingga
memiliki korelasi yang lemah dalam data. Hal
ini membuat algoritma Close tidak
memperlihatkan
keunggulannya
dalam
efisiensi waktu dan penggunaan sumberdaya
komputasi.
Pembentukan minimal non-redundant
association rules membutuhkan waktu
eksekusi lebih sedikit. Pembentukan aturan
asosiasi yang menggunakan aplikasi penelitian
Widodo (2004) membutuhkan waktu eksekusi
yang lebih lama. Hal ini disebabkan
pembentukan aturan asosiasi dilakukan
dengan mengkombinasikan semua item yang
ada
dalam
large
itemset,
sehingga
membutuhkan waktu eksekusi yang lebih lama
dan sumberdaya komputasi yang besar.
Berdasarkan
data
transaksi
yang
digunakan, jumlah aturan asosiasi yang
dihasilkan oleh aplikasi penelitian Widodo
(2004) lebih kecil dibandingkan jumlah
minimal non-redundant association rules.
Aturan asosiasi yang berulang tidak terbentuk
karena dipengaruhi sifat data yang digunakan
pada penelitian ini, sehingga keunggulan
12
mining minimal non-redundant association
rules tidak terlihat.
Meskipun begitu, mining minimal nonredundant
association
rules
mampu
menghasilkan
aturan
asosiasi
yang
mengandung informasi lebih banyak yang
tidak dihasilkan oleh aplikasi penelitian
sebelumnya (Widodo 2004). Terbentuknya
aturan asosasi tersebut merupakan keunggulan
lain yang dimiliki mining minimal nonredundant association rules.
Berdasarkan hasil perbandingan, mining
minimal non-redundant association rules
memiliki keunggulan dibandingkan mining
association rules pada penelitian sebelumnya
(Widodo 2004). Keunggulan dalam waktu
eksekusi, penggunaan sumberdaya komputasi
dan hasil aturan asosiasi yang dihasilkan.
Pada penelitian ini, keunggulan mining
non-redundant association rules hanya terlihat
pada proses pembentukan minimal nonredundant association rules saja. Algoritma
Close tidak memperlihatkan keunggulannya
karena sifat data transaksi yang tidak padat
dan berkorelasi lemah.
menghasilkan aturan asosiasi yang tidak
berulang dengan anteseden yang minimal
dan konsekuen yang maksimal,
2 menghasilkan aturan asosasi yang lebih
banyak mengandung informasi dari basis
data. Jika dihasilkan aturan asosiasi 001
→ 003 (mie instant → susu) maka akan
dihasilkan juga aturan asosasi 003 → 001
(susu → mie instant) dengan informasi
nilai support yang sama tetapi nilai
confidence yang berbeda,
3 efisiensi terhadap waktu eksekusi dan
penggunaan sumberdaya komputasi.
Waktu eksekusi pembentukan aturan
asosiasi tercepat adalah 2 detik yang
terjadi pada nilai minsup terbesar, yaitu
5 % sedangkan waktu eksekusi paling
lama sekitar 43 detik terjadi pada nilai
minsup terkecil, yaitu 0,5 %.
Data transaksi dalam penelitian ini
memiliki sifat data yang tidak padat dan
berkorelasi rendah, sehingga algoritma Close
membutuhkan waktu eksekusi lebih lama.
Semakin kecil nilai minsup, maka semakin
lama waktu yang dibutuhkan untuk
membentuk generators dan frequent closed
itemsets.
KESIMPULAN DAN SARAN
Saran
Aplikasi mining minimal non-redundant
association rules yang telah dihasilkan dapat
dicobakan dengan menggunakan data yang
bersifat padat dan memiliki korelasi tinggi,
sehingga mining minimal non-redundant
association rules dapat memperlihatkan
keunggulannya.
Aplikasi mining minimal non-redundant
association rules yang telah dihasilkan, dapat
dikembangkan
dengan
menggunakan
algoritma lain untuk membentuk generators
dan frequent closed itemsets yang lebih sedikit
pada data yang bersifat jarang.
Kesimpulan
Penelitian ini menerapkan teknik minimal
non-redundant association rules mining
menggunakan generators dan frequent closed
itemsets untuk membentuk aturan asosisi yang
tidak berulang. Algoritma Close menggunakan
teknik pruning terhadap closed itemset lattice,
untuk membentuk generators dan frequent
closed itemsets.
Minimal non-redundant association rules
mining menghasilkan aturan asosiasi yang
mengandung
informasi
lebih
banyak
dibandingkan dengan mining association rules.
Pada penelitian ini, mining minimal nonredundant
association
rules
mampu
menghasilkan aturan asosiasi 003, 009 → 008
(susu, pelengkap roti → snack) dengan nilai
support 0,7 % dan confidence 78,67 % untuk
nilai minsup 0,5 % dan mincof 75 %
sedangkan mining association rules tidak
menghasilkan aturan tersebut.
Berdasarkan hasil penelitian, dapat
dinyatakan
keunggulan
minimal
nonredundant association rules mining sebagai
berikut:
1
DAFTAR PUSTAKA
Bastide Y, Pasquier N, Taouil
Lakhal L. 2000. Mining
Redundant Association
Frequent Closed Itemsets.
Pascal University.
R, Stumme G,
Minimal NonRules using
France: Blaise
Godin R, Missaoui R, Alaoui H. 1995.
Incremental
Concept
Formation
Algorithms based on Galois (Concept)
Lattices. Computational Intelligence: 246267.
Download