algoritma apriori modifikasi dengan teknik combination reduction

advertisement
TESIS
ALGORITMA APRIORI MODIFIKASI DENGAN
TEKNIK COMBINATION REDUCTION DAN
ITERATION LIMITATION PADA KERANJANG
BELANJA
ADIE WAHYUDI OKTAVIA GAMA
NIM 1291761013
PROGRAM MAGISTER
PROGRAM STUDI MAGISTER TEKNIK ELEKTRO
PROGRAM PASCASARJANA
UNIVERSITAS UDAYANA
DENPASAR
2016
TESIS
ALGORITMA APRIORI MODIFIKASI DENGAN
TEKNIK COMBINATION REDUCTION DAN
ITERATION LIMITATION PADA KERANJANG
BELANJA
Tesis untuk Memperoleh Gelar Magister
pada Program Magister, Program Studi Teknik Elektro,
Program Pascasarjana Universitas Udayana
ADIE WAHYUDI OKTAVIA GAMA
NIM 1291761013
PROGRAM MAGISTER
PROGRAM STUDI MAGISTER TEKNIK ELEKTRO
PROGRAM PASCASARJANA
UNIVERSITAS UDAYANA
DENPASAR
2016
ii
Lembar Pengesahan
TESIS INI TELAH DISETUJUI
TANGGAL 22 APRIL 2016
Pembimbing I,
Pembimbing II,
Prof. Dr. IKG Darma Putra, S.Kom., MT.
NIP. 197404241999031003
Dr. Eng. I Putu Agung Bayupati, S.T., M.T.
NIP. 197504232003121002
Mengetahui
Ketua Program Magister
Program Studi Teknik Elektro
Program Pascasarjana
Universitas Udayana
Direktur
Program Pascasarjana
Universitas Udayana
Prof. Ir. Ida Ayu Giriantari, M.EngSc., Ph.D
NIP. 196512131991032001
Prof. Dr. dr. A.A. Raka Sudewi, Sp.S (K)
NIP. 195902151985102001
iii
Tesis Ini Telah Diuji dan Dinilai Oleh Panitia Penguji
pada Program Pascasarjana Universitas Udayana
pada Tanggal 22 April 2016
Berdasarkan SK Rektor Universitas Udayana
No.
: 1860/UN.14.4/HK/2016
Tanggal
: 21 April 2016
Panitia Penguji Tesis adalah
Ketua
: Prof. Dr. I Ketut Gede Darma Putra, S.Kom., M.T.
Anggota
:
1.
Dr. Eng. I Putu Agung Bayupati, S.T., M.T.
2.
Dr. Ir. Made Sudarma, M.A.Sc.
3.
Ir. Linawati, M.Eng.Sc., Ph.D.
4.
Ni Made Ary Esta Dewi Wirastuti, S.T., M.Sc., Ph.D.
iv
SURAT PERNYATAAN BEBAS PLAGIAT
Saya yang bertandatangan di bawah ini :
Nama
: Adie Wahyudi Oktavia Gama
NIM
: 1291761013
Program Studi
: Magister Teknik Elektro
Judul Tesis
: Algoritma
Apriori
Modifikasi
Dengan
Teknik
Combination Reduction Dan Iteration Limitation Pada
Keranjang Belanja
Dengan ini menyatakan bahwa karya ilmiah Tesis ini bebas plagiat.
Apabila dikemudian hari terbukti plagiat dalam karya ilmiah ini, maka saya
bersedia menerima sanksi sesuai peraturan Mendiknas RI No. 17 Tahun 2010 dan
Peraturan Perundang-undangan yang berlaku.
Denpasar, 22 April 2016
Yang membuat pernyataan
Adie Wahyudi Oktavia Gama
v
KATA PENGANTAR
Puji dan syukur kehadirat Ida Sang Hyang Widhi Wasa, oleh karena berkat
Asung Kertha Wara NugrahaNya Penulis dapat menyelesaikan Tesis ini dengan
judul “Algoritma Apriori Modifikasi dengan Teknik Combination Reduction dan
Iteration Limitation pada Keranjang Belanja”.
Penulis menyadari, bahwa tanpa berbekal ilmu pengetahuan, dorongan dan
motivasi serta bantuan dari berbagai pihak, Tesis ini tidak akan terselesaikan
dengan baik dan tepat pada waktunya. Oleh karena itu, disertai dengan
kerendahan hati dan rasa hormat, Penulis mengucapkan terimakasih dan
penghargaan yang setinggi-tingginya kepada :
Rektor Universitas Udayana, Prof. Dr. dr. Ketut Suastika, Sp.PD. KEMD
yang telah memberikan waktu dan fasilitas yang baik dalam mengikuti dan
menyelesaikan pendidikan pada Program Studi Magister Teknik Elektro.
Direktur Pascasarjana Universitas Udayana, Prof. Dr. dr. A.A. Raka Sudewi,
Sp.S (K) serta Ketua Program Studi Teknik Elektro, Prof. Ir. Ida Ayu Giriantari,
M.EngSc., Ph.D yang juga telah memberikan ruang dan waktu kepada penulis selama
mengikuti perkuliahan.
Pembimbing I, Prof. Dr. IKG Darma Putra, S.Kom., M.T. serta
Pembimbing II, Dr.Eng. I Putu Agung Bayupati, S.T., M.T. yang dengan sepenuh
hati membimbing dan selalu mengarahkan penulis sehingga tesis ini dapat
terselesaikan dengan baik.
Bapak dan Ibu dewan penguji proposal dan tesis yang membuat karya ini
menjadi lebih sempurna serta seluruh Dosen Pengajar yang memberikan
tambahan ilmu pengetahuan dan wawasan penulis.
vi
Kedua Orang Tua yang telah mengasuh dan membesarkan penulis dan
memberikan falsafah hidup hingga menjadi seperti sekarang ini, kakak tercinta,
seluruh keluarga dan yang terkasih yang tidak henti-hentinya memberi dukungan
penuh demi terselesaikannya tesis ini dengan baik.
Teman-teman dan rekan-rekan seangkatan penulis yang bersama-sama
menempuh perkuliahan yang selalu saling membantu dan penuh motivasi.
Semua pihak yang telah membantu hingga Tesis ini dapat selesai, terutama
kepada pemilik minimarket Toko Tujuh
Belas, Sesetan-Denpasar atas
kesediaannya memberikan data untuk ujicoba program.
Penulis menyadari, bahwa Tesis ini masih jauh dari kesempurnaan oleh
karena keterbatasan serta kemampuan yang Penulis miliki, Penulis mengharapkan
kritik serta saran yang membangun dari berbagai pihak demi kesempurnaan Tesis
ini.
Denpasar, 22 April 2016
Penulis,
Adie Wahyudi Oktavia Gama
vii
ABSTRAK
Analisis asosiasi digunakan untuk menemukan hubungan menarik antara
suatu kombinasi item yang tersembunyi dalam transaksi. Hubungan ini
direpresentasikan dalam bentuk aturan asosiasi. Aturan asosiasi berbentuk if
antecedent then consequent. Algoritma apriori merupakan salah satu metode
asosiasi yang menggunakan pendekatan iteratif dimana k-itemset digunakan untuk
mengeksplorasi (k+1)-itemset. Calon (k+1)-itemset yang mengandung frekuensi
subset yang jarang muncul tidak dipakai dalam menentukan aturan asosiasi.
Implementasi algoritma apriori didahului dengan persiapan database transaksi
serta penentuan batas minimum support dan confidence. Algoritma apriori akan
menemukan kombinasi dengan cara proses iterasi yaitu scaning database yang
berulang-ulang, memasangkan satu item dengan item lainnya dan mencatat jumlah
kemunculan kombinasi dalam keseluruhan transaksi. Frequent itemset ditentukan
dengan cara memilih kombinasi atau itemset yang nilai kemuculannya diatas atau
sama dengan nilai minimum support dan kemudian menjadi calon aturan asosiasi.
Persentase nilai support dan confidence dari masing-masing calon aturan asosiasi
kemudian dihitung. Aturan asosiasi yang berlaku dipilih dari yang memenuhi
syarat minimum support dan confidence. Aturan asosiasi yang dibentuk dari
frequent itemset tersebut kemudian dapat dipakai sebagai pendukung keputusan
dalam penjualan seperti mengatur penempatan barang, mengatur persediaan atau
membuat promosi pemasaran dengan menerapkan diskon untuk kombinasi
barang-barang tertentu yang sering muncul dalam transaksi.
Apriori akan melambat terhadap database yang bertambah besar dalam
menentukan aturan asosiasi. Teknik-teknik modifikasi digunakan untuk
melakukan optimasi terhadap kinerja algoritma apriori sehingga mendapatkan
frequent itemset dalam waktu yang singkat. Modifikasi pada penelitian ini
menggunakan penggabungan teknik combination reduction dan iteration
limitation. Hasil perbandingan algoritma apriori tanpa modifikasi dengan yang
sudah dimodifikasi diujicoba dengan sample data dari 100 transaksi sampai
dengan 500 transaksi terbukti lebih cepat mendapatkan frequent itemset dan
kualitas aturan asosiasi yang dibentuk tetap terjaga.
Kata kunci: Data Mining, Analisis Asosiasi, Algoritma Apriori, Frequent
Itemset, Modifikasi Apriori, Combination Reduction, Iteration Limitation.
viii
ABSTRACT
Association analysis is used to find interesting relationship between
hidden combination of items in the transaction. This relationship is represented in
the form of association rules. Association rules is formed by “if antecedent then
consequent”. Apriori algorithm is one of association method that uses an iterative
approach where k-itemset used to explore (k+1)-itemset. Candidates of (k+1)itemset containing frequency subset that rarely appear is not used in determining
association rules. Apriori algorithm implementation was preceded by the
preparation of database transactions and determination of minimum support and
confidence. Implementation of the apriori algorithm was preceded by the
preparation of transactions database and determination of minimum support and
confidence. Apriori algorithm scanned the database repeatedly, pair one item to
another and record the number of occurrences in the overall transaction. Frequent
itemset is determined by selecting a combination or itemset that the count value
greater than or equal to the minimum support and then calculated the percentage
value of support and confidence of each candidate. The association rules selected
from which qualified the minimum support and confidence. Association rules
formed from the frequent itemset then can be used as decision support in sales as
it regulates the placement of goods, organize supplies or create marketing
promotions by applying discounts to the combination of certain items that often
appear in the transaction.
Apriori performance to find association rule will become slower when
used to analyze database that grows continuously in size. Modification techniques
is then use to perform the optimization of the apriori algorithm performance to
find frequent itemset more effectively. Modifications techniques used in this study
is using the combination technique that use both combination reduction and
iteration limitation. The comparison of the apriori algorithm without modification
and with the modified algorithm with sample data from 100 transactions to 500
transactions proved to be faster for getting frequent itemset and the association
rules quality is still maintained.
Keyword : Data Mining, Asosiasi Analysis, Apriori Algorithm, Frequent Itemset,
Apriori Modified, Combination Reduction, Iteration Limitation.
ix
DAFTAR ISI
SAMPUL DEPAN .............................................................................................
SAMPUL DALAM ............................................................................................
LEMBAR PENGESAHAN ................................................................................
PENETAPAN PENGUJI ....................................................................................
SURAT PERNYATAAN BEBAS PLAGIAT....................................................
KATA PENGANTAR ........................................................................................
ABSTRAK ..........................................................................................................
ABSTRACT........................................................................................................
DAFTAR ISI ......................................................................................................
DAFTAR TABEL ..............................................................................................
DAFTAR GAMBAR ..........................................................................................
DAFTAR ISTILAH ............................................................................................
i
ii
iii
iv
v
vi
viii
ix
x
xii
xiii
xiv
BAB I PENDAHULUAN..................................................................................
1.1 Latar Belakang .......................................................................................
1.2 Rumusan Masalah ..................................................................................
1.3 Tujuan Penelitian ...................................................................................
1.4 Manfaat Penelitian .................................................................................
1.5 Ruang Lingkup Penelitian ......................................................................
1.6 Keaslian Penelitian .................................................................................
BAB II TINJAUAN PUSTAKA ......................................................................
2.1 State of The Art ......................................................................................
2.2 Pengertian Data Mining .........................................................................
2.3 Tahapan Data Mining..............................................................................
2.4 Tugas Utama Data Mining......................................................................
2.4.1 Deskripsi......................................................................................
2.4.2 Prediksi ........................................................................................
2.4.3 Etimasi.........................................................................................
2.4.4 Klasifikasi....................................................................................
2.4.5 Clustering ....................................................................................
2.4.6 Asosiasi........................................................................................
2.5 Aplikasi Data Mining .............................................................................
2.5.1 Penerapan Data Mining pada CRM ............................................
2.5.2 Data Mining dalam Kerangka CRM ...........................................
2.6 Metode Asosiasi ......................................................................................
2.7 Algoritma Apriori....................................................................................
2.7.1 Struktur Kombinasi .....................................................................
2.7.2 Perhitungan Waktu Iterasi...........................................................
BAB III METODOLOGI DAN PERANCANGAN .......................................
3.1 Sumber Data............................................................................................
1
1
6
6
7
8
9
12
12
15
17
20
20
21
21
22
23
24
25
26
27
31
34
35
37
38
38
x
3.2 Tempat dan Waktu Penelitian .................................................................
3.3 Rancangan Penelitian ..............................................................................
3.3.1 Gambaran Umum Sistem ............................................................
3.3.1.1 Database Transaksi............................................................
3.3.1.2 Algoritma Apriori ..............................................................
3.3.1.3 Penerapan Algoritma Apriori pada Transaki Penjualan ....
3.3.1.4 Aturan Asosiasi ..................................................................
3.3.1.5 Modifikasi Algoritma Apriori............................................
3.3.2 Rancangan Database ...................................................................
3.3.3 Relasional Database....................................................................
3.4 Sistematika Pengujian Kinerja Algoritma Apriori..................................
3.5 Instrumen Penelitian ...............................................................................
BAB IV HASIL DAN PEMBAHASAN ..........................................................
4.1 Identifikasi Awal .....................................................................................
4.1.1 Menentukan Batas Minimum Support dan Minimum Confidence
4.1.2 Database Sampel Transaksi ........................................................
4.2 Pembentukan Kombinasi Calon (K+1) Itemset.......................................
4.3 Menentukan Frequent (K+1) Itemset ......................................................
4.4 Pembentukan Aturan Asosiasi ................................................................
4.4.1 Analisa Pola Frekuensi Tinggi ....................................................
4.4.2 Menentukan Aturan Asosiasi ......................................................
4.5 Modifikasi Apriori...................................................................................
4.5.1 Combination Reduction ...............................................................
4.5.1.1 Menentukan Item-Item yang digunakan Membangkitkan
Kombinasi (1-itemset)........................................................
4.5.1.2 Membangkitkan Kombinasi Itemset berdasarkan Frequent
Itemset Sebelumnya ...........................................................
4.5.2 Iteration Limitation .....................................................................
4.6 Hasil Perbandingan Algoritma Apriori dengan Apriori Modifikasi .......
4.6.1 Pengukuran dari Segi Waktu .......................................................
4.6.2 Pengukuran dari Segi Kualitas Aturan Asosiasi..........................
4.6.2.1 Kualitas Aturan dengan Sampel 100 Transaksi .................
4.6.2.2 Kualitas Aturan dengan Sampel 200 Transaksi .................
4.6.2.3 Kualitas Aturan dengan Sampel 300 Transaksi .................
4.6.2.4 Kualitas Aturan dengan Sampel 400 Transaksi .................
4.6.2.5 Kualitas Aturan dengan Sampel 500 Transaksi .................
BAB V PENUTUP.............................................................................................
5.1 Simpulan ......................................................................................................
5.2 Saran .............................................................................................................
DAFTAR PUSTAKA
xi
38
39
39
41
42
45
51
51
55
59
59
60
62
62
62
64
65
70
71
72
72
75
75
76
78
81
82
83
86
86
87
88
89
90
92
92
93
DAFTAR TABEL
Tabel 2.1
Tabel 3.1
Tabel 3.2
Tabel 3.3
Tabel 3.4
Tabel 3.5
Tabel 3.6
Tabel 3.7
Tabel 3.8
Tabel 3.9
Tabel 3.10
Tabel 3.11
Tabel 3.12
Tabel 3.13
Tabel 3.14
Tabel 3.15
Tabel 3.16
Tabel 4.1
Tabel 4.2
Penelitian yang Sudah Dilakukan Sebelumnya................................
Data Transaksi Penjualan .................................................................
Penjabaran Transaksi dalam Bentuk 1-Itemset ................................
Calon Kandidat 2-Itemset yang Mungkin ........................................
Calon Kandidat 3-Itemset yang Mungkin ........................................
Calon Aturan Asosiasi dari F2 .........................................................
Calon Aturan Asosiasi dari F3 .........................................................
Aturan Asosiasi Final .......................................................................
Item yang Memenuhi Minimum Support..........................................
Calon Kandidat 3-Itemset yang Mungkin ........................................
Data Transaksi dengan Set Size untuk Pembatasan Transaksi .........
Struktur Database Master Data Barang ...........................................
Contoh Data Master Data Barang ....................................................
Struktur Database Transaksi Penjualan ...........................................
Contoh Data Transaksi Penjualan ....................................................
Struktur Database Detail Transaksi Penjualan ................................
Contoh Data Detail Transaksi Penjualan .........................................
Calon Aturan Asosiasi dari F2 .........................................................
Perbandingan Waktu Algoritma Apriori dengan Beberapa Sampel
Transaksi ..........................................................................................
xii
14
45
46
47
48
49
50
50
52
53
55
56
56
57
57
58
58
71
84
DAFTAR GAMBAR
Gambar 1.1
Gambar 2.1
Gambar 3.1
Gambar 3.2
Gambar 3.3
Gambar 4.1
Gambar 4.2
Gambar 4.3
Gambar 4.4
Gambar 4.5
Gambar 4.6
Gambar 4.7
Gambar 4.8
Gambar 4.9
Gambar 4.10
Gambar 4.11
Gambar 4.12
Gambar 4.13
Gambar 4.14
Gambar 4.15
Gambar 4.16
Gambar 4.17
Gambar 4.18
Fish Bone Menemukan Frequent Itemset Menggunakan Algoritma
Apriori ......................................................................................... 10
Tahapan Data Mining.................................................................. 18
Gambaran Umum Menemukan Frequent Itemset Menggunakan
Algoritma Apriori........................................................................ 40
Flowchart Algoritma Apriori ...................................................... 43
Relasional Database yang Dirancang untuk Data Mining
Menggunakan Algoritma Apriori ................................................ 59
Tampilan Menentukan Nilai Minimum Support dan Minimum
Confidence................................................................................... 63
Calon Kombinasi dengan 2-Itemset............................................. 67
Calon Kombinasi dengan 3-Itemset............................................. 68
Itemset dengan Nilai Kemunculan di Atas atau Sama dengan
Minimum Support ........................................................................ 70
Pembentukan Aturan Asosiasi..................................................... 74
Seleksi Item-Item yang Memenuhi Minimal Support.................. 77
Frequent Itemset dari 2-Itemset untuk Membangkitkan Itemset
Selanjutnya .................................................................................. 78
Hasil dari Penerapan Combination Reduction pada Calon 3Itemset.......................................................................................... 80
Jumlah Transaksi yang Sering Muncul Sebagai Pembatas
Transaksi...................................................................................... 82
Grafik Perbandingan Waktu Algoritma Apriori ......................... 85
Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba
Sampel 100 Transaksi.................................................................. 86
Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba
Sampel 100 Transaksi.................................................................. 87
Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba
Sampel 200 Transaksi.................................................................. 87
Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba
Sampel 200 Transaksi.................................................................. 87
Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba
Sampel 300 Transaksi.................................................................. 88
Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba
Sampel 300 Transaksi.................................................................. 88
Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba
Sampel 400 Transaksi.................................................................. 90
Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba
Sampel 500 Transaksi.................................................................. 91
xiii
DAFTAR ISTILAH
Confidence
: Hubungan keterkaitan antar satu barang
dengan barang lainnya dalam suatu
transaksi.
Combination Reduction
: Pengurangan jumlah kombinasi yang
dibangkitkan berdasarkan frequent itemset
dan item yang memenuhi minimum
support.
Customer Relationship Management : Strategi bisnis yang berbasis hubungan
baik terhadap pelanggan yang bertujuan
memaksimalkan daya beli pelanggan.
Data Mining
: Proses menemukan pengetahuan baru
dalam sejumlah data yang besar.
Frequent Itemset
: Kombinasi barang-barang yang sering
muncul pada setiap transaksi.
Modifikasi Algoritma
: Melakukan perubahan baik seluruh atau
sebagian dari algoritma yang tidak
menyimpang dari konsep dasar algoritma
tersebut dengan harapan memperoleh hasil
yang lebih baik.
Itemset
: Kombinasi barang-barang dalam suatu
transaksi.
Iterasi
: Proses yang digunakan secara berulangulang untuk menyelesaikan masalah
tertentu.
Iteration Limitation
: Pembatasan iterasi sampai dengan nilai
batas yang ditentukan.
Mapping
: Menempatkan atau memetakan data dari
data sumber ke suatu data target yang
ditentukan.
Market Basket Analysis
: Analisa keranjang belanja pelanggan
tetang kebiasaan barang-barang yang
dibeli.
Missing Value
: Nilai atau data yang hilang akibat
kesalahan proses.
Scanning Database
: Melakukan analisa terhadap suatu
simpanan data atau membaca simpanan
data.
Support
: Jumlah
kemunculan
barang
atau
kombinasi
barang
pada
sejumlah
transaksi.
xiv
Transaction Reduction
: Pengurangan jumlah transaksi dengan
melakukan
pemangkasan
terhadap
transaksi yang jumlah kombinasi item /
barangnya kurang dari dengan nilai yang
ditentukan.
xv
Download