analisis keterkaitan data transaksi penjualan buku menggunakan

advertisement
ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU
MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID
LINKAGE HIERARCHICAL METHOD (CLHM)
ANALYSIS RELATIONSHIP TRANSACTION DATA OF BOOKSELLING
USING APRIORI ALGORITHM AND CENTROID LINKAGE
HIERARCHICAL METHOD (CLHM) ALGORITHM
Nurani, Andani Achmad, Amil Ahmad Ilham
Program Studi Teknik Elektro, Konsentrasi Teknik Informatika,
Fakultas Teknik, Universitas Hasanuddin Makassar
Alamat Korespondensi :
Nurani
Program Studi Teknik Elektro
Konsentrasi Teknik Informatika
Fakultas Teknik
Universitas Hasanuddin Makassar
HP: 081343646568
Email: [email protected]
Abstrak
Saat ini penempatan barang pada etalase barang di toko buku tidak sesuai dengan perilaku belanja konsumen
disebabkan karena manajemen produk, dalam hal ini pengaturan penempatan letak produk yang tidak sesuai
dengan perilaku belanja, sehingga perputaran barang tidak terjadi secara maksimal. Penelitian ini bertujuan untuk
mencari keterkaitan atau hubungan antara item-item yang berbeda dalam suatu set data dengan menggunakan
teknik data mining, dalam hal ini keterkaitan antara satu buku dengan buku lain pada sebuah toko buku, dimana
tujuan akhir penelitian ini adalah sebagai sistem yang mampu memberikan informasi tentang solusi-solusi
pendukung pengambilan keputusan dan kebijakan di dalam sebuah toko buku. Metode algoritma yang digunakan
pada penelitian ini adalah algoritma Apriori yang berfungsi untuk mendapatkan pola-pola item yang saling
berkaitan kemudian algoritma CLHM untuk klasterisasi data agar data yang digunakan tidak memiliki variasi data
yang tinggi. Hasil dari penelitian ini adalah informasi berupa pola yang dihasilkan menggunakan algoritma
kombinasi algoritma CLHM dan Apriori yaitu jika konsumen membeli buku pendidikan dasar dan pelajaran maka
ia membeli buku teknologi dengan nilai confidence 0.75 itu artinya nilai confidence yang dihasilkan lebih besar
dibandingkan nilai confidence yang ditetapkan yaitu sebesar ≥ 0.75. Dari hasil tersebut dapat disimpulkan bahwa
kombinasi algoritma CLHM dan Apriori menghasilkan keterkaitan yang lebih tinggi.
Kata kunci : Data Mining, CLHM, Apriori.
Abstract
Current placement of goods on the goods in the storefront bookstore does not comply with consumer shopping
behavior due to product management in terms of setting the location of product placement that does not comply
with the spending behavior, so that the velocity of the goods does not occur to the fullest. This study aimed to
explore the linkages or relationships between different items in a set of data by using data mining techniques, in
this case the relationship between the book with another book in a bookstore, where the ultimate goal of this
research is a system that is capable of providing information about solutions and policy decision support in a
bookstore. Algorithm method used in this study is the Apriori algorithm that is used to obtain patterns related
items then CLHM algorithm for clustering the data so that the data used do not have a high variation in the data.
The results of this study is the information in the form of patterns produced using a combination of algorithm and
Apriori algorithm CLHM ie if consumers buy books and basic educational lessons so he bought the book value of
the technology with confidence 0.75 that means confidence value is greater than the specified value is equal
confidence ≥ 0.75. From these results it can be concluded that the combination of CLHM and Apriori algorithm
produces a higher relevance.
Keywords: Data Mining, CLHM, Apriori.
PENDAHULUAN
Pengolahan informasi data mining adalah Association rule mining yang digunakan
untuk menemukan hubungan diantara data atau bagaimana suatu kelompok data
mempengaruhi suatu keberadaan data yang lain (Kantardzic, 2003).
Metode ini dapat membantu mengenali pola-pola tertentu di dalam kumpulan data
yang besar. Aturan keterkaitan (association rules) adalah suatu prosedur untuk mencari
hubungan antar item dalam suatu data set yang ditentukan (Han dan Kamber, 2001).
Association rule mining dipergunakan untuk mencari kaidah asosiasi antara suatu kombinasin
item. Mendeteksi kumpulan-kumpulan atribut yang muncul bersamaan (co-occur) dalam
frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut.
Association Rules seringkali disebut dengan "Market Basket Analysis", yang digunakan untuk
menemukan relasi atau korelasi diantara himpunan item-item. Market Basket Analysis adalah
Analisis dari kebiasaan membeli customer dengan mencari asosiasi dan korelasi antara itemitem berbeda yang diletakkan customer dalam keranjang belanjaannya.
Salah satu potensi penerapan association rules adalah pada pengaturan penempatan
jenis-jenis buku pada rak di toko buku. Saat ini penempatan barang pada etalase barang di
toko buku tidak sesuai dengan perilaku belanja konsumen. Hal inilah yang menjadi masalah
yang sering dihadapi oleh perusahaan. Perusahaan mengalami masalah dalam manajemen
produk serta kesulitan dalam hal pengaturan penempatan letak produk, sehingga perputaran
barang tidak terjadi secara maksimal.
Aturan keterkaitan (association rules) merupakan suatu prosedur untuk mencari
hubungan antar item dalam suatu set data yang ditentukan (Han dan Kamber, 2001) dan
(Jiawei dan Micheline, 2000). Dengan menggunakan teknik pengolahan informasi Data
Mining yaitu Association rule mining (Ulmer, 2002) yang digunakan untuk menemukan
hubungan antara data atau bagaimana suatu kelompok data yang mempengaruhi suatu
keberadaaan data yang lain (Kantardzic, 2003) Metode ini dapat membantu mengenali polapola tertentu di dalam kumpulan data yang besar.
Umumnya data yang digunakan untuk proses association rules atau aturan keterkaitan
sangat besar dan terdapat variasi data yang sangat tinggi. Hal ini dapat mengurangi kualitas
dari kaidah yang dihasilkan. Oleh karena itu, pada penelitian ini digunakan teknik clustering
terlebih dahulu menggunakan algoritma clustering Centroid Linkage Hierarchical Method
(CLHM) (Usmaida, 2007), agar data yang digunakan untuk aturan asosiasi sudah terklaster
dengan baik (Martiana, 2010) dan (Barakbah dan Arai, 2004).
Sistem yang dibuat diharapkan menjadi sebuah solusi dari latar belakang permasalahan
diatas. Sehingga berdasarkan latar belakang masalah yang dijelaskan, maka dapat
dirumuskan tujuan penelitian ini adalah untuk mencari keterkaitan atau hubungan antara itemitem yang berbeda dalam suatu set data dengan menggunakan teknik data mining, dalam hal
ini keterkaitan antara satu buku dengan buku lain pada sebuah toko buku, dimana tujuan akhir
penelitian ini yaitu sebagai sistem yang mampu memberikan informasi tentang solusi-solusi
pendukung pengambilan keputusan dan kebijakan di dalam sebuah toko buku.
BAHAN DAN METODE
Lokasi dan Waktu Penelitian
Penelitian ini dilaksanakan disalah satu toko buku gramedia yang ada di kota Makassar
dan dilakukan selama 6 (Enam) bulan dimulai bulan Oktober 2013 sampai bulan Maret 2014.
Sumber Data
Data yang digunakan pada penelitian ini adalah real dataset yaitu data penjualan yang
diambil secara langsung dari laporan harian penjualan toko buku gramedia.
Rancangan Penelitian
Secara umum penelitian yang dilakukan adalah merancang suatu aplikasi
menggunakan teknologi data mining menggunakan algoritma Apriori untuk mendapatkan
pengetahuan berupa pola asosiasi pembelian item oleh konsumen yang bisa digunakan sebagai
strategi penjualan. Pada penelitian ini proses pencarian kaidah asosiasi menggunakan
algoritma kombinasi antara CLHM dan Apriori. Proses dari pencarian keterkaitan item
tersebut dapat dilihat pada gambar 1. Perangkat lunak yang digunakan pada penelitian ini
terdiri dari MySQL. Selanjutnya terdapat Aplikasi Web dimana aplikasi web yang digunakan
disini yaitu bahasa pemrograman PHP, Javascript, HTML, jquery dan CSS serta Macromedia
Dreamweaver sebagai editor untuk membangun listing program.
Metode Analisis Data
Metode analisis data yang di gunakan adalah algoritma CLHM dimulai dengan
pemilihan secara acak K, dimana K disini merupakan banyaknya klaster yang ingin dibentuk.
Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat
dari klaster atau biasa disebut dengan centroid, yang memiliki mean atau “means”. Hitung
jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian
hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan
setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai
centroid tidak berubah (stabil) (Witten, et al., 2005). Hasil cluster dari algoritma CLHM ini
selanjutnya dimasukkan kedalam algoritma Apriori dimana algoritma ini bekerja untuk
melakukan pencarian frequent itemset dengan menggunakan teknik association rule.
(Moertini, 2007) dan (Yova dan Fahrian,2008).
HASIL PENELITIAN
Hasil dari penelitian yang menggunakan dataset transaksi pembelian dari sebuah toko
buku dimana satu record paling sedikit memuat satu item pembelanjaan yaitu berupa polapola keterkaita item. Pada data transaksi penjualan terdapat beraneka ragam kategori item yang
dibeli oleh konsumen. Dalam penelitian ini, diambil 15 kategori item sebagai bahan penelitian.
Sehingga pada tahap penyeleksian data ini akan mengambil data transaksi yang mengandung
kategori item yang sudah ditentukan dan transaksi yang tidak mengandung kategori item yang
diteliti akan dibuang. Adapun 15 kategori item yang akan diteliti dapat dilihat pada tabel 1.
Item-item dikonversikan ke dalam angka-angka yang menunjukkan kode item yang
dibeli pelanggan. Berikutnya adalah melakukan proses pencarian kaidah asosiasi untuk dataset
yang tidak diklaster dan data yang diklaster. Dataset tersebut diklaster dengan menggunakan
algoritma CLHM dengan jumlah klaster 5 dan hasilnya dapat dilihat pada tabel 2.
Pada tabel 3 menunjukkan hasil dari algoritma Apriori dengan nilai minimum support
support 0.2 atau sama dengan 20 % dan confidence 0.75 atau sama dengan 75%. Dengan
menggunakan kombinasi algoritma CLHM dan Apriori dihasilkan berupa pola-pola
keterkaitan data serta nilai keterkaitannya. Pola-polanya yaitu jika konsumen membeli buku
pendidikan dasar dan pelajaran maka ia membeli buku teknologi dengan nilai confidence 0.75,
dan seterusnya seperti yang terlihat pada tabel 3.
PEMBAHASAN
Penelitian ini menunjukkan bahwa nilai confidence dari data yang di-cluster, dengan
menggunakan algoritma CLHM yang kemudian dicari keterkaitannya menggunakan algoritma
Apriori menghasilkan confidence yang lebih besar dibandingkan dengan data yang tidak dicluster. Hal ini menunjukkan bahwa proses clustering akan menghasilkan kaidah-kaidah
asosiasi dengan kualitas yang lebih baik. Sesuai dengan tujuan penelitian ini yaitu
menghasilkan penggalian kaidah asosiasi multi obyektif yang baik, dengan menggunakan
sampel yang dilakukan proses clustering terlebih dahulu akan menghasilkan kaidah-kaidah
asosiasi yang lebih baik, hal ini ditunjukkan dengan nilai rata-rata yang diperoleh mempunyai
nilai yang lebih besar dibandingkan data yang tidak melalui proses clustering terlebih dahulu.
Kemudian dengan hasil yang diperoleh maka bisa dimanfaatkan menghasilkan
pengetahuan tentang pola pembelian konsumen yang selama ini jarang diketahui, penulis
berasumsi bahwa hasil tersebut dapat dimanfaatkan untuk membantu membuat strategi bisnis,
diantaranya : Menyusun layout yang baik didasarkan pada pola pembelian item yang memiliki
nilai confidence tinggi. Letak item Buku yang memiliki nilai confidence tinggi sehingga bisa
diatur berdekatan agar memudahkan konsumen dalam membeli kedua item tersebut dan dapat
meningkatkan penjualan keduanya.
Selanjutnya hasil pola yang didapat juga bisa digunakan dalam membantu manajer
sebuah took buku dalam menentukan keputusan persediaan barang. Sebagai contoh item Buku
kesehatan dan Buku pendidikan memiliki keterkaitan. Dari data tersebut, maka manajer
pemasaran setidaknya harus menjaga ketersediaan stok kedua item tersebut agar tetap sama.
Serta memberikan paket diskon terhadap pola pembelian item yang memiliki nilai confidence
tinggi namun memiliki nilai support yang kecil. Hal ini berguna untuk menarik minat
konsumen yang sering membeli item-item yang terdapat pada pola tersebut agar lebih
bertambah. Adapun asumsi dari penulis untuk memanfaatkan pola yang dihasilkan yaitu
dengan merubah penataan item saat ini, yang diharapkan mampu meningkatkan nilai
penjualan.
KESIMPULAN DAN SARAN
Dengan menerapkan algoritma CLHM dan Apriori pada data transaksi penjualan di
toko buku, dapat menghasilkan sebuah pengetahuan berupa keterkaitan data item-item yang
sering dibeli secara bersamaan. Hasil dari pengolahan pada penelitian ini dengan nilai support
sebesar 0.2 dan confidence sebesar 0.75, Hasil dari kombinasi algoritma Apriori dan CLHM
terdapat beberapa pola yang memenuhi syarat yaitu jika konsumen membeli buku pendidikan
dasar dan pelajaran maka ia membeli buku teknologi dengan nilai confidence 0.75. Jika
konsumen membeli buku pendidikan dasar dan buku pelajaran maka ia membeli buku cerita
dengan nilai confidence 0.75. Agar mendapatkan hasil yang lebih baik, saran yang dapat
diberikan berkaitan dengan penelitian ini untuk pengembangan selanjutnya adalah menambah
volume data yang digunakan untuk uji coba serta lebih memadatkan jenis kriteria item
sehingga dapat menghasilkan pola yang lebih efisien. Menggunakan algoritma clustering lain
seperti K-NN serta menggunakan teknik pengembangan aturan keterkaitan yang lain.
UCAPAN TERIMA KASIH
Penulis menyadari bahwa penyusunan penelitian ini banyak mengalami hambatan,
rintangan dan halangan, penulis juga menyadari bahwa masih banyak kekurangan pada
penelitian ini, namun dengan bantuan dari berbagai pihak, penelitian ini dapat terselesaikan
dengan baik, Oleh karena itu, pada kesempatan ini penulis ingin menyampaikan rasa terima
kasih dan penghargaan yang setinggi-tingginya kepada Bapak Dr. Ir. Andani Achmad, MT
dan Bapak Amil Ahmad Ilham, ST., M.Eng., Ph.D selaku pembimbing yang banyak
meluangkan waktunya memberikan petunjuk dan bimbingan sehingga kesulitan penulis dalam
membuat tesis ini dapat terselesaikan. Terima kasih juga yang sebesar-besarnya kepada Bapak
dan Ibu Dosen yang telah memberikan banyak masukan dan bimbingannya selama penulis
menempuh perkuliahan.
DAFTAR PUSTAKA
Barakbah, A.R. dan Arai, K. (2004). Identifying Moving to make automatic clustering for
normal data set, In. Proc. IECI Japan Workshop, Musashi Institute of Technology, Tokyo.
Han, J. dan Kamber, M. (2001). Data Mining Concepts and Techniques. Morgan Kaufmann,
California.
Jiawei, H dan Micheline, K, (2000). Data Mining: Concepts and Techniques : Chapter 6.
Mining Association Rules in Large Database, Simon Fraser University.
Kantardzic, M. (2003). Data Mining Concepts Models, and Algorithms. New Jersey : IEEE.
Moertini, V dan Marsela, Y. (2007). Analisis Keranjang Pasar Dengan Algoritma HashBased Pada Data Transaksi Penjualan Apotek. Jurusan Ilmu Komputer, Universitas
Katolik Parahyangan, Bandung.
Martiana, E, et al., (2010). Mesin Pencari Dokumen Dengan Pengklasteran Secara Otomatis.
Telkomnika Vol. 8, No. 1, April 2010.
Ulmer, David. (2002). Mining an Online Auctions Data Warehouse. The Mid-Atlantic Student
Workshop on Programming Languages and Systems, Pace University.
Usmaida, A. (2007). Web Mining Untuk Pencarian Berdasarkan Kata Kunci Dengan Teknik
Clustering, Tugas Akhir Jurusan Teknologi Informasi Politeknik Elektronika Negeri
Surabaya.
Witten, et al., (2005). Data Mining Practical Machine Learning Tools and Techniques,
Second Edition. Morgan Kaufmann, San Fransisco.
Yova, R. dan Fahrian, M. (2008). Implementasi Algoritma-Algoritma Association Rules
Sebagai Bagian Dari Pengembangan Data Mining Algorithms Collection. Konferensi
Nasional dan Sistem Informatika.
Tabel 1. Kategori Item
Kode item
Nama item
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Kesehatan
Pendidikan Dasar
Pelajaran
Sains
Teknologi
Cerita
Kejiwaan
Agama
Resep
Fiksi
Hidup_Sehat
Pemerintahan
Ensiklopedi
Hiburan
15
Majalah
Tabel 2. Hasil Cluster Algoritma CLHM
Transaksi
Item
1
{2,3,5,6}
3
{2,3,5,6,9}
11
{2,3,5}
13
{2,3,5,6}
17
{2,3,5,6}
22
{2,3,5,6}
23
{3,5,7,9}
27
{2.3}
28
{2,3,5,9}
30
{2,3,5,6}
Tabel 3. Nilai confidence item-item yang memenuhi syarat menggunakan algoritma Apriori
Item-item
Nilai
confidence
2,3->5
0.75
2,3->6
0.75
2,5->3
0.75
2,5->6
0.65
2,6->3
0.75
2,6->5
0.75
3,5->2
0.75
3,5->6
0.65
3,6->2
0.65
3,6->5
0.75
5,6->2
0.65
5,6->3
0.75
Keterangan
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 3 (Pelajaran) maka ia membeli item 5 (Teknologi)
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 3 (Pelajaran) maka ia membeli item 6 (Cerita)
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 5 (Teknologi) maka ia membeli item 3 (Pelajaran)
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 5 (Teknologi) maka ia membeli item 6 (Cerita)
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 6 (Cerita) maka ia membeli item 3 (Pelajaran)
Jika konsumen membeli item 2 (Pendidikan Dasar) dan
item 6 (Cerita) maka ia membeli item 5 (Teknologi)
Jika konsumen membeli item 3 (Pelajaran) dan
item 5 (Teknologi) maka ia membeli item 2 (Pendidikan Dasar)
Jika konsumen membeli item 3 (Pelajaran) dan
item 5 (Teknologi) maka ia membeli item 6 (Cerita)
Jika konsumen membeli item 3 (Pelajaran) dan
item 6 (Cerita) maka ia membeli item 2 (Pendidikan Dasar)
Jika konsumen membeli item 3 (Pelajaran) dan
item 6 (Cerita) maka ia membeli item 5 (Teknologi)
Jika konsumen membeli item 5 (Teknologi) dan
item 6 (Cerita) maka ia membeli item 2 (Pendidikan Dasar)
Jika konsumen membeli item 5 (Teknologi) dan
item 6 (Cerita) maka ia membeli item 3 (Pelajaran)
Gambar 1. Arsitektur Sistem
Data transaksi
penjualan
CLHM
Apriori
Keterkaitan
data
Download