Implementasi Data Mining Asosiasi Menggunakan Algoritma Apriori

advertisement
Implementasi Data Mining Asosiasi Menggunakan Algoritma Apriori
Untuk Menentukan Itemset Promosi Penjualan Pada Agung Swalayan
Rochmad Dwi Cahyono1, Candra Irawan2
Sistem Informasi, Fakultas Ilmu Komputer, Universitas Dian Nuswantono
Jl. Nakula 1 No. 5-1, Semarang, Indonesia
Telp. (024) 3517261. Fax: (024) 3520165
E-mail : [email protected], [email protected]
1,2
Abstrak
Agung Swalayan merupakan salah satu dari sekian banyak swalayan yang memiliki banyak
sekali data transaksi penjualan yang tersimpan didalam suatu database, sehingga dari data
transaksi tersebut dapat digunakan untuk menganalisis pola pembelian konsumen dengan
menggunakan data mining. Apriori merupakan salah satu algoritma dari fungsi asosiasi yang
mana masuk dalam prosedur Market Basket Analysis (Analisis Keranjang Pasar) pada data
mining yang mampu menemukan pengetahuan baru berupa itemset yang dibeli oleh konsumen
secara bersamaan dalam satu transaksi. Setiap pola memiliki 2 parameter utama yaitu nilai
support (Pendukung) dan nilai confidece (kepercayaan). Sehingga dari parameter ini dapat
ditemukan sebuah kaidah asosiasi dengan menggunakan algoritma apriori, dengan cara tidak
lagi mengikutsertakan kandidat itemset yang tidak memenuhi nilai support. Implementasi data
mining menggunakan RapidMiner membantu menemukan pola pembelian konsumen dengan
akurat, diantaranya adalah jika membeli Sampo maka akan membeli Sabun Mandi dengan nilai
suppport = 43.6% dan nilai confidence = 76.9%, jika membeli Deterjen maka akan membeli
Sabun Mandi dengan nilai support 42.5% dan nilai confidence 79.3%, jika membeli Pasta Gigi
maka akan membeli Sabun Mandi dengan nilai support 45.7% dan nilai confidence 79.8%. Dari
pola pembelian yang ditemukan maka dapat digunakan untuk menentukan promosi penjualan
berupa pemberian diskon untuk paket barang yang masuk dalam pola yang telah ditemukan.
Kata Kunci: data mining, market basket analysis, fungsi asosiasi, algoritma apriori, promosi
penjualan
Abstract
Agung Swalayan is one of many market that have much of data transaction in the database, so
that data transaction can be useful to analyzing point-of-sale transaction by using data mining.
Apriori is one of algorithm from association rules that’s include at Market Basket Analysis in
the data mining, Market Basket Analys can find itemset which has been purchased by customer
of each transaction. Every pattern or point-of-sale have 2 parameters that are support and
confidence. And than by that parameter obtain to finding association rules by using apriori
algorithm, apriori will not be including candidats that don’t meet the support value.
Implementation of data mining by using RapidMiner can finding a point-of-sale with high
accuracy, there are If customer purchase Shampoo than the customer also purchase Bath Soap
with support= 43.6% and confidence= 76.9%, If customer purchase Detergent than customer
aslo purchase Bath Soap with support= 42.5% and confidence= 79.3%, If customer Purchase
Toothpaste than customer also purchase bath Soap with support 45.7% and confidence 79.8%.
Keywords: data mining, market basket analysis, association rules, apriori algorthm, sales
promotion
1
1. PENDAHULUAN
Sistem
informasi
merupakan
sekumpulan data yang terorganisasi,
baik
pengumpulan
maupun
penyimpanan berbagai data dilakukan
dalam suatu database dengan skala yang
besar. Setiap hari perusahaan dalam
bentuk penjualan maupun pemasaran
memiliki
berpuluh-puluh
hingga
beratus-ratus data transaksi.
Agung Swalayan merupakan salah satu
pasar modern milik perorangan yang
menyediakan
berbagai
kebutuhan
sehari-hari di Kabupaten Sragen yang
memiliki banyak data transakasi setiap
harinya, akan tetapi data tersebut belum
digunakan secara optimal untuk
menyusun strategi penjualan berikutnya
agar swalayan tersebut semakin
berkembang dan dikenal masyarakat.
Promosi merupakan sebuah sarana
komunikasi antara penjual dan calon
pembeli dengan cara membujuk dan
atau mempengaruhi calon pembeli
untuk membeli barang/jasa yang dijual
oleh penjual. Promosi yang dilakukan
dengan baik dan benar maka akan dapat
membantu
meningkatkan
profit
perusahaan. Ada banyak metode
promosi salah satunya adalah promosi
penjualan. Promosi penjualan bertujuan
untuk menarik minat customer ataupun
calon pembeli untuk mengenal dan
membeli suatu produk/jasa [1]. Agung
Swalayan juga pernah melakukan
promosi
penjualan
dengan cara
memberi kupon kepada pelanggan yang
melakukan pembelian dengan total
transaksi minimal seratus ribu rupiah
yang dikumpulkan selama 3 (tiga) bulan
kemudian memasuki bulan ke 4 (empat)
dilakukan pengundian pemenang, akan
tetapi promosi penjualan yang pernah
dilakukan masih belum membantu
dalam upaya menarik minat calon
pembeli serta meningkatkan penjualan
yaitu berkisar 32 juta rupiah setiap
harinya dimana jika dilihat tanpa
melakukan promosi penjualan Agung
Swalayan juga mampu mencapai
penjualan sebesar 32 juta rupiah. Oleh
karena
itu
dibutuhkan
sebuah
improvment dalam melakukan promosi
penjualan
yaitu
dengan
cara
mengidentifikasi barang-barang apa saja
yang dibeli secara bersamaan oleh
customer, dengan begitu akan menarik
banyak customer karena barang yang
dipromosikan merupakan barang yang
dibutuhkan oleh customer.
Data mining atau penggalian data
merupakan disiplin ilmu yang memiliki
tujuan utama untuk menggali serta
menemukan kembali sebuah inti sari
dari sekian banyaknya data yang berada
pada database untuk menambang
informasi atau pengetahuan baru bagi
orang yang membutuhkannya. Sehingga
data yang disimpan tidak hanya
memenuhi database, akan tetapi dapat
dimanfaatkan
untuk
menentukan
strategi berikutnya [2].
Association rules benar-benar diperoleh
dari data transaksi penjualan yang
mendeskripsikan barang apa saja yang
dibeli secara bersamaan. Meskipun
berawal dari transaksi penjualan,
association rules juga dapat diterapkan
dan dikembangkan diluar dari data-data
penjualan [3].
Pada fungsi asosiasi memiliki beberapa
algoritma
salah
satunya
adalah
algoritma apriori. Algoritma apriori
adalah algortima yang pertama kali
digunakan untuk menentukan frequent
itemset pada aturan asosiasi. Apriori
memiliki beberapa tahap yang dimulai
dari pembentukan kandidat itemset,
kemudian menghitung support dari
setiap
k-kandidat
itemset
dan
dilanjutkan dengan menetapkan pola
frekuensi tinggi, kemudian yang
terakhir adalah abila tidak dapat
menentukan pola frekuensi tinggi yang
baru maka semua proses dihentikan.
2. RUMUSAN MASALAH
Dari latar belakang diatas maka dapat
diketahui rumusan masalanya adalah
bagaimana
cara
menggali
dan
memanfaatkan data transaksi penjualan
yang ada didalam database dengan
menerapkan fungsi asosiasi dan
menggunakan algoritma apriori pada
Agung Swalayan untuk menentukan
itemset promosi penjualan sebagai
strategi perusahaan?
3. METODE PENELITIAN
3.1 Objek Penelitian
Agung Swalayan merupakan pasar
modern pertama di wilayah Kecamatan
Tanon yang beralamatkan Dukuh
Patihan, Desa Gabugan, Kecamatan
Tanon, Kabupaten Sragen. Agung
Swalayan merupakan peralihan dari
Toserba Condong Raos yang dimiliki
oleh Drs. H. Jam Sriyono yang berlamat
Dukuh Geneng, Desa Karangasem,
Kecamatan Tanon, Kabupaten Sragen.
Kemudian pada tanggal 01 Januari 2011
Toserba Condong Raos resmi diakuisisi
oleh H. Agung Prakoso yang
beralamatkan Ruko Puro Asri Blok 42
Nomor 05, Puro, Karangmalang,
Kabupaten Sragen, sehingga
nama
Toserba Condong Raos diganti dengan
nama Agung Swalayan. Pada tahun
2011 kepemimpinan Agung Swalayan
dipegang oleh Rina Murtafia hingga
tahun 2012, kemudian digantikan oleh
Suratno hingga sekarang.
3.2 Kaidah Asosiasi
Association rules atau kaidah asosiasi
merupakan salah satu fungsi data
mining yang dapat menemukan item
yang muncul secara bersaman dalam
satu event, kejadian atau group dengan
cara mengkuantifikasi dua atribut atau
lebih, singkat kata asosiastion rules
berbentuk “Jika kejadian sebelumnya-
maka kejadian berikutnya”, “jika
membeli barang a, maka juga akan
membeli barang b”. Selain itu
association rules juga memiliki ukuran
support
dan
confidence
untuk
memastikan apakah pola asosiasi yang
ditemukan adalah pola yang valid atau
tidak [3].
Association rules ditentukan oleh
support dan confidence, yang berarti
[2]:
1. Support : suatu nilai penunjang
yang menunjukan seberapa besar
atau berapa kali sebuah kombinasi
item muncul dalam database.
2. Confidence
:
suatu
nilai
kepercayaan yang menunjukkan
kuatnya item yang ditemukan
dalam pola association rule atau
sering disebut kaidah asosiasi.
Kedua parameter tersebut digunakan
untuk dapat menentukan seberapa bagus
atau valid kaidah asosiasi yang
ditemukan, dengan cara pola yang
ditemukan harus memenuhi syarat
minimal support dan juga minimal
confidence. Kaidah asosiasi memiliki 2
(dua) tahap, yaitu [2] :
1. Analisis Pola Frequent
Tahap pertama mencari kombinasi
item atau itemset didalam database
yang memenuhi nilai minimum
support, yang diperoleh dari rumus
berikut :
Support(A)
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴
=
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
Kemudian untuk nilai support dari 2
item diperoleh dari rumus berikut :
Support(A, B) = 𝑃(𝐴 ∩ 𝐵)
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵
=
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
2. Pembentukan Kaidah Asosiasi
Berikutnya mencari kaidah asosiasi
yang
memenuhi
syarat
nilai
minimum confidence, dengan rumus
sebagai berikut :
Confidence = 𝑃(𝐴 → 𝐵)
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵
=
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴
3.3 Market Basket Analysis
Market Basket Analysis adalah salah
satu tekhnik yang paling umum
digunakan pada data mining, dimana
tekhnik ini sering digambarkan sebagai
keranjang belanja yang memuat item
pembelian paling sering dibeli secara
bersamaan oleh customer. Market
basket analysis digunakan untuk
mempermudah
dalam
memahami
customer sebaik mungkin dengan cara
memahami apa saja item yang paling
sering mereka beli secara bersamaan,
maka dari itu market basket analysis
dapat dikatakan berpedoman dalam 3
entitas yaitu customer, order, dan item
[3].
Maka dari itu tekhnik ini sangat tepat
untuk menganalisis kebiasaan customer
pada Agung Swalayan dalam rangka
menentukan itemset promosi penjualan.
Dengan memahami apa yang pembeli
inginkan dan pembeli butuhkan maka
promosi penjualan pada Agung
Swalayan dapat menunjang penjualan
serta meningkatkan loyalitas customer
dan menarik pembeli baru atau calon
pembeli didalam ketatnya persaingan
yang ada.
3.4 Proses Penelitian
Metode analisis yang digunakan dalam
penelitian adalah salah satu metode dari
fungsi asosiasi dalam data mining atau
sering disebut sebagai Martket Basket
Analysis dengan algoritma apriori. Data
mining memiliki proses yang panjang,
mulai dari pengumpulan data, seleksi
data, cleaning data, transformasi data,
data mining, implementasi dan yang
terakhir adalah interpretasi & evaluasi.
Setelah mengatahui proses utama dari
data mining, maka peneliti dapat
menentukan langkah-langkah yang
dapat diambil untuk dapat menemukan
kaidah asosiasi tanpa melewatkan
proses utama dari data mining.
Langkah-langkah
yang
digunakan
peneliti adalah sebagai berikut :
1. Pengumpulan Data Transaksi
Dalam penelitian ini menggunakan
data utama yaitu berupa data
transaksi penjualan mulai dari 1 mei
2015 s/d 30 september 2015 pada
Agung Swalayan.
2. Seleksi Data
Dari data yang diperoleh maka
diseleksi terlebih dahulu data mana
saja yang akan digunakan, dalam
penelitian ini data yang akan
digunakan adalah 20 produk
kebutuhan sehari-hari. Sehingga
akan
diseleksi
data
yang
mengandung 20 produk yang telah
ditentukan
diantaranya
adalah
Deterjen, Pasta Gigi, Sikat Gigi,
Sabun Mandi, Sampo, Parfum, Obat
Nyamuk,
Pengharum Ruangan,
Pembersih Lantai, Tisu, Teh,
Minuman Bersoda, Kopi, Susu,
Gula, Snack, Telur, Minyak Goreng,
Tepung Terigu, Mie Instan .
3. Cleaning/ pembersihan Data
Pada cleaning data dilakukan
pemilihan atribut yaitu atribut nomor
transaksi penjualan & nama barang,
sehingga
atribut
yang
tidak
digunakan akan dihapus, selain itu
juga dilakukan perbaikan untuk datadata yang rusak atau kurang tepat.
4. Transformasi Data
Pada tahap transformasi adalah
proses untuk mengintegraasikan data
transaksi penjualan pada Agung
Swalayan dengan RapidMiner, yaitu
5.
6.
7.
8.
9.
diubah dalam bentuk tabulasi dengan
ekstensi *.XLS (Ms. Excell).
Sampling Data
Pada tahap ini populasi yang ada
akan
dibuat
sampel
dengan
menggunakan
desain
sampel
nonprobabilitas judgement sampling.
Kemudian
menghitung
sampel
minimal dari populasi yang ada.
Clustering (Pengelompokan)
Setelah disampling serta dihitung
jumlah sampel yang digunakan untuk
mewakili populasi, maka dapat
diteruskan dengan clustering atau
pengelompokan data untuk dapat
menambah kualitas data atau
menambah nilai support dan nilai
confidence. Data akan dikelompokan
menjadi 2 yaitu data yang berkualitas
dan juga data yang kurang
berkualitas.
Target Data
Data yang berkualitas merupakan
target data yang digunakan untuk
menemukan kaidah asosiasi trasaksi
penjualan pada Agung Swalayan.
Data Mining
Setelah data ditransformasikan dan
juga dipilih maka akan dilakukan
proses
data
mining
untuk
menemukan kaidah asosiasi yang
dibutuhkan dengan menggunakan
algortima apriori. Pada proses ini
peneliti menghitung contoh transaksi
secara
konvensional
tanpa
menggunakan tools data mining.
Interpretasi
Dan yang terakhir adalah mengubah
atau menterjemahkan pola-pola yang
ditemukan kedalam bahasa yang
lebih mudah untuk dipahami. Pada
proses akhir dari peneitian ini
biasanya disajikan dalam bentuk
tabel, graph dan juga text untuk
dapat ditarik sebuah kesimpulan atau
hasil dari penelitian.
Gambar 3.1 Metode Penelitian
4. HASIL PENELITIAN
Gambar 4.1 Tabulasi Data Transaksi
Gambar 4.2 Grafik Perbandingan
Cluster
Gambar 4.3 Implementasi Asosiasi
pada RapidMiner
Gambar 4.4 Interpretasi Tabel View
Gambar 4.5 Interpretasi Graph View
Gambar 4.6 Interpretasi Text View
5. KESIMPULAN
Data mining sangat berguna untuk
mengoptimalkan
data
transaksi
penjualan yang ada pada Agung
Swalayan dengan menggunakan kaidah
asosiasi.
Kaidah
asosiasi
dapat
menemukan pola prilaku pembelian
konsumen atau menemukan barang apa
saja yang dibeli secara bersamaan oleh
konsumen, sehingga dapat digunakan
untuk
membuat
sebuah strategi
penjualan dengan cara promosi atau
diskon barang. Algoritma apriori
merupakan salah satu metode yang tepat
untuk menganalisis pola prilaku
konsumen karena termasuk pada
prosedur Market Basket Analysis ,
sehingga ditemukan pola pembelian
konsumen pada Agung Swalayan
seperti berikut :
1. Jika membeli Sampo maka membeli
Sabun
Mandi
dengan
nilai
confidence 76.9%
2. Jika membeli Deterjen maka
membeli Ssabun Mandi dengan nilai
confidence 79.3%
3. Jika membeli Pasta Gigi maka
membeli Sabun Mandi dengan nilai
confidence 79.8%
Dari pola pembelian konsumen yang
telah didapatkan,
maka peneliti
memberi saran kepada pihak Agung
Swalayan sebagai berikut :
1. Dari hasil penelitian yang didapat
maka
Agung
Swalayan
bisa
melakukan product bundling berupa
harga paket untuk 2 (dua) buah
produk, yaitu Sampo & Sabun
Mandi, Deterjen & Sabun Mandi,
Pasta Gigi & Sabun Mandi.
2. Menaruh item yang ada pada 3
kaidah asosiasi yang telah ditemukan
dengan jarak yang berdekatan.
Sehingga customer maupun calon
pembeli dapat dengan mudah
menemukan barang yang dicari.
DAFTAR PUSTAKA
[1].
Nency M.N Togas, Jantje L.
Sepang, and Rudy S Wenas,
"Periklanan, Penjualan Pribadi, Promosi
Penjalan Dan Publisitas Terhadap
Keputusan Pembelian Pada Penerbit
Andi Cabang Manado," ISSN: 23031174, vol. 2, pp. 578-488, Desember
2014.
[2].
Emma Taufiq Luthfi Kusrini,
Algoritma Data Mining, 1st ed.: Andi,
2009.
[3].
Michael J.A Berry and Gordon
S. Linof, Data Mining Techniques: For
Marketing, Sales, and Customer
Relationship
Management,
2nd
Edition.: Wliey, 2004, ch. 9, pp. 287320.
[4].
Dedy Suryadi, ST, M.S and Sani
Susanto, Ph.D , Pengantar Data Mining,
Nikodemus WK, Ed.: Andi, 2010.
[5].
Kennedi Tampubolon, Hoga
Saragih,
and
Bobby
Reza,
"Implementasi Data Mining Algoritma
Apriori Pada Sistem Persediaan Alatalat Kesaehatan," ISSN: 2339-210X,
vol. I, pp. 93-106, Oktober 2013.
[6].
Prof. Mudrajad Kuncoro, Ph.D ,
, M.M. Wibi Hardani, Ed. jakarta,
Indonesia: Erlangga, 2013, ch. 7.
Pemilihan Sampel, pp. 117-143.
[7].
Regina Yamin, "Peresepsi Nilai,
Peresepsi
Kualitas
Dan
Citra
Perusahaan
Terhadap
Kepuasan
Pelanggan Pada PT. Astra International
Daihatsu Di Manado," ISSN: 23031174, vol. I No.3, pp. 1231-1240,
September 2013.
[8].
Lia Ambarwati, Denis Aprilia C,
Donny Aji Baskoro, and I Wayan Simri
Wicaksana, Belajar Data Mining
Dengan Menggunakan
Remi Sanjaya, Ed.
RapidMiner,
[9].
Popy Meliana, "Penerapan Data
Mining Dengan Metode Klasifikasi
Menggunakan Metode ," ISSN : 20851669, e-ISSN : 2460-0288, vol. VII
No.1, Januari 2015.
[10]. Dewi
Kartika
Pane,
"Implementasi Data Mining Pada
Penjualan Produk Elektronik Dengan
Algortima Apriori (Studi Kasus:
Kreditplus)," ISSN : 2301-9425, vol. IV
No.3, Agustus 2013.
[11]. Febriana Santi Wahyuni, Daniel
O Siahaan, and Chastine Fatichah,
"Penggunaan Cluster-Based Sampling
Untuk Penggalian Kaidah Asosiasi
Multi Objektif," ISSN: 0216-0544, vol.
V No.1, pp. 59-67, Januari 2009.
[12]. Nurdin and Dewi Astika,
"Penerapan Data Mining Untuk
Menganalisis Penjualan Barang Dengan
Menggunakan Metode Apriori Pada
Supermarket Sejahtera Lhoksumawe,"
Techsi, vol. VI No.1, pp. 133-155, April
2015.
[13]. Ralfi
Klinkenberg,
Ingo
Mierswa,
and
Simon
Fischer.
RapidMiner
Tutorial.
[Online].
http://docs.rapidminer.com/studio/gettin
g-started/4-applying-model.html
[14]. Christian Borgelt. (2015, Oct.)
Apriori.
[Online].
http://www.borgelt.net/doc/apriori/aprio
ri.html
[15]. Tan, Stinbach, and Kumar.
(2016, Jan.) Clustering at Data Mining.
[Online].
https://wwwusers.cs.umn.edu/~kumar/dmbook/dmsl
ides/chap8_basic_cluster_analysis.pdf
[16]. J. Delayne Stroud. (2015, Dec.)
Basic Sampling Strategies: Sample Vs
Population
Data.
[Online].
http://www.isixsigma.com/toolstemplates/sampling-data/basicsampling-strategies-sample-vspopulation-data/
[17]. Kurt Thearling. (2015, Oct.) An
introduction to Data Mining. [Online].
http://www.thearling.com/text/dmwhite/
dmwhite.htm
Download