Implementasi Data Mining Asosiasi Menggunakan Algoritma Apriori Untuk Menentukan Itemset Promosi Penjualan Pada Agung Swalayan Rochmad Dwi Cahyono1, Candra Irawan2 Sistem Informasi, Fakultas Ilmu Komputer, Universitas Dian Nuswantono Jl. Nakula 1 No. 5-1, Semarang, Indonesia Telp. (024) 3517261. Fax: (024) 3520165 E-mail : [email protected], [email protected] 1,2 Abstrak Agung Swalayan merupakan salah satu dari sekian banyak swalayan yang memiliki banyak sekali data transaksi penjualan yang tersimpan didalam suatu database, sehingga dari data transaksi tersebut dapat digunakan untuk menganalisis pola pembelian konsumen dengan menggunakan data mining. Apriori merupakan salah satu algoritma dari fungsi asosiasi yang mana masuk dalam prosedur Market Basket Analysis (Analisis Keranjang Pasar) pada data mining yang mampu menemukan pengetahuan baru berupa itemset yang dibeli oleh konsumen secara bersamaan dalam satu transaksi. Setiap pola memiliki 2 parameter utama yaitu nilai support (Pendukung) dan nilai confidece (kepercayaan). Sehingga dari parameter ini dapat ditemukan sebuah kaidah asosiasi dengan menggunakan algoritma apriori, dengan cara tidak lagi mengikutsertakan kandidat itemset yang tidak memenuhi nilai support. Implementasi data mining menggunakan RapidMiner membantu menemukan pola pembelian konsumen dengan akurat, diantaranya adalah jika membeli Sampo maka akan membeli Sabun Mandi dengan nilai suppport = 43.6% dan nilai confidence = 76.9%, jika membeli Deterjen maka akan membeli Sabun Mandi dengan nilai support 42.5% dan nilai confidence 79.3%, jika membeli Pasta Gigi maka akan membeli Sabun Mandi dengan nilai support 45.7% dan nilai confidence 79.8%. Dari pola pembelian yang ditemukan maka dapat digunakan untuk menentukan promosi penjualan berupa pemberian diskon untuk paket barang yang masuk dalam pola yang telah ditemukan. Kata Kunci: data mining, market basket analysis, fungsi asosiasi, algoritma apriori, promosi penjualan Abstract Agung Swalayan is one of many market that have much of data transaction in the database, so that data transaction can be useful to analyzing point-of-sale transaction by using data mining. Apriori is one of algorithm from association rules that’s include at Market Basket Analysis in the data mining, Market Basket Analys can find itemset which has been purchased by customer of each transaction. Every pattern or point-of-sale have 2 parameters that are support and confidence. And than by that parameter obtain to finding association rules by using apriori algorithm, apriori will not be including candidats that don’t meet the support value. Implementation of data mining by using RapidMiner can finding a point-of-sale with high accuracy, there are If customer purchase Shampoo than the customer also purchase Bath Soap with support= 43.6% and confidence= 76.9%, If customer purchase Detergent than customer aslo purchase Bath Soap with support= 42.5% and confidence= 79.3%, If customer Purchase Toothpaste than customer also purchase bath Soap with support 45.7% and confidence 79.8%. Keywords: data mining, market basket analysis, association rules, apriori algorthm, sales promotion 1 1. PENDAHULUAN Sistem informasi merupakan sekumpulan data yang terorganisasi, baik pengumpulan maupun penyimpanan berbagai data dilakukan dalam suatu database dengan skala yang besar. Setiap hari perusahaan dalam bentuk penjualan maupun pemasaran memiliki berpuluh-puluh hingga beratus-ratus data transaksi. Agung Swalayan merupakan salah satu pasar modern milik perorangan yang menyediakan berbagai kebutuhan sehari-hari di Kabupaten Sragen yang memiliki banyak data transakasi setiap harinya, akan tetapi data tersebut belum digunakan secara optimal untuk menyusun strategi penjualan berikutnya agar swalayan tersebut semakin berkembang dan dikenal masyarakat. Promosi merupakan sebuah sarana komunikasi antara penjual dan calon pembeli dengan cara membujuk dan atau mempengaruhi calon pembeli untuk membeli barang/jasa yang dijual oleh penjual. Promosi yang dilakukan dengan baik dan benar maka akan dapat membantu meningkatkan profit perusahaan. Ada banyak metode promosi salah satunya adalah promosi penjualan. Promosi penjualan bertujuan untuk menarik minat customer ataupun calon pembeli untuk mengenal dan membeli suatu produk/jasa [1]. Agung Swalayan juga pernah melakukan promosi penjualan dengan cara memberi kupon kepada pelanggan yang melakukan pembelian dengan total transaksi minimal seratus ribu rupiah yang dikumpulkan selama 3 (tiga) bulan kemudian memasuki bulan ke 4 (empat) dilakukan pengundian pemenang, akan tetapi promosi penjualan yang pernah dilakukan masih belum membantu dalam upaya menarik minat calon pembeli serta meningkatkan penjualan yaitu berkisar 32 juta rupiah setiap harinya dimana jika dilihat tanpa melakukan promosi penjualan Agung Swalayan juga mampu mencapai penjualan sebesar 32 juta rupiah. Oleh karena itu dibutuhkan sebuah improvment dalam melakukan promosi penjualan yaitu dengan cara mengidentifikasi barang-barang apa saja yang dibeli secara bersamaan oleh customer, dengan begitu akan menarik banyak customer karena barang yang dipromosikan merupakan barang yang dibutuhkan oleh customer. Data mining atau penggalian data merupakan disiplin ilmu yang memiliki tujuan utama untuk menggali serta menemukan kembali sebuah inti sari dari sekian banyaknya data yang berada pada database untuk menambang informasi atau pengetahuan baru bagi orang yang membutuhkannya. Sehingga data yang disimpan tidak hanya memenuhi database, akan tetapi dapat dimanfaatkan untuk menentukan strategi berikutnya [2]. Association rules benar-benar diperoleh dari data transaksi penjualan yang mendeskripsikan barang apa saja yang dibeli secara bersamaan. Meskipun berawal dari transaksi penjualan, association rules juga dapat diterapkan dan dikembangkan diluar dari data-data penjualan [3]. Pada fungsi asosiasi memiliki beberapa algoritma salah satunya adalah algoritma apriori. Algoritma apriori adalah algortima yang pertama kali digunakan untuk menentukan frequent itemset pada aturan asosiasi. Apriori memiliki beberapa tahap yang dimulai dari pembentukan kandidat itemset, kemudian menghitung support dari setiap k-kandidat itemset dan dilanjutkan dengan menetapkan pola frekuensi tinggi, kemudian yang terakhir adalah abila tidak dapat menentukan pola frekuensi tinggi yang baru maka semua proses dihentikan. 2. RUMUSAN MASALAH Dari latar belakang diatas maka dapat diketahui rumusan masalanya adalah bagaimana cara menggali dan memanfaatkan data transaksi penjualan yang ada didalam database dengan menerapkan fungsi asosiasi dan menggunakan algoritma apriori pada Agung Swalayan untuk menentukan itemset promosi penjualan sebagai strategi perusahaan? 3. METODE PENELITIAN 3.1 Objek Penelitian Agung Swalayan merupakan pasar modern pertama di wilayah Kecamatan Tanon yang beralamatkan Dukuh Patihan, Desa Gabugan, Kecamatan Tanon, Kabupaten Sragen. Agung Swalayan merupakan peralihan dari Toserba Condong Raos yang dimiliki oleh Drs. H. Jam Sriyono yang berlamat Dukuh Geneng, Desa Karangasem, Kecamatan Tanon, Kabupaten Sragen. Kemudian pada tanggal 01 Januari 2011 Toserba Condong Raos resmi diakuisisi oleh H. Agung Prakoso yang beralamatkan Ruko Puro Asri Blok 42 Nomor 05, Puro, Karangmalang, Kabupaten Sragen, sehingga nama Toserba Condong Raos diganti dengan nama Agung Swalayan. Pada tahun 2011 kepemimpinan Agung Swalayan dipegang oleh Rina Murtafia hingga tahun 2012, kemudian digantikan oleh Suratno hingga sekarang. 3.2 Kaidah Asosiasi Association rules atau kaidah asosiasi merupakan salah satu fungsi data mining yang dapat menemukan item yang muncul secara bersaman dalam satu event, kejadian atau group dengan cara mengkuantifikasi dua atribut atau lebih, singkat kata asosiastion rules berbentuk “Jika kejadian sebelumnya- maka kejadian berikutnya”, “jika membeli barang a, maka juga akan membeli barang b”. Selain itu association rules juga memiliki ukuran support dan confidence untuk memastikan apakah pola asosiasi yang ditemukan adalah pola yang valid atau tidak [3]. Association rules ditentukan oleh support dan confidence, yang berarti [2]: 1. Support : suatu nilai penunjang yang menunjukan seberapa besar atau berapa kali sebuah kombinasi item muncul dalam database. 2. Confidence : suatu nilai kepercayaan yang menunjukkan kuatnya item yang ditemukan dalam pola association rule atau sering disebut kaidah asosiasi. Kedua parameter tersebut digunakan untuk dapat menentukan seberapa bagus atau valid kaidah asosiasi yang ditemukan, dengan cara pola yang ditemukan harus memenuhi syarat minimal support dan juga minimal confidence. Kaidah asosiasi memiliki 2 (dua) tahap, yaitu [2] : 1. Analisis Pola Frequent Tahap pertama mencari kombinasi item atau itemset didalam database yang memenuhi nilai minimum support, yang diperoleh dari rumus berikut : Support(A) 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 = 𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 Kemudian untuk nilai support dari 2 item diperoleh dari rumus berikut : Support(A, B) = 𝑃(𝐴 ∩ 𝐵) 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵 = 𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 2. Pembentukan Kaidah Asosiasi Berikutnya mencari kaidah asosiasi yang memenuhi syarat nilai minimum confidence, dengan rumus sebagai berikut : Confidence = 𝑃(𝐴 → 𝐵) 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵 = 𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝐴 3.3 Market Basket Analysis Market Basket Analysis adalah salah satu tekhnik yang paling umum digunakan pada data mining, dimana tekhnik ini sering digambarkan sebagai keranjang belanja yang memuat item pembelian paling sering dibeli secara bersamaan oleh customer. Market basket analysis digunakan untuk mempermudah dalam memahami customer sebaik mungkin dengan cara memahami apa saja item yang paling sering mereka beli secara bersamaan, maka dari itu market basket analysis dapat dikatakan berpedoman dalam 3 entitas yaitu customer, order, dan item [3]. Maka dari itu tekhnik ini sangat tepat untuk menganalisis kebiasaan customer pada Agung Swalayan dalam rangka menentukan itemset promosi penjualan. Dengan memahami apa yang pembeli inginkan dan pembeli butuhkan maka promosi penjualan pada Agung Swalayan dapat menunjang penjualan serta meningkatkan loyalitas customer dan menarik pembeli baru atau calon pembeli didalam ketatnya persaingan yang ada. 3.4 Proses Penelitian Metode analisis yang digunakan dalam penelitian adalah salah satu metode dari fungsi asosiasi dalam data mining atau sering disebut sebagai Martket Basket Analysis dengan algoritma apriori. Data mining memiliki proses yang panjang, mulai dari pengumpulan data, seleksi data, cleaning data, transformasi data, data mining, implementasi dan yang terakhir adalah interpretasi & evaluasi. Setelah mengatahui proses utama dari data mining, maka peneliti dapat menentukan langkah-langkah yang dapat diambil untuk dapat menemukan kaidah asosiasi tanpa melewatkan proses utama dari data mining. Langkah-langkah yang digunakan peneliti adalah sebagai berikut : 1. Pengumpulan Data Transaksi Dalam penelitian ini menggunakan data utama yaitu berupa data transaksi penjualan mulai dari 1 mei 2015 s/d 30 september 2015 pada Agung Swalayan. 2. Seleksi Data Dari data yang diperoleh maka diseleksi terlebih dahulu data mana saja yang akan digunakan, dalam penelitian ini data yang akan digunakan adalah 20 produk kebutuhan sehari-hari. Sehingga akan diseleksi data yang mengandung 20 produk yang telah ditentukan diantaranya adalah Deterjen, Pasta Gigi, Sikat Gigi, Sabun Mandi, Sampo, Parfum, Obat Nyamuk, Pengharum Ruangan, Pembersih Lantai, Tisu, Teh, Minuman Bersoda, Kopi, Susu, Gula, Snack, Telur, Minyak Goreng, Tepung Terigu, Mie Instan . 3. Cleaning/ pembersihan Data Pada cleaning data dilakukan pemilihan atribut yaitu atribut nomor transaksi penjualan & nama barang, sehingga atribut yang tidak digunakan akan dihapus, selain itu juga dilakukan perbaikan untuk datadata yang rusak atau kurang tepat. 4. Transformasi Data Pada tahap transformasi adalah proses untuk mengintegraasikan data transaksi penjualan pada Agung Swalayan dengan RapidMiner, yaitu 5. 6. 7. 8. 9. diubah dalam bentuk tabulasi dengan ekstensi *.XLS (Ms. Excell). Sampling Data Pada tahap ini populasi yang ada akan dibuat sampel dengan menggunakan desain sampel nonprobabilitas judgement sampling. Kemudian menghitung sampel minimal dari populasi yang ada. Clustering (Pengelompokan) Setelah disampling serta dihitung jumlah sampel yang digunakan untuk mewakili populasi, maka dapat diteruskan dengan clustering atau pengelompokan data untuk dapat menambah kualitas data atau menambah nilai support dan nilai confidence. Data akan dikelompokan menjadi 2 yaitu data yang berkualitas dan juga data yang kurang berkualitas. Target Data Data yang berkualitas merupakan target data yang digunakan untuk menemukan kaidah asosiasi trasaksi penjualan pada Agung Swalayan. Data Mining Setelah data ditransformasikan dan juga dipilih maka akan dilakukan proses data mining untuk menemukan kaidah asosiasi yang dibutuhkan dengan menggunakan algortima apriori. Pada proses ini peneliti menghitung contoh transaksi secara konvensional tanpa menggunakan tools data mining. Interpretasi Dan yang terakhir adalah mengubah atau menterjemahkan pola-pola yang ditemukan kedalam bahasa yang lebih mudah untuk dipahami. Pada proses akhir dari peneitian ini biasanya disajikan dalam bentuk tabel, graph dan juga text untuk dapat ditarik sebuah kesimpulan atau hasil dari penelitian. Gambar 3.1 Metode Penelitian 4. HASIL PENELITIAN Gambar 4.1 Tabulasi Data Transaksi Gambar 4.2 Grafik Perbandingan Cluster Gambar 4.3 Implementasi Asosiasi pada RapidMiner Gambar 4.4 Interpretasi Tabel View Gambar 4.5 Interpretasi Graph View Gambar 4.6 Interpretasi Text View 5. KESIMPULAN Data mining sangat berguna untuk mengoptimalkan data transaksi penjualan yang ada pada Agung Swalayan dengan menggunakan kaidah asosiasi. Kaidah asosiasi dapat menemukan pola prilaku pembelian konsumen atau menemukan barang apa saja yang dibeli secara bersamaan oleh konsumen, sehingga dapat digunakan untuk membuat sebuah strategi penjualan dengan cara promosi atau diskon barang. Algoritma apriori merupakan salah satu metode yang tepat untuk menganalisis pola prilaku konsumen karena termasuk pada prosedur Market Basket Analysis , sehingga ditemukan pola pembelian konsumen pada Agung Swalayan seperti berikut : 1. Jika membeli Sampo maka membeli Sabun Mandi dengan nilai confidence 76.9% 2. Jika membeli Deterjen maka membeli Ssabun Mandi dengan nilai confidence 79.3% 3. Jika membeli Pasta Gigi maka membeli Sabun Mandi dengan nilai confidence 79.8% Dari pola pembelian konsumen yang telah didapatkan, maka peneliti memberi saran kepada pihak Agung Swalayan sebagai berikut : 1. Dari hasil penelitian yang didapat maka Agung Swalayan bisa melakukan product bundling berupa harga paket untuk 2 (dua) buah produk, yaitu Sampo & Sabun Mandi, Deterjen & Sabun Mandi, Pasta Gigi & Sabun Mandi. 2. Menaruh item yang ada pada 3 kaidah asosiasi yang telah ditemukan dengan jarak yang berdekatan. Sehingga customer maupun calon pembeli dapat dengan mudah menemukan barang yang dicari. DAFTAR PUSTAKA [1]. Nency M.N Togas, Jantje L. Sepang, and Rudy S Wenas, "Periklanan, Penjualan Pribadi, Promosi Penjalan Dan Publisitas Terhadap Keputusan Pembelian Pada Penerbit Andi Cabang Manado," ISSN: 23031174, vol. 2, pp. 578-488, Desember 2014. [2]. Emma Taufiq Luthfi Kusrini, Algoritma Data Mining, 1st ed.: Andi, 2009. [3]. Michael J.A Berry and Gordon S. Linof, Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management, 2nd Edition.: Wliey, 2004, ch. 9, pp. 287320. [4]. Dedy Suryadi, ST, M.S and Sani Susanto, Ph.D , Pengantar Data Mining, Nikodemus WK, Ed.: Andi, 2010. [5]. Kennedi Tampubolon, Hoga Saragih, and Bobby Reza, "Implementasi Data Mining Algoritma Apriori Pada Sistem Persediaan Alatalat Kesaehatan," ISSN: 2339-210X, vol. I, pp. 93-106, Oktober 2013. [6]. Prof. Mudrajad Kuncoro, Ph.D , , M.M. Wibi Hardani, Ed. jakarta, Indonesia: Erlangga, 2013, ch. 7. Pemilihan Sampel, pp. 117-143. [7]. Regina Yamin, "Peresepsi Nilai, Peresepsi Kualitas Dan Citra Perusahaan Terhadap Kepuasan Pelanggan Pada PT. Astra International Daihatsu Di Manado," ISSN: 23031174, vol. I No.3, pp. 1231-1240, September 2013. [8]. Lia Ambarwati, Denis Aprilia C, Donny Aji Baskoro, and I Wayan Simri Wicaksana, Belajar Data Mining Dengan Menggunakan Remi Sanjaya, Ed. RapidMiner, [9]. Popy Meliana, "Penerapan Data Mining Dengan Metode Klasifikasi Menggunakan Metode ," ISSN : 20851669, e-ISSN : 2460-0288, vol. VII No.1, Januari 2015. [10]. Dewi Kartika Pane, "Implementasi Data Mining Pada Penjualan Produk Elektronik Dengan Algortima Apriori (Studi Kasus: Kreditplus)," ISSN : 2301-9425, vol. IV No.3, Agustus 2013. [11]. Febriana Santi Wahyuni, Daniel O Siahaan, and Chastine Fatichah, "Penggunaan Cluster-Based Sampling Untuk Penggalian Kaidah Asosiasi Multi Objektif," ISSN: 0216-0544, vol. V No.1, pp. 59-67, Januari 2009. [12]. Nurdin and Dewi Astika, "Penerapan Data Mining Untuk Menganalisis Penjualan Barang Dengan Menggunakan Metode Apriori Pada Supermarket Sejahtera Lhoksumawe," Techsi, vol. VI No.1, pp. 133-155, April 2015. [13]. Ralfi Klinkenberg, Ingo Mierswa, and Simon Fischer. RapidMiner Tutorial. [Online]. http://docs.rapidminer.com/studio/gettin g-started/4-applying-model.html [14]. Christian Borgelt. (2015, Oct.) Apriori. [Online]. http://www.borgelt.net/doc/apriori/aprio ri.html [15]. Tan, Stinbach, and Kumar. (2016, Jan.) Clustering at Data Mining. [Online]. https://wwwusers.cs.umn.edu/~kumar/dmbook/dmsl ides/chap8_basic_cluster_analysis.pdf [16]. J. Delayne Stroud. (2015, Dec.) Basic Sampling Strategies: Sample Vs Population Data. [Online]. http://www.isixsigma.com/toolstemplates/sampling-data/basicsampling-strategies-sample-vspopulation-data/ [17]. Kurt Thearling. (2015, Oct.) An introduction to Data Mining. [Online]. http://www.thearling.com/text/dmwhite/ dmwhite.htm