Implementasi Algoritma Association Rule Dan K-Means Sebagai Sistem Rekomendasi Produk Pada Website Penjualan Online Teguh Iman Hermanto Teknik Informatika, Sekolah Tinggi Teknik Wastukancana Email : [email protected] Abstrak Penelitian ini membahas tentang pengolahan data transaksi pembelian dan data pelanggan untuk menghasilkan sebuah informasi yang dapat membantu pengambilan keputusan dalam meningkatkan penjualan dengan memberikan sistem penawaran barang. Penelitian ini didasarkan adanya masalah pada sistem penjualan online yang belum memiliki sistem penawaran barang yang sesuai dengan karakteristik pembeli. Metode yang digunakan pada penelitian ini adalah pengolahan data transaksi pembelian menggunakan algoritma Association Rule dan pengolahan data pelanggan menggunakan K-Means clustering. Pengolahan data transaksi dilakukan dengan menentukan nilai support dan confidence sebagai nilai kepastian dari pola data pembelian yang dihasilkan. Pengolahan data pelanggan dilakukan dengan menentukan nilai Recency, Frequency, dan Monetary sebagai variabel untuk menentukan segmentasi pelanggan. Hasil dari penelitian ini adalah pengolahan data menggunakan algoritma Association Rule dengan nilai optimal confidence dan support sebesar 8% dan pengolahan data pelanggan menggunakan algoritma K-Means dengan nilai below zeros sebanyak 2 pelanggan, nilai migrator sebanyak 6 pelanggan, nilai most growable sebanyak 97 pelanggan, dan nilai most valuable sebanyak 31 pelanggan. Kata kunci : Association Rule, Confidence, Support, K-Means clustering, RFM 1. Pendahuluan Peningkatan kebutuhan informasi yang dapat digunakan sebagai sistem pengambilan keputusan bisnis sangatlah dibutuhkan oleh para manager pemilik perusahaan. Seorang manager membutuhkan sebuah sistem yang dapat mengolah sekumpulan data yang tersimpan di dalam media penyimpanan untuk dijadikan sebuah pengetahuan baru yang dapat mendukung sebuah keputusan bisnis (Wen dkk., 2012). Bisnis cerdas sangat dibutuhkan dalam sebuah sistem yang sedang dimplemenasikan di dalam menunjang sebuah kegiatan bisnis di dalam sebuah perusahaan. Tujuan bisnis cerdas adalah untuk mengolah data yang sangat banyak menjadi memiliki nilai bisnis melalui laporan analistik. Oleh karena itu diperlukan sebuah sistem yang mampu memilah dan memilih data, sehingga dapat diperoleh informasi yang berguna bagi penggunanya (Cakir dan Aras, 2012). Bisnis cerdas dapat diterapkan dalam sebuah sistem penjualan online sehingga manager dapat mengetahui banyak informasi yang digunakan sebagai pendukung keputusan dalam mengelola perusahaan. Kecerdasan bisnis yang diterapkan dapat dikembangkan sesuai dengan kebutuhan manager dalam mengelola perusahaan (Liao dkk., 2012). Penelitian ini dilakukan dengan membangun sebuah sistem penjualan online dengan fitur analisis keranjang pasar yang dapat menemukan aturan asosiatif dengan memanfaatkan data tranasaksi terkait dengan daftar pembelian produk yang dibeli oleh 33 konsumen. Dari hasil analisis asosiasi inilah terbentuk sebuah aturan yang digunakan sebagai alat untuk merekomendasikan barang sesuai dengan kebutuhan customer. 2. Kerangka Teori 2.1 Association Rule Analisis asosiasi atau Association Rules didefinisikan sebagai suatu proses untuk menemukan semua aturan asosiatif yang memenuhi syarat minimum untuk support dan syarat minimum confidence pada database. Metodologi dasar analisis Apriori terbagi menjadi dua tahap, yaitu : a. Analisa Pola Frekuensi Tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan persamaan 2.1 berikut : () (2.1) Pada persamaan2.1 menjelaskan bahwa nilai support diperoleh dengan cara mencari jumlah transaksi yang mengandung nilai A (satu item) dibagi dengan jumlah keseluruhan transaksi. Sedangkan nilai support dari 2-item diperleh dari rumus berikut : ( ) √( ) ( ) ( ) b. Analisa pembentukan aturan asosiasi ( ) (2.2) 2.3 Segmentasi Pelanggan Pada persamaan 2.2 menjelaskan bahwa nilai support diperoleh dengan cara mencari jumlah transaksi yang mengandung A dan B (item pertama bersamaan dengan item lain) dibagi dengan jumlah keseluruhan transaksi. c. Pembentukan aturan asosiatif Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk nilai confidence dengan menghitung nilai confidence aturan assosiatif A confidence dari aturan A persamaan berikut: ( ) B Nilai B diperoleh dari ( ) Persamaan 2.3 menjelaskan bahwa nilai confidence diperoleh dengan cara mencari jumlai transaksi yang mengandung A dan B dibagi dengan jumlah transaksi yang mangandung nilai A. 2.2 Algoritma K-Means Algoritma K-Means pertama kali dipublikasikan oleh Stuart Lloyd pada tahun 1984 dan merupakan algoritma clustering yang banyak digunakan. Algoritma K-Means bekerja dengan mensegmentasi objek yang ada kedalam kelompok atau yang disebut dengan segmen sehingga objek yang berada dalam masing-masing kelompok lebih serupa satu sama lain dibandingkan dengan objek dalam kelompok yang berbeda. K-Means bekerja dengan pendekatan Top-Down karena memulai dengan segmentasi yang sudah ditentukan terlebih dahulu (Myatt, 2007). Sehingga hasil data sebuah segmen tidak mungkin tercampur antara satu segmen dengan segmen lainnya (Xu dan Wunsch, 2009). Pendekatan ini juga mempercepat proses komputasi untuk data dalam jumlah besar. Perhitungan jarak antar titik dengan menggunakan Euclidean distance dapat dilakukan pada titik dalam satu dimensi, dua dimensi, maupun 3 dimensi. Formula Jarak antar dua titik dalam satu, dua dan tiga dimensi secara berurutan ditunjukkan pada persamaan berikut ini. (2.4) ) √( ( ) √( ) ( ) Segmentasi merupakan proses mengidentifikasi dan memilah-milah konsumen kedalam kelompokkelompok pembeli yang dirasa memiliki kebutuhan atau keinginan atas produk atau jasa yang diberikan (Kotler, 2004) Don Pepper dan Martha Roger dalam bukunya “Managing Customer Relationship : A Strategic Framework”. Melakukan kategorisasi pelanggan sebagai berikut: a. Most Valuble Customer (MVC), yaitu pelanggan dengan nilai paling tinggi bagi perusahaan. Pelanggan yang termasuk dalam kategori ini adalah pelanggan yang seharusnya menjadi perhatian perusahaan. Hal ini dikarenakan pelanggan kategori MVC memberikan keuntungan terbesar bagi perusahaan. b. Most Growable Customer, yaitu pelanggan yang tanpa disadari memiliki potensi besar. c. Below Zeros, yaitu pelanggan yang memberikan keuntungan lebih sedikit daripada biaya untuk memberikan pelayanan. d. Migrators, yaitu pelanggan yang berada pada posisi diantara below zeros dan most growable customer dan perlu dianalisis agar dapat diketahui kategori asalnya (Pepper & Roger, 2004). 2.4 RFM model Sebuah model untuk segmentasi pelanggan dapat diusulkan menjadi sebuah model, yaitu RFM model, yang dapat digunakan untuk mengukur customer value. Disebutkan pula bahwa analisis RFM merupakan salah satu cara yang dapat digunakan untuk mengetahui pelanggan-pelanggan potensial. Model RFM diaplikasikan secara luas pada database pemasaran dan merupakan tool yang umum digunakan untuk membangun strategi pemasaran. (Wei, 2010). RFM berdasarkan segmentasi pelanggan menghasilkan kemampuan segmentasi antara 75% sampai 85%. Berikut ini adalah penjelasan mengenai RFM menurut Cheng dan Chen (2009): 1. Recency, yaitu kapan transaksi terakhir dilakukan 2. Frequency, tingkat keseringan pelanggan melakukan transaksi. Misalkan sekali transaksi tiap bulan, atau 2 kali dalam satu tahun 3. Monetary, besarnya nilai transaksi yang dilakukan (2.5) Penerapkan RFM analysis untuk menentukan segmentasi pelanggan pada salah satu perusahaan elektronik penyedia power supply. Sementara itu, D. (2.6) 34 Christodoulakis melakukan penelitian mengenai penerapan RFM untuk menentukan customer value dari pelanggan e-banking. 3. Metodologi 100% 3.1 Prosedur Penelitian 80% Prosedur penelitian pada penelitian ini dimulai dengan mengidentifikasi masalah, kemudian dilanjutkan dengan studi pustaka, pengumpulan data, dan pengolahan data. Pada pengolahan data, terdapat dua proses pengolahanyaitu pengolahan data pelanggan menggunakan K-Means Clustering dan pengolahan data transaksi menggunakan Apriori Algorithm.hasil dari dua pengolahan berupa segmentasi pelanggan dan kumpulan aturan asosiasi pembelian produk yang divisualisasikan dalam bentuk dashboard, seperti pada Gambar 3.1 berikut : 60% Precision 40% Recall 20% F-Measure 0% 5% 6% 7% 8% 9% Gambar 4.1 Hasil Pengukuran Performa Asosiasi Identifikasi masalah 4.2 Hasil Pembentukan Segmentasi Pengumpulan Data Pada pengujian analisis clustering menggunakan metode RFM ditemukan 4 cluster yaitu migrator, most growble, below zeros, dan most valuable. Masingmasing cluster terdapat data pelanggan yang masuk ke dalam cluster tersebut yang nantinya tabel cluster akandihitung nilai precision dan nilai recall untuk mengetahui performa dari masing-masing cluster. Hasil dari pengolahan segmentasi pelanggan dapat dilihat pada Gambar 4.2. Data Mining K-Means Clustering Segmentasi Pelanggan Association Rule Analisis Pembelian Aturan Asosiasi Pembelian Dashboard Gambar 3.1 Prosedur Penelitian Pada proses data mining terdapat dua proses pengolahan data, yaitu data pelanggan menggunakan algoritma K-Means clustering dan data transaksi pembelian menggunakan algoritma Apriori. Data pelanggan yang diolah menggunakan algoritma KMeans Clustering menghasilkan sebuah data segmentasi pelanggan yang berfungsi untuk membagi kategori pelanggan sesuai dengan metode RFM (Recency, Frequency, dan Monetary). Data transaksi pembelian yang diolah menggunakan algoritma Apriori berfungsi untuk menghasilkan sebuah pola transaksi pembelian yang dilakukan oleh konsumen sehingga sistem penjualan dapat melakukan rekomendasi produk yang akan dibeli konsumen sesuai data pola transaksi yang dihasilkan. 4. Gambar 4.2 Hasil Segmentasi Pelanggan 5. Kesimpulan Berdasarkan dari proses pengolahan data transaksi menggunakan metode association rule dan proses pengolahan segmentasi data pelanggan menggunakan metode K Means clustering dapat disimpulkan penerapan metode asosiasi dalam mengolah data transaksi yang dilakukan oleh pelanggan dapat membantu sistem dalam membentuk pola frequent itemset yang berfugsi untuk sistem penawaran barang agar dapat meningkatkan penjualan barang ke konsumen. Penerapan metode K-menas clustering dalam mengolah data pelanggan berdasarkan recency, frequancy, dan monetary dapat membentuk sebuah cluster atau pengelompokan pelanggan menjadi empat kelompok yaitu migrator, most growable, below zeros, dan most valuable. Pengelompokan pelanggan dapat membantu sistem untuk mempelajari intensitas Hasil dan Pembahasan 4.1 Hasil Pembentukan Asosiasi Pada pengujian analisis asosiasi dilakukan proses pengujian pada data transaksi penjualan barang menggunakan lima kali perbandingan nilai support dan nilai confidence sebesar 5%, 6%, 7%, 8%, dan 9% (Hsu dkk., 2004). Hasil pengolahan data transaksi melalui beberapa tahap yaitu pembentukan kandidat itemset dan pengukuran frequent itemset.Untuk grafik hasil pengujian performa analisis asosasi dapat dilihat pada Gambar 4.1. 35 pelanggan dalam melakukan transaksi pembelian pada sistem penjualan online. Daftar Pustaka Ahn, K., 2012, Effective Product Assignment Based on Association Rule Mining in Retail. Expert System With Applications, 1255112556. Berry, M., J., dan Linoff, G., S., 2004, Data Mining Techniques For Marketing, Sales, Customer Relationship Management Second Editon, Wiley Publishing. Cakir, O., & Aras, 2012, A Recomendation Engine by Using Association Rules, Procedia – Social and Behavioral Sciences 62, 452 – 456. Deypir, M., dan Sadreddini, M., H., 2012, A Dynamic Layout of Sliding Window for Frequent Itemset Mining Over Data Streams, The Journalof System and Software 85, 746-759. Dongwon, L., Park, S., H., dan Moon, S., 2013, Utility-Based Association Rule Minin : A Marketing Solution for CrossSelling, Expert Systems With Applications 40, 2715-2725. Hsu, P., Y., Chen, Y., L., dan Ling, C., C., 2004, Algorithms for mining association rules in bag databases, Information Sciences 166 31-47. Kim, Y, S, & Yum B., J., 2011, Recomender Systembased On Click Stream Data Using Association Rule Mining, Expert systems with applications 38, 13320-13327. Kuo, R., J., Chao, C., M., dan Chiu, Y., T., 2011, Application of Particle Swarm Optimization to Association Rule Mining. Applied Soft Computing 11, 326–336. Larose, D., T., 2005, Discovering Knowledge in Data: an Introduction to Data Mining, John Willey & Sons. Liao, S., H., Chu, P., H., Chen, Y., J., dan Chang C., C., 2012, Mining Customer Knowledge for Exploring Online Group Buying Behavior, Expert System With Applications 39, 37083716. Pepper, D., dan Roger, M., 2004, managing customer relationship, John Willey & Sons, Inc. Roy, D., K., dan Sharma., L., K., 2010, Genetic K-Means Clustering Algorithm for Mixed Numeric and Categorical Data Sets, International Journal of Artificial Intelegence & Applications (IJAIA) vol.1, 2333-9721. Shweta, T., Bharadwaj, K., K., 2012, Enhanced New User Recomendations Based on Quantitative Association Rule Mining. Procedia Computer science 10, 102-109. Taniar, D., Rahayu, W., Lee, V., Daly, O., 2008, Exception Rules in Association Rule Mining, Applied Mathematics and Computation 205, 735–750. Turban, E., Aronson, J., E., Liang, T., P., 2005, Decision support system and intelligent systems, Andi Offset. Vipin Kumar, V., Tan, P., N., Steinbach, M., 2006, Introduction to Data Mining Edisi 1, Pearson Education. Voditel, P., P., & Deshpande, U., 2013, A Stock Market Portofolio Recomender System Based on Association Rule Mining. Applied Soft Computing 13, 1055 – 1063. Wei, J., T., Lin, S., Yen.,dan Wu, H., H., 2010, A review of the application of RFM model, African Journal ofBusiness Management Vol. 4(19), Pp. 4199-4206. Wen, C., H., Liao, S., H., Chang, W., L., Hsu, P., Yu., 2012, Mining Shopping Behavior In The Taiwan Luxury Products Market, Expert System With Applications 39, 11257-11268. Witten, I., H., Eibe, F., dan Hall, M., A., 2011, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier. 36