PERANCANGAN WEB E-COMMERCE TERINTEGRASI DENGAN MARKET BASKET ANALYSIS Imelda, Erwanda, Try Permatasari, Rhio Sutoyo Fakultas Ilmu Komputer Universitas Bina Nusantara Jl. K.H. Syahdan No. 9, Kemanggisan/Palmerah, Jakarta 11480 [email protected] ABSTRAK E-commerce merupakan salah satu sektor yang paling berkembang pesat seiring dengan perkembangan teknologi Internet. Namun, banyak website e-commerce masih memiliki fitur standar tanpa perancangan sistem yang memungkinkan usaha itu untuk menjual produk lebih banyak dengan praktik cross-selling untuk meningkatkan probabilitas keuntungan dan interest pembeli untuk kembali melakukan pembelian. Mengamati kondisi tersebut, perancangan web e-commerce yang terintegrasi dengan market basket analysis sebagai basis untuk praktik cross-selling dilakukan. Web dikembangkan dengan studi literatur, analisis algoritma sejenis, dan wawancara dan kuisioner sebagai metode analisis serta metode waterfall yang terdiri dari communication, planning, modeling, construction, dan deployment sebagai metode pengembangan aplikasi. Hasil yang dicapai adalah sebuah web yang dapat memberikan rekomendasi produk-produk tambahan yang terkait dengan produk utama yang sedang dilihat atau telah dibeli. Rekomendasi diperoleh dengan data mining dari transaksi yang telah ada selama tiga tahun terakhir. Simpulan yang diperoleh adalah penggunaan data mining pada rekomendasi “Frequently Bought Together”, “Customer Who Bought This Also Bought”, dan “Recommended Products” sudah sesuai dengan harapan pengguna. Kata kunci: web, e-commerce, sistem rekomendasi, cross-selling, data mining ABSTRACT E-commerce is one of the most rapidly growing sectors with the development of Internet. However, most of e-commerce websites still has the standard features without a system that enables the business to sell more products by cross-selling support to increase the probability of getting more profit and interest of buyers to re-purchase. Observing these conditions, designing an e-commerce web integrated with market basket analysis as a base for cross-selling support can be considered as a solution. The web developed by literature study, similar algorithm analysis, and interview and questionnaire analysis as the analysis methods and waterfall model which consists of communication, planning, modeling, construction, and deployment as an application development method. The result is a web that can give additional products recommendation associated with the main product which is being seen or been purchased. The recommendation obtained by data mining from the available transactions for the last three years. The conclusion is the implementation of data mining on the recommendation of “Frequently Bought Together”, “Customer Who Bought This Product Also Bought”, and “Recommended Products” has been running as user expectations. Keyword: web, e-commerce, recommendation system, cross-selling, data mining 1. PENDAHULUAN Peningkatan kualitas pelayanan informasi telah mendorong perkembangan teknologi informasi dalam menyajikan informasi dan komunikasi secara luas. Banyak investasi waktu dan ruang dalam pengembangan website sebagai salah satu media penyajian informasi yang paling berkembang. Perkembangan website telah memengaruhi gaya hidup masyarakat yang semakin sadar akan kemudahan dan pentingnya penggunaan teknologi tersebut. Oleh sebab itu, tak bisa dipungkiri jika teknologi telah mengubah perilaku konsumen dalam melakukan transaksi komersil. E-commerce merupakan salah satu sektor yang paling berkembang pesat seiring dengan perkembangan teknologi Internet. Indonesia baru-baru ini dinamai oleh para pemimpin bisnis global sebagai key market untuk diperhatikan pada tahun 2013. Sebuah survei tahunan oleh Economist Corporate Network menyorot Indonesia sebagai negara bisnis yang memiliki pengaruh yang besar dan tidak dapat diabaikan. Indonesia berada pada posisi ketiga dalam daftar “where companies would be increasing investment,” setelah Cina dan India (Sugden, 2013). E-commerce di Indonesia telah tumbuh pesat dalam beberapa tahun terakhir dan ini diperkirakan akan terus berlanjut. Penelitian oleh Veritrans dan Daily Social (dalam sebuah proyek di Harvard Business School) memperkirakan bahwa pasar e-commerce saat ini bernilai 0,9 milliar dollar US. Mereka memprediksi nilai ini akan melambung menjadi 10 miliar dollar US pada tahun 2015. Hal berjalan berdasarkan kenaikan penggunaan internet, dengan jumlah pengguna hampir tiga kali lipat dari 55 juta sampai 149 juta pengguna (Sugden, 2013). Tren ini menuntut industri di Indonesia untuk mulai memanfaatkan berbagai macam teknologi untuk memudahkan para konsumen. Para pelaku bisnis Usaha Mikro, Kecil, dan Menengah (UMKM) juga tak boleh ketinggalan. Guna mendukung kesiapan para pelaku bisnis UMKM dalam menghadapi era Asean Economy Community (AEC) dan globalisasi. Akan tetapi, banyaknya e-commerce di Indonesia kurang dipadani dengan penggunaan sistem analisis yang sesuai untuk meningkatkan strategi pemasaran yang efektif untuk meningkatkan jumlah penjualan yang berkelanjutan. Oleh karena itu, beberapa metode analisis pemasaran dan manajemen hubungan pelanggan harus diintegrasikan. Pola-pola analisis tertentu dapat diciptakan dari pengumpulan data berdasarkan aliran data yang tercipta saat proses transaksi terjadi. Interaksi pelanggan dengan bisnis melalui transaksi telah melahirkan data-data tertentu yang sangat bernilai bila dilakukan analisis lebih lanjut untuk mengetahui interest pengguna terhadap produk yang ada. Analisis itu dapat dilakukan dengan teknikteknik data mining. Market basket analysis adalah suatu proses yang menganalisis kebiasaan pembelian pelanggan dengan menemukan asosiasi antar-item yang berbeda dalam keranjang belanja pelanggan (Han dan Kamber, 2006, p228). Informasi ini sangat berguna bagi bisnis e-commerce dapat melakukan crossselling, yaitu konsep penjualan yang menggunakan produk utama sebagai pemicu ketertarikan pembeli untuk melakukan pembelian selanjutnya untuk produk lain yang berkaitan dengan produk utama. Banyak bisnis e-commerce berskala kecil maupun besar, seperti Bhinneka.com (http://www.bhinneka.com) dan Lazada.com.my (http://www.lazada.com.my) belum memanfaatkan analisis ini untuk menambah profit usaha dengan praktik cross-selling dan minat pembeli untuk berbelanja produk lain yang mungkin berhubungan dengan produk yang sedang dilihat atau telah dibeli. Berdasarkan latar belakang di atas, beberapa masalah terjadi, yaitu tidak tersedianya analisis untuk membantu cross-selling, keterbatasan sistem analisis yang terintegrasi dengan e-commerce sebagai sarana rekomendasi produk bagi pengguna sekaligus sebagai pendorong peningkatan penjualan, dan kurangnya implementasi sistem personalisasi. Berdasarkan masalah-masalah tersebut, web e-commerce dikembangkan dengan fitur rekomendasi produk untuk pemilik usaha kecil dan menengah, yaitu Christie’s Galleries. Tujuan dibuatnya sistem rekomendasi pada web e-commerce yang terintegrasi dengan market basket analysis adalah mengimplementasikan sistem rekomendasi pada usaha kecil dan menengah yang berbasis online yang hanya memiliki data penjualan sederhana untuk dianalisis, menyediakan sarana cross-selling yang terintegrasi langsung dengan website sebagai sarana penjualan dan peningkatan interest user untuk berbelanja karena ketersediaan akomodasi bagi user untuk mengeksplorasi keterkaitan suatu produk dengan produk lain, dan menyajikan kemampuan rekomendasi produk terpersonalisasi berdasarkan analisis transaksi pengguna. 2. METODE PENELITIAN Proses data mining berdasarkan CRISP-DM (Cross Industry Standard Process for Data Mining). Menurut Nisbet et al. (2009:35-36), metode CRISP-DM mendefinisikan hirarki yang terdiri dari fase utama, tugas umum dan khusus, dan contoh proses. Proses data mining berdasarkan CRISP-DM terdiri dari enam fase sebagai berikut: 1. Business Understanding Pemahaman bisnis yang dijalankan oleh Christie’s Galleries berguna untuk menganalisis definisi masalah data mining dan pendekatan pemecahan masalah. Hal ini dilakukan semata-mata untuk memahami tujuan bisnis dengan benar untuk memastikan bahwa perancangan data mining yang dilakukan dapat memberikan pengetahuan dan informasi yang tepat sebagai hasil rekomendasi produk-produk yang dapat ditampilkan pada web pages. Tabel 1. Permasalahan Data Mining 2. Data Understanding Tahap berikutnya setelah permasalahan bisnis dibentuk menjadi permasalahan data mining adalah pengumpulan dan pemilihan sumber data yang akan dibentuk sebagai sumber pembuatan model data mining. Gambar 1. Star Scheme Data Mart Penjualan 3. Data Preparation Pada tahap data preparation, pemilihan informasi yang ada di dalam data mart yang berhubungan dan akan digunakan dalam pembuatan model data mining dilakukan. A. View vBoughtProduct View vBoughtProduct digunakan untuk memastikan hanya data-data produk yang ada pada SalesFact saja yang diolah. CREATE VIEW vBoughtProduct AS SELECT (ROW_NUMBER() OVER(ORDER BY productcode)-1) AS row, productcode, productid FROM ProductDimension a WHERE EXISTS(SELECT timeid FROM SalesFact b WHERE b.productcode = a.productcode) B. View vBuyingMember View vBuyingMember digunakan untuk memastikan hanya data-data pelanggan yang ada pada SalesFact saja yang diolah. CREATE VIEW vBuyingMember AS SELECT membercode, memberid FROM MemberDimension a WHERE EXISTS(SELECT timeid FROM SalesFact b WHERE a.membercode = b.membercode) C. View vSameTimeBought View vSameTimeBought dibuat untuk mendukung analisis produk-produk yang dibeli secara bersamaan dalam suatu transaksi. CREATE VIEW vSameTimeBought AS SELECT DISTINCT t1.timeid, t1.membercode, productid = CAST('{' + SUBSTRING ( (SELECT ', ' + CAST(row AS VARCHAR)+' t' AS [text()] FROM vBoughtProduct v, SalesFact t2 WHERE t2.timeid = t1.timeid and t2.membercode = t1.membercode AND v.productcode = t2.productcode GROUP BY row ORDER By row FOR XML PATH(''), ELEMENTS), 3, 100 ) + '}' AS VARCHAR) FROM SalesFact t1 4. Modeling A. Produk yang Sering Dibeli Bersamaan Pada tahap ini, pembuatan model data mining dilakukan sesuai dengan algoritma yang dipilih. Untuk produk yang dibeli bersamaan, algoritma yang digunakan adalah FPGrowth untuk mencari association rules yang baik untuk setiap produk. Menurut Vivekananth (2012:79), salah satu algoritma association rule mining yang sangat berpengaruh adalah Apriori. Pengembangan Apriori telah banyak dilakukan dan FP-Growth merupakan salah satunya. FP-Growth dianggap sebagai suatu kemajuan besar dalam perbaikan kinerja dari Apriori. Algoritma ini dibuat dengan struktur data yang dikenal sebagai frequent-pattern tree atau FP-tree. Menurut Han dan Kamber (2006:243), Frequent Patttern Growth Algorithm atau yang biasa disebut dengan FP Growth Algorithm adalah suatu algoritma yang mengkompres database yang merepresentasikan frequent item ke dalam frequent pattern tree (FP tree). Karena perangkat lunak data mining yang dipilih untuk mendapatkan pola yang dibutuhkan adalah Weka, input data yang digunakan untuk analisis harus sesuai dengan format yang bisa dikenali Weka. Menurut Witten et al. (2011:403), Weka adalah aplikasi berbasis Java yang bersifat open source untuk data mining. Weka mengenal input file berekstensi ARFF (Atribute-Relation File Format). Untuk itu, view vSameTimeBought yang menjadi data sumber harus diolah menjadi bentuk ARFF yang sesuai dengan standar format Weka. Proses pembentukan file ARFF yang dibutuhkan memanfaatkan fungsi PHP untuk membaca isi view vSameTimeBought, kemudian membentuk format yang sesuai, dan menyimpan hasilnya ke dalam bentuk ARFF. Gambar 4.1 menunjukan hasil file ARFF dari data sumber vSameTimeBought. Nilai ‘t’ menyatakan bahwa produk tersebut dibeli pada transaksi tersebut. Pada Weka, penyusunan data berdasarkan index, misalnya ‘{0 t}’ berarti productid ‘BA001’ dibeli pada transaksi tersebut. Gambar 2. Format File Input Weka B. Pelanggan yang Membeli Produk Ini juga Membeli Produk Lain Penghitungan lift dari setiap produk terhadap produk lain dapat dilakukan untuk mendapatkan hasil rekomendasi yang diinginkan. Keterikatan produk satu dengan produk lain dapat dihitung dengan selisih nilai lift dengan logical rule = 1/support(B), artinya jika terdapat tiga produk A, B, dan C dengan nilai lift produk A dan B adalah 3,2; nilai support(B) = 2 (logical rule = 1/2) dan lift A dan C adalah 3,0, dan nilai support(C) = 1 (logical rule = 1), maka jika produk A dipilih pelanggan, maka rekomendasi produk C memiliki kemungkinan lebih besar untuk dipilih karena selisih lift dengan nilai logical rule lebih kecil. C. Prediksi Produk yang Diinginkan Pelanggan Berdasarkan Kesamaan Produk dengan Produk yang Telah Dibeli Algoritma yang dapat dipakai untuk menghitung nilai kesamaan antara dua produk dengan menggunakan metode Tanimoto. Menurut Owen et al. (2012:54), Tanimoto coefficient adalah perbandingan ukuran antara intersection dua barang yang disukai pengguna dengan union kedua barang tersebut. Setelah nilai kesamaan dihitung, maka nilai ini akan sangat berguna untuk menghitung nilai prediksi preferensi seorang pelanggan yang telah membeli barang dengan mengakumulasikan nilai kesamaan tiap-tiap produk dengan produk-produk yang dibeli. Hasilnya, nilai prediksi yang terbesar akan ditampilkan sebagai personalisasi rekomendasi kepada pelanggan tersebut. Perhitungan nilai kesamaan Tanimoto dilakukan dengan sintaks PHP dan hasilnya dimasukkan ke dalam database agar sistem dapat mengimplementasikan langsung hasil tersebut. Misalnya, perhitungan nilai kesamaan antara ‘BA001’ dan ‘GL017’ dapat dilakukan dengan: T(a, b) = Ket: Nc adalah jumlah member yang membeli produk a dan b Na adalah jumlah member yang membeli produk a Nb adalah jumlah member yang membeli produk b Misalnya, jumlah member yang membeli produk ‘BA001’ dan ‘GL017’ adalah satu orang, membeli ‘BA001’ adalah satu orang, dan membeli ‘GL017’ adalah lima orang. Nilai kesamaan ‘BA001’ dan ‘GL017’ menjadi: T(BA001, GL017) = 1 / (1 + 5 + 1) = 0,1429 Hasil nilai rekomendasi ditentukan melalui cara distributed item-based algorithm. Misalnya, perhitungan nilai rekomendasi dari produk ‘SH052’ untuk member ‘M000001’. Kode produk pada tabel 4.13 menunjukkan produk-produk yang dibeli member ‘M000001’. Pertama-tama, produk-produk yang dibeli oleh member tersebut dicari dengan nilai kesamaan Tanimoto antara produk yang dibeli dengan produk ‘SH052’. Setelah itu, hasil nilai kesamaan dari produk-produk yang dibeli dengan produk ‘SH052’ dijumlah sebagai nilai rekomendasi. Hasilnya dapat dilihat pada tabel 4.13. Perhitungan nilai rekomendasi dilanjutkan dengan produk-produk yang lain dengan cara yang sama. No. 1 2 3 4 5 6 7 Nilai Kesamaan dengan Produk ‘SH052’ SH019 0,0698 SH047 0,0513 SH063 0 SA003 0,0484 SH005 0,0357 SH021 0,0667 SH020 0 Total 0,2719 Tabel 2. Hasil Nilai Kesamaan Kode Produk Pada implemetasi sistem, PHP akan membaca view vBoughtProduct untuk menghitung kombinasi nilai kesamaan dari masing-masing pasangan produk kemudian memasukkan nilai-nilai tersebut ke database. Setelah itu, jika pelanggan tertentu melakukan transaksi, maka sistem akan mencari produk-produk yang telah dibeli oleh pelanggan dan mengakumulasi nilai-nilai kesamaan dengan produk-produk lain, kemudian hasil-hasilnya akan disimpan ke dalam database. Sistem hanya perlu melakukan penyaringan banyaknya produk yang akan ditampilkan kepada pelanggan tersebut. 5. Evaluation Tahap evaluasi dilakukan dengan mengganti min support dan min confidence untuk menghasilkan jumlah rule yang diinginkan. 6. Deployment Pada tahap ini, perancangan web page yang akan menampilkan hasil rekomendasi berdasarkan rule dan nilai-nilai yang telah ada di dalam database dapat dilakukan. Web page dirancang menggunakan PHP, HTML, JavaScript, dan CSS. a. Frequently Bought Together Gambar 3. Contoh Rekomendasi “Frequently Bought Together” pada Sistem b. Customer Who Bought This Product Also Bought Gambar 4. Contoh Implementasi “Customer Who Bought This Product Also Bought” pada Sistem c. Recommended Products Gambar 5. Contoh Tampilan “Recommended Products” pada Sistem 3. HASIL DAN EVALUASI 3.1 HASIL Hasil dari integrasi data mining dengan web e-commerce adalah sistem rekomendasi, yaitu “Frequently Bought Together”, “Customer Who Bought This Product Also Bought”, dan “Recommended Products”. “Frequently Bought Together” adalah rekomendasi produk yang sering dibeli secara bersamaan dengan produk tersebut. “Customer Who Bought This Product Also Bought” adalah rekomendasi produk untuk member berdasarkan produk yang dibeli oleh customer atau member lain yang juga pernah membeli produk tersebut. “Recommended Products” adalah produkproduk yang direkomendasikan berdasarkan data history produk-produk yang telah dibeli dan ditampilkan pada home page. Gambar 5. Sistem Rekomendasi “Frequently Bought Together” dan “Customer Who Bought This Product Also Bought” Gambar 6. Sistem Rekomendasi “Recommended Products” 3.2 EVALUASI Evaluasi aplikasi dilakukan dengan kuesioner dan membandingkan algoritma fp-growth dengan algoritma apriori. Kesimpulan hasil evaluasi fitur-fitur rekomendasi dari data-data yang telah diisi responden pada kuesioner evaluasi adalah sebagai berikut: a. 84% responden setuju dengan kecocokan produk yang direkomendasikan untuk produk yang ditampilkan setelah ditunjukkan produk pada rekomendasi “Frequently Bought Together”. b. Evaluasi rekomendasi “Customers Who Bought This Item Also Bought” dilakukan dengan perhitungan precision, recall, dan F1 score. Hasil evaluasi menunjukkan hasil yang cukup memuaskan dengan rata-rata precision 0,80, recall 0,69, dan F1 score 0,70. c. “Recommended Products” dievaluasi dengan mengambil contoh seorang member yang telah membeli produk-produk dan meminta responden menilai “Recommended Products” berdasarkan produk-produk yang telah dibeli tersebut. Nilai precision, recall, dan F1 score dihitung, Hasil evaluasi menunjukkan hasil yang cukup memuaskan dengan rata-rata precision 0,74, recall 0,78, dan F1 score 0,75. Evaluasi sistem yang dilakukan adalah peninjuan penggunaan algoritma FP-Growth dengan Apriori yang mencakup pengukuran waktu yang dibutuhkan untuk mendapatkan association rules dengan Weka dan hasil dari masing-masing algoritma untuk diimplementasikan pada sistem rekomendasi “Frequently Bought Together”. Gambar 7. Perbandingan Waktu Eksekusi Berdasarkan Minimum Support Gambar 8. Perbandingan Waktu Eksekusi Berdasarkan Minimum Confidence Kesimpulan yang dapat ditarik berdasarkan hasil perbandingan waktu eksekusi masing-masing algoritma untuk menggali association rules adalah algoritma FP-Growth terbukti sangat unggul pada kecepetan eksekusi. Perbedaan kecepatan eksekusi FP-Growth dengan Apriori semakin jauh ketika minimum support semakin rendah dan perbedaan kecepatan cenderung sama saat minimum confidence semakin rendah. 4 SIMPULAN DAN SARAN Berdasarkan analisis hasil evaluasi pada web Christie’s Galleries, dapat disimpulkan: 1. Sistem rekomendasi telah berjalan sesuai dengan harapan penguna dalam menampilkan produkproduk tambahan yang berkaitan dengan produk utama. 2. Sistem rekomendasi dapat dirancang dengan menggunakan data transaksi penjualan sebagai data sumber awal. 3. Tersedianya sarana cross-selling yang terintegrasi langsung dengan website. Saran yang diberikan untuk mengembangkan rancangan yang dihasilkan, yaitu: 1. Berbagai perbaikan pada tampilan layar dapat dilakukan selanjutnya untuk lebih memudahkan pengguna menjelajahi web yang telah dirancang. 2. Sistem rating dapat diimplementasi apabila sistem ingin dikembangkan lebih terpersonalisasi. 3. Web selanjutnya disarankan dapat menghadirkan fitur rekomendasi personal untuk member yang belum membeli produk dengan sumber data analisis lebih kompleks. DAFTAR PUSTAKA Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of Statistical Analysis and Data Mining Applications. London: Elsevier. Owen, Sean, Anil, Robin, Dunning, Ted, & Friedman, Ellen. (2012). Mahout in Action. New York: Manning Publications. Sugden, Susie. (2013, June 12). Indonesian e-commerce market size to double in 2013 to US$8B. E27. Retrieved from http://e27.co/2013/06/12/indonesian-e-commerce-market-size-to-doublein-2013-to-us-8b/ Witten, Ian H., Frank, Eibe, & Hall, Mark A. (2011). Data Mining Practical Machine Learning Tools and Techniques. San Francsico: Elsevier. Vivekananth, P. (2012). Different Data Mining Algorithms: A Performance Analysis. International Journal of Emerging Trends and Technology in Computer Science, Vol. 1, 79-84.