perancangan web e-commerce terintegrasi dengan market basket

advertisement
PERANCANGAN WEB E-COMMERCE
TERINTEGRASI DENGAN MARKET
BASKET ANALYSIS
Imelda, Erwanda, Try Permatasari, Rhio Sutoyo
Fakultas Ilmu Komputer Universitas Bina Nusantara
Jl. K.H. Syahdan No. 9, Kemanggisan/Palmerah, Jakarta 11480
[email protected]
ABSTRAK
E-commerce merupakan salah satu sektor yang paling berkembang pesat seiring dengan
perkembangan teknologi Internet. Namun, banyak website e-commerce masih memiliki fitur standar
tanpa perancangan sistem yang memungkinkan usaha itu untuk menjual produk lebih banyak dengan
praktik cross-selling untuk meningkatkan probabilitas keuntungan dan interest pembeli untuk kembali
melakukan pembelian. Mengamati kondisi tersebut, perancangan web e-commerce yang terintegrasi
dengan market basket analysis sebagai basis untuk praktik cross-selling dilakukan. Web
dikembangkan dengan studi literatur, analisis algoritma sejenis, dan wawancara dan kuisioner
sebagai metode analisis serta metode waterfall yang terdiri dari communication, planning, modeling,
construction, dan deployment sebagai metode pengembangan aplikasi. Hasil yang dicapai adalah
sebuah web yang dapat memberikan rekomendasi produk-produk tambahan yang terkait dengan
produk utama yang sedang dilihat atau telah dibeli. Rekomendasi diperoleh dengan data mining dari
transaksi yang telah ada selama tiga tahun terakhir. Simpulan yang diperoleh adalah penggunaan
data mining pada rekomendasi “Frequently Bought Together”, “Customer Who Bought This Also
Bought”, dan “Recommended Products” sudah sesuai dengan harapan pengguna.
Kata kunci: web, e-commerce, sistem rekomendasi, cross-selling, data mining
ABSTRACT
E-commerce is one of the most rapidly growing sectors with the development of Internet.
However, most of e-commerce websites still has the standard features without a system that enables
the business to sell more products by cross-selling support to increase the probability of getting more
profit and interest of buyers to re-purchase. Observing these conditions, designing an e-commerce web
integrated with market basket analysis as a base for cross-selling support can be considered as a
solution. The web developed by literature study, similar algorithm analysis, and interview and
questionnaire analysis as the analysis methods and waterfall model which consists of communication,
planning, modeling, construction, and deployment as an application development method. The result
is a web that can give additional products recommendation associated with the main product which is
being seen or been purchased. The recommendation obtained by data mining from the available
transactions for the last three years. The conclusion is the implementation of data mining on the
recommendation of “Frequently Bought Together”, “Customer Who Bought This Product Also
Bought”, and “Recommended Products” has been running as user expectations.
Keyword: web, e-commerce, recommendation system, cross-selling, data mining
1. PENDAHULUAN
Peningkatan kualitas pelayanan informasi telah mendorong perkembangan teknologi informasi
dalam menyajikan informasi dan komunikasi secara luas. Banyak investasi waktu dan ruang dalam
pengembangan website sebagai salah satu media penyajian informasi yang paling berkembang.
Perkembangan website telah memengaruhi gaya hidup masyarakat yang semakin sadar akan
kemudahan dan pentingnya penggunaan teknologi tersebut. Oleh sebab itu, tak bisa dipungkiri jika
teknologi telah mengubah perilaku konsumen dalam melakukan transaksi komersil.
E-commerce merupakan salah satu sektor yang paling berkembang pesat seiring dengan
perkembangan teknologi Internet. Indonesia baru-baru ini dinamai oleh para pemimpin bisnis global
sebagai key market untuk diperhatikan pada tahun 2013. Sebuah survei tahunan oleh Economist
Corporate Network menyorot Indonesia sebagai negara bisnis yang memiliki pengaruh yang besar dan
tidak dapat diabaikan. Indonesia berada pada posisi ketiga dalam daftar “where companies would be
increasing investment,” setelah Cina dan India (Sugden, 2013).
E-commerce di Indonesia telah tumbuh pesat dalam beberapa tahun terakhir dan ini
diperkirakan akan terus berlanjut. Penelitian oleh Veritrans dan Daily Social (dalam sebuah proyek di
Harvard Business School) memperkirakan bahwa pasar e-commerce saat ini bernilai 0,9 milliar dollar
US. Mereka memprediksi nilai ini akan melambung menjadi 10 miliar dollar US pada tahun 2015. Hal
berjalan berdasarkan kenaikan penggunaan internet, dengan jumlah pengguna hampir tiga kali lipat
dari 55 juta sampai 149 juta pengguna (Sugden, 2013).
Tren ini menuntut industri di Indonesia untuk mulai memanfaatkan berbagai macam teknologi
untuk memudahkan para konsumen. Para pelaku bisnis Usaha Mikro, Kecil, dan Menengah (UMKM)
juga tak boleh ketinggalan. Guna mendukung kesiapan para pelaku bisnis UMKM dalam menghadapi
era Asean Economy Community (AEC) dan globalisasi. Akan tetapi, banyaknya e-commerce di
Indonesia kurang dipadani dengan penggunaan sistem analisis yang sesuai untuk meningkatkan
strategi pemasaran yang efektif untuk meningkatkan jumlah penjualan yang berkelanjutan. Oleh
karena itu, beberapa metode analisis pemasaran dan manajemen hubungan pelanggan harus
diintegrasikan.
Pola-pola analisis tertentu dapat diciptakan dari pengumpulan data berdasarkan aliran data yang
tercipta saat proses transaksi terjadi. Interaksi pelanggan dengan bisnis melalui transaksi telah
melahirkan data-data tertentu yang sangat bernilai bila dilakukan analisis lebih lanjut untuk
mengetahui interest pengguna terhadap produk yang ada. Analisis itu dapat dilakukan dengan teknikteknik data mining.
Market basket analysis adalah suatu proses yang menganalisis kebiasaan pembelian pelanggan
dengan menemukan asosiasi antar-item yang berbeda dalam keranjang belanja pelanggan (Han dan
Kamber, 2006, p228). Informasi ini sangat berguna bagi bisnis e-commerce dapat melakukan crossselling, yaitu konsep penjualan yang menggunakan produk utama sebagai pemicu ketertarikan
pembeli untuk melakukan pembelian selanjutnya untuk produk lain yang berkaitan dengan produk
utama.
Banyak bisnis e-commerce berskala kecil maupun besar, seperti Bhinneka.com
(http://www.bhinneka.com) dan Lazada.com.my (http://www.lazada.com.my) belum memanfaatkan
analisis ini untuk menambah profit usaha dengan praktik cross-selling dan minat pembeli untuk
berbelanja produk lain yang mungkin berhubungan dengan produk yang sedang dilihat atau telah
dibeli.
Berdasarkan latar belakang di atas, beberapa masalah terjadi, yaitu tidak tersedianya analisis
untuk membantu cross-selling, keterbatasan sistem analisis yang terintegrasi dengan e-commerce
sebagai sarana rekomendasi produk bagi pengguna sekaligus sebagai pendorong peningkatan
penjualan, dan kurangnya implementasi sistem personalisasi. Berdasarkan masalah-masalah tersebut,
web e-commerce dikembangkan dengan fitur rekomendasi produk untuk pemilik usaha kecil dan
menengah, yaitu Christie’s Galleries.
Tujuan dibuatnya sistem rekomendasi pada web e-commerce yang terintegrasi dengan market
basket analysis adalah mengimplementasikan sistem rekomendasi pada usaha kecil dan menengah
yang berbasis online yang hanya memiliki data penjualan sederhana untuk dianalisis, menyediakan
sarana cross-selling yang terintegrasi langsung dengan website sebagai sarana penjualan dan
peningkatan interest user untuk berbelanja karena ketersediaan akomodasi bagi user untuk
mengeksplorasi keterkaitan suatu produk dengan produk lain, dan menyajikan kemampuan
rekomendasi produk terpersonalisasi berdasarkan analisis transaksi pengguna.
2. METODE PENELITIAN
Proses data mining berdasarkan CRISP-DM (Cross Industry Standard Process for Data Mining).
Menurut Nisbet et al. (2009:35-36), metode CRISP-DM mendefinisikan hirarki yang terdiri dari fase
utama, tugas umum dan khusus, dan contoh proses. Proses data mining berdasarkan CRISP-DM
terdiri dari enam fase sebagai berikut:
1.
Business Understanding
Pemahaman bisnis yang dijalankan oleh Christie’s Galleries berguna untuk menganalisis
definisi masalah data mining dan pendekatan pemecahan masalah. Hal ini dilakukan semata-mata
untuk memahami tujuan bisnis dengan benar untuk memastikan bahwa perancangan data mining
yang dilakukan dapat memberikan pengetahuan dan informasi yang tepat sebagai hasil
rekomendasi produk-produk yang dapat ditampilkan pada web pages.
Tabel 1. Permasalahan Data Mining
2.
Data Understanding
Tahap berikutnya setelah permasalahan bisnis dibentuk menjadi permasalahan data
mining adalah pengumpulan dan pemilihan sumber data yang akan dibentuk sebagai sumber
pembuatan model data mining.
Gambar 1. Star Scheme Data Mart Penjualan
3.
Data Preparation
Pada tahap data preparation, pemilihan informasi yang ada di dalam data mart yang
berhubungan dan akan digunakan dalam pembuatan model data mining dilakukan.
A. View vBoughtProduct
View vBoughtProduct digunakan untuk memastikan hanya data-data produk yang ada
pada SalesFact saja yang diolah.
CREATE VIEW vBoughtProduct AS SELECT (ROW_NUMBER()
OVER(ORDER BY productcode)-1) AS row, productcode,
productid FROM ProductDimension a WHERE EXISTS(SELECT
timeid FROM SalesFact b WHERE b.productcode =
a.productcode)
B. View vBuyingMember
View vBuyingMember digunakan untuk memastikan hanya data-data pelanggan yang
ada pada SalesFact saja yang diolah.
CREATE VIEW vBuyingMember AS SELECT membercode, memberid
FROM MemberDimension a WHERE EXISTS(SELECT timeid FROM
SalesFact b WHERE a.membercode = b.membercode)
C. View vSameTimeBought
View vSameTimeBought dibuat untuk mendukung analisis produk-produk yang dibeli
secara bersamaan dalam suatu transaksi.
CREATE VIEW vSameTimeBought AS SELECT DISTINCT
t1.timeid, t1.membercode, productid = CAST('{' +
SUBSTRING
( (SELECT ', ' + CAST(row AS VARCHAR)+' t' AS [text()]
FROM vBoughtProduct v, SalesFact t2
WHERE t2.timeid = t1.timeid and t2.membercode =
t1.membercode
AND v.productcode = t2.productcode GROUP BY row
ORDER By row FOR XML PATH(''), ELEMENTS), 3, 100
) + '}' AS VARCHAR) FROM SalesFact t1
4.
Modeling
A. Produk yang Sering Dibeli Bersamaan
Pada tahap ini, pembuatan model data mining dilakukan sesuai dengan algoritma
yang dipilih. Untuk produk yang dibeli bersamaan, algoritma yang digunakan adalah FPGrowth untuk mencari association rules yang baik untuk setiap produk.
Menurut Vivekananth (2012:79), salah satu algoritma association rule mining
yang sangat berpengaruh adalah Apriori. Pengembangan Apriori telah banyak dilakukan
dan FP-Growth merupakan salah satunya. FP-Growth dianggap sebagai suatu kemajuan
besar dalam perbaikan kinerja dari Apriori. Algoritma ini dibuat dengan struktur data
yang dikenal sebagai frequent-pattern tree atau FP-tree.
Menurut Han dan Kamber (2006:243), Frequent Patttern Growth Algorithm
atau yang biasa disebut dengan FP Growth Algorithm adalah suatu algoritma yang
mengkompres database yang merepresentasikan frequent item ke dalam frequent pattern
tree (FP tree).
Karena perangkat lunak data mining yang dipilih untuk mendapatkan pola yang
dibutuhkan adalah Weka, input data yang digunakan untuk analisis harus sesuai dengan
format yang bisa dikenali Weka. Menurut Witten et al. (2011:403), Weka adalah aplikasi
berbasis Java yang bersifat open source untuk data mining. Weka mengenal input file
berekstensi ARFF (Atribute-Relation File Format). Untuk itu, view vSameTimeBought
yang menjadi data sumber harus diolah menjadi bentuk ARFF yang sesuai dengan
standar format Weka.
Proses pembentukan file ARFF yang dibutuhkan memanfaatkan fungsi PHP untuk
membaca isi view vSameTimeBought, kemudian membentuk format yang sesuai, dan
menyimpan hasilnya ke dalam bentuk ARFF. Gambar 4.1 menunjukan hasil file ARFF
dari data sumber vSameTimeBought. Nilai ‘t’ menyatakan bahwa produk tersebut dibeli
pada transaksi tersebut. Pada Weka, penyusunan data berdasarkan index, misalnya ‘{0 t}’
berarti productid ‘BA001’ dibeli pada transaksi tersebut.
Gambar 2. Format File Input Weka
B. Pelanggan yang Membeli Produk Ini juga Membeli Produk Lain
Penghitungan lift dari setiap produk terhadap produk lain dapat dilakukan untuk
mendapatkan hasil rekomendasi yang diinginkan. Keterikatan produk satu dengan produk
lain dapat dihitung dengan selisih nilai lift dengan logical rule = 1/support(B), artinya jika
terdapat tiga produk A, B, dan C dengan nilai lift produk A dan B adalah 3,2; nilai support(B)
= 2 (logical rule = 1/2) dan lift A dan C adalah 3,0, dan nilai support(C) = 1 (logical rule =
1), maka jika produk A dipilih pelanggan, maka rekomendasi produk C memiliki
kemungkinan lebih besar untuk dipilih karena selisih lift dengan nilai logical rule lebih kecil.
C. Prediksi Produk yang Diinginkan Pelanggan Berdasarkan Kesamaan Produk dengan
Produk yang Telah Dibeli
Algoritma yang dapat dipakai untuk menghitung nilai kesamaan antara dua produk
dengan menggunakan metode Tanimoto. Menurut Owen et al. (2012:54), Tanimoto
coefficient adalah perbandingan ukuran antara intersection dua barang yang disukai
pengguna dengan union kedua barang tersebut. Setelah nilai kesamaan dihitung, maka nilai
ini akan sangat berguna untuk menghitung nilai prediksi preferensi seorang pelanggan yang
telah membeli barang dengan mengakumulasikan nilai kesamaan tiap-tiap produk dengan
produk-produk yang dibeli. Hasilnya, nilai prediksi yang terbesar akan ditampilkan sebagai
personalisasi rekomendasi kepada pelanggan tersebut.
Perhitungan nilai kesamaan Tanimoto dilakukan dengan sintaks PHP dan hasilnya
dimasukkan ke dalam database agar sistem dapat mengimplementasikan langsung hasil
tersebut. Misalnya, perhitungan nilai kesamaan antara ‘BA001’ dan ‘GL017’ dapat dilakukan
dengan:
T(a, b) =
Ket: Nc adalah jumlah member yang membeli produk a dan b
Na adalah jumlah member yang membeli produk a
Nb adalah jumlah member yang membeli produk b
Misalnya, jumlah member yang membeli produk ‘BA001’ dan ‘GL017’ adalah satu
orang, membeli ‘BA001’ adalah satu orang, dan membeli ‘GL017’ adalah lima orang. Nilai
kesamaan ‘BA001’ dan ‘GL017’ menjadi:
T(BA001, GL017) = 1 / (1 + 5 + 1) = 0,1429
Hasil nilai rekomendasi ditentukan melalui cara distributed item-based algorithm.
Misalnya, perhitungan nilai rekomendasi dari produk ‘SH052’ untuk member ‘M000001’.
Kode produk pada tabel 4.13 menunjukkan produk-produk yang dibeli member ‘M000001’.
Pertama-tama, produk-produk yang dibeli oleh member tersebut dicari dengan nilai
kesamaan Tanimoto antara produk yang dibeli dengan produk ‘SH052’. Setelah itu, hasil
nilai kesamaan dari produk-produk yang dibeli dengan produk ‘SH052’ dijumlah sebagai
nilai rekomendasi. Hasilnya dapat dilihat pada tabel 4.13. Perhitungan nilai rekomendasi
dilanjutkan dengan produk-produk yang lain dengan cara yang sama.
No.
1
2
3
4
5
6
7
Nilai Kesamaan dengan
Produk ‘SH052’
SH019
0,0698
SH047
0,0513
SH063
0
SA003
0,0484
SH005
0,0357
SH021
0,0667
SH020
0
Total 0,2719
Tabel 2. Hasil Nilai Kesamaan
Kode Produk
Pada implemetasi sistem, PHP akan membaca view vBoughtProduct untuk
menghitung kombinasi nilai kesamaan dari masing-masing pasangan produk kemudian
memasukkan nilai-nilai tersebut ke database. Setelah itu, jika pelanggan tertentu melakukan
transaksi, maka sistem akan mencari produk-produk yang telah dibeli oleh pelanggan dan
mengakumulasi nilai-nilai kesamaan dengan produk-produk lain, kemudian hasil-hasilnya
akan disimpan ke dalam database. Sistem hanya perlu melakukan penyaringan banyaknya
produk yang akan ditampilkan kepada pelanggan tersebut.
5.
Evaluation
Tahap evaluasi dilakukan dengan mengganti min support dan min confidence untuk
menghasilkan jumlah rule yang diinginkan.
6.
Deployment
Pada tahap ini, perancangan web page yang akan menampilkan hasil rekomendasi
berdasarkan rule dan nilai-nilai yang telah ada di dalam database dapat dilakukan. Web page
dirancang menggunakan PHP, HTML, JavaScript, dan CSS.
a.
Frequently Bought Together
Gambar 3. Contoh Rekomendasi “Frequently Bought Together” pada Sistem
b.
Customer Who Bought This Product Also Bought
Gambar 4. Contoh Implementasi “Customer Who Bought This Product Also
Bought” pada Sistem
c.
Recommended Products
Gambar 5. Contoh Tampilan “Recommended Products” pada Sistem
3. HASIL DAN EVALUASI
3.1 HASIL
Hasil dari integrasi data mining dengan web e-commerce adalah sistem rekomendasi, yaitu
“Frequently Bought Together”, “Customer Who Bought This Product Also Bought”, dan
“Recommended Products”. “Frequently Bought Together” adalah rekomendasi produk yang sering
dibeli secara bersamaan dengan produk tersebut. “Customer Who Bought This Product Also Bought”
adalah rekomendasi produk untuk member berdasarkan produk yang dibeli oleh customer atau
member lain yang juga pernah membeli produk tersebut. “Recommended Products” adalah produkproduk yang direkomendasikan berdasarkan data history produk-produk yang telah dibeli dan
ditampilkan pada home page.
Gambar 5. Sistem Rekomendasi “Frequently Bought Together” dan “Customer Who Bought This
Product Also Bought”
Gambar 6. Sistem Rekomendasi “Recommended Products”
3.2 EVALUASI
Evaluasi aplikasi dilakukan dengan kuesioner dan membandingkan algoritma fp-growth dengan
algoritma apriori. Kesimpulan hasil evaluasi fitur-fitur rekomendasi dari data-data yang telah diisi
responden pada kuesioner evaluasi adalah sebagai berikut:
a. 84% responden setuju dengan kecocokan produk yang direkomendasikan untuk produk yang
ditampilkan setelah ditunjukkan produk pada rekomendasi “Frequently Bought Together”.
b.
Evaluasi rekomendasi “Customers Who Bought This Item Also Bought” dilakukan dengan
perhitungan precision, recall, dan F1 score. Hasil evaluasi menunjukkan hasil yang cukup
memuaskan dengan rata-rata precision 0,80, recall 0,69, dan F1 score 0,70.
c. “Recommended Products” dievaluasi dengan mengambil contoh seorang member yang telah
membeli produk-produk dan meminta responden menilai “Recommended Products” berdasarkan
produk-produk yang telah dibeli tersebut. Nilai precision, recall, dan F1 score dihitung, Hasil
evaluasi menunjukkan hasil yang cukup memuaskan dengan rata-rata precision 0,74, recall 0,78,
dan F1 score 0,75.
Evaluasi sistem yang dilakukan adalah peninjuan penggunaan algoritma FP-Growth dengan
Apriori yang mencakup pengukuran waktu yang dibutuhkan untuk mendapatkan association rules
dengan Weka dan hasil dari masing-masing algoritma untuk diimplementasikan pada sistem
rekomendasi “Frequently Bought Together”.
Gambar 7. Perbandingan Waktu Eksekusi Berdasarkan Minimum Support
Gambar 8. Perbandingan Waktu Eksekusi Berdasarkan Minimum Confidence
Kesimpulan yang dapat ditarik berdasarkan hasil perbandingan waktu eksekusi masing-masing
algoritma untuk menggali association rules adalah algoritma FP-Growth terbukti sangat unggul pada
kecepetan eksekusi. Perbedaan kecepatan eksekusi FP-Growth dengan Apriori semakin jauh ketika
minimum support semakin rendah dan perbedaan kecepatan cenderung sama saat minimum confidence
semakin rendah.
4 SIMPULAN DAN SARAN
Berdasarkan analisis hasil evaluasi pada web Christie’s Galleries, dapat disimpulkan:
1. Sistem rekomendasi telah berjalan sesuai dengan harapan penguna dalam menampilkan produkproduk tambahan yang berkaitan dengan produk utama.
2. Sistem rekomendasi dapat dirancang dengan menggunakan data transaksi penjualan sebagai data
sumber awal.
3. Tersedianya sarana cross-selling yang terintegrasi langsung dengan website.
Saran yang diberikan untuk mengembangkan rancangan yang dihasilkan, yaitu:
1. Berbagai perbaikan pada tampilan layar dapat dilakukan selanjutnya untuk lebih memudahkan
pengguna menjelajahi web yang telah dirancang.
2. Sistem rating dapat diimplementasi apabila sistem ingin dikembangkan lebih terpersonalisasi.
3.
Web selanjutnya disarankan dapat menghadirkan fitur rekomendasi personal untuk member yang
belum membeli produk dengan sumber data analisis lebih kompleks.
DAFTAR PUSTAKA
Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of Statistical Analysis and Data Mining
Applications. London: Elsevier.
Owen, Sean, Anil, Robin, Dunning, Ted, & Friedman, Ellen. (2012). Mahout in Action. New York:
Manning Publications.
Sugden, Susie. (2013, June 12). Indonesian e-commerce market size to double in 2013 to US$8B.
E27. Retrieved from http://e27.co/2013/06/12/indonesian-e-commerce-market-size-to-doublein-2013-to-us-8b/
Witten, Ian H., Frank, Eibe, & Hall, Mark A. (2011). Data Mining Practical Machine Learning Tools
and Techniques. San Francsico: Elsevier.
Vivekananth, P. (2012). Different Data Mining Algorithms: A Performance Analysis. International
Journal of Emerging Trends and Technology in Computer Science, Vol. 1, 79-84.
Download