ANALISIS SEGMENTASI PELANGGAN LAUNDRY BI4

advertisement
ANALISIS SEGMENTASI PELANGGAN LAUNDRY BI4 PUTRA DENGAN MENGGUNAKAN
ALGORITMA K-MEANS CLUSTERING
Fitria Fauziah Ahmad, Acep Irham Gufroni, dan Neng Ika Kurniati
Teknik Informatika Universitas Siliwangi Tasikmalaya
Email: [email protected]
ABSTRAK
Laundry Bi4 Putra merupakan suatu perusahaan yang bergerak di bidang bisnis jasa laundry di Ciamis. Persaingan
yang ketat mendorong Laundry Bi4 Putra untuk mengelola pelanggannya secara maksimal. Karena pada dasarnya
pelanggan merupakan unsur penting dalam pengembangan strategi bisnis, pelanggan juga merupakan sumber
keuntungan dalam perusahaan. Maka dari itu diperlukan pemahamaan yang baik tentang pelanggan. Pemahaman yang
baik terhadap pelanggan dapat digunakan oleh perusahaan untuk melihat pelanggan yang berpotensial. Masalah yang
sering dihadapi adalah kesulitan dalam menganalisa perilaku pelanggan. Segmentasi pelanggan adalah metode populer
yang digunakan untuk menganalisa perilaku pelanggan yang tepat untuk mengembangkan strategi. Dengan melakukan
segmentasi pelanggan berdasarkan perilakunya dalam bertransaksi, pengusaha dapat menerapkan strategi pemasaran
menjadi lebih baik. Untuk memenuhi kebutuhan Laundry Bi4 Putra dalam hal tersebut banyak sekali cara yang dapat
ditempuh. Salah satu caranya yang dapat dilakukan yaitu dengan memanfaatkan data perusahaan menggunakan data
mining dengan tujuan untuk melakukan segmentasi pelanggan Laundry Bi4 Putra. Model data mining yang akan
digunakan dalam penelitian ini adalah Clustering dan algoritmanya yaitu K-Means. K-means adalah algoritma
partitional (non-hierarchical) clustering yang mempartisi atau membagi sekumpulan data ke dalam sejumlah cluster
berdasarkan kemiripannya. Serta menggunakan analisa RFM yang merepresentasikan jumlah pelanggan di setiap
cluster/segmen. Penggunaan K-means Clustering dalam penelitian ini menghasilkan segmen atau pengelompokkan
pelanggan yang dapat membantu Laundry Bi4 Putra untuk mengetahui perilaku pelanggan dalam bertransaksi dan juga
membantu perusahaan dalam mencari strategi baru yang tepat dan sesuai untuk dikembangkan.
Kata Kunci: Clustering, Data Mining, K-means, Pelanggan, RFM, Segmentasi
ABSTRACT
Laundry Bi4 Putra is a laundry service company in Ciamis. Intense and high competition encourages Laundry Bi4
Putra to manage customers optimally. Because basically customers are the most important element in the development
of business strategy, customers are also source of profit in the company. Therefore, it is necessary to have a good
perception about customer. A good perception about customer can be used by the company to see the potential
customers. The most problem that encountered often by company is difficulty in analyzing behavior of customers.
Customer segmentation is a popular method to analyze behavior of customers to develop new strategy. By segmenting
customers based on its behavior in transaction, the owner of the company can implement the better marketing strategies.
To meet the needs of Laundry Bi4 Putra, there are so many ways that can be used. One of the methods is by utilizing
data of the company using data mining with aim to segmenting customers. Data mining models to be used in this
research is Clustering and the algorithm is K-Means. K-means algorithm is a partitional (non-hierarchical) clustering
which is to partition or divide a set of data into a number of clusters based on similarity. RFM analyze concept also
being used in this research to represent number of customers in each cluster/segment. The implementation of K-means
clustering in this research obtain customers categorization or customers segmetation that can help Laundry Bi4 Putra
to know behavior of customers and also help the company in finding new strategies to be developed in the future.
Keywords: Customers, Clustering, Data Mining, K-means, RFM, Segmentation
I.
PENDAHULUAN
Perkembangan bisnis laundry sekarang ini semakin
hari kian meningkat pesat. Bahkan belakangan bisnis
laundry banyak dipilih sebagai investasi masa depan
mengingat keuntungannya yang cukup besar. Sehingga
tidak heran lagi jika bisnis laundry sekarang ini banyak
kita jumpai di sekitar kita (bisnisukm.com, 2014).
Persaingan ketat di bidang usaha ini menuntut
penguasaha untuk semakin kreatif, cepat tanggap dan
memaksimalkan pelayanan agar usaha laundry yang
dimiliki semakin sukses dan dapat bersaing dengan
kompetitor. Oleh karena itu perlu bagi sebuah
perusahaan jasa untuk memperhatikan kualitas produk
jasa dan pelayanan yang dimiliki oleh perusahaan demi
mempertahankan pelanggan.
Pelanggan merupakan unsur penting dalam
pengembangan strategi bisnis, pelanggan juga
merupakan salah satu sumber keuntungan dalam
perusahaan. Maka dari itu diperlukan pemahamaan yang
baik tentang pelanggan. Pemahaman yang baik terhadap
pelanggan dapat digunakan oleh perusahaan untuk
melihat pelanggan yang potensial. Masalah yang sering
dihadapi adalah kesulitan dalam menganalisa perilaku
pelanggan.
Segmentasi pelanggan adalah metode populer yang
digunakan untuk menganalisa perilaku pelanggan yang
tepat untuk mengembangkan strategi. Dengan
melakukan
segmentasi
pelanggan
berdasarkan
perilakunya dalam bertransaksi, pengusaha dapat
menerapkan strategi pemasaran menjadi lebih baik.
Untuk memenuhi kebutuhan perusahaan dalam hal
tersebut banyak sekali cara yang dapat ditempuh. Salah
satu caranya yang dapat dilakukan yaitu dengan
memanfaatkan data perusahaan menggunakan data
mining. Penggunaan teknik data mining diharapkan
dapat membantu mempercepat proses pengambilan
keputusan, memungkinkan perusahaan untuk mengelola
informasi yang terkandung didalam data perusahan
yaitu data pelanggan dan data transaksi menjadi sebuah
pengetahuan
(knowledge)
yang
baru.
Lewat
pengetahuan yang didapat perusahaan mendapatkan
berbagai pertimbangan yang memungkinkan untuk
diambil sebagai strategi baru yang dapat membantu
kemajuan perusahaan di masa yang akan datang. Salah
satu model data mining yang akan digunakan dalam
penelitian ini adalah Clustering dan algoritmanya yaitu
K-Means. Algoritma K-Means adalah salah satu
algoritma sangat terkenal karena kemudahan dan
kemampuannya untuk mengklasifikasi data besar dan
outlier dengan sangat cepat.
Batasan masalah pada penelitian ini diantaranya
data yang diolah adalah data transaksi Laundry Bi4
Putra dari bulan Januari 2015 sampai dengan bulan Mei
2015 yang berupa pembukuan kemudian dipindahkan ke
dalam Microsoft Office Excel. Analisis ini digunakan
untuk mengelompokkan pelanggan berdasarkan
segmen-segmen yang telah ditentukan yang mengacu
pada atribut RFM. Algoritma yang digunakan dalam
penelitian ini adalah K-means Clustering. Output yang
dihasilkan berupa pengetahuan berbentuk tabel dan
grafik.
Tujuan penelitian ini adalah untuk mengetahui
perilaku pelanggan berdasarkan analisa RFM yaitu
recency; mengacu pada waktu transaksi terakhir dengan
menganalisa jarak titik waktu, frequency; mengacu pada
frekuensi transaksi, dan monetary; mengacu pada nilai
total transaksi terbaru yang kemudian akan dibuat
segmentasi pelanggan dengan menggunakan model
Clustering dan algoritma K-Means. Selain itu tujuan
penelitian ini adalah untuk memberikan kemudahan
bagi perusahaan dalam mencari strategi yang tepat dan
sesuai dengan perilaku pelanggan.
Manfaat dari penelitian ini adalah memberikan
informasi kepada perusahaan dalam mengambil
kebijakan dan strategi dalam meningkatkan kualitas
pelayanan dan dalam mempertahankan pelanggan.
II. LANDASAN TEORI
A. Data Mining
Data mining merupakan proses pencarian pola-pola
yang menarik dan tersembunyi (hidden pattern) dari
suatu kumpulan data yang berukuran besar yang
tersimpan dalam suatu basis data, data warehouse atau
tempat penyimpanan data lainnya (Tan, 2004). Data
mining sebenarnya merupakan salah satu rangkaian dari
proses pencarian pengetahuan pada database
(Knowledge Discovery in Database/KDD). Serangkaian
proses tersebut yang memiliki tahap sebagai berikut:
1. Pembersihan data dan integrasi data (cleaning and
integration)
2. Seleksi dan transformasi data (selection and
transformation)
3. Penambangan data (data mining)
4. Evaluasi pola dan presentasi pengetahuan
(evaluation and knowledge presentation)
B. Clustering
Clustering dikategorikan kedalam teknik “Undirect
Knowledge” atau Unsupervised Learning karena tidak
membutuhkan proses pelatihan untuk klasifikasi awal
data dalam masing-masing kelompok atau cluster.
Tujuan utama clustering adalah untuk menentukan atau
mencari pola yang bermanfaat atau yang berguna pada
suatu database, kemudian merangkumnya dan membuat
lebih mudah untuk dipahami.
Clustering adalah metode analisa data yang sering
dimasukkan sebagai salah satu metode data mining
yang memiliki tujuan untuk mengelompokkan data
dengan karakteristik yang sama ke suatu „wilayah‟ yang
sama dan data dengan karakteristik yang berbeda ke
„wilayah‟ yang lain. Ada beberapa pendekatan yang
digunakan dalam mengembangkan metode clustering.
Dua pendekatan utama adalah clustering dengan
pendekatan partisi dan clustering dengan pendekatan
hirarki. Clustering dengan pendekatan partisi atau
sering disebut dengan partition-based clustering
mengelompokkan data dengan memilah-milah data
yang dianalisa ke dalam cluster-cluster yang ada.
C. K-Means
K-means adalah metode pengelompokkan data
dengan mengambil parameter sejumlah k cluster, dan
mempartisi data kedalam cluster tersebut, dengan
berpatokan pada kemiripan antara data dalam suatu
cluster dan ketidak-miripan diantara cluster yang
berbeda, pusat dari cluster adalah rata-rata dari nilai
anggota cluster yang disebut dengan centroid atau
center of gravity (Han&Kamber, 2006).
Selain itu K-means melakukan pengelompokkan
dengan meminimalkan jumlah kuadrat dari jarak
(distance) antara data dengan centroid cluster yang
cocok (Teknomo, 2007). Dengan kata lain, metode ini
berusaha untuk meminimalkan variasi antar data yang
ada di dalam suatu cluster dan memaksimalkan variasi
dengan data yang ada di cluster lainnya.
Proses pengelompokkan data ke dalam suatu
cluster dapat dilakukan dengan cara menghitung jarak
terdekat dari suatu data ke sebuah titik centroid. Rumus
untuk mengukur jarak yaitu dengan menggunakan
rumus Euclidean:
(
)
√(
)
(
)
(
)
Dimana
(
dan
(
merupakan dua objek data n-dimensional (Han &
Kamber, 2006).
III. METODOLOGI
Untuk memberikan langkah yang pasti dalam
melaksanaan penelitian, maka dibuatlah alur penelitian
sebagai berikut.
D. Segmentasi Pelanggan
Di dalam www.kamusbisnis.com segmentasi
pelanggan (customer segmentation) adalah pembagian
pasar ke dalam kelompok-kelompok pelanggan spesifik
yang memiliki karakteristik sama. Segmentasi
pelanggan dapat menjadi sarana ampuh untuk
mengidentifikasi kebutuhan pelanggan yang tidak
terlayani sehingga kemudian dapat mengungguli
pesaing dengan mengembangkan produk dan layanan
unik yang menarik.
Segmentasi pelanggan paling efektif ketika sebuah
perusahaan menyesuaikan layanan dengan segmen yang
paling menguntungkan dan melayani mereka dengan
keunggulan kompetitif yang unik. Prioritas ini dapat
membantu perusahaan mengembangkan kampanye
pemasaran dan strategi harga untuk mengambil nilai
maksimum baik dari pelanggan yang memberikan
keuntungan tinggi maupun rendah. Perusahaan dapat
menggunakan segmentasi pelanggan sebagai dasar
dalam
mengalokasikan
sumber
daya
untuk
pengembangan produk, pasar, layanan dan distribusi.
Gambar 3.1. Alur Penelitian
E. RFM
RFM adalah salah satu model proses dalam
menganalisis perilaku pelanggan. RFM merupakan
singkatan dari Recency, Frequency dan Monetary. RFM
menggunakan informasi tentang perilaku pelanggan
pada masa lalu yang mudah dilacak dan tersedia di
database. Tujuan dari RFM adalah untuk meramalkan
perilaku konsumen di masa depan (mengarahkan
keputusan segmentasi dan strategi yang lebih baik).
Oleh karena itu, perlu menterjemahkan prilaku
konsumen dalam „angka‟ sehingga dapat digunakan
sepanjang waktu. Analisa RFM terdiri dari tiga dimensi,
yaitu:
1. Recency
Recency adalah mengukur perilaku pelanggan
dengan melihat transaksi yang dilakukan paling
akhir (paling baru).
2. Frequency
Frequency
adalah
mengukur
nilai/perilaku
pelanggan dengan melihat aktifitas transaksi yang
dilakukan oleh pelanggan dalam satu periode.
3. Monetary
Monetary
adalah
mengukur
nilai/perilaku
pelanggan dengan melihat rata-rata total transaksi
yang dilakukan oleh pelanggan dalam satu kali
bertransaksi.
A. Metode Pengumpulan Data
1. Observasi dilakukan di Laundry Bi4 Putra yang
berlokasi di Jl. Jend. Sudirman No. 42 Ciamis pada
tanggal 28 Juni 2015. Penulis terjun langsung ke
lapangan untuk mencari tahu informasi tentang
laundry tersebut. Dari hasil observasi yang telah
dilakukan diketahui bahwa Laundry Bi4 Putra
masih melakukan penyimpanan data secara manual
(tulis tangan di buku besar) baik dalam mendata
pelanggan maupun transaksi sehari-hari.
2. Wawancara dilakukan kepada pihak yang
berhubungan dengan penelitian ini, yaitu dengan
Ibu Uriyah selaku pemilik Laundry Bi4 Putra.
Wawancara
dilakukan
untuk
mendapatkan
informasi dan data-data Laundry Bi4 Putra
langsung melalui pemilik. Hasil wawancara
disajikan di bagian lampiran.
3. Studi pustaka dilakukan untuk mendapatkan
referensi yang berhubungan dengan penelitian.
Sumber yang digunakan untuk mencari referensi
diantaranya buku, sumber dari internet seperti ebook, jurnal dan blog.
B. Metode Persiapan Data Mining
1. Data Cleaning
Data cleaning atau pembersihan data adalah upaya
untuk mengatasi nilai-nilai yang hilang, menghaluskan
noise ketika mengidentifikasi outlier, dan memperbaiki
inkonsistensi dalam data (Han, Kamber&Pei, 2012).
Dari data set data transaksi pelanggan sebanyak 171
data yang terdiri dari no, tanggal transaksi, nama, jenis
(kiloan, satuan), qty, harga dan total. Data tersebut
kemudian masuk ke proses cleaning dan beberapa
kolom yang tidak digunakan dalam proses cleaning
akan dihilangkan. Berikut ini adalah kolom-kolom yang
dihilangkan beserta alasan mengapa kolom tersebut
mengalami proses cleaning.
a. Kolom jenis; kiloan – satuan dihilangkan karena
kolom ini bersifat teks dan tidak diperlukan dalam
proses mining, serta memiliki data yang tidak
lengkap
b. Kolom qty, dihilangkan karena kolom ini tidak
akan digunakan dalam proses mining
c. Kolom harga, dihilangkan karena kolom ini tidak
akan digunakan dalam proses mining dan sudah
terwakili oleh kolom total
d. Terdapat 1 data premature, yaitu data yang tidak
lengkap terdapat pada kolom nama pelanggan ke
171
Lampiran 2 adalah hasil dari data cleaning pertama,
didapatkan 170 data karena terdapat 1 data premature
(data yang tidak lengkap). Setelah proses cleaning
pertama selesai lalu dilakukan proses data reduction.
Data Reduction
Data Reduction atau Data Selection merupakan
proses meminimalkan jumlah data yang digunakan
untuk proses mining dengan tetap merepresentasikan
data aslinya.
Setelah proses data cleaning selesai dilakukan, lalu
masuk ke proses data reduction. Data reduction yang
dilakukan disini yaitu dengan menghapus data yang
memiliki atribut sama, yaitu pada atribut nama. Juga
dengan menambahkan atribut frekuensi transaksi yang
mana atribut ini berisi jumlah frekuensi transaksi yang
dilakukan oleh pelanggan. Perhitungan frekuensi
transaksi di hitung dengan cara mengurutkan nama
pelanggan berdasarkan abjad dari a-z. Karena
penomoran frekuensi transaksi dilakukan berdasarkan
tanggal terakhir transaksi maka tanggal transaksi
sebelum transaksi terakhir dihapus, sehingga tidak ada
nama pelanggan yang ganda/sama. Proses penghapusan
data ini dilakukan agar tidak terjadi redudansi.
Dari 171 data set yang telah mengalami proses
cleaning menghasilkan 86 data dari hasil reduksi data
yang ganda (lebih dari satu) yang dapat dilanjutkan ke
proses selanjutnya.
b.
tanggal transaksi menjadi recency, frekuensi
transaksi menjadi frequency dan total menjadi
monetary, karena pada dasarnya istilah tersebut
memliki makna yang sama dengan atribut aslinya
Data transformation selanjutnya yaitu mengubah
kolom recency dari format tanggal menjadi total
hari terakhir transaksi, dihitung sejak data di proses
yaitu pada tanggal 8 Juli 2015.
C. Proses Data Mining
Berikut ini adalah proses data mining dengan
menggunakan algoritma K-Means Clustering:
1. Tentukan jumlah cluster (k), tetapkan pusat cluster
sembarang (random)
2. Hitung jarak setiap data ke pusat cluster
3. Kelompokkan data ke dalam cluster dengan jarak
yang paling pendek
4. Hitung pusat cluster yang baru dengan mencari
nilai rata-rata dari data-data yang menjadi anggota
pada cluster tersebut
5. Pada iterasi pertama diperoleh nilai centroid baru
dengan titik pusat yang berbeda. Maka ulang
kembali langkah ke 2 sampai langkah ke 4, ulang
terus menerus dan hentikan iterasi jika nilai
centroid sebelum dan sesudahnya bernilai sama.
2.
3.
Data Transformation
Data transformation adalah proses yang dilakukan
untuk mengubah/mengkonversikan data yang akan
digunakan untuk proses data mining (Han, Kamber&Pei,
2012). Proses ini sangat membantu proses data mining
menjadi lebih efisien, dan hasil yang didapatkan lebih
mudah untuk dipahami.
a. Proses transformation terjadi pada penamaan
atribut yang sesuai dengan atribut RFM, yaitu
IV. HASIL DAN PEMBAHASAN
A. Data Preprocessing
Berikut ini adalah data training hasil dari data
preprocessing (data cleaning, data reducing dan data
transformation) yang kemudian akan diproses
menggunakan algoritma K-Means Clustering.
Tabel 4.1. Data training yang akan diproses
menggunakan data mining
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nama
Ratna
Rei
Yuli
Bina
Epong
Neng
Ucu
Wawan
Yeni
Alfin
Ipeh
Lina
Nana
Teh Enung
Dini
Mbak Ela
Siti
Bu Dede
Salon Asih
Wa Karman
Recency
(hari)
177
177
177
176
176
176
176
169
169
168
168
168
168
168
167
166
166
165
165
163
Frequency
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
2
1
1
Monetary
(rupiah)
19000
23000
15000
26000
20000
30700
20000
22200
10000
27000
20160
20000
15000
40500
40000
14190
15000
32000
13200
15000
Sampai data ke-86
B. Proses Algoritma K-means Clustering
1. Tentukan jumlah cluster (k), tetapkan titik pusat
cluster sembarang
Tahap ini merupakan tahap yang dilakukan untuk
menentukan jumlah cluster yang akan dihasilkan.
Dalam penelitian ini jumlah cluster yang akan
dihasilkan adalah sebanyak 4 cluster. Untuk titik pusat
cluster masing masing cluster diambil secara sembarang
(random) dari data, diantaranya:
Tabel 4.2. Titik pusat cluster yang diambil secara
random
166
1
15000
Cluster 1
148
2
21000
Cluster 2
124
3
3500
Cluster 3
88
4
30000
Cluster 4
2.
Hitung jarak setiap data ke pusat cluster
Pada tahap ini dilakukan penghitungan jarak setiap
data ke pusat cluster masing-masing. Untuk
menghitung jarak data ke pusat cluster dapat
menggunakan rumus Euclidean berikut:
(
√(
)
)
(
)
(
)
Lalu hitunglah jarak masing-masing data ke pusat
cluster yang telah ditentukan. Berikut ini adalah
perhitungan jarak dengan menggunakan rumus
Euclidean pada iterasi ke-1.
Centroid 1
)
√(
√(
√(
√(
)
)
)
)
(
(
(
(
)
)
)
)
(
(
(
(
)
)
)
)
)
√(
)
(
)
(
)
(
)
(
)
(
)
(
(
(
)
(
)
)
)
(
)
(
)
(
)
(
(
)
)
(
(
)
)
3.
Kelompokkan data ke dalam cluster dengan
jarak yang paling pendek
Cluster 1: Data dengan jarak paling pendek pada cluster
1 yaitu data ke-: 3, 9, 13, 16, 17, 19, 20, 22, 26, 46, 49,
50, 55, 61, 72, 77, 78, 80, 81, 84, 86
Cluster 2: Data dengan jarak paling pendek pada cluster
2 yaitu data ke-: 1, 2, 5, 7, 8, 11, 12, 24, 27, 28, 29, 31,
34, 35, 36, 40, 44, 56, 68, 69, 76, 82
Cluster 3: Data dengan jarak paling pendek pada cluster
3 yaitu data ke-: 54, 58, 62, 85
Cluster 4: Data dengan jarak paling pendek pada cluster
4 yaitu data ke-: 4, 6, 10, 14, 15, 18, 21, 23, 25, 30, 32,
33, 37, 38, 39, 41, 42, 43, 45, 47, 48, 51, 52, 53, 57, 59,
60, 63, 64, 65, 66, 67, 70, 71, 73, 74, 75, 79, 83
4.
Hitung pusat cluster yang baru dengan mencari
nilai rata-rata dari data-data yang menjadi
anggota pada cluster tersebut
Lalu jumlahkan data masing-masing yang sudah
dikelompokan sehingga menghasilkan nilai centroid
baru.
Tabel 4.3. Centroid baru 1 pada iterasi ke-1
Centroid Baru 1
126.476
2.381
14,115.238
Tabel 4.4. Centroid baru 2 pada iterasi ke-1
Centroid Baru 2
143.864
1.364
21,530.000
Tabel 4.5. Centroid baru 3 pada iterasi ke-1
Centroid 2
(
)
)
Lakukan perhitungan yang sama sampai data ke-86.
Lakukan perhitungan yang sama sampai data ke-86
(
√(
√(
)
)
)
)
)
√(
√(
√(
√(
√(
(
(
(
(
(
)
)
)
)
)
(
(
(
(
(
)
)
)
)
)
Centroid Baru 3
105.500
3.500
6,625.000
Tabel 4.6. Centroid baru 4 pada iterasi ke-1
Lakukan perhitungan yang sama sampai data ke-86
Centroid Baru 4
Centroid 3
(
)
(
)
(
)
(
)
(
)
)
)
)
)
)
√(
√(
√(
√(
√(
(
(
(
(
(
)
)
)
)
)
(
(
(
(
(
)
)
)
)
)
Lakukan perhitungan yang sama sampai data ke-86
Centroid 4
(
)
(
)
(
)
√(
√(
√(
)
)
)
(
(
(
)
)
)
(
(
(
)
)
)
129.590
5.
1.949
53,009.436
Pada iterasi pertama diperoleh nilai centroid baru
dengan titik pusat yang berbeda. Maka ulang
kembali langkah ke 2 sampai langkah ke 4, ulang
terus menerus dan hentikan proses iterasi jika nilai
centroid sebelum dan sesudahnya bernilai sama.
Berikut merupakan data centroid baru hasil dari
perhitungan 13 kali iterasi. Nilai yang diberi warna
abu-abu adalah centroid yang sebelum dan
sesudahnya memiliki nilai yang sama.
Tabel 4.6. Hasil Iterasi ke 1 sampai Iterasi ke-13
Cluster /
Iterasi
Titik
Pusat
Awal
Iterasi 1
Iterasi 2
Iterasi 3
Iterasi 4
Iterasi 5
Iterasi 6
Iterasi 7
Iterasi 8
Iterasi 9
Iterasi 10
Iterasi 11
Iterasi 12
Iterasi 13
C1
C2
C3
C4
165.00
1.00
15,000.00
146.00
2.00
21,000.00
121.00
3.00
3,500.00
86.00
4.00
30,000.00
126.48
125.65
130.21
136.38
136.51
136.80
136.54
135.57
135.97
135.28
136.07
135.98
135.98
2.38
2.47
2.37
2.03
1.79
1.78
1.78
1.65
1.69
1.75
1.73
1.71
1.71
14,115.24
14,615.88
15,024.74
17,113.44
18,670.00
19,698.90
20,435.73
23,947.16
25,223.59
26,113.00
26,463.90
26,833.81
26,833.81
143.86
136.60
136.50
131.39
130.48
130.42
131.46
135.40
134.76
133.73
131.29
131.23
131.23
1.36
1.70
1.75
1.94
2.14
2.04
2.12
2.00
1.94
1.87
1.93
2.00
2.00
21,530.00
25,043.00
27,759.55
33,673.75
37,353.62
40,181.54
43,184.73
49,246.15
54,845.76
56,838.53
58,005.57
59,236.77
59,236.77
105.50
111.57
111.57
111.57
114.88
117.00
117.25
123.57
123.12
125.19
125.19
125.19
125.19
3.50
2.86
2.86
2.86
3.00
3.10
2.75
2.65
2.56
2.50
2.50
2.50
2.50
6,625.00
8,064.29
8,064.29
8,064.29
8,556.25
9,516.00
10,279.17
12,523.91
12,916.80
13,150.77
13,150.77
13,150.77
13,150.77
129.59
132.55
127.25
129.27
127.00
125.22
124.86
121.83
125.00
125.00
125.00
125.00
125.00
1.95
1.82
1.75
1.36
1.40
1.44
1.29
1.33
1.40
1.40
1.40
1.40
1.40
53,009.44
70,786.73
81,288.00
95,237.55
98,411.30
101,823.67
111,418.57
117,488.33
124,986.00
124,986.00
124,986.00
124,986.00
124,986.00
C. Knowledge Presentation
a. Cluster 1
Berdasarkan
hasil
perhitungan
dengan
menggunakan algoritma K-means terdapat 42 data yang
menjadi anggota cluster 1. Cluster 1 memiliki nilai
centroid akhir (135.976 ; 1.714 ; 26,833.810).
b. Cluster 2
Berdasarkan
hasil
perhitungan
dengan
menggunakan algoritma K-means terdapat 13 data yang
menjadi anggota cluster 2. Cluster 2 memiliki nilai
centroid akhir (131.231 ; 2.000 ; 59,236.769).
c. Cluster 3
Berdasarkan
hasil
perhitungan
dengan
menggunakan algoritma K-means terdapat 26 data yang
menjadi anggota cluster 3. Cluster 3 memiliki nilai
centroid akhir (125.192 ; 2.500 ; 13,150.769).
d. Cluster 4
Berdasarkan
hasil
perhitungan
dengan
menggunakan algoritma K-means terdapat 5 data yang
menjadi anggota cluster 4. Cluster 4 memiliki nilai
centroid akhir (125.000 ; 1.400 ; 124,986.000).
Hasil akhir dari perhitungan menggunakan
algoritma K-means Clustering tersebut kemudian
dikelompokkan dan diberi keterangan berdasarkan
clusternya masing-masing dan digambarkan ke dalam
bentuk tabel dan grafik. Terdiri dari empat cluster yang
memiliki masing-masing anggota yaitu:
1. Cluster 1 terdapat 42 orang pelanggan atau 48.84%
dari total pelanggan. Cluster ini memiliki nilai R
tinggi, F rendah dan M rendah (R↑F↓M↓). Cluster
ini memiliki nilai recency yang tinggi menandakan
bahwa banyak pelanggan di cluster ini yang
bertransaksi dalam rentang waktu/jarak yang cukup
lama, dan frequency serta monetary keduanya
bernilai rendah menandakan bahwa pelanggan di
cluster ini tidak begitu loyal (tidak begitu sering
2.
3.
4.
atau bahkan hanya sekali bertransaksi) dan
bertransaksi dengan nominal kecil.
Cluster 2 terdapat 13 orang pelanggan atau 15.12%
dari total pelanggan. Cluster ini memiliki nilai R
tinggi, F tinggi dan M tinggi (R↑F↑M↑). Cluster ini
memiliki nilai recency yang tinggi menandakan
bahwa banyak pelanggan di cluster ini yang
bertransaksi dalam rentang waktu/jarak yang cukup
lama, dan frequency serta monetary keduanya
bernilai tinggi menandakan bahwa pelanggan di
cluster ini loyal (sering melakukan transaksi) dan
bertransaksi dengan nominal besar.
Cluster 3 terdapat 26 orang pelanggan atau 30.23%
dari total pelanggan. Cluster ini memiliki nilai R
rendah, F tinggi dan M rendah (R↓F↑M↓). Cluster
ini memiliki nilai recency yang rendah menandakan
bahwa banyak pelanggan di cluster ini yang
bertransaksi dalam rentang waktu/jarak yang cukup
dekat (baru baru ini), dengan nilai frequencynya
tinggi menandakan bahwa pelanggan di cluster ini
loyal atau sering melakukan transaksi dan nilai
monetarynya
rendah
menunjukkan
bahwa
pelanggan di cluster ini bertransaksi dengan
nominal kecil.
Cluster 4 terdapat 5 orang pelanggan atau 5.81%
dari total pelanggan. Cluster ini memiliki nilai R
rendah, F tinggi dan M tinggi (R↓F↓M↑). Cluster
ini memiliki nilai recency yang rendah menandakan
bahwa banyak pelanggan di cluster ini yang
bertransaksi dalam rentang waktu/jarak yang cukup
dekat (baru baru ini), dengan nilai frequencynya
rendah menandakan bahwa pelanggan di cluster ini
tidak loyal atau jarang (atau hanya sesekali)
melakukan transaksi dan nilai monetarynya tinggi
menunjukkan bahwa pelanggan di cluster ini
bertransaksi dengan nominal besar.
Segmen-segmen tersebut terbentuk berdasarkan
nilai recency (R), frequency (F) dan monetary (M).
Semakin besar nilai R menunjukan bahwa pelanggan
sudah lama melakukan transaksi, semakin kecil nilai R
maka semakin dekat pula jarak transaksi terakhir
sehinggan mengindikasikan pelanggan akan melakukan
transaksi kembali secara berulang. Semakin besar nilai
F menunjukan bahwa pelanggan tersebut sering
melakukan transaksi, dan semakin besar nilai M
menunjukan bahwa jumlah transaksi yang dibayarkan
semakin besar.
V. KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan hasil penelitian tugas akhir yang telah
dilakukan maka didapatkan beberapa kesimpulan,
diantaranya:
1. Setelah dilakukan segmentasi pelanggan Laundry
Bi4 Putra dengan menggunakan algoritma K-Means
Clustering yang terdiri dari empat cluster, yang
kemudian dipresentasikan ke dalam tabel dan grafik
maka didapatkan Cluster 1 terdapat 42 orang
pelanggan, Cluster 2 terdapat 13 orang pelanggan,
Cluster 3 terdapat 26 orang pelanggan dan Cluster
4 terdapat 5 orang pelanggan.
2. Pelanggan yang bertransaksi dengan nominal besar
(dengan nilai monetary yang besar) memberikan
keuntungan terbesar kepada perusahaan, yang mana
sangat berpotensial dan akan semakin berkembang.
Juga terdapat banyak pelanggan yang tanpa disadari
berpotensial dan memberikan keuntungan besar
terhadap perusahaan, yaitu pelanggan yang berada
di cluster dengan nilai frequency dan monetary nya
masih termasuk tinggi. Akan tetapi, masih banyak
pelanggan yang memberikan keuntungan lebih
sedikit dibandingkan dengan biaya yang
dikeluarkan oleh perusahaan untuk pelayanan.
3. Segmen terbentuk berdasarkan nilai RFM nya,
semakin tinggi nilai frequencynya menunjukan
semakin setia pelanggan terhadap perusahaan,
semakin tinggi nilai monetary maka semakin tinggi
pula total transaksi yang dibayarkan terhadap
perusahaan.
B. Saran
Adapun saran yang didapatkan dari penelitian ini
untuk pengembangan kedepannya adalah:
1. Penelitian dapat dilanjutkan dengan menggunakan
jumlah data yang lebih banyak dan/atau
menggunakan data yang mewakili transaksi
pelanggan dalam kurun waktu yang lebih lama.
2. Untuk
keakuratan
perhitungan
dengan
menggunakan algoritma K-means Clustering dapat
melakukan perbandingan dengan menggunakan
algoritma lain.
3. Penentuan titik pusat dapat dilakukan dengan
menggunakan cara lain tidak secara random agar
hasil lebih optimal.
4.
Hasil perhitungan dan pengelompokkan pada
penelitian ini dapat dijadikan referensi bagi
perusahaan dalam mengambil kebijakan dan atau
strategi.
DAFTAR PUSTAKA
Eka S, Silvi. Segmentasi Pelanggan Menggunakan Two
Stage Clusteringdan LRFM Model pada Divisi
Marketing PT.XYZ untuk Mendukung Strategi
Pengelolaan Pelanggan. Jurnal Tugas Akhir.
Institut Teknologi Sepuluh Nopember, Surabaya.
Febrina W, Gita. 2013. Segmentasi Pelanggan
Menggunakan Algoritma K-Means untuk Customer
Relationship Management (CRM) pada Hijab
Miulan. Jurnal Tugas Akhir Fakultas Ilmu
Komputer Universitas Dian Nuswantoro Semarang.
Han, Jiawei & Kamber, Michelin. 2006. Data Mining:
Concept and Techiques 2nd Edition. San Fransisco:
Morgan Kauffman-Elsevier.
I. H. Witten, E. Frank & M. A. Hall. 2011. Data Mining:
Practical Machine Learning, Tools and Techniques
3rd Edition. USA: Morgan Kauffman-Elsevier.
J.Han, M.Kamber & J.Pei. 2012. Data Mining: Concept
and Techiques 3rd Edition. USA: Morgan
Kauffman-Elsevier.
Larose, Daniel.T. 2005. Discovering Knowledge in Data:
An Introduction to Data Mining. New York: John
Willey & Sons, Inc.
P. N. Tan, M. Steinbach & V. Kumar. 2004.
Introduction to Data Mining. Boston: Pearson
Education.
Anonim; Strategi Pemasaran Bisnis Laundry Rumahan.
http://www.bisnisukm.com/strategi-pemasaranbisnis-laundry-rumahan.html. 16 Juni 2015.
Teknomo, Kardi. 2007. K-Means Clustering Tutorials.
Widiarina & Wahono, Romi Satria. 2015. Algoritma
Cluster Dinamik untuk Optimasi Cluster pada
Algoritma K-Means dalam Pemetaan Nasabah
Potensial. Journal of Intelligent Systems, Vol. 1,
No. 1, February 2015. ISSN 2356-3982. Magister
Ilmu Komputer, STMIK Nusa Mandiri.
Download