ANALISIS SEGMENTASI PELANGGAN LAUNDRY BI4 PUTRA DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING Fitria Fauziah Ahmad, Acep Irham Gufroni, dan Neng Ika Kurniati Teknik Informatika Universitas Siliwangi Tasikmalaya Email: [email protected] ABSTRAK Laundry Bi4 Putra merupakan suatu perusahaan yang bergerak di bidang bisnis jasa laundry di Ciamis. Persaingan yang ketat mendorong Laundry Bi4 Putra untuk mengelola pelanggannya secara maksimal. Karena pada dasarnya pelanggan merupakan unsur penting dalam pengembangan strategi bisnis, pelanggan juga merupakan sumber keuntungan dalam perusahaan. Maka dari itu diperlukan pemahamaan yang baik tentang pelanggan. Pemahaman yang baik terhadap pelanggan dapat digunakan oleh perusahaan untuk melihat pelanggan yang berpotensial. Masalah yang sering dihadapi adalah kesulitan dalam menganalisa perilaku pelanggan. Segmentasi pelanggan adalah metode populer yang digunakan untuk menganalisa perilaku pelanggan yang tepat untuk mengembangkan strategi. Dengan melakukan segmentasi pelanggan berdasarkan perilakunya dalam bertransaksi, pengusaha dapat menerapkan strategi pemasaran menjadi lebih baik. Untuk memenuhi kebutuhan Laundry Bi4 Putra dalam hal tersebut banyak sekali cara yang dapat ditempuh. Salah satu caranya yang dapat dilakukan yaitu dengan memanfaatkan data perusahaan menggunakan data mining dengan tujuan untuk melakukan segmentasi pelanggan Laundry Bi4 Putra. Model data mining yang akan digunakan dalam penelitian ini adalah Clustering dan algoritmanya yaitu K-Means. K-means adalah algoritma partitional (non-hierarchical) clustering yang mempartisi atau membagi sekumpulan data ke dalam sejumlah cluster berdasarkan kemiripannya. Serta menggunakan analisa RFM yang merepresentasikan jumlah pelanggan di setiap cluster/segmen. Penggunaan K-means Clustering dalam penelitian ini menghasilkan segmen atau pengelompokkan pelanggan yang dapat membantu Laundry Bi4 Putra untuk mengetahui perilaku pelanggan dalam bertransaksi dan juga membantu perusahaan dalam mencari strategi baru yang tepat dan sesuai untuk dikembangkan. Kata Kunci: Clustering, Data Mining, K-means, Pelanggan, RFM, Segmentasi ABSTRACT Laundry Bi4 Putra is a laundry service company in Ciamis. Intense and high competition encourages Laundry Bi4 Putra to manage customers optimally. Because basically customers are the most important element in the development of business strategy, customers are also source of profit in the company. Therefore, it is necessary to have a good perception about customer. A good perception about customer can be used by the company to see the potential customers. The most problem that encountered often by company is difficulty in analyzing behavior of customers. Customer segmentation is a popular method to analyze behavior of customers to develop new strategy. By segmenting customers based on its behavior in transaction, the owner of the company can implement the better marketing strategies. To meet the needs of Laundry Bi4 Putra, there are so many ways that can be used. One of the methods is by utilizing data of the company using data mining with aim to segmenting customers. Data mining models to be used in this research is Clustering and the algorithm is K-Means. K-means algorithm is a partitional (non-hierarchical) clustering which is to partition or divide a set of data into a number of clusters based on similarity. RFM analyze concept also being used in this research to represent number of customers in each cluster/segment. The implementation of K-means clustering in this research obtain customers categorization or customers segmetation that can help Laundry Bi4 Putra to know behavior of customers and also help the company in finding new strategies to be developed in the future. Keywords: Customers, Clustering, Data Mining, K-means, RFM, Segmentation I. PENDAHULUAN Perkembangan bisnis laundry sekarang ini semakin hari kian meningkat pesat. Bahkan belakangan bisnis laundry banyak dipilih sebagai investasi masa depan mengingat keuntungannya yang cukup besar. Sehingga tidak heran lagi jika bisnis laundry sekarang ini banyak kita jumpai di sekitar kita (bisnisukm.com, 2014). Persaingan ketat di bidang usaha ini menuntut penguasaha untuk semakin kreatif, cepat tanggap dan memaksimalkan pelayanan agar usaha laundry yang dimiliki semakin sukses dan dapat bersaing dengan kompetitor. Oleh karena itu perlu bagi sebuah perusahaan jasa untuk memperhatikan kualitas produk jasa dan pelayanan yang dimiliki oleh perusahaan demi mempertahankan pelanggan. Pelanggan merupakan unsur penting dalam pengembangan strategi bisnis, pelanggan juga merupakan salah satu sumber keuntungan dalam perusahaan. Maka dari itu diperlukan pemahamaan yang baik tentang pelanggan. Pemahaman yang baik terhadap pelanggan dapat digunakan oleh perusahaan untuk melihat pelanggan yang potensial. Masalah yang sering dihadapi adalah kesulitan dalam menganalisa perilaku pelanggan. Segmentasi pelanggan adalah metode populer yang digunakan untuk menganalisa perilaku pelanggan yang tepat untuk mengembangkan strategi. Dengan melakukan segmentasi pelanggan berdasarkan perilakunya dalam bertransaksi, pengusaha dapat menerapkan strategi pemasaran menjadi lebih baik. Untuk memenuhi kebutuhan perusahaan dalam hal tersebut banyak sekali cara yang dapat ditempuh. Salah satu caranya yang dapat dilakukan yaitu dengan memanfaatkan data perusahaan menggunakan data mining. Penggunaan teknik data mining diharapkan dapat membantu mempercepat proses pengambilan keputusan, memungkinkan perusahaan untuk mengelola informasi yang terkandung didalam data perusahan yaitu data pelanggan dan data transaksi menjadi sebuah pengetahuan (knowledge) yang baru. Lewat pengetahuan yang didapat perusahaan mendapatkan berbagai pertimbangan yang memungkinkan untuk diambil sebagai strategi baru yang dapat membantu kemajuan perusahaan di masa yang akan datang. Salah satu model data mining yang akan digunakan dalam penelitian ini adalah Clustering dan algoritmanya yaitu K-Means. Algoritma K-Means adalah salah satu algoritma sangat terkenal karena kemudahan dan kemampuannya untuk mengklasifikasi data besar dan outlier dengan sangat cepat. Batasan masalah pada penelitian ini diantaranya data yang diolah adalah data transaksi Laundry Bi4 Putra dari bulan Januari 2015 sampai dengan bulan Mei 2015 yang berupa pembukuan kemudian dipindahkan ke dalam Microsoft Office Excel. Analisis ini digunakan untuk mengelompokkan pelanggan berdasarkan segmen-segmen yang telah ditentukan yang mengacu pada atribut RFM. Algoritma yang digunakan dalam penelitian ini adalah K-means Clustering. Output yang dihasilkan berupa pengetahuan berbentuk tabel dan grafik. Tujuan penelitian ini adalah untuk mengetahui perilaku pelanggan berdasarkan analisa RFM yaitu recency; mengacu pada waktu transaksi terakhir dengan menganalisa jarak titik waktu, frequency; mengacu pada frekuensi transaksi, dan monetary; mengacu pada nilai total transaksi terbaru yang kemudian akan dibuat segmentasi pelanggan dengan menggunakan model Clustering dan algoritma K-Means. Selain itu tujuan penelitian ini adalah untuk memberikan kemudahan bagi perusahaan dalam mencari strategi yang tepat dan sesuai dengan perilaku pelanggan. Manfaat dari penelitian ini adalah memberikan informasi kepada perusahaan dalam mengambil kebijakan dan strategi dalam meningkatkan kualitas pelayanan dan dalam mempertahankan pelanggan. II. LANDASAN TEORI A. Data Mining Data mining merupakan proses pencarian pola-pola yang menarik dan tersembunyi (hidden pattern) dari suatu kumpulan data yang berukuran besar yang tersimpan dalam suatu basis data, data warehouse atau tempat penyimpanan data lainnya (Tan, 2004). Data mining sebenarnya merupakan salah satu rangkaian dari proses pencarian pengetahuan pada database (Knowledge Discovery in Database/KDD). Serangkaian proses tersebut yang memiliki tahap sebagai berikut: 1. Pembersihan data dan integrasi data (cleaning and integration) 2. Seleksi dan transformasi data (selection and transformation) 3. Penambangan data (data mining) 4. Evaluasi pola dan presentasi pengetahuan (evaluation and knowledge presentation) B. Clustering Clustering dikategorikan kedalam teknik “Undirect Knowledge” atau Unsupervised Learning karena tidak membutuhkan proses pelatihan untuk klasifikasi awal data dalam masing-masing kelompok atau cluster. Tujuan utama clustering adalah untuk menentukan atau mencari pola yang bermanfaat atau yang berguna pada suatu database, kemudian merangkumnya dan membuat lebih mudah untuk dipahami. Clustering adalah metode analisa data yang sering dimasukkan sebagai salah satu metode data mining yang memiliki tujuan untuk mengelompokkan data dengan karakteristik yang sama ke suatu „wilayah‟ yang sama dan data dengan karakteristik yang berbeda ke „wilayah‟ yang lain. Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering. Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada. C. K-Means K-means adalah metode pengelompokkan data dengan mengambil parameter sejumlah k cluster, dan mempartisi data kedalam cluster tersebut, dengan berpatokan pada kemiripan antara data dalam suatu cluster dan ketidak-miripan diantara cluster yang berbeda, pusat dari cluster adalah rata-rata dari nilai anggota cluster yang disebut dengan centroid atau center of gravity (Han&Kamber, 2006). Selain itu K-means melakukan pengelompokkan dengan meminimalkan jumlah kuadrat dari jarak (distance) antara data dengan centroid cluster yang cocok (Teknomo, 2007). Dengan kata lain, metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya. Proses pengelompokkan data ke dalam suatu cluster dapat dilakukan dengan cara menghitung jarak terdekat dari suatu data ke sebuah titik centroid. Rumus untuk mengukur jarak yaitu dengan menggunakan rumus Euclidean: ( ) √( ) ( ) ( ) Dimana ( dan ( merupakan dua objek data n-dimensional (Han & Kamber, 2006). III. METODOLOGI Untuk memberikan langkah yang pasti dalam melaksanaan penelitian, maka dibuatlah alur penelitian sebagai berikut. D. Segmentasi Pelanggan Di dalam www.kamusbisnis.com segmentasi pelanggan (customer segmentation) adalah pembagian pasar ke dalam kelompok-kelompok pelanggan spesifik yang memiliki karakteristik sama. Segmentasi pelanggan dapat menjadi sarana ampuh untuk mengidentifikasi kebutuhan pelanggan yang tidak terlayani sehingga kemudian dapat mengungguli pesaing dengan mengembangkan produk dan layanan unik yang menarik. Segmentasi pelanggan paling efektif ketika sebuah perusahaan menyesuaikan layanan dengan segmen yang paling menguntungkan dan melayani mereka dengan keunggulan kompetitif yang unik. Prioritas ini dapat membantu perusahaan mengembangkan kampanye pemasaran dan strategi harga untuk mengambil nilai maksimum baik dari pelanggan yang memberikan keuntungan tinggi maupun rendah. Perusahaan dapat menggunakan segmentasi pelanggan sebagai dasar dalam mengalokasikan sumber daya untuk pengembangan produk, pasar, layanan dan distribusi. Gambar 3.1. Alur Penelitian E. RFM RFM adalah salah satu model proses dalam menganalisis perilaku pelanggan. RFM merupakan singkatan dari Recency, Frequency dan Monetary. RFM menggunakan informasi tentang perilaku pelanggan pada masa lalu yang mudah dilacak dan tersedia di database. Tujuan dari RFM adalah untuk meramalkan perilaku konsumen di masa depan (mengarahkan keputusan segmentasi dan strategi yang lebih baik). Oleh karena itu, perlu menterjemahkan prilaku konsumen dalam „angka‟ sehingga dapat digunakan sepanjang waktu. Analisa RFM terdiri dari tiga dimensi, yaitu: 1. Recency Recency adalah mengukur perilaku pelanggan dengan melihat transaksi yang dilakukan paling akhir (paling baru). 2. Frequency Frequency adalah mengukur nilai/perilaku pelanggan dengan melihat aktifitas transaksi yang dilakukan oleh pelanggan dalam satu periode. 3. Monetary Monetary adalah mengukur nilai/perilaku pelanggan dengan melihat rata-rata total transaksi yang dilakukan oleh pelanggan dalam satu kali bertransaksi. A. Metode Pengumpulan Data 1. Observasi dilakukan di Laundry Bi4 Putra yang berlokasi di Jl. Jend. Sudirman No. 42 Ciamis pada tanggal 28 Juni 2015. Penulis terjun langsung ke lapangan untuk mencari tahu informasi tentang laundry tersebut. Dari hasil observasi yang telah dilakukan diketahui bahwa Laundry Bi4 Putra masih melakukan penyimpanan data secara manual (tulis tangan di buku besar) baik dalam mendata pelanggan maupun transaksi sehari-hari. 2. Wawancara dilakukan kepada pihak yang berhubungan dengan penelitian ini, yaitu dengan Ibu Uriyah selaku pemilik Laundry Bi4 Putra. Wawancara dilakukan untuk mendapatkan informasi dan data-data Laundry Bi4 Putra langsung melalui pemilik. Hasil wawancara disajikan di bagian lampiran. 3. Studi pustaka dilakukan untuk mendapatkan referensi yang berhubungan dengan penelitian. Sumber yang digunakan untuk mencari referensi diantaranya buku, sumber dari internet seperti ebook, jurnal dan blog. B. Metode Persiapan Data Mining 1. Data Cleaning Data cleaning atau pembersihan data adalah upaya untuk mengatasi nilai-nilai yang hilang, menghaluskan noise ketika mengidentifikasi outlier, dan memperbaiki inkonsistensi dalam data (Han, Kamber&Pei, 2012). Dari data set data transaksi pelanggan sebanyak 171 data yang terdiri dari no, tanggal transaksi, nama, jenis (kiloan, satuan), qty, harga dan total. Data tersebut kemudian masuk ke proses cleaning dan beberapa kolom yang tidak digunakan dalam proses cleaning akan dihilangkan. Berikut ini adalah kolom-kolom yang dihilangkan beserta alasan mengapa kolom tersebut mengalami proses cleaning. a. Kolom jenis; kiloan – satuan dihilangkan karena kolom ini bersifat teks dan tidak diperlukan dalam proses mining, serta memiliki data yang tidak lengkap b. Kolom qty, dihilangkan karena kolom ini tidak akan digunakan dalam proses mining c. Kolom harga, dihilangkan karena kolom ini tidak akan digunakan dalam proses mining dan sudah terwakili oleh kolom total d. Terdapat 1 data premature, yaitu data yang tidak lengkap terdapat pada kolom nama pelanggan ke 171 Lampiran 2 adalah hasil dari data cleaning pertama, didapatkan 170 data karena terdapat 1 data premature (data yang tidak lengkap). Setelah proses cleaning pertama selesai lalu dilakukan proses data reduction. Data Reduction Data Reduction atau Data Selection merupakan proses meminimalkan jumlah data yang digunakan untuk proses mining dengan tetap merepresentasikan data aslinya. Setelah proses data cleaning selesai dilakukan, lalu masuk ke proses data reduction. Data reduction yang dilakukan disini yaitu dengan menghapus data yang memiliki atribut sama, yaitu pada atribut nama. Juga dengan menambahkan atribut frekuensi transaksi yang mana atribut ini berisi jumlah frekuensi transaksi yang dilakukan oleh pelanggan. Perhitungan frekuensi transaksi di hitung dengan cara mengurutkan nama pelanggan berdasarkan abjad dari a-z. Karena penomoran frekuensi transaksi dilakukan berdasarkan tanggal terakhir transaksi maka tanggal transaksi sebelum transaksi terakhir dihapus, sehingga tidak ada nama pelanggan yang ganda/sama. Proses penghapusan data ini dilakukan agar tidak terjadi redudansi. Dari 171 data set yang telah mengalami proses cleaning menghasilkan 86 data dari hasil reduksi data yang ganda (lebih dari satu) yang dapat dilanjutkan ke proses selanjutnya. b. tanggal transaksi menjadi recency, frekuensi transaksi menjadi frequency dan total menjadi monetary, karena pada dasarnya istilah tersebut memliki makna yang sama dengan atribut aslinya Data transformation selanjutnya yaitu mengubah kolom recency dari format tanggal menjadi total hari terakhir transaksi, dihitung sejak data di proses yaitu pada tanggal 8 Juli 2015. C. Proses Data Mining Berikut ini adalah proses data mining dengan menggunakan algoritma K-Means Clustering: 1. Tentukan jumlah cluster (k), tetapkan pusat cluster sembarang (random) 2. Hitung jarak setiap data ke pusat cluster 3. Kelompokkan data ke dalam cluster dengan jarak yang paling pendek 4. Hitung pusat cluster yang baru dengan mencari nilai rata-rata dari data-data yang menjadi anggota pada cluster tersebut 5. Pada iterasi pertama diperoleh nilai centroid baru dengan titik pusat yang berbeda. Maka ulang kembali langkah ke 2 sampai langkah ke 4, ulang terus menerus dan hentikan iterasi jika nilai centroid sebelum dan sesudahnya bernilai sama. 2. 3. Data Transformation Data transformation adalah proses yang dilakukan untuk mengubah/mengkonversikan data yang akan digunakan untuk proses data mining (Han, Kamber&Pei, 2012). Proses ini sangat membantu proses data mining menjadi lebih efisien, dan hasil yang didapatkan lebih mudah untuk dipahami. a. Proses transformation terjadi pada penamaan atribut yang sesuai dengan atribut RFM, yaitu IV. HASIL DAN PEMBAHASAN A. Data Preprocessing Berikut ini adalah data training hasil dari data preprocessing (data cleaning, data reducing dan data transformation) yang kemudian akan diproses menggunakan algoritma K-Means Clustering. Tabel 4.1. Data training yang akan diproses menggunakan data mining No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Nama Ratna Rei Yuli Bina Epong Neng Ucu Wawan Yeni Alfin Ipeh Lina Nana Teh Enung Dini Mbak Ela Siti Bu Dede Salon Asih Wa Karman Recency (hari) 177 177 177 176 176 176 176 169 169 168 168 168 168 168 167 166 166 165 165 163 Frequency 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 1 1 Monetary (rupiah) 19000 23000 15000 26000 20000 30700 20000 22200 10000 27000 20160 20000 15000 40500 40000 14190 15000 32000 13200 15000 Sampai data ke-86 B. Proses Algoritma K-means Clustering 1. Tentukan jumlah cluster (k), tetapkan titik pusat cluster sembarang Tahap ini merupakan tahap yang dilakukan untuk menentukan jumlah cluster yang akan dihasilkan. Dalam penelitian ini jumlah cluster yang akan dihasilkan adalah sebanyak 4 cluster. Untuk titik pusat cluster masing masing cluster diambil secara sembarang (random) dari data, diantaranya: Tabel 4.2. Titik pusat cluster yang diambil secara random 166 1 15000 Cluster 1 148 2 21000 Cluster 2 124 3 3500 Cluster 3 88 4 30000 Cluster 4 2. Hitung jarak setiap data ke pusat cluster Pada tahap ini dilakukan penghitungan jarak setiap data ke pusat cluster masing-masing. Untuk menghitung jarak data ke pusat cluster dapat menggunakan rumus Euclidean berikut: ( √( ) ) ( ) ( ) Lalu hitunglah jarak masing-masing data ke pusat cluster yang telah ditentukan. Berikut ini adalah perhitungan jarak dengan menggunakan rumus Euclidean pada iterasi ke-1. Centroid 1 ) √( √( √( √( ) ) ) ) ( ( ( ( ) ) ) ) ( ( ( ( ) ) ) ) ) √( ) ( ) ( ) ( ) ( ) ( ) ( ( ( ) ( ) ) ) ( ) ( ) ( ) ( ( ) ) ( ( ) ) 3. Kelompokkan data ke dalam cluster dengan jarak yang paling pendek Cluster 1: Data dengan jarak paling pendek pada cluster 1 yaitu data ke-: 3, 9, 13, 16, 17, 19, 20, 22, 26, 46, 49, 50, 55, 61, 72, 77, 78, 80, 81, 84, 86 Cluster 2: Data dengan jarak paling pendek pada cluster 2 yaitu data ke-: 1, 2, 5, 7, 8, 11, 12, 24, 27, 28, 29, 31, 34, 35, 36, 40, 44, 56, 68, 69, 76, 82 Cluster 3: Data dengan jarak paling pendek pada cluster 3 yaitu data ke-: 54, 58, 62, 85 Cluster 4: Data dengan jarak paling pendek pada cluster 4 yaitu data ke-: 4, 6, 10, 14, 15, 18, 21, 23, 25, 30, 32, 33, 37, 38, 39, 41, 42, 43, 45, 47, 48, 51, 52, 53, 57, 59, 60, 63, 64, 65, 66, 67, 70, 71, 73, 74, 75, 79, 83 4. Hitung pusat cluster yang baru dengan mencari nilai rata-rata dari data-data yang menjadi anggota pada cluster tersebut Lalu jumlahkan data masing-masing yang sudah dikelompokan sehingga menghasilkan nilai centroid baru. Tabel 4.3. Centroid baru 1 pada iterasi ke-1 Centroid Baru 1 126.476 2.381 14,115.238 Tabel 4.4. Centroid baru 2 pada iterasi ke-1 Centroid Baru 2 143.864 1.364 21,530.000 Tabel 4.5. Centroid baru 3 pada iterasi ke-1 Centroid 2 ( ) ) Lakukan perhitungan yang sama sampai data ke-86. Lakukan perhitungan yang sama sampai data ke-86 ( √( √( ) ) ) ) ) √( √( √( √( √( ( ( ( ( ( ) ) ) ) ) ( ( ( ( ( ) ) ) ) ) Centroid Baru 3 105.500 3.500 6,625.000 Tabel 4.6. Centroid baru 4 pada iterasi ke-1 Lakukan perhitungan yang sama sampai data ke-86 Centroid Baru 4 Centroid 3 ( ) ( ) ( ) ( ) ( ) ) ) ) ) ) √( √( √( √( √( ( ( ( ( ( ) ) ) ) ) ( ( ( ( ( ) ) ) ) ) Lakukan perhitungan yang sama sampai data ke-86 Centroid 4 ( ) ( ) ( ) √( √( √( ) ) ) ( ( ( ) ) ) ( ( ( ) ) ) 129.590 5. 1.949 53,009.436 Pada iterasi pertama diperoleh nilai centroid baru dengan titik pusat yang berbeda. Maka ulang kembali langkah ke 2 sampai langkah ke 4, ulang terus menerus dan hentikan proses iterasi jika nilai centroid sebelum dan sesudahnya bernilai sama. Berikut merupakan data centroid baru hasil dari perhitungan 13 kali iterasi. Nilai yang diberi warna abu-abu adalah centroid yang sebelum dan sesudahnya memiliki nilai yang sama. Tabel 4.6. Hasil Iterasi ke 1 sampai Iterasi ke-13 Cluster / Iterasi Titik Pusat Awal Iterasi 1 Iterasi 2 Iterasi 3 Iterasi 4 Iterasi 5 Iterasi 6 Iterasi 7 Iterasi 8 Iterasi 9 Iterasi 10 Iterasi 11 Iterasi 12 Iterasi 13 C1 C2 C3 C4 165.00 1.00 15,000.00 146.00 2.00 21,000.00 121.00 3.00 3,500.00 86.00 4.00 30,000.00 126.48 125.65 130.21 136.38 136.51 136.80 136.54 135.57 135.97 135.28 136.07 135.98 135.98 2.38 2.47 2.37 2.03 1.79 1.78 1.78 1.65 1.69 1.75 1.73 1.71 1.71 14,115.24 14,615.88 15,024.74 17,113.44 18,670.00 19,698.90 20,435.73 23,947.16 25,223.59 26,113.00 26,463.90 26,833.81 26,833.81 143.86 136.60 136.50 131.39 130.48 130.42 131.46 135.40 134.76 133.73 131.29 131.23 131.23 1.36 1.70 1.75 1.94 2.14 2.04 2.12 2.00 1.94 1.87 1.93 2.00 2.00 21,530.00 25,043.00 27,759.55 33,673.75 37,353.62 40,181.54 43,184.73 49,246.15 54,845.76 56,838.53 58,005.57 59,236.77 59,236.77 105.50 111.57 111.57 111.57 114.88 117.00 117.25 123.57 123.12 125.19 125.19 125.19 125.19 3.50 2.86 2.86 2.86 3.00 3.10 2.75 2.65 2.56 2.50 2.50 2.50 2.50 6,625.00 8,064.29 8,064.29 8,064.29 8,556.25 9,516.00 10,279.17 12,523.91 12,916.80 13,150.77 13,150.77 13,150.77 13,150.77 129.59 132.55 127.25 129.27 127.00 125.22 124.86 121.83 125.00 125.00 125.00 125.00 125.00 1.95 1.82 1.75 1.36 1.40 1.44 1.29 1.33 1.40 1.40 1.40 1.40 1.40 53,009.44 70,786.73 81,288.00 95,237.55 98,411.30 101,823.67 111,418.57 117,488.33 124,986.00 124,986.00 124,986.00 124,986.00 124,986.00 C. Knowledge Presentation a. Cluster 1 Berdasarkan hasil perhitungan dengan menggunakan algoritma K-means terdapat 42 data yang menjadi anggota cluster 1. Cluster 1 memiliki nilai centroid akhir (135.976 ; 1.714 ; 26,833.810). b. Cluster 2 Berdasarkan hasil perhitungan dengan menggunakan algoritma K-means terdapat 13 data yang menjadi anggota cluster 2. Cluster 2 memiliki nilai centroid akhir (131.231 ; 2.000 ; 59,236.769). c. Cluster 3 Berdasarkan hasil perhitungan dengan menggunakan algoritma K-means terdapat 26 data yang menjadi anggota cluster 3. Cluster 3 memiliki nilai centroid akhir (125.192 ; 2.500 ; 13,150.769). d. Cluster 4 Berdasarkan hasil perhitungan dengan menggunakan algoritma K-means terdapat 5 data yang menjadi anggota cluster 4. Cluster 4 memiliki nilai centroid akhir (125.000 ; 1.400 ; 124,986.000). Hasil akhir dari perhitungan menggunakan algoritma K-means Clustering tersebut kemudian dikelompokkan dan diberi keterangan berdasarkan clusternya masing-masing dan digambarkan ke dalam bentuk tabel dan grafik. Terdiri dari empat cluster yang memiliki masing-masing anggota yaitu: 1. Cluster 1 terdapat 42 orang pelanggan atau 48.84% dari total pelanggan. Cluster ini memiliki nilai R tinggi, F rendah dan M rendah (R↑F↓M↓). Cluster ini memiliki nilai recency yang tinggi menandakan bahwa banyak pelanggan di cluster ini yang bertransaksi dalam rentang waktu/jarak yang cukup lama, dan frequency serta monetary keduanya bernilai rendah menandakan bahwa pelanggan di cluster ini tidak begitu loyal (tidak begitu sering 2. 3. 4. atau bahkan hanya sekali bertransaksi) dan bertransaksi dengan nominal kecil. Cluster 2 terdapat 13 orang pelanggan atau 15.12% dari total pelanggan. Cluster ini memiliki nilai R tinggi, F tinggi dan M tinggi (R↑F↑M↑). Cluster ini memiliki nilai recency yang tinggi menandakan bahwa banyak pelanggan di cluster ini yang bertransaksi dalam rentang waktu/jarak yang cukup lama, dan frequency serta monetary keduanya bernilai tinggi menandakan bahwa pelanggan di cluster ini loyal (sering melakukan transaksi) dan bertransaksi dengan nominal besar. Cluster 3 terdapat 26 orang pelanggan atau 30.23% dari total pelanggan. Cluster ini memiliki nilai R rendah, F tinggi dan M rendah (R↓F↑M↓). Cluster ini memiliki nilai recency yang rendah menandakan bahwa banyak pelanggan di cluster ini yang bertransaksi dalam rentang waktu/jarak yang cukup dekat (baru baru ini), dengan nilai frequencynya tinggi menandakan bahwa pelanggan di cluster ini loyal atau sering melakukan transaksi dan nilai monetarynya rendah menunjukkan bahwa pelanggan di cluster ini bertransaksi dengan nominal kecil. Cluster 4 terdapat 5 orang pelanggan atau 5.81% dari total pelanggan. Cluster ini memiliki nilai R rendah, F tinggi dan M tinggi (R↓F↓M↑). Cluster ini memiliki nilai recency yang rendah menandakan bahwa banyak pelanggan di cluster ini yang bertransaksi dalam rentang waktu/jarak yang cukup dekat (baru baru ini), dengan nilai frequencynya rendah menandakan bahwa pelanggan di cluster ini tidak loyal atau jarang (atau hanya sesekali) melakukan transaksi dan nilai monetarynya tinggi menunjukkan bahwa pelanggan di cluster ini bertransaksi dengan nominal besar. Segmen-segmen tersebut terbentuk berdasarkan nilai recency (R), frequency (F) dan monetary (M). Semakin besar nilai R menunjukan bahwa pelanggan sudah lama melakukan transaksi, semakin kecil nilai R maka semakin dekat pula jarak transaksi terakhir sehinggan mengindikasikan pelanggan akan melakukan transaksi kembali secara berulang. Semakin besar nilai F menunjukan bahwa pelanggan tersebut sering melakukan transaksi, dan semakin besar nilai M menunjukan bahwa jumlah transaksi yang dibayarkan semakin besar. V. KESIMPULAN DAN SARAN A. Kesimpulan Berdasarkan hasil penelitian tugas akhir yang telah dilakukan maka didapatkan beberapa kesimpulan, diantaranya: 1. Setelah dilakukan segmentasi pelanggan Laundry Bi4 Putra dengan menggunakan algoritma K-Means Clustering yang terdiri dari empat cluster, yang kemudian dipresentasikan ke dalam tabel dan grafik maka didapatkan Cluster 1 terdapat 42 orang pelanggan, Cluster 2 terdapat 13 orang pelanggan, Cluster 3 terdapat 26 orang pelanggan dan Cluster 4 terdapat 5 orang pelanggan. 2. Pelanggan yang bertransaksi dengan nominal besar (dengan nilai monetary yang besar) memberikan keuntungan terbesar kepada perusahaan, yang mana sangat berpotensial dan akan semakin berkembang. Juga terdapat banyak pelanggan yang tanpa disadari berpotensial dan memberikan keuntungan besar terhadap perusahaan, yaitu pelanggan yang berada di cluster dengan nilai frequency dan monetary nya masih termasuk tinggi. Akan tetapi, masih banyak pelanggan yang memberikan keuntungan lebih sedikit dibandingkan dengan biaya yang dikeluarkan oleh perusahaan untuk pelayanan. 3. Segmen terbentuk berdasarkan nilai RFM nya, semakin tinggi nilai frequencynya menunjukan semakin setia pelanggan terhadap perusahaan, semakin tinggi nilai monetary maka semakin tinggi pula total transaksi yang dibayarkan terhadap perusahaan. B. Saran Adapun saran yang didapatkan dari penelitian ini untuk pengembangan kedepannya adalah: 1. Penelitian dapat dilanjutkan dengan menggunakan jumlah data yang lebih banyak dan/atau menggunakan data yang mewakili transaksi pelanggan dalam kurun waktu yang lebih lama. 2. Untuk keakuratan perhitungan dengan menggunakan algoritma K-means Clustering dapat melakukan perbandingan dengan menggunakan algoritma lain. 3. Penentuan titik pusat dapat dilakukan dengan menggunakan cara lain tidak secara random agar hasil lebih optimal. 4. Hasil perhitungan dan pengelompokkan pada penelitian ini dapat dijadikan referensi bagi perusahaan dalam mengambil kebijakan dan atau strategi. DAFTAR PUSTAKA Eka S, Silvi. Segmentasi Pelanggan Menggunakan Two Stage Clusteringdan LRFM Model pada Divisi Marketing PT.XYZ untuk Mendukung Strategi Pengelolaan Pelanggan. Jurnal Tugas Akhir. Institut Teknologi Sepuluh Nopember, Surabaya. Febrina W, Gita. 2013. Segmentasi Pelanggan Menggunakan Algoritma K-Means untuk Customer Relationship Management (CRM) pada Hijab Miulan. Jurnal Tugas Akhir Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang. Han, Jiawei & Kamber, Michelin. 2006. Data Mining: Concept and Techiques 2nd Edition. San Fransisco: Morgan Kauffman-Elsevier. I. H. Witten, E. Frank & M. A. Hall. 2011. Data Mining: Practical Machine Learning, Tools and Techniques 3rd Edition. USA: Morgan Kauffman-Elsevier. J.Han, M.Kamber & J.Pei. 2012. Data Mining: Concept and Techiques 3rd Edition. USA: Morgan Kauffman-Elsevier. Larose, Daniel.T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. New York: John Willey & Sons, Inc. P. N. Tan, M. Steinbach & V. Kumar. 2004. Introduction to Data Mining. Boston: Pearson Education. Anonim; Strategi Pemasaran Bisnis Laundry Rumahan. http://www.bisnisukm.com/strategi-pemasaranbisnis-laundry-rumahan.html. 16 Juni 2015. Teknomo, Kardi. 2007. K-Means Clustering Tutorials. Widiarina & Wahono, Romi Satria. 2015. Algoritma Cluster Dinamik untuk Optimasi Cluster pada Algoritma K-Means dalam Pemetaan Nasabah Potensial. Journal of Intelligent Systems, Vol. 1, No. 1, February 2015. ISSN 2356-3982. Magister Ilmu Komputer, STMIK Nusa Mandiri.