PENERAPAN DATA MINING UNTUK PENGELOMPOKAN MINAT KONSUMEN TERHADAP PRODUK LG MOBILE PALEMBANG Rino Riandi Agustin1, M. Akbar, M.IT.2, Siti Sa’uda, M.kom.3 Mahasiswa Universitas BinaDarma1, Dosen Universitas BinaDarma2, Dosen Universitas BinaDarma3 Program Studi Informatika, Fakultas Ilmu Komputer, Universitas Binadarma Jl.Ahmad Yani No.12 Plaju Palembang Pos-el : [email protected], [email protected] [email protected] Abstract : The variety of brands , types and models of mobile phones that are offered provide plenty of choice for consumers . So do not rule out a consumer will switch other perceived kemerek have advantages compared with the previously used brand . The ability of the technology to store data , process data , extract the data , analyze the data , and summarize data to produce an information that support the decision of the election it is still lacking . With the existence of this problem then comes techniques and new knowledge in processing the data into information . Judging from the number of consumer interest towards mobile phone is probably the application of data mining by the method of clustering and K -Means algorithm can help PT . LG Mobile Palembang in the grouping of consumer interest . Keywords: Data Mining, Clustering,Weka, Algoritma K-Means. Abstrak : Bervariasinya merek, jenis, serta model handphone yang ditawarkan memberikan banyak pilihan bagi konsumen. Sehingga tidak menutup kemungkinan seorang konsumen akan beralih kemerek lain yang dirasakan memiliki kelebihan disbanding dengan merek yang dipakai sebelumnya. Kemampuan teknologi untuk menyimpan data, mengolah data, mengekstrak data, menganalis data, dan meringkas data untuk menghasilkan sebuah informasi yang menunjang kegiatan pemilihan keputusan dirasa masih kurang. Dengan adanya masalah ini maka munculah teknik dan ilmu baru dalam mengolah data menjadi informasi. Dilihat dari banyaknya minat konsumen terhadap telfon genggam mungkin penerapan data mining dengan metode clustering dan algoritma K-Means dapat membantu PT. LG Mobile Palembang dalam pengelompokan minat konsumen. Kata kunci : Data Mining, Clustering,Weka, Algoritma K-Means. 1. yang memudahkan kinerja manusia. Akan PENDAHULUAN tetapi teknologi yang canggih sering sekali Pesatnya dunia tidak diimbangi dengan penyajian informasi teknologi dan informasi saat ini, berdampak yang memadai. Data yang cukup besar juga pada kebutuhan informasi yang akurat serta terkadang cepat informasi yang akurat, karena masih banyak didalam perkembangan kehidupan sehari-hari. Dimana teknologi informasi sangat berperan penting dalam kehidupan sekarang dan yang akan datang. Hal ini bisa dilihat dari pemanfaatan teknologi dalam bidang apapun akan sulit diolah menjadi kekurangan dari berbagai aspek. Kemampuan sebuah teknologi untuk menyimpan data, mengolah data, mengekstrak data, menganalis data, dan Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 1 meringkas data guna menghasilkan sebuah merupakan informasi bergerak yang menunjang kegiatan sebuah perusahaan dibidang penjualan yang produk pemilihan keputusan dirasa masih kurang. handphone, dan produk yang dimiliki LG Dengan munculnya masalah ini maka timbul Mobile sendiri memiliki bermacam-macam lah teknik dan ilmu baru dalam mengolah tipe handphone. Oleh karena itu, perusahaan data menjadi informasi. Salah satunya ini dengan teknik Data Mining untuk mengatasi penentuan jumlah penyediaan tipe jenis suatu masalah penggalian informasi atau barang karena konsumen memiliki selera pola yang penting atau menarik data dalam berbeda dalam tipe pembelian handphone, jumlah yang besar. Data mining bisa dan dengan penerapan data mining untuk memberikan pengetahuan-pengetahuan yang pengelompokan minat konsumen diharapkan sebelumnya tersembunyi di dalam gudang dapat membantu LG Mobile Palembang data sehingga dapat menjadi informasi yang dalam berharga. sebuah produk sebelum dijual. Data mining Data mining dalam prosesnya menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengektraksi dan mengidentifikasi informasi yang bermanfaat serta suatu pengetahuan yang terkait dari berbagai database yang besar (Turban, dkk. 2005). Kemajuan teknologi informasi juga sering mengalami kendala mempertimbangkan merupakan solusi produk-produk konsumen, untuk yang agar dalam kemungkinan memprediksi diminati dapat oleh meminimalisir kerugian dan bertumpuknya suatu produk yang berdampak buruk bagi perusahaan. Dengan adanya masalah dan solusi tersebut untuk mengatasi keadaan dimana perusahaan LG Mobile Palembang membutuhkan sebuah informasi untuk memprediksi suatu produk. Untuk Pelembang, karena perusahaan ini memiliki mengimplementasikan penulis tertarik database yang besar. Sehingga dalam dengan masalah tersebut, sehingga penulis pengolahan akan dirasakan oleh data Produk yang LG besar Mobile tersebut menuangkan penelitiannya dalam perusahaan memerlukan teknologi untuk bentuk penulisan skripsi yang berjudul mengetahui “Penerapan informasi yang dibutuhkan Data Mining dalam meningkatkan kinerja dan pendapatan Pengelompokan dari hasil usaha. LG Mobile Palembang Terhadap Produk PT. LG”. Minat Untuk Konsumen Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 2 2. TINJAUAN PUSTAKA 2.1. Produk Menurut Fandy Tjiptono (2008), Atribut Produk adalah unsur-unsur produk yang dipandang penting oleh konsumen dan dijadikan dasar pengambilan keputusan. Atribut Produk meliputi merek, kemasan, jaminan(garansi), pelayanan,dan sebagainya. 2.2. 2.4. Data Mining digunakan Algoritma K-Means Dalam Data mining adalah suatu istilah yang Gambar 2.1. Clustering dan mesin pembelajaran K-means merupakan metode menguraikan analisis kelompok yang mengarah pada penemuan pengetahuan di dalam database. permatisian N objek pengamatan dalam K Data yang kelompok (cluster) dimana setiap objek menggunakan teknik statistik, matematika, pengamatan dimiliki oleh sebuah kelompok kecerdasan buatan, dan machine learning dengan mean (rata-rata) terdekat.1. untuk mengekstraksi dan mengidentifikasi Barang, yaitu berisi data produk. Atribut informasi yang bemanfaat dan pengetahuan yang ada dapat dilihat dalam tabel tabel 1. yang terkait dari berbagai database besar 2.4.1 mining untuk statistik adalah proses (Kusrini & Luthfi. 2009). 2.3. Data Penerapan Clustering K-Means memisahkan data ke k Clustering daerah bagian yang terpisah, dimana k Clustering termasuk metode yang adalah bilangan integer positif. Algoritma sudah cukup dikenal dan banyak dipakai K-Means sangat terkenal karena kemudahan dalam data mining. Sampai sekarang para dan kemampuannya untuk mengklasifikasi ilmuwan dalam bidang data mining masih data besar dan outlier dengan sangat cepat. melakukan berbagai usaha untuk melakukan Berikut adalah langkah-langkah algoritma perbaikan model clustering karena metode K-Means : yang dikembangkan sekarang masih bersifat heuristic. Usaha-usaha untuk menghitung jumlah cluster yang optimal dan pengklasteran yang paling baik masih terus 1. Penentuan pusat cluster awal Pusat awal cluster didapatkan dari data sendiri bukan dengan menentukan titik dilakukan. Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 3 baru, yaitu dengan menrandom pusat awal generalisasi/formulasi dari sekumpulan data dari data. sampling. 2. Perhitungan jarak dengan pusat cluster 3 Untuk mengukur jarak antara data ANALISIS DATA MINING 3.1 Analisis Data dengan pusat cluster digunakan Euclidian Analisis data dilakukan untuk distance. Algoritma perhitungan jarak data memperoleh gambaran sistem yang akan dengan pusat cluster dibuat dan langkah-langkah dalam model 3. Pengelompokkan data arsitektur sistem mengikuti proses dari Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak Knowledge Discovery in Database (KDD). 3.1.1 Data Selection terdekat antara data dengan pusat cluster, Data dalam penelitian ini bersumber jarak ini menunjukkan bahwa data tersebut dari PT. LG Mobile Palembang. Adapun berada dalam satu kelompok dengan pusat data tersebut terdiri dari data barang, dan cluster terdekat. data store name mulai dari tahun 2015. 4. Penentuan pusat cluster baru Atribut Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata nilai Type_hp Type produk/barang Model_Hanphone Nama model Handphone anggota cluster dan pusat cluster. Pusat cluster baru = x1+x2+x3…..+xn+xp Keterangan Tabel 3.1 Tabel Atribut Data Barang Jumlah+1 Data Store Name, yaitu data yang Dimana : berisi nama toko yang menjual produk- x1,x2,x3,….xn=anggota cluster produk LG Mobile. Atribut dapat dilihat xp dalam table 3.2 2.5. = pusat lama WEKA Atribut Weka adalah aplikasi data mining Keterangan Id_Toko Kode Toko open source berbasis java. Aplikasi ini District Wilayah/Tempat Store dikembangkan pertama kali oleh Universita Store_Nm Nama Toko Waikato di Selandia Baru. Weka terdiri dari Nm_Hp Nama Model Handphone koleksi algoritma machine learning yang dapat digunakan untuk melakukan Tabel 3.2 Tabel Atribut Store Name Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 4 Data pegawai, yaitu data yang berisi promoter atau pegawai yang menjual produk. Data ini hanya menyimpan kode pegawai. Atribut Keterangan CRI_ID Kode Pegawai Nm_Pegawai Nama Pegawai Tabel 3.4 Data yang mengandung missing value Tabel 3.3 Tabel Atribut Pegawai 3.1.1 Pre-processing Langkah-langkah yang dilakukan dalam tahapan pre-processing menghasilkan dataset yang bersih (clean) sehingga dapat digunakan dalam tahap selanjutnya yaitu mining dengan tujuan mendapatkan pola nilai yang terjadi dalam seluruh semester yang telah merupakan dilalui. tahap Data Cleaning pembersihan data merupakan tahap awal dari KDD. 3.1.2.1 Data Cleaning Pada proses Data Cleaning di dapat beberapa atribut yang akan digunakan untuk proses mining berikutnya. Adapun atribut- Tabel 3.5 Data yang relevan dan tidak redundant Tabel 3.5 diatas menggambarkan data yang mengandung missing value dan tidak relevan dibersihkan sehingga diperoleh data yang sudah relevan sehingga dapat diproses ke tahap mining berikuntya. atribut tetap terbagi menjadi 2 kelompok data yaitu data toko dan data barang. Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 5 3.1.2.2 Integrasi Data Integrasi Data, 3.1.2 Transformasi Data merupakan Tahap transformasi data yaitu tahap penggabungan data dari berbagai sumber. dimana data dirubah menjadi bentuk yang Adapun dataset dari toko yang digunakan sesuai untuk data mining. Jika data belum barasal dari berbagai sumber yang nantinya terbentuk menjadi data yang dapat diproses digabungkan menjadi satu tabel. mining, maka harus dilakukan tahap cleaning. Dalam proses ini jika diperlukan Toko -id_toko : Char -distrik : Char -store_nm : Pegawai Char -pegawai -type_hp : Char Integer nm_pegawai : CharGambar 3.6. dapat ditambahkan atribut bantu diluar NewTable -id_toko : Char -distrik : Char -store_nm : Char -type_hp : Integer Integrasi-pegawai Data : char atribut yang sudah ada dari data yang di dapat. 4. HASIL DAN PEMBAHASAN 4.1.1 Proses Clustering Algoritma KMeans Pada tahap ini akan dilakukan proses Tabel pegawai memiliki atribut yang utama yaitu segmentasi data nilai yang terdiri dari id pegawai dan nama pegawai. diakses dari database yaitu sebuah metode Data ini nantinya diintegrasikan dengan clustering algoritma K-Means. Berikut ini tabel toko yang sudah relevan sehingga tabel merupakan diagram flowchart dari algoritma toko memiliki kelengkapan data yang lebih K-Means. informatif. 1. N data : data set yang akan diolah sebanyak N data dimana N data tersebut terdiri dari atribut-atributnya N(D690, D855, D335, D295) 2. K centroid : Inisialisasi dari pusat cluster data adalah sebanyak K dimana pusat-pusat awal tersebut digunakan sebagai banyaknya kelas yang akan Tabel 3.7 Dataset Integrasi tercipta. Centroid didapatkan secara random dari N data set yang ada. 3. Euclidian Distance: merupakan jarak yang didapat dari perhitungan antara Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 6 semua N data dengan K centroid dimana akan memperoleh tingkat kedekatan dengan kelas yang terdekat dengan 4.2 Proses Data Mining Menggunakan WEKA Setelah dijelaskan proses penerapan populasi data tersebut. data mining dengan teknik clustering secara titik x = (x1, x2, x3, ... xn) dan titik y = teroritis pada penjelasan diatas, maka kali (y1, y2, y3, ... yn) adalah: ini akan dijelaskan proses data mining secara aplikatif dimana proses data mining yang akan dilakukan menggunakan software data mining WEKA V.3.7.12. Dimana, x : Titik data pertama, y : Titik data kedua, n : Jumlah karakteristik (attribut) dalam terminologi data mining, d(x,y) : Euclidian distance yaitu jarak antara data pada titik x dan titik y 4. Pengelompokkan sejumlah data: setelah data tersebut populasi menemukan kedekatan dengan salah satu centroid yang ada. Gambar 4.1 Tampilan Awal Aplikasi WEKA Langkah pertama yang dilakukan untuk meng-import data kedalam WEKA 5. Update centroid baru: tiap kelas yang telah tercipta tadi melakukan update centroid baru. 6. Batas iterasi: apabila dalam proses clustering belum optimal namun sudah memenuhi batas iterasi maksimum, maka proses dihentikan. Gambar 4.2 Menu Utama WEKA Explorer Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 7 Kemudian lanjutkan dengan mengklik Hasil dari grafik keseluruhan dapat menu open file lalu pilih data yang akan ditampilkan dengan mengklik menu pilihan dibuka selanjutnya pilih open. yang bertuliskan visualize all pada kolom selected attribute yang terletak dibawah tabel dan akan menghasilkan tampilan seperti pada gambar 4.5 Gambar 4.3 Menu import data Tampilah hasil dari import data tadi berupa pengelompokan berdasarkan database 5 yang atribut ada Gambar 4.5 Grafik Atribut Keseluruhan yaitu Tanggal Penjualan, Nama Toko, Tipe Hp, Nama Pegawai, dan ID pegawai. Proses berikutnya yaitu penggunaan metode Clustering yang dapat digunakan sebagai penentu nilai cluster yang telah diproses. Gambar 4.4 Import data Penjualan Dari hasil import data penjualan dapat kita Gambar 4.6 Proses Cluster lihat hasil dari jumlah data per-atribut. Cara menampilkan tabel data dari atribut-atribut Setelah algoritma telah di pilih pastikan yang ada dengan mengklik satu persatu pada kolom cluster mode ditandai pada atribut yang akan dipilih. menu yang bertuliskan use training set, setelah itu lanjutkan dengan mengklik start Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 8 4.3 Interpretation / Evaluation Interpretation atau Evalution merupakan pola informasi yang dapat dihasilkan dari proses data mining yang telah dilakukan, berdasarkan hasil tabel dan grafik yang sebelumnya. dibahas pada penjelasan Dari seluruh data penjualan produk yang sering terjual pada produk Gambar 4.7 Use Training Set dapat dilihat dari tabel pada atribut store Hasil dari use training set menampilkan hasil dari clusterer output yang berisikan nilai cluster centroids berdasarkan 5 atribut yang digunakan. Gambar 4.8 Classes to Clusters Store Name Gambar 4.8 menampilkan pengelompokan clustering yang terdiri dari 2 iterasi, bertujuan untuk menunjukkan proses iterasi dan class pada cluster dengan jumlah record pada store name. name yaitu Erafon Megastore. Sedangkan type hp yaitu type D335 yang paling di minati oleh konsumen. Berikut adalah grafik Cluster dari setiap atribut. . Gambar 4.9 Grafik Cluster Gambar 4.9 menampilkan grafik cluster yang terdiri dari beberapa atribut yang telah di-cluster pada tools yang terdapat pada WEKA, bertujuan untuk menunjukkan peng-clusteran dalam sebuah data dengan jumlah record yang ada. Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 9 5. SIMPULAN DAN SARAN berbeda dan dengan jumlah data yang 5.1 Kesimpulan lebih Setelah melalui tahap-tahap proses pengelompokan besar lagi sehingga minat prediksi konsumen analisis data dan penerapan data mining terhadap produk yang dihasilkan lebih dengan menggunakan aplikasi Weka maka akurat. dapat diambil kesimpulan sebagai berikut: 1. Penerapan data mining dengan 2. Pada penelitian yang akan dating, dapat menggunakan teknik data mining dan teknik clustering dan algorima K-Means algoritma yang telah dilakukan menghasilkan sebuah menggabungkan menjadi dua teknik data informasi prediksi mining sehingga akan menghasilkan pengelompokan minat konsumen terhadap hasil yang variatif dan tentunya bernilai produk LG Mobile Palembang. informasi yang tinggi. 2. mengenai data lainnya ataupun juga Informasi mengenai data penjualan 3. Penelitian ini disarankan dapat menjadi yang dihasilkan dari penerapan data mining bahan referensi yang dipergunakan dan yang dilakukan. dikembangkan 3. selanjutnya. Semakin kecil batasan nilai data untuk penenlitian transaksi penjualan yang ditentukan maka DAFTAR RUJUKAN semakin sedikit pula pola/aturan yang dapat dihasilkan dan waktu yang diperlukan lebih Anamida. 2011. Weka, sedikit. 4. http://www.scribd.com/doc/4901452 Store yang paling banyak melakukan 0/WEKA, diakses tgl 12 Juni 2015. penjualan produk LG dari hasil analisa data mining adalah Erafon Megastore dan produk yang sering diminati konsumen adalah jenis Fandy Tjiptono,2008, Strategi Bisnis Pemasaran. Andi. Yogyakarta. tipe hape D335 yaitu LG Bello. 5.2. Saran Berdasarkan kesimpulan yang telah diuraikan di atas, maka ada beberapa saran Kusrini & Luthfi. 2009. Algoritma Data Mining. Yogyakarta: Andi Offset. perlu disampaikan sebagai berikut : 1. Pada penelitian selanjutnya dapat mencoba menggunakan dataset yang Kotler, Philip and Gary Armstrong. 2008. Prinsip-prinsip Pemasaran. Edisi Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 10 12. Jilid 1. Jakarta: Erlangga. Larose. 2005. Data Mining. Yogyakarta: Andi Offset. Pramudiono, I. 2006. Apa itu Data Mining? Diakses tanggal 24 juli 2015. dari http://datamining.japati.net/cgibin/indodm.cgi. Santoso, Budi. 2007. “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu, Yogyakarta. Turban. dkk., 2005, Decision Support System and Intelligent System (Sistem Pendukung Keputusan dan Sistem Cerdas), Andi, Yogyakarta. Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) | 11