1 PENERAPAN DATA MINING UNTUK PENGELOMPOKAN MINAT

advertisement
PENERAPAN DATA MINING UNTUK PENGELOMPOKAN MINAT KONSUMEN
TERHADAP PRODUK LG MOBILE PALEMBANG
Rino Riandi Agustin1, M. Akbar, M.IT.2, Siti Sa’uda, M.kom.3
Mahasiswa Universitas BinaDarma1, Dosen Universitas BinaDarma2, Dosen Universitas BinaDarma3
Program Studi Informatika, Fakultas Ilmu Komputer, Universitas Binadarma
Jl.Ahmad Yani No.12 Plaju Palembang
Pos-el : [email protected], [email protected]
[email protected]
Abstract : The variety of brands , types and models of mobile phones that are offered provide plenty of choice for
consumers . So do not rule out a consumer will switch other perceived kemerek have advantages compared with the
previously used brand . The ability of the technology to store data , process data , extract the data , analyze the data
, and summarize data to produce an information that support the decision of the election it is still lacking . With the
existence of this problem then comes techniques and new knowledge in processing the data into information .
Judging from the number of consumer interest towards mobile phone is probably the application of data mining by
the method of clustering and K -Means algorithm can help PT . LG Mobile Palembang in the grouping of consumer
interest .
Keywords: Data Mining, Clustering,Weka, Algoritma K-Means.
Abstrak : Bervariasinya merek, jenis, serta model handphone yang ditawarkan memberikan banyak pilihan bagi
konsumen. Sehingga tidak menutup kemungkinan seorang konsumen akan beralih kemerek lain yang dirasakan
memiliki kelebihan disbanding dengan merek yang dipakai sebelumnya. Kemampuan teknologi untuk menyimpan
data, mengolah data, mengekstrak data, menganalis data, dan meringkas data untuk menghasilkan sebuah
informasi yang menunjang kegiatan pemilihan keputusan dirasa masih kurang. Dengan adanya masalah ini maka
munculah teknik dan ilmu baru dalam mengolah data menjadi informasi. Dilihat dari banyaknya minat konsumen
terhadap telfon genggam mungkin penerapan data mining dengan metode clustering dan algoritma K-Means dapat
membantu PT. LG Mobile Palembang dalam pengelompokan minat konsumen.
Kata kunci : Data Mining, Clustering,Weka, Algoritma K-Means.
1.
yang memudahkan kinerja manusia. Akan
PENDAHULUAN
tetapi teknologi yang canggih sering sekali
Pesatnya
dunia
tidak diimbangi dengan penyajian informasi
teknologi dan informasi saat ini, berdampak
yang memadai. Data yang cukup besar juga
pada kebutuhan informasi yang akurat serta
terkadang
cepat
informasi yang akurat, karena masih banyak
didalam
perkembangan
kehidupan
sehari-hari.
Dimana teknologi informasi sangat berperan
penting dalam kehidupan sekarang dan yang
akan datang. Hal ini bisa dilihat dari
pemanfaatan teknologi dalam bidang apapun
akan
sulit
diolah
menjadi
kekurangan dari berbagai aspek.
Kemampuan sebuah teknologi untuk
menyimpan
data,
mengolah
data,
mengekstrak data, menganalis data, dan
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
1
meringkas data guna menghasilkan sebuah
merupakan
informasi
bergerak
yang
menunjang
kegiatan
sebuah
perusahaan
dibidang
penjualan
yang
produk
pemilihan keputusan dirasa masih kurang.
handphone, dan produk yang dimiliki LG
Dengan munculnya masalah ini maka timbul
Mobile sendiri memiliki bermacam-macam
lah teknik dan ilmu baru dalam mengolah
tipe handphone. Oleh karena itu, perusahaan
data menjadi informasi. Salah satunya
ini
dengan teknik Data Mining untuk mengatasi
penentuan jumlah penyediaan tipe jenis
suatu masalah penggalian informasi atau
barang karena konsumen memiliki selera
pola yang penting atau menarik data dalam
berbeda dalam tipe pembelian handphone,
jumlah yang besar. Data mining bisa
dan dengan penerapan data mining untuk
memberikan pengetahuan-pengetahuan yang
pengelompokan minat konsumen diharapkan
sebelumnya tersembunyi di dalam gudang
dapat membantu LG Mobile Palembang
data sehingga dapat menjadi informasi yang
dalam
berharga.
sebuah produk sebelum dijual. Data mining
Data
mining
dalam
prosesnya
menggunakan teknik statistik, matematika,
kecerdasan buatan, dan machine learning
untuk mengektraksi dan mengidentifikasi
informasi yang
bermanfaat serta suatu
pengetahuan yang terkait dari berbagai
database yang besar (Turban, dkk. 2005).
Kemajuan teknologi informasi juga
sering
mengalami
kendala
mempertimbangkan
merupakan
solusi
produk-produk
konsumen,
untuk
yang
agar
dalam
kemungkinan
memprediksi
diminati
dapat
oleh
meminimalisir
kerugian dan bertumpuknya suatu produk
yang berdampak buruk bagi perusahaan.
Dengan adanya masalah dan solusi
tersebut untuk mengatasi keadaan dimana
perusahaan
LG
Mobile
Palembang
membutuhkan
sebuah
informasi
untuk
memprediksi
suatu
produk.
Untuk
Pelembang, karena perusahaan ini memiliki
mengimplementasikan
penulis
tertarik
database yang besar. Sehingga dalam
dengan masalah tersebut, sehingga penulis
pengolahan
akan
dirasakan
oleh
data
Produk
yang
LG
besar
Mobile
tersebut
menuangkan
penelitiannya
dalam
perusahaan memerlukan teknologi untuk
bentuk penulisan skripsi yang berjudul
mengetahui
“Penerapan
informasi
yang
dibutuhkan
Data
Mining
dalam meningkatkan kinerja dan pendapatan
Pengelompokan
dari hasil usaha. LG Mobile Palembang
Terhadap Produk PT. LG”.
Minat
Untuk
Konsumen
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
2
2.
TINJAUAN PUSTAKA
2.1.
Produk
Menurut Fandy Tjiptono (2008),
Atribut Produk adalah unsur-unsur produk
yang dipandang penting oleh konsumen dan
dijadikan dasar pengambilan keputusan.
Atribut Produk meliputi merek, kemasan,
jaminan(garansi), pelayanan,dan sebagainya.
2.2.
2.4.
Data Mining
digunakan
Algoritma K-Means
Dalam
Data mining adalah suatu istilah
yang
Gambar 2.1. Clustering
dan
mesin
pembelajaran K-means merupakan metode
menguraikan
analisis kelompok yang mengarah pada
penemuan pengetahuan di dalam database.
permatisian N objek pengamatan dalam K
Data
yang
kelompok (cluster) dimana setiap objek
menggunakan teknik statistik, matematika,
pengamatan dimiliki oleh sebuah kelompok
kecerdasan buatan, dan machine learning
dengan mean (rata-rata) terdekat.1.
untuk mengekstraksi dan mengidentifikasi
Barang, yaitu berisi data produk. Atribut
informasi yang bemanfaat dan pengetahuan
yang ada dapat dilihat dalam tabel tabel 1.
yang terkait dari berbagai database besar
2.4.1
mining
untuk
statistik
adalah
proses
(Kusrini & Luthfi. 2009).
2.3.
Data
Penerapan Clustering
K-Means memisahkan data ke k
Clustering
daerah bagian yang terpisah, dimana k
Clustering termasuk metode yang
adalah bilangan integer positif. Algoritma
sudah cukup dikenal dan banyak dipakai
K-Means sangat terkenal karena kemudahan
dalam data mining. Sampai sekarang para
dan kemampuannya untuk mengklasifikasi
ilmuwan dalam bidang data mining masih
data besar dan outlier dengan sangat cepat.
melakukan berbagai usaha untuk melakukan
Berikut adalah langkah-langkah algoritma
perbaikan model clustering karena metode
K-Means :
yang dikembangkan sekarang masih bersifat
heuristic. Usaha-usaha untuk menghitung
jumlah
cluster
yang
optimal
dan
pengklasteran yang paling baik masih terus
1. Penentuan pusat cluster awal
Pusat awal cluster didapatkan dari
data sendiri bukan dengan menentukan titik
dilakukan.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
3
baru, yaitu dengan menrandom pusat awal
generalisasi/formulasi dari sekumpulan data
dari data.
sampling.
2. Perhitungan jarak dengan pusat cluster
3
Untuk mengukur jarak antara data
ANALISIS DATA MINING
3.1 Analisis Data
dengan pusat cluster digunakan Euclidian
Analisis
data
dilakukan
untuk
distance. Algoritma perhitungan jarak data
memperoleh gambaran sistem yang akan
dengan pusat cluster
dibuat dan langkah-langkah dalam model
3. Pengelompokkan data
arsitektur sistem mengikuti proses dari
Jarak
hasil
perhitungan
akan
dilakukan perbandingan dan dipilih jarak
Knowledge Discovery in Database (KDD).
3.1.1 Data Selection
terdekat antara data dengan pusat cluster,
Data dalam penelitian ini bersumber
jarak ini menunjukkan bahwa data tersebut
dari PT. LG Mobile Palembang. Adapun
berada dalam satu kelompok dengan pusat
data tersebut terdiri dari data barang, dan
cluster terdekat.
data store name mulai dari tahun 2015.
4. Penentuan pusat cluster baru
Atribut
Untuk mendapatkan pusat cluster
baru bisa dihitung dari rata-rata nilai
Type_hp
Type produk/barang
Model_Hanphone
Nama model
Handphone
anggota cluster dan pusat cluster.
Pusat cluster baru = x1+x2+x3…..+xn+xp
Keterangan
Tabel 3.1 Tabel Atribut Data Barang
Jumlah+1
Data Store Name, yaitu data yang
Dimana :
berisi nama toko yang menjual produk-
x1,x2,x3,….xn=anggota cluster
produk LG Mobile. Atribut dapat dilihat
xp
dalam table 3.2
2.5.
= pusat lama
WEKA
Atribut
Weka adalah aplikasi data mining
Keterangan
Id_Toko
Kode Toko
open source berbasis java. Aplikasi ini
District
Wilayah/Tempat Store
dikembangkan pertama kali oleh Universita
Store_Nm
Nama Toko
Waikato di Selandia Baru. Weka terdiri dari
Nm_Hp
Nama Model Handphone
koleksi algoritma machine learning yang
dapat
digunakan
untuk
melakukan
Tabel 3.2 Tabel Atribut Store Name
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
4
Data pegawai, yaitu data yang berisi
promoter
atau
pegawai
yang
menjual
produk. Data ini hanya menyimpan kode
pegawai.
Atribut
Keterangan
CRI_ID
Kode Pegawai
Nm_Pegawai
Nama Pegawai
Tabel 3.4 Data yang mengandung
missing value
Tabel 3.3 Tabel Atribut Pegawai
3.1.1
Pre-processing
Langkah-langkah
yang
dilakukan
dalam tahapan pre-processing menghasilkan
dataset yang bersih (clean) sehingga dapat
digunakan dalam tahap selanjutnya yaitu
mining dengan tujuan mendapatkan pola
nilai yang terjadi dalam seluruh semester
yang
telah
merupakan
dilalui.
tahap
Data
Cleaning
pembersihan
data
merupakan tahap awal dari KDD.
3.1.2.1 Data Cleaning
Pada proses Data Cleaning di dapat
beberapa atribut yang akan digunakan untuk
proses mining berikutnya. Adapun atribut-
Tabel 3.5 Data yang relevan dan
tidak redundant
Tabel 3.5 diatas menggambarkan
data yang mengandung missing value dan
tidak relevan dibersihkan sehingga diperoleh
data yang sudah relevan sehingga dapat
diproses ke tahap mining berikuntya.
atribut tetap terbagi menjadi 2 kelompok
data yaitu data toko dan data barang.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
5
3.1.2.2 Integrasi Data
Integrasi
Data,
3.1.2 Transformasi Data
merupakan
Tahap transformasi data yaitu tahap
penggabungan data dari berbagai sumber.
dimana data dirubah menjadi bentuk yang
Adapun dataset dari toko yang digunakan
sesuai untuk data mining. Jika data belum
barasal dari berbagai sumber yang nantinya
terbentuk menjadi data yang dapat diproses
digabungkan menjadi satu tabel.
mining,
maka
harus
dilakukan
tahap
cleaning. Dalam proses ini jika diperlukan
Toko
-id_toko :
Char
-distrik :
Char
-store_nm :
Pegawai
Char
-pegawai
-type_hp :
Char
Integer
nm_pegawai
: CharGambar 3.6.
dapat ditambahkan atribut bantu diluar
NewTable
-id_toko :
Char
-distrik :
Char
-store_nm :
Char
-type_hp :
Integer
Integrasi-pegawai
Data :
char
atribut yang sudah ada dari data yang di
dapat.
4. HASIL DAN PEMBAHASAN
4.1.1 Proses Clustering Algoritma KMeans
Pada tahap ini akan dilakukan proses
Tabel pegawai memiliki atribut yang
utama yaitu segmentasi data nilai yang
terdiri dari id pegawai dan nama pegawai.
diakses dari database yaitu sebuah metode
Data ini nantinya diintegrasikan dengan
clustering algoritma K-Means. Berikut ini
tabel toko yang sudah relevan sehingga tabel
merupakan diagram flowchart dari algoritma
toko memiliki kelengkapan data yang lebih
K-Means.
informatif.
1. N data : data set yang akan diolah
sebanyak N data dimana N data tersebut
terdiri dari atribut-atributnya N(D690,
D855, D335, D295)
2. K centroid : Inisialisasi dari pusat
cluster data adalah sebanyak K dimana
pusat-pusat awal tersebut digunakan
sebagai banyaknya kelas yang akan
Tabel 3.7 Dataset Integrasi
tercipta. Centroid didapatkan secara
random dari N data set yang ada.
3. Euclidian Distance: merupakan jarak
yang didapat dari perhitungan antara
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
6
semua N data dengan K centroid dimana
akan memperoleh tingkat kedekatan
dengan kelas yang terdekat dengan
4.2 Proses Data Mining Menggunakan
WEKA
Setelah dijelaskan proses penerapan
populasi data tersebut.
data mining dengan teknik clustering secara
titik x = (x1, x2, x3, ... xn) dan titik y =
teroritis pada penjelasan diatas, maka kali
(y1, y2, y3, ... yn) adalah:
ini akan dijelaskan proses data mining
secara aplikatif dimana proses data mining
yang akan dilakukan menggunakan software
data mining WEKA V.3.7.12.
Dimana,
x : Titik data pertama,
y : Titik data kedua,
n : Jumlah karakteristik (attribut) dalam
terminologi data mining,
d(x,y) : Euclidian distance yaitu jarak
antara data pada titik x dan titik y
4. Pengelompokkan
sejumlah
data:
setelah
data
tersebut
populasi
menemukan kedekatan dengan salah satu
centroid yang ada.
Gambar 4.1 Tampilan Awal Aplikasi
WEKA
Langkah pertama yang dilakukan untuk
meng-import data kedalam WEKA
5. Update centroid baru: tiap kelas yang
telah tercipta tadi melakukan update
centroid baru.
6. Batas iterasi: apabila dalam proses
clustering belum optimal namun sudah
memenuhi batas iterasi maksimum,
maka proses dihentikan.
Gambar 4.2 Menu Utama WEKA Explorer
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
7
Kemudian lanjutkan dengan mengklik
Hasil dari grafik keseluruhan dapat
menu open file lalu pilih data yang akan
ditampilkan dengan mengklik menu pilihan
dibuka selanjutnya pilih open.
yang bertuliskan visualize all pada kolom
selected attribute yang terletak dibawah
tabel dan akan menghasilkan tampilan
seperti pada gambar 4.5
Gambar 4.3 Menu import data
Tampilah hasil dari import data tadi
berupa
pengelompokan
berdasarkan
database
5
yang
atribut
ada
Gambar 4.5 Grafik Atribut Keseluruhan
yaitu
Tanggal Penjualan, Nama Toko, Tipe Hp,
Nama Pegawai, dan ID pegawai.
Proses berikutnya yaitu penggunaan
metode Clustering yang dapat digunakan
sebagai penentu nilai cluster yang telah
diproses.
Gambar 4.4 Import data Penjualan
Dari hasil import data penjualan dapat kita
Gambar 4.6 Proses Cluster
lihat hasil dari jumlah data per-atribut. Cara
menampilkan tabel data dari atribut-atribut
Setelah algoritma telah di pilih pastikan
yang ada dengan mengklik satu persatu
pada kolom cluster mode ditandai pada
atribut yang akan dipilih.
menu yang bertuliskan use training set,
setelah itu lanjutkan dengan mengklik start
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
8
4.3 Interpretation / Evaluation
Interpretation
atau
Evalution
merupakan pola informasi yang dapat
dihasilkan dari proses data mining yang
telah dilakukan, berdasarkan hasil tabel dan
grafik
yang
sebelumnya.
dibahas
pada
penjelasan
Dari seluruh data penjualan
produk yang sering terjual pada produk
Gambar 4.7 Use Training Set
dapat dilihat dari tabel pada atribut store
Hasil
dari
use
training
set
menampilkan hasil dari clusterer output
yang
berisikan
nilai
cluster
centroids
berdasarkan 5 atribut yang digunakan.
Gambar 4.8 Classes to Clusters Store
Name
Gambar
4.8
menampilkan
pengelompokan clustering yang terdiri dari
2 iterasi, bertujuan untuk menunjukkan
proses iterasi dan class pada cluster dengan
jumlah record pada store name.
name yaitu Erafon Megastore. Sedangkan
type hp yaitu type D335 yang paling di
minati oleh konsumen. Berikut adalah grafik
Cluster dari setiap atribut.
. Gambar 4.9 Grafik Cluster
Gambar
4.9
menampilkan
grafik
cluster yang terdiri dari beberapa atribut
yang telah di-cluster pada tools yang
terdapat pada WEKA, bertujuan untuk
menunjukkan peng-clusteran dalam sebuah
data dengan jumlah record yang ada.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
9
5.
SIMPULAN DAN SARAN
berbeda dan dengan jumlah data yang
5.1
Kesimpulan
lebih
Setelah melalui tahap-tahap proses
pengelompokan
besar
lagi
sehingga
minat
prediksi
konsumen
analisis data dan penerapan data mining
terhadap produk yang dihasilkan lebih
dengan menggunakan aplikasi Weka maka
akurat.
dapat diambil kesimpulan sebagai berikut:
1.
Penerapan
data
mining
dengan
2.
Pada penelitian yang akan dating, dapat
menggunakan teknik data mining dan
teknik clustering dan algorima K-Means
algoritma
yang telah dilakukan menghasilkan sebuah
menggabungkan menjadi dua teknik data
informasi
prediksi
mining sehingga akan menghasilkan
pengelompokan minat konsumen terhadap
hasil yang variatif dan tentunya bernilai
produk LG Mobile Palembang.
informasi yang tinggi.
2.
mengenai
data
lainnya
ataupun
juga
Informasi mengenai data penjualan
3. Penelitian ini disarankan dapat menjadi
yang dihasilkan dari penerapan data mining
bahan referensi yang dipergunakan dan
yang dilakukan.
dikembangkan
3.
selanjutnya.
Semakin kecil batasan nilai data
untuk
penenlitian
transaksi penjualan yang ditentukan maka
DAFTAR RUJUKAN
semakin sedikit pula pola/aturan yang dapat
dihasilkan dan waktu yang diperlukan lebih
Anamida. 2011. Weka,
sedikit.
4.
http://www.scribd.com/doc/4901452
Store yang paling banyak melakukan
0/WEKA, diakses tgl 12 Juni 2015.
penjualan produk LG dari hasil analisa data
mining adalah Erafon Megastore dan produk
yang sering diminati konsumen adalah jenis
Fandy
Tjiptono,2008,
Strategi
Bisnis
Pemasaran. Andi. Yogyakarta.
tipe hape D335 yaitu LG Bello.
5.2. Saran
Berdasarkan kesimpulan yang telah
diuraikan di atas, maka ada beberapa saran
Kusrini & Luthfi. 2009. Algoritma Data
Mining. Yogyakarta: Andi Offset.
perlu disampaikan sebagai berikut :
1. Pada
penelitian
selanjutnya
dapat
mencoba menggunakan dataset yang
Kotler, Philip and Gary Armstrong. 2008.
Prinsip-prinsip Pemasaran. Edisi
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
10
12. Jilid 1. Jakarta: Erlangga.
Larose. 2005. Data Mining. Yogyakarta:
Andi Offset.
Pramudiono, I. 2006. Apa itu Data Mining?
Diakses tanggal 24 juli 2015.
dari http://datamining.japati.net/cgibin/indodm.cgi.
Santoso, Budi. 2007. “Data Mining Teknik
Pemanfaatan Data untuk Keperluan
Bisnis”, Graha Ilmu, Yogyakarta.
Turban. dkk., 2005, Decision Support
System
and
Intelligent
System
(Sistem Pendukung Keputusan dan
Sistem Cerdas), Andi, Yogyakarta.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
11
Download