Analisa Customer Service System Menggunakan

advertisement
37
Analisa Customer Service System Menggunakan Metode Data Mining
Dengan Algoritma FP-Growth
(Studi Kasus Di PT Batamindo Investment Cakrawala)
Hilda Herasmus
STT Ibnu Sina; Jl.Teuku Umar – Lubuk Baja; telp/fax : 0778-425391/ 0778-458394
Program Studi Teknik Informatika, STT Ibnu Sina, Batam
e-mail: [email protected]
Abstrak
Banyaknya data permintaan pelanggan yang ditampung melalui sistim Customer Service Online
System (CSOS) dalam melakukan pelayanan kepada rutin kepada pelanggan di Kawasan Industri
Batamindo (KIB). Data tersebut dapat diolah lebih lanjut menjadi suatu informasi yang berguna
bagi Manajemen dalam pengambilan keputusan. Dengan adanya data Mining diharapkan dapat
membantu PT KIB dalam menggali informasi yang terkandung didalam suatu permintaan
pelayanan menjadi sebuah pengetahuan (knowledge) yang baru. Association Rule, yaitu suatu
prosedur dalam Market Analysis untuk mencari pengetahuan berupa hubungan kebiasaan
pelanggan dalam meminta pelayanan berupa perbaikan gedung, informasi data dan konsultasi.
Algoritma FP Growth merupakan algoritma yang sangat efisien dalam mencari frequent itemset
dalam sebuah kumpulan data dengan membangkitkan struktur prefix-tree. Data yang diolah
adalah data permintaan pelanggan dari tahun 2016 dengan jumlah data 264 permintaan.
Kata kunci— Pelayanan Pelanggan, data mining, association rule, algoritma fp-growth, fp-tree.
1. PENDAHULUAN
Perkembangan teknologi pada saat ini telah mempengaruhi semua aktivitas manusia dan
memberikan pengaruh positif terhadap produktifitas kerja disegala aspek kehidupan. Banyaknya
persaingan dalam dunia bisnis khususnya industri penjualan menuntut para pengembang
menemukan suatu strategi yang dapat meningkatkan penjualan dan pemasaran produk yang
dijualnya (Dewi Kartika, 2013). Perkembangan dalam teknologi pengumpulan dan penyimpanan
data serta pengolahan dengan dengan lebih cepat telah memudahkan organisasi untuk
mengumpulkan sejumlah data berukuran besar sehingga menghasilkan informasi yang sangat
berguna.
Data Mining adalah suatu proses untuk memperoleh informasi penting yang sangat
berguna dari informasi yang sebelumnya tidak diketahui dan pengetahuan yang diperoleh
informasi yang berharga dan dapat dimengerti dari sebuah data (Yi Zeng et al, 2015). Algoritma
Data Mining diketahui sebagai pengolah data yang dapat mengolah data dalam jumlah yang besar.
Karena ketersediaan sejumlah besar data dan kebutuhan untuk mengubah data tersebut menjadi
informasi yang berguna dan pengetahuan. Data Mining telah berkembang menjadi teknik yang
paling banyak digunakan di masyarakat secara keseluruhan (Hamsathvani et al, 2014).
Secara umum, teori FP-Growth telah digunakan dalam banyak aplikasi seperti medicine,
pharmacology, business industry, banking, market research, engineering design, meteorology,
vibration analysis dan bidang pekerjaan lainnya. Data Mining adalah suatu proses untuk
mengevaluasi dari persepsi yang berbeda dan di simpulkan menjadi sebuah informasi yang
berguna. Kumpulan dari informasi yang sangat berguna ini bisa digunakan untuk membuat
strategi bisnis untuk meningkatkan keuntungan (Shivam Sidhu et al, 2014). Algoritma FPGrowth adalah bagian dari teknik asosiasi pada Data Mining. FP-Growth sendiri adalah salah
satu alternatif Algoritma yang dapat digunakan untuk menentukan himpunan data yang paling
sering muncul (frequest itemset) dalam sekumpulan data (Ali Ikhwan et al, 2015).
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
Jurnal Teknik Ibnu Sina (JT-IBSI)
38
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)
2. METODE PENELITIAN
2.1 Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database (KDD) adalah proses menentukan informasi yang
berguna serta pola-pola yang ada dalam data. Data Mining merupakan salah satu langkah dari
serangkaian proses iterative KDD. Tahapan proses KDD dapat dilihat pada gambar 2.1(Ali
Ikhwan et al, 2015).
Gambar 1. Tahapan proses KDD
Awalnya Data Mining juga dikenal dengan nama Knowledge Discovery in Database (KDD).
Knowledge Discovery in Databases adalah proses mencari dan mengidentifikasi pola (pattern)
dalam database. Pola yang ditemukan bersifat valid, potentially useful (sangat nyata digunakan)
dan ultimately understandable (bisa digunakan dengan segala aspek) Data Mining adalah
ekstraksi informasi atau pola penting atau menarik dari data yang ada di database yang besar
(Abdullah Saad Almalaise Alghamdi, 2011). Menurut Rizka NA (2011), Proses KDD secara garis
besar terdiri dari:
1. Data Selection
Pada proses ini dilakukan pemilihan himpunan data, menciptakan himpunan data target, atau
memfokuskan pada subset variable (sampel data) dimana penemuan (discovery) akan
dilakukan. Hasil seleksi disimpan dalam suatu berkas yang terpisah dari basis data
operasional.
2. Pre-Processing dan Cleaning Data
Pre-Processing dan Cleaning Data dilakukan membuang data yang tidak konsisten dan
noise, duplikasi data, memperbaiki kesalahan data, dan bisa diperkaya dengan data eksternal
yang relevan.
3. Transformation
Proses ini mentransformasikan atau menggabungkan data ke dalam yang lebih tepat untuk
melakukan proses mining dengan cara melakukan peringkasan (agregasi)
4. Data Mining
Proses Data Mining yyaitu proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik, metode atau algoritma tertentu sesuai dengan tujuan dari
proses KDD secara keseluruhan
5. Interpretation / Evaluasi
Proses untuk menerjemahkan pola-pola yang dihasilkan dari Data Mining. Mengevaluasi
(menguji) apakah pola atau informasi yang ditemukan bersesuaian atau bertentangan dengan
fakta atau hipotesa sebelumnya. Pengetahuan yang diperoleh dari pola-pola yang terbentuk
dipresentasikan dalam bentuk visualisasi.
2.2. Data Mining
Istilah Data Mining dan KDD sering kali digunakan secara bersamaan untuk menjelaskan
proses pencarian Knowledge yang tersembunyi di dalam Database. Sebenarnya, kedua istilah
tersebut memiliki konsep yang berbeda akan tetapi berkaitan satu sama lainnya. Dan, salah satu
tahapan dalam keseluruhan proses KDD adalah Data Mining.
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
39
Herasmus
Perkembangan Data Mining (DM) yang pesat tidak dapat lepas dari perkembangan
teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi (Kavitha. M dan
Tamil Selvi ST, 2016).
Menarik untuk diingat bahwa kata Mining sendiri berarti usaha mendapatkan sedikit
barang berharga dari sejumlah besar material dasar. Dari definisi-definisi itu, dapat dilihat ada
beberapa faktor yang mendefinisikan Data Mining :
1. Data Mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu.
2. Data Mining memiliki objek berupa data yang berjumlah besar dan kompleks.
3. Data Mining memiliki untuk menemukan hubungan-hubungan atau pola-pola yang
mungkin memberikan indikasi yang bermanfaat
4. Data Mining bukanlah suatu bidang yang sma sekali baru yang memiliki banyak aspek dan
teknik dari bidang-bidang ilmu yang lainnya.
2.2.1
Tahapan dalam Data Mining
Menurut Ali Ikhwan et al 2015), ada empat tahap yang dilalui dalam Data Mining antara
lain:
1. Precise statement of the problem
Sebelum mengakses perangkat lunak Data Mining, seorang analis harus memiliki kejelasan
perihal ‘pertanyaan apa yang akan ingin dijawabnya’. Jika tidak ada formula yang tepat
untuk problematika yang ada maka itu hanya akan membuang-buang waktu dan uang dalam
membuat solusinya.
2. Initial Exploration
Tahap ini dimulai dengan mempersiapkan data yang juga termasuk kedalam proses Data
Mining “Cleaning” (misalnya : mengedentifikasi dan menyikirkan data yang dikodekan
salah), transformasi data, memilih subset record, data set dan langkah awal dari seleksi
proses. Mendeskripsikan dan memvisualisasikan data adalah kunci dari tahap ini.
3. Model building and validation
Tahap ini melibatkan pertimbangan terhadap ragam permodelan dan memilih yang terbaik
bagi performasi prediktif.
4. Deployment
Memilih aplikasi yang tepat berikut permodelan untuk membuat (Generate) prediksi
2.2.2 Pengelompokan Data Mining
Menurut Rizka NA (2011), berdasarkan tugas yang dapat dilakukan, maka Data Mining
dibagi menjadi beberapa Kelompok Proses, yaitu :
1. Kelompok Proses Deskripsi.
Untuk melihat gambaran dari keadaan berdasarkan data yang tersedia.
2. Kelompok Proses Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah
numerik daripada kearah kategori. Estimasi memberikan perkiraan terhadap informasi yang
ada dan memberikan perkiraan ke depan berdasarkan informasi atau data yang telah ada.
Model Estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Kelompok Proses Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai
dari hasil akan ada di masa mendatang.
4. Kelompok Proses Klasifikasi
Dalam proses klasifikasi ditentukan oleh variabel kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan
sedang dan pendapatan rendah.
5. Kelompok Proses Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan atau memperhatikan dan
membentuk kelas objek-objek yang memiliki kemiripan
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)
40
6.
Kelompok Proses Asosiasi
Proses Asosiasi adalah untuk menemukan atribut yang muncul dalam satu waktu. Di dalam
proses Asosiasi ada terdapat analisis aosiasi yang disebut dengan pola Frequent Pattern
Mining (Pola Frekuensi Tinggi). Penting atau tidaknya suatu aturan asosiasi dapat diketahui
dari dua parameter yatiu support (nilai penunjang) yaitu berupa persentase kombinasi item
tersebut dalam database dan nilai Confidence.
2.3 Tahapan Asosiasi
Analisis Asosiasi dikenal juga sebagai salah satu teknik Data Mining yang menjadi dasar
dari berbagai teknik Data Mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang
disebut analisis pola frequensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti
untuk menghasilkan algoritma yang efisien.
Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support
(nilai penunjang) yaitu persentase. Kombinasi item tersebut dalam database dan confidence.
Tahapan dalam analisa Asosiasi adalah sebagai berikut :
1. Data Preparation.
Data cleaning dan preparation merupakan proses krusial yang memembutuhkan 80% usaha
untuk merekayasa data. Proses preparation data terdiri dari tiga aspek, yakni:
a. Melengkapkan data yang tidak lengkap (incomplete), yaitu data yang kekurangan nilai
atribut atau hanya mengandung agregat data (contoh : address = " ").
b. Membersihkan data Noise, yaitu data yang masih mengandung error dan outliers.
c. Membersihkan data yang tidak konsisten (inconsistent), yaitu data yang mengandung
discrepansi dalam code.
2. Proses Preparation dalam sistem Mining dapat memilih data yang relevan dan mengurangi
data yang tidak berkualitas sehingga akan lebih efisien karena menghasilkan dataset yang
lebih sedikit daripada dataset yang asli.
2.4. Algoritma FP-Growth
FP-Growth adalah salah satu alternatif algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan
data. FP-growth menggunakan pendekatan yang berbeda dari paradigma yang digunakan pada
algoritma Apriori (Ali Ikhwan et al, 2015).
FP-Growth adalah salah satu alternatif algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling sering muncul (frequent item set) dalam sekumpulan
data. Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. FP-Growth adalah
metode yang sering itemset pertambangan tanpa Generasi calon. Ini membangun sebuah struktur
data yang sangat padat (FP-tree) untuk kompres database transaksi asli.
2.5. Aplikasi Teknik Data Mining
Aplikasi teknik Data Mining sendiri hanya merupakan salah satu bagian dari proses Data
Mining. Ada beberapa teknik Data Mining yang sudah umum dipakai. Kita akan membahas lebih
jauh mengenai teknik-teknik yang ada di sesi berikutnya. Perlu diperhatikan bahwa ada kalanya
teknik-teknik Data Mining umum yang tersedia di pasar tidak mencukupi untuk melaksanakan
Data Mining di bidang tertentu atau untuk data tertentu. Sebagai contoh akhir-akhir ini
dikembangkan berbagai teknik Data Mining baru untuk penerapan di bidang bio informatika
seperti analisa hasil microarray untuk mengidentifikasi DNA dan fungsi-fungsinya.
2.5.1.
Pengumpulan Data
Data penelitian ini dikumpulkan dari observasi, buku–buku dan situs yang berhubungan
dengan Data Mining khususnya untuk prediksi atau peramalan. Dalam hal ini penulis mengambil
database pada perusahaan perbankan yang Go Public Indonesia. Sampel yang digunakan dalam
penelitian ini adalah Permintan Pelanggan pada salah satu perusahaan Pengelola Kawasan
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
Herasmus
41
Industri yang memiliki kriteria tertentu. Metode pengambilan sampel yang digunakan adalah
purposive sampling di mana pengambilan perusahaan sampel dilakukan berdasarkan kriteria
yaitu:
1. Permintaan pelanggan yang ada di Kawasan Industri Batamindo tahun 2016,
2. Perusahaan bergerak dalam bidang Industri,
3. Data Permintaan dan Pelayanan Pelanggan dari setiap divisi.
Data yang digunakan dalam penelitian ini yaitu data sekunder berupa laporan permintaan
pelanggan tahunan yang didapat melalui Customer Service Online System tahun 2016.
2.5.2.
Analisa Masalah.
Dari hasil studi literatur yang dilakukan dan data-data yang dikumpulkan, Selanjutnya
dilakukan tahapan analisis. Pada tahap ini, dianalisa lebih mendalam tentang prediksi jumlah
pelayanan yang diberikan kepada pelanggan.
2.5.3.
Pengolahan Data dengan Algoritma
Dari hasil pengumpulan data selanjutnya dilakukan analisis untuk menentukan variabelvariabel yang akan dijadikan input pada Software RapidMiner Studio 7.4. Dimana variablevariabel yang ada diolah sesuai jumlah permintaan dari setiap pelanggan.
2.5.4.
Pengolahan Data dengan Software RapidMiner Studio 7.4
Pada tahap ini data diolah dan variabel yang sudah diperoleh akan diproses dengan
menggunakan bantuan Software RapidMiner Studio 7.4. Data yang didapatkan berdasarkan
permintaan pelanggan setiap hari, yang dikelompokan berdasarkan pelayanan yang disediakan
oleh setiap bagian di perusahaan.
2.5.5
Evaluasi Akhir
Pada tahap evaluasi akhir, hasil dari pengolahan data dengan bantuan Software
RapidMiner Studio 7.4 untuk memperoleh nilai statistic yang akan dibandingkan dengan hasil
prediksi yang selama ini dilakukan dengan sistem rata-rata (Mean). Sehingga kita dapat menarik
suatu kesimpulan terhadap hasil prediksi mana yang lebih mendekati, atau errornya yang lebih
kecil.
Penelitian adalah pekerjaan ilmiah yang bermaksud mengungkapkan rahasia ilmu secara
obyektif, dengan dibentengi bukti-bukti yang lengkap dan kokoh. Pengertian masalah penelitian
yang dapat diangkat untuk diteliti secara ilmiah memiliki unsur-unsur sebagai berikut:
a. Pendekatan ilmiah masalah penelitian harus tampak dan dirasakan sebagai suatu tantangan
bagi peneliti untuk dipecahkan dengan mempergunakan keahlian atau kemampuan
profesionalnya
b. Masalah penelitian merupakan kondisi yang menunjukkan kesenjangan (gap) antara peristiwa
atau keadaan nyata (das sain) dengan tolok ukur tertentu (das sollen) sebagai kondisi ideal
atau seharusnya bagi peristiwa atau keadaan tertentu.
c. Masalah penelitian adalah keraguan yang timbul terhadap suatu peristiwa atau keadaan
tertentu berupa kesangsian tentang tingkat kebenarannya suatu peristiwa atau keadaan Untuk
membantu peneliti muda dalam usaha mennyeleksi dan merumuskan masalah dan submasalah yang patut dibahas secara ilmiah
d. Masalah penelitian sedapat mungkin menghasilkan sesuatu yang baru.
e. Masalah penelitian harus dipilih yang dapat dihimpun datanya secara lengkap dan obyektif.
f. Masalah penelitian tidak boleh terlalu luas, tetapi juga tidak boleh terlalu sempit.
Di dalam melakukan penelitian untuk mendapatkan hasil yang maksimal, penulis
mengikuti Metode Penelitian yang telah ditetapkan. Metodologi Penelitian ini dibuat untuk
mengidentifikasi permasalahan, analisa permasalahan dan untuk mencari penyelesaian masalah
di dalam strategi Pelayanan Pelanggan di Kawasan Industri Batamindo.
Dalam Metodologi Penelitian ada urutan kerangka kerja yang harus diikuti. Urutan
kerangka kerja ini merupakan gambaran dari langkah-langkah yang harus dilalui agar penelitian
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
42
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)
bisa berjalan dengan baik. Ini sangat perlu ditetapkan supaya penelitian dapat dilakukan dengan
terstruktur.
Langkah yang akan dilakukan harus mencakup mulai dari mempelajari masalah sampai
dengan adanya suatu sistem yang dapat dihasilkan sehingga masalah dapat teratasi. Maka di sini
akan ditetapkan beberapa tahapan yang ada pada gambar 2 (Ali Ikhwan et al, 2015)
Pengumpulan Data
Analisa Data
Analisa Sistem
Perancangan Sistem
Implementasi Sistem
Pengujian Sistem
Gambar 2. Kerangka kerja
3. HASIL DAN PEMBAHASAN
3.1 Pembentukan Frequent Pattern Tree (FP-Tree)
Setelah item – item frequent didapat yang memenuhi nilai support count maka
pembangkitan FP Tree dapat dilakukan. data akan diolah secara manual sesuai dengan konsep
data mining dengan menggunakan algoritma frequent pattern growth
(FP Growth).
Setelah data diurut dapat kita lanjut pada tahap pembangkitan FP Tree. Pembacaan TID 1 atau
transaksi pertama, lalu dilanjutkan pembacaan TID 2 (transaksi kedua), dan dilanjutkan transaksi
selaanjutnya hingga transaksi terakhir.
Dengan menggunakan Frequent Pattern Growth maka dapat dilanjutkan dengan proses
pembangkit FP Tree dari data permintaan pelanggan yang digunakan, pembacaan TID atau
pembangkit FP Tree dapat dilihat dari penjalasan berikut :
Pembacaan TID 1
Pada transaksi pertama atau TID 1 itemnya adalah { FA, DA, CA } yang kemudian membentuk
lintasan FA, DA, CA. sehingga terbentuk lintasan Null-FA, DA, CA dengan support count awal
1, pembacaan TID 1 dapat dilihat pada gambar 3. lalu dilanjutkan dengan pembacaan TID 2.
Null
FA :1
DA:1
CA:1
Gambar 3. Hasil Pembentukan FP Tree Setelah Pembacaan TID 1
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
43
Herasmus
Pembacaan TID 2
Pada transaksi kedua atau TID 2 terdapat item {FA}, sehingga support count bertambah menjadi
{FA:2, DA:1,CA:1). Pembacaan TID 2 dapat dilihat pada gambar 4. yang akan dilanjutkan
pembacaan TID 3.
Null
Null
Null
FA :3
FA :2
DA:1
FA :3
DA:2
DA:1
CA:1
FA :1
DA:2
CA:2
CA:1
CA:2
TID 2
TID 3
TID 4
Gambar 4.Hasil Pembentukan FP Tree Setelah Pembacaan TID 2, TID 3 dan TID 4
Pembentukan TID 3
Pada transaksi ketiga atau TID 3 terdapat item {FA, DA, CA}, sehingga terjadi penambahan
support count pada lintasan yang sudah ada menjadi {FA:3, DA:2, CA:2}, pembacaan TID 3
dapat dilihat pada gambar 4., yang akan dilanjutkan pembacaan TID 4.
Pembacaan TID 4
Pada transaksi keempat atau TID 4 terdapat item {DA, FA, CA} yang kemudian menambah
lintasan transaksi baru dengan support count {DA:1, FA:1, CA:1}, pembentukan FP-Tree dari
TID 4 dapat dilihat pada gambar 4., yang akan dilanjutkan pembacaan TID 5
Pembacaan TID 5
Pada transaksi kelima atau TID 5 terdapat item {FA, DA, CA}, pembentukan FP Tree dari TID
5 terjadi penambahan support account menjadi {FA:4, DA:3, CA:3,, Pembacaan TID 5 dapat
dilihat pada gambar 4.5, yang akan dilanjutkan pembacaan TID 6.
Null
DA:1
FA :4
DA:3
FA :4
FA :1
CA:3
CA:1
TID 5
Null
Null
FA :5
DA:2
DA:3
DA:4
FA :2
CA:3
CA:2
TID 6
DA:2
FA :2
CA:4
CA:2
TID 7
Gambar 5. Hasil Pembentukan FP Tree Setelah Pembacaan TID 5, TID 6, dan TID 7
Pembacaan TID 6
Pada transaksi keenam atau TID 6 terdapat item {DA, FA, CA}, sehingga menambah support
count pada simpul menjadi {DA:2, FA:2, CA:2}, pembentukan FP Tree dari TID 6 dapat dilihat
pada gambar 5., yang akan dilanjutkan pembacaan TID 7.
Pembacaan TID 7
Pada transaksi ketujuh atau TID 7 terdapat item {FA, DA, CA} sehingga terjadi penambahan
support count pada simpul menjadi{FA:5, DA:4, CA:4}. Pembentukan FP Tree dari TID 7 dapat
dilihat pada gambar 5., dilanjutkan pembacaan TID 8.
Pembacaan TID 8
Pada transaksi kedelapan atau TID 8 terdapat item {DA, FA, CA}, sehingga terjadi penambahan
support count pada simpul menjadi {DA:3, FA:2, CA:2} pembentukan FP Tree dari TID 8 dapat
dilihat pada gambar 6.
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)
44
Pembacaan TID 9
Pada transaksi kedelapan atau TID 9 itemnya adalah {DA, FA, CA} sehingga terjadi penambahan
support count pada simpul menjadi {DA:4, FA:3, CA:3}, pembentukan FP Tree dari TID 9 dapat
dilihat pada gambar 6.
Null
FA :5
DA:3
DA:4
FA :5
FA :3
CA:5
CA:3
TID 8
DA:4
DA:5
FA :3
CA:4
CA:2
FA :6
DA:4
DA:4
FA :2
CA:4
Null
Null
TID 9
CA:3
TID 10
Gambar 6. Hasil Pembentukan FP Tree Setelah Pembacaan TID 8, TID 9 dan TID 10
Pembacaan TID 10
Pada transaksi kedelapan atau TID 10 itemnya adalah {FA, DA, CA} yang menambah support
count pada simpul menjadi {FA:6, DA:5, CA:5}, pembentukan FP Tree dari TID 10 dapat dilihat
pada gambar 6.
Ada 10 pembacaan TID dari hasil transaksi dengan terbentuknya 10 FP Tree. Setelah proses
pembangkitan FP Tree ini , proses penerapan FP Growth dapat dilanjutkan.
3.2. Penerapan FP Growth
Setelah dilakukan pembangunan FP Tree dari sekumpulan transaksi yang telah dilakukan, pada
tahapan di atas maka dilanjutkan dengan tahap FP Growth untuk mencari frequent itemset yang
memenuhi syarat. Langkah FP Growth ini sebanyak 3 langkah utama yaitu Conditional Pattern
Base, pembangkitan Conditional FP Tree, dan pencarian Frequent Itemset.
3.2.1. Pembangkitan Conditional Pattern Base
Setiap simpul dalam FP-Tree mengandung tiga informasi penting yaitu label item yang
menginformasikan jenis item yang direpresentasikan simpul tersebut, support count yang
merepresentasikan jumlah lintasan transaksi yang melalui simpul tersebut dan pointer
penghubung yang menghubungkan simpul-simpul dengan label item sama antar lintasan yang
ditandai dengan garis putus-putus.
Tabel Header
Kode
Frekuensi
FA
9
FP-Tree
Pointer
Null
FA :6
DA
DA:5
CA
DA:4
9
8
CA:5
FA :3
CA:3
Gambar 7. Pembangkitan Conditional FP-Tree
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
45
Herasmus
Tabel 1. Conditional Pattern Base
Item
Conditional Pattern Base
FA
{DA:4}
DA
{FA:6}
CA
{(FA:6, DA:5, CA:5), (DA:4, FA:3)}
3.2.2 Pembangkitan Conditional FP-Tree
Setelah mencari frequent itemset untuk beberapa akhiran (Suffix). Untuk menentukan
frequent itemset, maka perlu ditentukan terlebih dahulu lintasan yang berakhiran dengan Support
Count terkecil. Pada tahap pembangkitan Conditional Pattern Base dilakukan melalui cabang
pohon dengan Support Count terkecil, yaitu CA berturut-turut ditentukan juga yang berakhiran
DA dan FA. Untuk membangkitkan Conditional FP-Tree, maka harus dibuang lintasan yang
mengandung Suffix CA, DA dan FA. Hal ini akan dijelaskan dari gambar di bawah ini.
Null
FA :6
DA:5
Null
FA :6
DA:4
FA :3
DA:5
Null
DA:4
FA :6
FA :3
FA :3
CA
DA
FA
Gambar 8. Conditional FP Tree dengan Suffix CA, DA dan FA
Pada Gambar 8. ini merupakan lintasan transaksi yang berakhiran CA, terlihat dengan
pembacaan CA sebanyak 8 kali dari 2 lintasan , pada lintasan pertama CA melewati jalur FA,
DA dan masuk ke CA , lintasan ke dua dari Null masuk DA, FA dan langsung masuk ke CA.
Proses dalam membangkitkan Conditionall Pattern Base yang mengandung Suffix DA dapat
dilihat juga pada gambar 8. Pada gambar 8. ini merupakan lintasan transaksi yang berakhiran DA,
terlihat dengan pembacaan DA sebanyak 6 kali pada seluruh lintasan, dan melewati 2 jalur utama.
Pada jalur pertama CA langsung masuk ke DA sebanyak 6 transaksi, lintasan kedua dari Null
masuk ke DA sebanyak 1 transaksi. Proses dalam membangkitkan Conditionall Pattern Base
yang mengandung Suffix FA dapat dilihat pada gambar 8. Pada gambar 8. ini merupakan lintasan
transaksi yang berakhiran CA, terlihat dengan pembacaan DA sebanyak 9 kali pada dua lintasan,
dan melewati 2 jalur utama. Pada lintasan pertama langsung masuk ke FA sebanyak 6 transaksi,
dan ke dua dari Null masuk ke DA sebanyak 4 transaksi.
3.2.3. Pencarian Frequent Itemset
Setelah memeriksa Frequent Itemset untuk akhiran (Suffix), maka dapatlah hasil secara
keseluruhan yang terlihat dalam tabel 2.
Suffix
CA
DA
FA
Tabel 2. Tabel Hasil Frequent Itemset
Frequent set
{CA}, {CA, DA}, {CA, FA}, {CA, DA, FA}
{DA}, {DA, CA}, {DA,FA}
{FA}
Pencarian Association Rules dilakukan melalui dua tahap yaitu pencarian frequent itemset dan
penyusutan rules. Penting tidaknya suatu Association Rules dapat diketahui dengan dua
parameter, yaitu Support (nilai penunjang) dengan nilai Minimum Support 80 % dan Confidence
(nilai kepastian) dengan Minimum Confidence 50 %. Support adalah ukuran yang menunjukan
tingkat dominasi itemset dari keseluruhan transaksi.
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
46
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)
Setelah didapat Frequent Itemset, selanjutnya membuat rules dengan cara menghitung confidence
dari tiap kombinasi rule. Dari 18 itemset yang dihasilkan pada tabel 4.3 Itemset yang dihitung
minimal berisi dua item dari semua rule yang dihasilkan jika A maka B, yang terdiri dari 12
subsets, yaitu :
{CA, DA}, {CA, FA}, {CA, DA, FA}, {CA, FA, DA},{DA, CA}, {DA,FA},
{DA, CA, FA}, {CA, FA, CA}, {FA,CA}, {FA, DA}, {FA, CA, DA}, {FA, DA, CA}. Hanya
kombinasi yang lebih besar atau sama dengan minimum confidence yang akan diambil atau strong
association rule saja.
Rumus untuk menghitung Support dan confidence menggunakan rumus:
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴𝑑𝑎𝑛 𝐵
𝑆𝑢𝑝𝑝𝑜𝑟𝑡(𝐴, 𝐵) =
𝑥 100%
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵
𝑥 100%
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
Perhitungan nilai 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 setiap Association Rule yang dilalui, maka didapat hasil yang
dapat dilihat pada tabel 3.
Tabel 3. Perhitungan Nilai Support Setiap Association Rule
No
Jika
Maka
Support (% )
1
CA
DA
8/10 = 80 %
2
CA
FA
8/10 = 80 %
3
CA
DA,FA
8/10 = 80 %
4
DA
CA
8/10 = 80 %
5
DA
FA
8/10 = 80 %
6
DA
FA, CA
8/10 = 80 %
7
DA,CA
FA
8/10 = 80 %
8
FA
CA
8/10 = 80 %
9
FA
DA
8/10 = 80 %
10
FA
CA, DA
8/10 = 80 %
11
FA
DA, CA
8/10 = 80 %
12
FA, DA
CA
8/10 = 80 %
𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒(𝐴 → 𝐵) =
Adapun perhitungan nilai Confidence setiap association rule yang dilalui maka diperolehlah hasil
secara ke seluruhan yang terlihat dalam tabel 4.
Tabel. 4. Perhitungan Confidence Setiap Assosiation Rule
No
Jika
Maka
Confidence (%)
1
CA
DA
8/8 = 100 %
2
CA
FA
8/8 = 100 %
3
CA
DA,FA
8/8 = 100 %
4
DA
CA
8/9 = 89 %
5
DA
FA
8/9 = 89 %
6
DA
FA, CA
8/9 = 89 %
7
DA,CA
FA
8/8 = 100 %
8
FA
CA
8/9 = 89 %
9
FA
DA
8/9 = 89 %
10
FA
CA, DA
8/9 = 89 %
11
FA
DA, CA
8/9 = 89 %
12 FA, DA
CA
8/8 = 100 %
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
47
Herasmus
Setelah diketahui hasil Support dan Confidence, maka kita akan menggabungkan
hasilnya seperti dapat kita lihat pada tabel 4. hasil dari evaluasi keseluruhan Association Rule
yang didapat.
Tabel 5. Hasil Evaluasi Rules
No
Jika
Maka
Support (% )
Confidence (%)
1
CA
DA
80%
100%
2
3
4
5
6
7
8
9
10
11
12
CA
CA
DA
DA
DA
DA,CA
FA
FA
FA
FA
FA, DA
FA
DA,FA
CA
FA
FA, CA
FA
CA
DA
CA, DA
DA, CA
CA
80%
80%
80%
80%
80%
80%
80%
80%
80%
80%
80%
100%
100%
89%
89%
89%
100%
89%
89%
89%
89%
100%
4. SIMPULAN
Dari tahap-tahap yang telah dilakukan di atas, maka dapat diambil kesimpulan sebagai berikut:
 Rule 1 : If ada permintaan untuk perbaikan Commercial area then ada permintaan untuk
Dormitory area dengan tingkat kepercayaan 100 % dan didukung oleh 80% dari
data keseluruhan.
 Rule 2 : If ada permintaan untuk perbaikan di Commercial area then ada permintaan untuk
Factory area dengan tingkat kepercayaan 100 % dan didukung oleh 80% dari
data keseluruhan.
 Rule 3 : If ada permintaan untuk perbaikan di Commercial area then maka akan ada
permintaan untuk Dormitory dan Factory area dengan tingkat kepercayaan 100
% dan didukung oleh 80% dari data keseluruhan.
 Rule 4 : If ada permintaan untuk perbaikan di Dormitory area then akan ada permintaan
untuk Factory area dengan tingkat kepercayaan 89 % dan didukung oleh 80%
dari data keseluruhan.
 Rule 5 : If ada permintaan untuk perbaikan di Dormitory area then ada permintaan untuk
Factory area dengan tingkat kepercayaan 89 % dan didukung oleh 80% dari data
keseluruhan.
 Rule 6 : If ada permintaan untuk perbaikan di Dormitory area then ada permintaan untuk
Factory dan Comercial area dengan tingkat kepercayaan 89 % dan didukung oleh
80% dari data keseluruhan.
 Rule 7 : If ada permintaan untuk perbaikan di Dormitory dan Commercial area then ada
permintaan untuk Factory area dengan tingkat kepercayaan 100% dan didukung
oleh 80% dari data keseluruhan.
 Rule 8 : If ada permintaan untuk perbaikan di Factory area then ada permintaan untuk
Comercial area dengan tingkat kepercayaan 89 % dan didukung oleh 80% dari
data keseluruhan.
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
48
Analisa Customer Service System Menggunakan Metode Data Mining Dengan
Algoritma FP-Growth (Studi Kasus Di PT Batamindo Investment Cakrawala)

Rule 9 : If ada permintaan untuk perbaikan di Factory area then maka akan ada permintaan
untuk Dormitory area dengan tingkat kepercayaan 89 % dan didukung oleh 80%
dari data keseluruhan.
 Rule 10 : If ada permintaan untuk perbaikan di Factory area then maka akan ada permintaan
untuk Dormitory dan Commercial area dengan tingkat kepercayaan 89 % dan
didukung oleh 80% dari data keseluruhan.
 Rule 11 : If ada permintaan untuk perbaikan di Factory area then maka akan ada permintaan
untuk Dormitory dan Comercial area dengan tingkat kepercayaan 100 % dan
didukung oleh 80% dari data keseluruhan.
 Rule 12 : If ada permintaan untuk perbaikan di Factory dan Dormitory area then maka akan
ada permintaan untuk Commercial Area dengan tingkat kepercayaan 100 % dan
didukung oleh 80% dari data keseluruhan.
Setelah diuraikan rule yang ada, dapat dibuktikan bahwa dengan menggunakan aplikasi
Rapidminer 7.4 dapat dianalisa Permintaan Pelanggan pada PT Batamindo Investment
Cakrawala dengan FP Growth. Dengan tingkat kepercayaan yang didapat dan didukung oleh
persentase keseluruhan data, bisa diprediksi berapa jumlah permintaan pelanggan selanjutnya.
DAFTAR PUSTAKA
Dewi Kartika Pane, “Implementasi Data Mining pada Penjualan Produk Elektronika dengan
Algoritma Apriori (Studi Kasus: Kreditplus)”, Pelita Informatika Budi Dharma, Volume :
IV, Nomor : 3, Agustus 2013.
Yi Zheng et al, “ Research of Improved FP-Growth Algoritm in Association Rules Mining”,
Hindawi Publishing Corporation Scientific Programming Volume 2015, Article ID 910281,
6 pages http://dx.doi.org/10.1155/2015/91028.
M.Hamsathvani et al, “Survey on Infrequent Weighted Itemset Mining Using FP Growth”,
International Journal of Advanced Research in Electrical, Electronics and Instrumentation
Engineering (An ISO 3297: 2007 Certified organization) Vol. 3, Issue 11, November 2014.
Shivam Sidhu, “FP Growth Algorithm Implementation”, International Journal of Computer
Applications (0975 – 8887) Volume 93 – No.8, May 2014.
A.Arthi Priadharsni dan Dr. E. Ramaraj, “Comparative Study of Revised FP – Growth, Weighted
Apriori and Fuzzy Apriori Algorithm”, International Journal of Engineering Trends and
Technology (IJETT) – Volume 13 Number 6 – Jul 2014.
Wiem Taktak dan Yahya Slimani, “MS-FP-Growth : A multi support version of FP-Growth
Algoritma. International Jurnal of Hybrid Information Technology Vol. 7 No.3 (2014), pp
155-166. http:// dot.doi.org/10.14257/ijhit.2014.7.3.16.
Ali Ikhwan et al, “ Penerapan Data Mining dengan Algoritma FP-Growth untuk Mendukung
Strategi Promosi Pendidikan (Studi Kasus Kampus STMIK Triguna Dharma), Magister Ilmu
Komputer Universitas Putra Indonesia“YPTK” Padang,
Program Studi Sistem Komputer, STMIK Triguna Dharma Sumbar.
Abdullah Saad Almalaise Alghamdi,” Efficient Implementation of FP Growth Algorithm-Data
Mining on Medical Data”, IJCSNS International Journal of Computer Science and Network
Security, VOL.11 No.12, December 2011, Chairman of CIT Faculty of Computing and
Information Technology King Abdulaziz University, Jeddah Kingdom of Saudi Arabia.
Rizka Nurul Arifin, “Implementasi Algoritma Frequent Pattern Growth (FG-Growth)
menentukan asosiasi antar produk (study kasus Nadiamart)
M.Kavitha and S.T.Tamil Selvi, “Comparative Study on Apriori Algorithm and Fp Growth
Algorithm with Pros and Cons”, International Journal of Computer Science Trends and
Technology (I JCS T) – Volume 4 Issue 4, Jul - Aug 2016.
Oktober 2017 | Vol. 2 | No. 2 | ISSN : 2541-2647
49
Herasmus
Goldie Gunadi dan Dana Indra Sensuse,” Penerapan Metode Data Mining market Basket
Analysis terhadap data penjualan produk buku dengan menggunakan Algoritma Apriori dan
Frequent Pattern Growth (Fp-Growth) : Studi Kasus Percetakan PT. Gramedia”
M.Eka Septa Eljandi et al, “ Perancangan Data Warehouse dan penerapan Data Mining
menggunakan Algoritma FP-Tree dan FP-Growth untuk penyusunan produk pada PT
Zhulian Palembang”
Jurnal Teknik Ibnu Sina (JT-IBSI), Sekolah Tinggi Teknik Ibnu sina – Batam
Download