skripsi - Universitas Dian Nuswantoro

advertisement
SKRIPSI
IMPLEMENTASI ALGORITMA C4.5 UNTUK
MEMPREDIKSI PERILAKU PEMBELIAN KONSUMEN
PADA SWALAYAN PANTES
IMPLEMENTATION OF C4.5 ALGORITHM
TO PREDICT CUSTOMERS BUYING BEHAVIOR
AT SWALAYAN PANTES
Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana
Teknik Informatika
Disusun Oleh:
NAMA
: NURUL HIDAYAT
NIM
: A11.2010.05672
Program Studi
: Teknik Informatika – S1
FAKULTAS ILMU KOMPUTER
UNIVERSITAS DIAN NUSWANTORO
SEMARANG
2014
PERSETUJUAN SKRIPSI
Nama
: Nurul Hidayat
NIM
: A11.2010.05672
Program Studi
: Teknik Informatika S-1
Fakultas
: Ilmu Komputer
Judul Tugas Akhir
: Implementasi Algoritma C4.5 untuk Memprediksi
Perilaku Pembelian Konsumen Pada Swalayan
Pantes
Tugas Akhir ini telah diperiksa dan disetujui,
Semarang, 16 Oktober 2014
Menyetujui:
Mengetahui:
Pembimbing
Dekan Fakultas Ilmu Komputer
Desi Purwanti K, M.Kom
Dr. Abdul Syukur
i
PENGESAHAN DEWAN PENGUJI
Nama
: Nurul Hidayat
NIM
: A11.2010.05672
Program Studi
: Teknik Informatika S-1
Fakultas
: Ilmu Komputer
Judul Tugas Akhir
: Implementasi Algoritma C4.5 untuk Memprediksi
Perilaku Pembelian Konsumen Pada Swalayan
Pantes
Tugas akhir ini telah diajukan dan dipertahankan dihadapan Dewan Penguji pada
Sidang Tugas Akhir tanggal 24 Oktober 2014. Menurut pandangan kami, tugas
akhir ini memadai dari segi kualitas maupun kuantitas untuk tujuan
penganugrahan gelar Sarjana Komputer (S.Kom)
Semarang, 24 Oktober 2014
Dewan Penguji:
Noor Ageng Setiyanto, M.Kom
Ajib Susanto, M.Kom
Anggota
Anggota
Solichul Huda, M.Kom
Ketua Penguji
ii
PERNYATAAN KEASLIAN SKRIPSI
Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah
ini, saya:
Nama : Nurul Hidayat
NIM
: A11.2010.05672
Menyatakan bahwa karya ilmiah saya yang berjudul:
“Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian
Konsumen Pada Swalayan Pantes”
merupakan karya asli saya (kecuali cuplikan dan ringkasan yang masing-masing
telah saya jelaskan sumbernya dan perangkat pendukung seperti web cam dll).
Apabila di kemudian hari, karya saya disinyalir bukan merupakan karya asli saya,
yang disertai dengan bukti-bukti yang cukup, maka saya bersedia untuk
dibatalkan gelar saya beserta hak dan kewajiban yang melekat pada gelar tersebut.
Demikian surat pernyataan ini saya buat dengan sebenarnya.
Dibuat di
: Kota Semarang
Pada tanggal : 16 Oktober 2014
Yang menyatakan
Nurul Hidayat
iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA
ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah
ini, saya:
Nama : Nurul Hidayat
NIM
: A11.2010.05672
demi mengembangkan Ilmu Pengetahuan, menyetujui untuk memberikan kepada
Universitas Dian Nuswantoro Hak Bebas Royalti Non-Eksklusif (Non-exclusive
Royalty-Free Right) atas karya ilmiah saya yang berjudul:
“Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian
Konsumen Pada Swalayan Pantes”
beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti NonEksklusif ini Universitas Dian Nuswantoro berhak untuk menyimpan, mengcopy
ulang (memperbanyak), menggunakan, mengelolanya dalam bentuk pangkalan
data (database), mendistribusikannya dan menampilkan/ mempublikasikannya di
internet atau media lain untuk kepentingan akademis tanpa perlu meminta izin
dari saya selama tetap mencantumkan nama saya sebagai penulis/ pencipta.
Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak
Universitas Dian Nuswantoro, segala bentuk tuntutan hukum yang timbul atas
pelanggaran Hak Cipta dalam karya ilmiah saya ini.
Demikian surat pernyataan ini saya buat dengan sebenarnya.
Dibuat di
: Kota Semarang
Pada Tanggal
: 16 Oktober 2014
Yang menyatakan
Nurul Hidayat
iv
UCAPAN TERIMA KASIH
Dengan memanjatkan puji syukur kehadirat Allah SWT. Tuhan Yang Maha
Pengasih dan Maha Penyayang yang telah melimpahkan segala rahmat, hidayah
dan inayah-Nya kepada penulis sehingga laporan tugas akhir dengan judul
“Implementasi Algoritma C4.5 untuk Memprediksi Pembelian Konsumen Pada
Swalayan Pantes” dapat penulis selesaikan sesuai dengan rencana karena
dukungan dari berbagai pihak yang tidak ternilai besarnya. Oleh karena itu
penulis menyampaikan terima kasih kepada:
1. Dr. Ir. Edi Noersasongko, M.Kom, selaku Rektor Universitas Dian
Nuswantoro Semarang.
2. Dr. Abdul Syukur, Drs, MM, selaku Dekan Fasilkom.
3. Heru Agus Santoso, Ph.D selaku Ka. Progdi Teknik Informatika.
4. Desi Purwanti Kusumaningrum, M.Kom selaku pembimbing tugas akhir yang
memberikan ide penelitian, informasi referensi yang penulis butuhkan dan
bimbingan yang berkaitan dengan penelitian penulis.
5. Dosen-dosen pengampu di Fakultas Ilmu Komputer Teknik Informatika
Universitas Dian Nuswantoro Semarang yang telah memberikan ilmu dan
pengalamannya
masing-masing,
sehingga
penulis
dapat
mengimplementasikan ilmu yang telah disampaikan.
6. Kedua Orang tua dan Kedua Kakak tersayang yang selalu memberikan
semangat dan dukungan.
7. Teman-teman yang telah mendukung dan membantu pembuatan skripsi.
Semoga Tuhan Yang Maha Esa memberikan balasan yang lebih kepada beliaubeliau, dan laporan tugas akhir ini dapat bermanfaat sebagaimana fungsinya.
Semarang, 16 Oktober 2014
Penulis
v
ABSTRAK
Belanja merupakan kegiatan yang sangat menyenangkan untuk sebagian
besar orang. Belanja bukan hanya sebagai aktivitas rutin untuk memenuhi
keinginan dan kebutuhan konsumen, akan tetapi menjadi sarana rekreasi
dan hiburan semata. Dari masalah ini manajer pemasaran harus bekerja
keras untuk mengetahui perilaku pembelian konsumen dengan cara
memprediksi perilaku pembeliannya. Penelitian ini menggunakan suatu
teknik data mining yaitu klasifikasi terhadap data konsumen. Dengan
menggunakan 4 variabel yaitu umur, pendapatan, status pelajar atau bukan
pelajar, dan tingkat pinjaman. Dengan menerapkan teknik data mining
pada data konsumen diharapkan dapat ditemukan aturan klasifikasi yang
dapat digunakan untuk memprediksi perilaku pembelian konsumen, tanpa
harus bertanya secara langsung kepada pengunjung apa mereka berniat
membeli atau sekedar melihat-lihat. Keluaran yang dihasilkan adalah
sistem yang mampu melakukan analisis data mining dengan Algoritma
C4.5 dan menghasilkan tree baru yang terbentuk untuk menentukan
perilaku pembelian konsumen.
Kata kunci: Perilaku pembelian konsumen, Data mining, Algoritma C4.5.
vi
DAFTAR ISI
PERSETUJUAN SKRIPSI .......................................................................... i
PENGESAHAN DEWAN PENGUJI ......................................................... ii
PERNYATAAN KEASLIAN SKRIPSI.................................................... iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS .................................................. iv
UCAPAN TERIMA KASIH....................................................................... v
ABSTRAK ................................................................................................. vi
DAFTAR ISI............................................................................................. vii
DAFTAR TABEL....................................................................................... x
DAFTAR GAMBAR ................................................................................. xi
BAB I .......................................................................................................... 1
PENDAHULUAN ...................................................................................... 1
1.1
Latar Belakang .............................................................................. 1
1.2
Perumusan Masalah....................................................................... 3
1.3
Batasan Masalah ............................................................................ 3
1.4
Tujuan Penelitian........................................................................... 4
1.5
Manfaat Penelitian......................................................................... 4
BAB II......................................................................................................... 5
TINJAUAN PUSTAKA DAN LANDASAN TEORI ................................ 5
2.1
Tinjauan Studi ............................................................................... 5
2.2
Tinjauan Pustaka ........................................................................... 8
2.2.1 Konsumen................................................................................ 8
2.2.2 Data Mining........................................................................... 10
vii
2.2.3 Algoritma C4.5 ...................................................................... 19
2.2.4 Rekayasa Perangkat Lunak ................................................... 21
2.3
Kerangka Pemikiran .................................................................... 25
BAB III ..................................................................................................... 26
METODOLOGI PENELITIAN................................................................ 26
3.1
Metode Penelitian........................................................................ 26
3.2
Sumber dan Teknik Pengumpulan Data ...................................... 27
3.2.1 Sumber Data .......................................................................... 27
3.2.2 Teknik Pengumpulan Data .................................................... 28
3.3
Ruang Lingkup Penelitian ........................................................... 29
3.4
Instrumen Penelitian.................................................................... 29
3.4.1 Kebutuhan Perangkat Lunak ................................................. 29
3.4.2 Kebutuhan Perangkat Keras .................................................. 30
3.5
Metode Pengembangan Perangkat Lunak ................................... 31
BAB IV ..................................................................................................... 36
RANCANGAN SISTEM DAN IMPLEMENTASI ................................. 36
4.1
Perancangan Sistem..................................................................... 36
4.1.1 Komunikasi dengan Pengguna .............................................. 36
4.1.2 Desain Antarmuka ................................................................. 40
4.1.3 Desain Database Prediksi Perilaku Pembelian Konsumen ... 43
4.2
Pengujian dan Implementasi Sistem ........................................... 44
4.2.1 Implementasi Sistem ............................................................. 44
4.2.2 Pengujian Perangkat Lunak................................................... 47
viii
BAB V ...................................................................................................... 50
HASIL PENELITIAN DAN PEMBAHASAN ........................................ 50
5.1
Pembahasan ................................................................................. 50
5.2
Hasil Penelitian ........................................................................... 50
5.2.1 Evaluasi Hasil Data Mining .................................................. 50
BAB VI ..................................................................................................... 62
KESIMPULAN DAN PENELITIAN SELANJUTNYA ......................... 62
6.1
Kesimpulan.................................................................................. 62
6.2
Penelitian Selanjutnya ................................................................. 63
DAFTAR PUSTAKA ............................................................................... 64
LAMPIRAN .............................................................................................. 66
ix
DAFTAR TABEL
Tabel 2.1 State of the art 1 .............................................................................................5
Tabel 2.2 State of the art 2 .............................................................................................7
Tabel 3.1 Attribut yang digunakan ..............................................................................32
Tabel 4.1 Tabel identifikasi dan pelaksanaan pengujian program ...............................48
Tabel 4.2 Tabel hasil pengujian perangkat lunak ........................................................48
Tabel 5.1 Perhitungan Node 1 .....................................................................................57
Tabel 5.2 Perhitungan Node 1.1 ..................................................................................58
Tabel 5.3 Perhitungan Node 1.2 ..................................................................................59
Tabel 5.4 Perhitungan Node 1.2.2 ...............................................................................60
x
DAFTAR GAMBAR
Gambar 2.1 Data Mining .............................................................................................10
Gambar 2.2 Tahap-Tahap Data Mining .......................................................................11
Gambar 2.3 Beberapa Metode Data Mining ................................................................12
Gambar 2.4 Proses Data Mining Menurut CRISP-DM ...............................................16
Gambar 2.5 Proses Web Engineering ..........................................................................22
Gambar 3.1 Tabel dataset konsumen ...........................................................................33
Gambar 3.2 Pohon Keputusan Hasil Perhitungan Node ..............................................34
Gambar 4.1 Use case diagram pada rancangan sistem ................................................37
Gambar 4.2 Diagram aktivitas untuk melakukan pengujian ........................................38
Gambar 4.3 Class Diagram ..........................................................................................39
Gambar 4.4 Desain Menu Login ..................................................................................40
Gambar 4.5 Desain Menu Utama.................................................................................41
Gambar 4.6 Desain Menu Data Training .....................................................................41
Gambar 4.7 Desain Menu Input Data Training ...........................................................42
Gambar 4.8 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk....................12
Gambar 4.9 Desain Menu Pengujian ...........................................................................43
Gambar 4.10 Desain Tabel User Login .......................................................................43
Gambar 4.11 Desain Tabel Attribut .............................................................................43
Gambar 4.12 Desain Tabel Dataset .............................................................................44
Gambar 4.13 Menu Login ............................................................................................44
Gambar 4.14 Menu Utama...........................................................................................44
Gambar 4.15 Menu Data Training ...............................................................................45
Gambar 4.16 Menu Input Data Training......................................................................45
Gambar 4.17 Menu Iterasi Perhitungan .......................................................................46
Gambar 4.18 Menu Tree yang Terbentuk, dan Akurasi ..............................................46
Gambar 4.19 Menu Pengujian .....................................................................................47
Gambar 5.1 Pohon Keputusan Node 1 .........................................................................58
Gambar 5.2 Pohon Keputusan Node 1.1 ......................................................................59
Gambar 5.3 Pohon Keputusan Node 1.2 ......................................................................60
xi
Gambar 5.3 Pohon Keputusan Node 1.2.2 ...................................................................61
xii
BAB I
PENDAHULUAN
1.1
Latar Belakang
Dunia perdagangan pada masa sekarang ini semakin maju, terbukti
dengan banyaknya jumlah supermarket, pasar swalayan, hypermarket dan
usaha ritel sejenis yang beroperasi di berbagai tempat baik di kota besar
maupun di kota kecil yang dari hari ke hari semakin menarik minat
konsumen. Melihat persaingan usaha yang semakin tajam antar pasar
swalayan atau hypermarket ini membuat seorang manajer pemasaran harus
selalu berpikir cepat dan terus memperbarui strategi yang diterapkan oleh
perusahaan.
Swalayan Pantes merupakan salah satu pasar swalayan yang
didirikan ditengah-tengah pusat Kecamatan Lasem untuk memenuhi
kebutuhan konsumen atas segala macam bentuk produk yang dihasilkan
oleh perusahaan. Lokasinya yang cukup strategis semakin mempermudah
Swalayan Pantes untuk dijangkau oleh konsumen. Selain itu, Swalayan
Pantes juga termasuk pendatang baru dan swalayan pertama yang ada di
Kecamatan Lasem tersebut. Hal ini membuat banyak konsumen
berdatangan dari segala golongan mulai dari golongan bawah sampai
golongan atas, bahkan segala umur semua membaur pada Swalayan Pantes
Lasem.
Belanja merupakan kegiatan yang sangat menyenangkan untuk
sebagian besar orang, karena belanja bukan hanya sebagai aktivitas rutin
untuk memenuhi keinginan dan kebutuhan konsumen, akan tetapi sering
kali kegiatan berbelanja menjadi sarana rekreasi dan hiburan semata.
Berbedanya pola perilaku konsumen ini membuat seorang manajer
pemasaran harus berfikir beberapa kali untuk menentukan target
penjualan, karena tidak semua pengunjung atau konsumen berniat untuk
membeli, akan tetapi ada yang sekedar melihat-lihat atau sekedar
1
2
refreshing. Dari masalah ini manajer pemasaran harus bekerja keras untuk
mengetahui perilaku pembelian konsumen dengan cara memprediksi
perilaku pembeliannya. Karena dengan memprediksi perilaku pembelian
konsumen, manajer pemasaran akan mengetahui konsumen yang berniat
membeli barang dengan konsumen yang hanya sekedar melihat-lihat atau
sekedar refreshing.
Data mining merupakan proses ekstraksi informasi atau pola
penting dalam basis data berukuran besar [1]. Salah satu proses dalam data
mining adalah klasifikasi, pada klasifikasi diberikan sejumlah record yang
dinamakan training set, yang terdiri dari beberapa atribut, salah satu
atribut menunjukkan kelas untuk record. Tujuan dari klasifikasi adalah
untuk menemukan model dari training set yang membedakan record
kedalam kategori atau kelas yang sesuai, model tersebut kemudian
digunakan untuk mengklasifikasikan record yang kelasnya belum
diketahui sebelumnya. Penelitian ini menggunakan suatu teknik dalam
data mining yaitu klasifikasi terhadap data konsumen. Dengan
menggunakan 4 variabel yaitu umur, pendapatan, status pelajar atau bukan
pelajar, dan tingkat pinjaman. Metode yang digunakan dalam penelitian
ini adalah fuzzy decision tree (Pohon Keputusan). Dengan menerapkan
teknik data mining pada data konsumen diharapkan dapat ditemukan
aturan klasifikasi yang dapat digunakan untuk memprediksi perilaku
pembelian konsumen, tanpa harus bertanya secara langsung kepada
pengunjung apa mereka berniat membeli atau sekedar melihat-lihat.
Pohon keputusan adalah salah satu metode klasifikasi yang paling
populer karena mudah untuk diinterpretasikan oleh manusia. Pohon
keputusan adalah model prediksi menggunakan struktur pohon atau
struktur berhierarki. Konsep dari pohon keputusan adalah mengubah data
menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama
dari penggunaan pohon keputusan adalah kemampuannya untuk membreakdown proses pengambilan keputusan yang kompleks menjadi lebih
3
simple sehingga pengambil keputusan akan lebih menginterpretasikan
solusi dari permasalahan. Algortima C4.5 merupakan salah satu cara yang
dapat dilakukan untuk membangun aturan yang direpresentasikan dalam
bentuk pohon keputusan. Fakta yang digunakan berasal dari tabel
keputusan yang kemudian diproses dengan Algoritma C4.5 [2].
Berdasarkan permasalahan yang telah diuraikan diatas, maka
dalam hal ini Penulis memilih judul “Implementasi Algoritma C4.5 untuk
Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes”,
sebagai judul untuk menyusun laporan Tugas Akhir guna menyelesaikan
Program Studi Strata 1 di Universitas Dian Nuswantoro Semarang.
1.2
Perumusan Masalah
Berdasarkan latar belakang masalah yang telah diuraikan diatas,
diperoleh rumusan masalah untuk melakukan penelitian ini yaitu
bagaimana mengimplementasikan Algoritma C4.5 untuk memprediksi
perilaku pembelian konsumen dengan data sampel yang ada.
1.3
Batasan Masalah
Dalam hal ini penulis melakukan pembatasan ruang lingkup
masalah, hal ini dilakukan agar pembahasannya tidak menyimpang
dari topik permasalahan tentang
Implementasi Algoritma C4.5 untuk
memprediksi perilaku pembelian konsumen pada Swalayan Pantes yang
ada di Kecamatan Lasem. Batasan masalahnya antara lain :
1. Sistem
hanya
membantu
memberikan
prediksi
dalam
menentukan perilaku pembelian konsumen.
2. Sistem menggunakan
4 variabel, yaitu Umur, Pendapatan,
Status Pelajar atau Bukan Pelajar, dan Tingkat Pinjaman.
3. Pengolahan data dilakukan menggunakan Algoritma C4.5.
4
1.4
Tujuan Penelitian
Berdasarkan perumusan masalah pada bagian sebelumnya, tujuan
yang
ingin
dicapai
dari
pengerjaan
tugas
akhir
ini
adalah
mengimplementasikan Algoritma C4.5 dalam memprediksi perilaku
pembelian konsumen.
1.5
Manfaat Penelitian
1. Manfaat Bagi Penulis
Dapat menerapkan ilmu dan ketrampilan pemrograman yang
telah diperoleh penulis selama di akademik terutama mengenai data
mining serta dapat memodelkan sistem perhitungan data dengan
menggunakan metode Decission Tree (Pohon Keputusan) yaitu
Algoritma C4.5.
2. Manfaat Bagi Perusahaan
Diharapkan dapat menyelesaikan masalah perilaku pembelian
konsumen yang sebelumnya belum diketahui oleh manajer pemasaran.
Dengan adanya sistem ini, manajer dapat memprediksi perilaku
pembelian konsumen.
3. Manfaat Bagi Universitas Dian Nuswantoro
Mengetahui sejauh mana penguasaan materi yang telah
didapatkan oleh mahasiswa selama menempuh perkuliahan di
Universitas Dian Nuswantoro serta sebagai bahan evaluasi akademik
untuk meningkatkan mutu pendidikan.
BAB II
TINJAUAN PUSTAKA DAN LANDASAN TEORI
2.1
Tinjauan Studi
Jurnal penelitian yang ditulis oleh Gaurav Kumar Nayak, Swathi J
Narayanan, Ilango Paramasivam dengan judul “Development and
Comparative Analysis Of Fuzzy Inference Systems for Predicting Buying
Behavior” merupakan kajian pustaka dalam penelitian ini.
Jurnal penelitian tersebut menjelaskan perbandingan antara metode
mamdani dan metode sugeno dalam kasus memprediksi pembelian
konsumen. Hasilnya adalah metode sugeno memiliki hasil yang lebih
akurat daripada menggunakan metode mamdani dalam memprediksi
apakah seseorang yang datang ke suatu toko atau tempat perbelanjaan itu
pasti membeli atau tidak membeli.
Hasil
yang
didapatkan
diperoleh
dari
beberapa
variabel
diantaranya, umur (Age), status pelajar atau bukan pelajar (Student),
pendapatan (Income) dan tingkat peminjaman (Credit Rating)[3].
Tabel 1.1 State of the art 1
Penulis
Judul
Masalah
Atribut
Gaurav Kumar
Development
Kurangnya
Umur
Nayak, Swathi
and Comparative
informasi
J
Analysis
Narayanan,
Of
Daripada
metode
status pelajar atau
Mamdani dan
mamdani,
metode
mengenai kapan
bukan
Metode
sugeno mempunyai
(Student),
Sugeno
hasil
Fuzzy Inference
dan
Paramasivam
Systems
kondisi
dalam
apa
(Age),
Hasil
Metode
Ilango
for
Metode
pelajar
pendapatan
yang
akurat
Predicting
konsumen
(Income)
Customer Buying
membeli produk
tingkat
perilaku
Behavior
tertentu
peminjaman
konsumen
dan
(Credit Rating)
5
lebih
dalam
memprediksi
pembelian
6
Jurnal penelitian yang ditulis oleh Ahmad Saikhu, Joko Lianto, dan
Umi Hanik dengan judul “FUZZY DECISION TREE DENGAN
ALGORITMA C4.5 PADA DATA DIABETES INDIAN PIMA” merupakan
kajian pustaka kedua dalam penelitian ini.
Penelitian ini menggunakan suatu teknik dalam data mining yaitu
klasifikasi terhadap data diabetes. Dengan menggunakan 9 variabel yaitu
number of times pregnant (time), plasma glucose concentration a 2 hours
in an oral glucose tolerance test (OGTT), diastolic blood pressure (D),
triceps skin fold thickness (T), 2-Hour serum insulin (IPOST), body
mass index (BMI), diabetes pedigree function (F), Age (T), dan
Class variable (Diagnosa). Metode yang digunakan dalam penelitian
ini adalah
fuzzy
decision
tree.
Penggunaan
teknik
fuzzy
memungkinkan dilakukannya prediksi suatu objek yang dimiliki lebih
dari satu kelas. Dengan menerapkan teknik data mining pada
diabetes diharapkan dapat ditemukan aturan klasifikasi yang dapat
digunakan untuk memprediksi potensi seseorang terserang diabetes,
tanpa
harus melawan diagnosis penyakit secara langsung dengan
diagnosis dini [1].
7
Tabel 2.2 State of the art 2
Penulis
Judul
Masalah
Atribut
Metode
Ahmad
FUZZY
Bagaimana
number
Saikhu,
DECISION
memprediksi
pregnant
Joko
TREE
potensi
plasma
Lianto,
DENGAN
seseorang
concentration
dan
ALGORITMA
terserang
hours
C4.5
diabetes, tanpa
glucose tolerance test
Algoritma
DATA
harus melawan
(OGTT),
C4.5
DIABETES
diagnosis
blood
pressure
(D),
INDIAN
penyakit secara
triceps
skin
fold
PIMA
langsung
thickness (T), 2-Hour
dengan
serum
diagnosis dini
(IPOST), body mass
Hanik
Umi
PADA
of
times
Metode
a.
Fuzzy
dihasilkan tingkat akurasi
Decision
yang lebih tinggi dibanding
2
Tree dengan
tanpa pruning, dari 69,14%
oral
menggunkan
ke 78,91%.
(time),
glucose
in
a
an
Hasil
diastolic
insulin
index (BMI), diabetes
pedigree function (F),
b.
Dengan
Pembagian
himpunan fuzzy
menggunakan
data
standard
pruning
pruning
data
dengan
referensi
dengan
memiliki tingkat
akurasi lebih tinggi 78,91%
dibandingkan
dengan
referensi
kuartil
data
76,95%.
Age (T), dan Class
variable (Diagnosa)
c. Semakin tinggi θr dan
θn, semakin tinggi tingkat
akurasi.
8
2.2
Tinjauan Pustaka
2.2.1
Konsumen
2.2.1.1 Definisi Konsumen
Konsumen adalah setiap orang pemakai barang dan/atau jasa yang
tersedia dalam masyarakat, baik bagi kepentingan diri sendiri, keluarga,
orang
lain,
maupun
makhluk
hidup
lain
dan
tidak
untuk
diperdagangkan. Jika tujuan pembelian produk tersebut untuk dijual
kembali, maka dia disebut pengecer atau distributor [11].
Dalam buku A.Z. Nasution yang berjudul “aspek-aspek hukum
masalah perlindungan konsumen”, istilah konsumen berasal dari bahasa
consumer (Inggris Amerika) atau consument (Belanda). Secara harfiah arti
kata consumer adalah lawan dari produsen, setiap orang yang
menggunakan barang.
2.2.1.2 Definisi Perilaku Konsumen
Menurut Ebert dan Griffin, “Perilaku konsumen dijelaskan sebagai
upaya konsumen untuk membuat keputusan tentang suatu produk yang
dibeli dan dikonsumsi” [12]. Perilaku Konsumen merupakan suatu tindakan
yang
tunjukkan
oleh
konsumen
dalam
hal
mencari,
menukar,
menggunakan, menilai, mengatur barang atau jasa yang mereka anggap
akan memuaskan kebutuhan mereka. Dalam arti lain perilaku ditunjukkan,
yakni bagaimana konsumen mau mengeluarkan sumber dayanya yang
terbatas seperti uang, waktu, tenaga untuk mendapatkan/menukarkan
dengan barang atau jasa yang diinginkannya. Menurut Mowen (2002)
bahwa, “perilaku konsumen (consumer behaviour) didefinisikan sebagai
studi tentang unit pembelian (buying units) dan proses pertukaran yang
melibatkan
perolehan,
pengalaman serta ide-ide”.
konsumsi
dan
pembuangan
barang,
jasa,
9
2.2.1.3 Macam-Macam Perilaku Konsumen
Jika dilihat dari perilaku konsumen dalam mengonsumsi suatu
barang dibedakan menjadi dua macam, yaitu [11]:
1. Perilaku Konsumen Rasional
Suatu
konsumsi
dapat
dikatakan
rasional
jika
memerhatikan hal-hal berikut:
a) Barang tersebut dapat memberikan kegunaan optimal
bagi konsumen.
b) Barang tersebut benar-benar diperlukan konsumen.
c) Mutu barang terjamin.
d) Harga sesuai dengan kemampuan konsumen
2. Perilaku Konsumen Irasional
Suatu perilaku dalam mengonsumsi dapat dikatakan tidak
rasional jika konsumen tersebut membeli barang tanpa
dipikirkan kegunaannya terlebih dahulu. Contohnya, yaitu:
a) Tertarik dengan promosi atau iklan baik di media cetak
maupun elektronik.
b) Memiliki merek yang sudah dikenal banyak konsumen.
c) Ada bursa obral atau bonus-bonus dan banjir diskon.
d) Prestise atau gengsi.
10
2.2.2
Data Mining
2.2.2.1 Definisi Data Mining
Data mining adalah proses yang menggunakan teknik statistik,
matematika,
kecerdasan
buatan,
dan
machine
learning
untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar [4].
Gambar 2.1 Data Mining
Istilah data mining memiliki hakikat sebagai disiplin ilmu yang
tujuannya adalah untuk menemukan, menggali, atau menambang
pengetahuan dari data atau informasi yang kita miliki. Data mining, sering
juga disebut sebagai knowledge discovery in database (KDD). KDD
adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis
untuk menemukan keteraturan, pola atau hubungan dalam set data
berukuran besar
[5]
. Sebenarnya kedua istilah tersebut memiliki konsep
yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu tahapan
dalam keseluruhan proses KDD adalah data mining [6].
11
2.2.2.2 Tahapan - Tahapan Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap yang diilustrasikan di Gambar 2.2. Tahap-tahap tersebut
bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan
knowledge base.
Gambar 2.2 Tahap-Tahap Data Mining
Tahap-tahap data mining adalah sebagai berikut [7]:
1. Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilangkan noise
dan data yang tidak konsisten atau data tidak relevan.
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai
database ke dalam satu database baru.
12
3. Seleksi data (data
(
selection)
Data yang ada pada database sering kali tidak semuanya
dipakai, oleh karena itu
it hanya data yang sesuai untuk dianalisis
yang akan diambil dari database.
4. Transformasi data (data
(
transformation)
Data diubah atau digabung ke dalam format yang sesuai
untuk diproses dalam data mining.
5. Proses mining
Merupakan suatu proses utama saat metode diterapk
diterapkan
untuk menemukan pengetahuan berharga dan tersembunyi dari
data. Beberapa metode yang
yang dapat digunakan berdasarkan
pengelompokan data mining dapat dilihat pada Gambar 2.3.
Gambar 2.3 Beberapa Metode Data Mining
13
6. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik ke dalam
knowledge based yang ditemukan.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan
mengenai
visualisasi
metode
yang
dan
penyajian
digunakan
untuk
pengetahuan
memperoleh
pengetahuan yang diperoleh pengguna.
2.2.2.3 Pengelompokan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas
yang dapat dilakukan, yaitu [8]:
1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin
mencoba mencari data untuk menggambarkan pola dan
kecenderungan yang terdapat dalam data. Sebagai contoh,
petugas pengumpulan suara mungkin tidak dapat menentukan
keterangan atau fakta bahwa siapa yang tidak cukup
professional akan sedikit didukung dalam pemilihan presiden.
Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelesan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel
target estimasi lebih kearah numerik dari pada kearah kategori.
Model
dibangun
menggunakan
record
lengkap
yang
menyediakan nilai dari variabel target sebagai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari
variabel target dibuat berdasarkan nilai variabel prediksi.
Sebagai contoh akan dilakukan estimasi tekanan darah sistolik
pada pasien rumah sakit berdasarkan umur pasien, jenis
14
kelamin, indeks berat badan, dan level sodium darah.
Hubungan antara tekanan darah sistolik dan nilai variabel
prediksi dalam proses pembelajaran akan menghasilkan model
estimasi. Model estimasi yang dihasilkan dapat digunakan
untuk kasus baru lainnya.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi,
kecuali bahwa dalam predikasi nilai dari hasil akan ada dimasa
mendatang.
Contoh prediksi bisnis dan penelitian adalah :
a) Prediksi harga beras dalam tiga bulan yang akan
datang.
b) Prediksi persentasi kenaikan kecelakaan lalu lintas
tahun depan jika batas bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam
klasifikasi dan estimasi dapat pula digunakan (untuk keadaan
yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai
contoh penggolongan pendapatan dapat dipisahkan dalam tiga
kategori, yaitu pendapatan tinggi, pendapatan sedang, dan
pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
a) Menentukan apakah suatu transaksi kartu kredit
merupakan transaksi yang curang atau tidak.
b) Memperkirakan apakah suatu pengajuan hipotek oleh
nasabah merupakan suatu kredit yang baik atau buruk.
15
c) Mendiagnosis
penyakit
seorang
pasien
untuk
mendapatkan termasuk kategori penyakit apa.
5. Pengklusteran
Pengkluteran
merupakan
pengelompokan
record,
pengamatan, atau memperhatikan dan membentuk kelas objekobjek yang memiliki kemiripan. Kluster adalah kumpulan
record yang memiliki kemiripan satu dengan yang lainnya dan
memiliki ketidakmiripan dengan record-record dalam kluster
lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak
adanya variabel target dalam pengklusteran. Pengklusteran
tidak mencoba untuk melakukan klasifikasi, mengestimasi,
atau memprediksi nilai dari variabel target. Akan tetapi,
algoritma pengklusteran mencoba untuk melakukan pembagian
terhadap keseluruhan data menjadi kelompok-kelompok yang
memiliki kemiripan (homogeny), yang mana kemiripan dalam
satu kelompok akan bernilai maksimal, sedangkan kemiripan
dengan record dalam kelompok lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah :
a) Mendapatkan kelompok-kelompok konsumen untuk
target
pemasaran
dari
satu
suatu
produk
bagi
perusahaan yang tidak memiliki dana pemesaran yang
besar.
b) Untuk
tujuan
audit
akuntansi,
yaitu
melakukan
pemisahan terhadap perilaku financial dalam baik dan
mencurigakan.
c) Melakukan pengklusteran terhadap ekspresi dari gen,
untuk mendapatkan kemiripan perilaku dari gen dalam
jumlah besar.
16
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan
attribute yang muncul dalam satu waktu. Dalam dunia bisnis
lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah:
dalah:
a) Meneliti
jumlah
telekomunikasi
pelanggan
seluler
yang
dari
perusahaan
diharapkan
untuk
memberikan respon positif terhadap penawaran upgrade
layanan yang diberikan.
b) Menentukan barang dalam supermarket yang dibeli
secara bersamaan dan yang tidak pernah dibeli secara
bersamaan.
2.2.2.4 Definisi Cross-Industry
Industry Standard Process for Data Mining (CRISPDM)
Larose dalam bukunya menjelaskan bahwa ada enam fase siklus
pada suatu proyek Data Mining.. Seluruh fase memiliki ketergantungan
dan berurutan dari fase sebelumnya
sebelumn [10].
Gambar 2.4 Proses Data Mining Menurut CRISP-DM
17
Enam fase CRISP-DM menurut Larose yang dikutip dari Kusrini
dan digunakan pada penelitian ini adalah [8]:
1. Fase Pemahaman Bisnis (Business Understanding Phase)
a) Menentukan tujuan proyek data mining dan kebutuhan
detail tentang manfaat untuk bisnis maupun penelitian.
b) Menerjemahkan
tujuan
dan
batasan
proyek
dari
permasalahan.
c) Persiapan langkah awal untuk mencapai tujuan proyek.
2. Fase Pemahaman Data (Data Understanding Phase)
a) Mengumpulkan data dari sumber data.
b) Menggunakan analisis data untuk mengenali lebih lanjut
data dan pencarian pengetahuan awal.
c) Evaluasi kualitas dan integritas data.
d) Pilih sebagian kecil group data yang mungkin mengandung
pola (pattern) dari permasalahan.
3. Fase Pengolahan Data (Data Preparation Phase)
a) Persiapan dataset yang akan digunakan. Pada tahap ini
dilakukan pembersihan atribut data yang tidak diperlukan
dalam fase permodelan.
b) Pilih kasus dan variabel yang ingin dianalisis sesuai dengan
tujuan proyek.
c) Transformasi variabel jika dibutuhkan.
4. Fase Permodelan (Modeling Phase)
a) Pemilihan dan penerapan teknik permodelan yang sesuai
dengan kasus yang ingin dianalisis.
b) Kalibrasi model untuk mengoptimalkan hasil.
18
c) Perlu diperhatikan bahwa beberapa teknik mungkin untuk
digunakan pada permasalahan data mining yang sama.
d) Jika diperlukan, proses dapat kembali ke fase pengolahan
data untuk menjadikan data ke dalam bentuk yang sesuai
dengan spesifikasi kebutuhan teknik data mining tertentu.
5. Fase Evaluasi (Evaluation Phase)
a) Mengevaluasi satu atau lebih model yang digunakan dalam
fase
permodelan
untuk
mendapatkan
kualitas
dan
efektivitas sebelum disebarkan untuk digunakan.
b) Menetapkan apakah terdapat model yang memenuhi tujuan
pada fase awal.
c) Menentukan apakah terdapat permasalahan penting dari
bisnis atau penelitian yang tidak tertangani dengan baik.
d) Mengambil keputusan berkaitan dengan penggunaan hasil
model dari data mining.
6. Fase Penyebaran (Deployment Phase)
a) Menggunakan model yang dihasilkan.
b) Contoh sederhana penyebaran: Pembuatan laporan.
c) Contoh kompleks penyebaran: Penerapan proses data
mining secara paralel pada departemen lain.
19
2.2.3
Algoritma C4.5
Algoritma C4.5 yaitu sebuah algoritma yang digunakan untuk
membentuk decision tree (pohon keputusan)[8]. Pohon keputusan
merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal.
Algoritma C4.5 mengkonstruksi pohon keputusan dari data pelatihan,
yang berupa kasus-kasus atau record-record (tupel) dalam basis data.
Setiap kasus berisikan nilai dari atribut-atribut untuk sebuah kelas.
Setiap atribut dapat berisi data diskret atau kontinyu (numerik).
Algoritma C4.5 juga menangani kasus yang tidak memiliki nilai untuk
sebuah atau lebih atribut. Akan tetapi, atribut kelas hanya bertipe
diskret dan tidak boleh kosong [9].
Secara umum algoritma C4.5 untuk membangun pohon keputusan
adalah sebagai berikut:
a) Pilih atribut sebagai akar
b) Buat cabang untuk masing-masing nilai
c) Bagi kasus dalam cabang
d) Ulangi proses untuk masing-masing cabang sampai semua
kasus pada cabang memiliki kelas yang sama.
Dasar untuk memilih atribut sebagai akar dari pohon adalah
dengan menghitung nilai gain tertinggi dari atribut-atribut yang ada.
Untuk menghitung gain digunakan rumus seperti tertera dalam persamaan
1 berikut :
Keterangan :
S
: himpunan kasus
A
: Atribut
20
n
: Jumlah partisi atribut A
|Si|
: Jumlah kasus pada partisi ke-i
|S|
: Jumlah kasus dalam S
Perhitungan dari persamaan 1 akan memperoleh nilai gain atribut
yang paling tertinggi. Gain adalah salah satu attribute selection measure
yang digunakan untuk memilih test atribut tiap node pada pohon. Atribut
dengan informasi gain tertinggi dipilih sebagai test atribut dari suatu node.
Sementara itu, perhitungan nilai entropi dapat dilihat pada persamaan 2.
Keterangan :
S
: Himpunan Kasus
n
: Jumlah partisi S
pi
: Proporsi dari Si terhadap S
21
2.2.4
Rekayasa Perangkat Lunak
2.2.4.1 Perangkat Lunak
Ian Sommerville dalam bukunya[13] menjelaskan bahwa perangkat
lunak adalah program komputer dan semua dokumentasi yang terkait
didalamnya. Software mungkin dapat dibangun untuk konsumen tertentu
atau juga mungkin dibangun untuk umum. Software yang dibangun
diharapkan memiliki fungsi dan performa yang baik. Selain itu, software
yang
dibuat
dapat
diperbaiki
(maintainable),
dapat
membuat
ketergantungan kepada user (dependable), dan dapat digunakan (usable).
2.2.4.2 Rekayasa Perangkat Lunak
Rekayasa Perangkat Lunak (RPL) adalah disiplin ilmu yang fokus
pada semua aspek pembangunan software. RPL memiliki aktifitas dasar
atau fase. Fase tersebut adalah penentuan spesifikasi software (Software
Specification), pembangunan software (Software Development), validasi
software (Software Validation), dan evolusi software (Software Evolution)
[13]
.
RPL bertujuan menghasilkan perangkat lunak berkualitas yang
dapat dilihat dari tiga sisi, sponsor (pihak yang mengeluarkan dana untuk
pembangunan
perangkat
lunak),
pemakai
(semua
pihak
yang
menggunakan perangkat lunak tersebut), dan pengembang (pihak
modikasi dan pengembangan perangkat lunak). Selain itu, RPL
mempunyai tujuan agar pembuatan perangkat lunak tidak menggunakan
biaya produksi berlebih (efisien), dan tepat pada waktunya.
22
2.2.4.3 Rekayasa Web (Web Engineering)
Web Engineering adalah suatu proses yang digunakan unt
untuk
membuat aplikasi web yang berkualitas tinggi
[14]
. Web Engineering
berbeda denga RPL (Rekayasa Perangkat Lunak), tetapi Web Engineering
memiliki konsep dan prinsip mendasar dari RPL. Proses di Web
Engineering lebih ditekankan pada aktivitas teknis dan manajemen
manajemen yang
hampir sama.
Gambar 2.5 Proses Web Engineering
Tahapan-tahapan
tahapan dalam Web Engineering antara lain :
1. Communication
ommunication
Sebelum pengerjaan teknis dapat dimulai, hal ini sangat
penting untuk mengkomunikasikan dan membuat kerja
kerja sama
dengan konsumen (dan stakeholder lain). Hal ini bermaksud
supaya stakeholder mengerti tujuan proyek dan untuk
mengumpulkan beberapa persyaratan yang membantu dalam
menetapkan fitur-fitur
fitur
dan fungsi-fungsi
fungsi perangkat lunak.
23
2. Planning
Beberapa proses yang rumit dapat disederhanakan jika
terdapat sebuah rancangan. Proyek perangkat lunak merupakan
proses yang rumit, dan aktifitas perencanaan membuat sebuah
rancangan (pola) yang dapat membantu tim sehingga dapat
membentuk suatu proses. Suatu rancangan – yang disebut
rencana proyek perangkat lunak – merupakan pengerjaan
tehnik perangkat lunak melalui pendeskripsian tugas-tugas
teknis yang akan diselenggarakan, resikonya kemungkinan
besar, sumber daya akan dapat dipenuhi, produksi kerja akan
dapat diproduksi, dan begitu pula jadwal kerja.
3. Modeling (Pemodelan)
Ketika
Anda
sebagai
ahli
pertamanan,
pembangun
jembatan, teknisi penerbangan, tukang kayu, ataupun seorang
arsitek, Anda bekerja dengan pemodelan setiap hari. Anda
membuat “sketsa” dari sebuah sesuatu sehingga Anda akan
dapat memahami gambar yang besar yang akan terlihat secara
kearsitekturan, bagaimana bagian-bagian dalam unsur pokok
dapat menyatu bersama, dan masih banyak karakteristik
lainnya. Jika tersedia, anda dapat memperhalus sketsa menjadi
lebih besar dan perincian yang lebih besar dalam usaha untuk
lebih memahami suatu masalah dan bagaimana Anda akan
mengatasinya. Teknisi perangkat lunak melakukan hal yang
sama dengan membuat model sehingga dapat lebih memahami
persyaratan-persyaratan perangkat lunak dan desain yang akan
mendapati persyaratan tersebut.
24
4. Construction (Penyusunan)
Aktifitas ini mengkombinasikan kode turunan (baik manual
atau otomatis) dan pengujian yang di penuhi untuk membuka
kode yang error.
5. Deployment (Penyebaran)
Perangkat Lunak (sebagai kesatuan yang lengkap atau
sebagai tambahan bagian secara lengkap) yang diterima oleh
konsumen sebagai penguji produk yang diterima dan
menyediakan timbal balik berdasarkan evaluasi.
25
2.3
Kerangka Pemikiran
Masalah
Kurangnya informasi mengenai kapan dan dalam kondisi apa konsumen membeli produk
tertentu
Pendekatan
Tools : PHP Hypertext Preprocessor
Metode Decision Tree yaitu Algoritma
(PHP)
C4.5
Implementasi
Menerapkan Metode Decision Tree yaitu
Inputan : Umur, Status Pelajar atau Bukan
Algoritma C4.5 dengan bahasa PHP
Pelajar, Gaji, dan Tingkat Pinjaman
Hasil
Algoritma C4.5 mampu bekerja secara optimal dan dapat mengetahui perilaku pembelian
konsumen
BAB III
METODOLOGI PENELITIAN
3.1
Metode Penelitian
Penelitian deskriptif adalah metode penelitian yang digunakan
untuk menemukan pengetahuan yang seluas-luasnya terhadap objek
penelitian pada suatu masa tertentu. Sedangkan menurut Punaji Setyosari,
“penelitian deskriptif adalah penelitian yang bertujuan untuk menjelaskan
atau mendeskripsikan suatu keadaan, peristiwa, objek apakah orang, atau
segala sesuatu yang terkait dengan variabel-variabel yang bisa dijelaskan
baik dengan angka-angka maupun kata-kata”.
Sedangkan menurut Sugiyono, “Metode deskriptif adalah metode
yang digunakan untuk menggambarkan atau menganalisis suatu hasil
penelitian tetapi tidak digunakan untuk membuat kesimpulan yang lebih
luas”.
Dari pengertian diatas dapat disimpulkan bahwa metode penelitian
yang digunakan adalah metode analisis deskriptif dengan pendekatan
kuantitatif artinya penelitian yang dilakukan adalah menekankan
analisanya pada data-data numerik (angka), yang bertujuan untuk
mendapatkan gambaran yang jelas mengenai suatu keadaan berdasarkan
data yang diperoleh dengan cara menyajikan, mengumpulkan dan
menganalisis data tersebut sehingga menjadi informasi baru yang dapat
digunakan untuk menganalisa mengenai masalah yang sedang diteliti.
26
27
3.2
Sumber dan Teknik Pengumpulan Data
3.2.1
Sumber Data
1. Data Primer
Data primer adalah data yang diperoleh secara langsung
dari objek yang diteliti atau baik yang dilakukan melalui
wawancara, pengamatan, pencatatan atau penelitian pada objek
penelitian yaitu konsumen yang ada di Swalayan Pantes.
Data yang didapatkan dari data primer yaitu data konsumen
antara lain : umur, pelajar atau bukan pelajar, gaji, dan tingkat
pinjaman.
2. Data Sekunder
Data sekunder adalah data yang diperlukan untuk
mendukung hasil penelitian berasal dari literatur, artikel, dan
berbagai sumber lain yang berhubungan dengan masalah
penelitian. Data sekunder umumnya berupa bukti catatan atau
laporan historis yang dipublikasikan maupun yang tidak
dipublikasikan,
data
sekunder
hanya
digunakan
untuk
pelengkap teori dari data primer yang diperoleh dari bukubuku, laporan skripsi lain, dan internet berupa definisi, dan
konsep-konsep yang berhubungan dengan penyusunan tugas
akhir ini.
28
3.2.2
Teknik Pengumpulan Data
Dalam penyusunan penelitian ini, untuk mendapatkan data dan
informasi yang di butuhkan, maka metode yang digunakan dalam proses
pengumpulan data dilakukan sebagai berikut :
1. Studi Pustaka
Studi Pustaka adalah metode dimana perolehan datadatanya melalui buku-buku atau jurnal yang berkaitan dengan
penelitian yang akan dilakukan.
Data yang diperoleh dari buku-buku dan jurnal-jurnal
mengenai Decision tree, Perilaku konsumen, informasi
mengenai metode-metode yang digunakan seperti Algoritma
C4.5 dan bahan tertulis lainnya.
2. Observasi
Observasi merupakan teknik dimana mengamati secara
langsung terhadap objek yang diteliti, teknik ini digunakan
untuk melengkapi data hasil wawancara sehingga data yang
didapatkan dapat dipertanggungjawabkan kebenarannya oleh
peneliti secara langung terhadap objek yang ditelitinya.
Dengan
menggunakan
metode
observasi,
penulis
melakukan pengamatan secara langsung mengenai kegiatan
dan kondisi perusahaan tempat penulis melakukan penelitian
pada Swalayan Pantes, dan mencatat semua informasi yang ada
yang mendukung penyusunan Tugas Akhir ini.
29
3. Wawancara
Metode yang dilakukan untuk mengumpulkan sebuah
informasi yang dilakukan dengan cara bertanya secara
langsung secara lisan maupun tulisan kepada objek penelitian
yang terkait dalam permasalahan yang akan dibahas dalam
penulisan penelitian, yaitu mengenai perilaku pembelian
konsumen pada Swalayan Pantes.
Data yang dapat disimpulkan dari hasil wawancara adalah
data-data mengenai variabel apa saja yang diperlukan untuk
menentukan perilaku pembelian konsumen.
3.3
Ruang Lingkup Penelitian
Ruang lingkup penelitian berfungsi untuk memberi batasan pada
objek penelitian, agar hasil penelitian tetap terfokus pada objek yang akan
diteliti sehingga permasalahan penelitian dapat dimengerti dengan baik
dan mudah. Dalam penelitian ini, yang menjadi ruang lingkup penelitian
adalah Swalayan Pantes yang berada di Kecamatan Lasem Kabupaten
Rembang.
3.4
Instrumen Penelitian
Dalam penelitian ini, dibutuhkan beberapa instrumen untuk
mendukung penelitian ini antara lain:
3.4.1
Kebutuhan Perangkat Lunak
Kebutuhan perangkat lunak merupakan faktor penting yang harus
dipenuhi dalam penelitian ini, sehingga perangkat lunak tersebut sesuai
dengan maksud dan tujuan dalam penelitian.
30
Adapun perangkat lunak yang dibutuhkan dalam penelitian ini
adalah sebagai berikut :
1. Sistem Operasi
Program dibuat menggunakan sistem operasi Microsoft
Windows 7 Ultimate.
2. Sublime Text 3, XAMPP 1.8.1, SQLyog Ultimate v7.15,
RapidMiner5, dan Browser Mozilla Firefox.
Software ini digunakan untuk implementasi metode yang
digunakan dalam penelitian.
3. Enterprise Architect 7.5, Microsoft Office Word 2007,
Microsoft Office Excel 2007, Microsoft Office Visio 2007.
Software ini digunakan untuk menulis laporan hasil
penelitian.
3.4.2
Kebutuhan Perangkat Keras
Selain kebutuhan perangkat lunak, diperlukan pula perangkat keras
yang harus dipenuhi dalam penelitian ini. Adapun perangkat keras yang
digunakan pada penelitian ini adalah sebagai berikut :
a. Personal Computer atau laptop dengan spesifikasi :
-
Prosesor : AMD A8-4500 APU
-
Sistem Operasi : Windows 7 Ultimate 64bit
-
RAM : 4 GB
b. Printer
31
3.5
Metode Pengembangan Perangkat Lunak
Pada penelitian ini digunakan metode pengembangan perangkat
lunak dengan model Web Engineering. Model tersebut dipilih karena
memiliki konsep dan prinsip mendasar dari RPL. Proses di Web
Engineering lebih ditekankan pada aktivitas teknis dan manajemen yang
hampir sama. Berikut tahapan yang digunakan dalam Web Engineering:
1. Communication
Komunikasi dalam hal ini berkonsentrasi dalam 2 hal,
analisa
bisnis
dan
perumusan.
Analisa
bisnis
akan
mendefinisikan hal – hal apa saja yang akan termuat di dalam
sistem. Perumusan adalah pengumpulan informasi tentang halhal yang akan dimuat dalam sistem yang melibatkan calon
pengguna.
2. Planning
Yaitu tahap penggabungan requirement (kebutuhan) dan
informasi dari user dan perencanaan teknis serta menanggapi
respon (tanggapan) dari user. Perencanaan teknis dilakukan
dengan mengidentifikasi perangkat lunak maupun perangkat
keras apa saja yang dibutuhkan, tergantung kesepakatan.
3. Modeling
Dalam tahapan ini, digunakan Cross Industry Standard
Processing-Data Mining (CRISP-DM) sebagai metode analisis
data dan pemodelan dengan fase sebagai berikut:
1. Fase Pemahaman Bisnis (Business Understanding Phase)
a) Penelitian ini memiliki tujuan menetukan perilaku
pembelian konsumen dengan menggunakan aturan
klasifikasi. Sehingga dari hasil yang diperoleh dapat
bermanfaat untuk lembaga atau instansi terkait.
32
b) Strategi awal yang akan digunakan adalah mencari
dataset konsumen.
2. Fase Pemahaman Data (Data Understanding Phase)
Pengumpulan data primer dilakukan dengan mengambil
data konsumen Swalayan Pantes dengan jumlah data
sebanyak 300 record, terdiri dari 5 atribut. Atribut tersebut
ada yang tergolong atribut prediktor yaitu atribut yang
dijadikan sebagai penentu perilaku konsumen, dan atribut
label yaitu atribut yang dijadikan sebagai hasil learning.
Adapaun atribut prediktor yaitu Umur (age), Pendapatan
(income), Pelajar atau Tidak Pelajar (student), dan Tingkat
Pinjaman (credit rating). Sedangkan varaibel tujuannya
atau labelnya adalah Jadi membeli atau tidak membeli
(buys).
Tabel 3.1 Attribut yang digunakan
No.
Attibut
Nilai
1.
Age
Umur
2.
Income
Pendapatan
3.
Student
Pelajar atau Tidak Pelajar
4.
Credit rating
Tingkat Pinjaman
5.
Buy
Jadi membeli atau tidak membeli
33
3. Fase Pengolahan Data (Data Preparation Phase)
Dataset training kemudian diimpor kedalam microsoft
excel.
Gambar 3.1 Tabel dataset konsumen
4. Fase Pemodelan (Modeling Phase)
Dari fase sebelumnya, dataset dimodelkan dengan
algoritma C4.5 sehingga menghasilkan Decision Tree yang
digunakan untuk menentukan label dari inputan baru.
5. Fase Evaluasi (Evaluation Phase)
Decision Tree yang dihasilkan dari fase sebelumnya
digunakan untuk menentukan prediksi inputan baru dengan
label yang belum diketahui.
34
6. Fase Pengebaran (Deployment Phase)
Fase berikutnya adalah fase penyebaran dimana model
yang
sudah
dievaluasi
disebarkan
sehingga
dapat
digunakan untuk menentukan aturan klasifikasi perilaku
pembelian konsumen dengan tree yang terbentuk seperti
dibawah ini:
Gambar 3.2 Pohon Keputusan Hasil Perhitungan Node
4. Construction
a. Implementasi (coding)
Implementasi
dilakukan
dengan
mengaplikasikan
halaman web dalam bentuk HTML berdasarkan hasil
perancangan isi pada aktivitas pada non technical member
sedangkan implementasi isi dan fungsi logika dibuat dalam
bentuk PHP.
b. Pengujian (testing)
Dilakukan untuk mengetahui kemungkinan terjadinya
kesalahan seperti kesalahan pada skrip atau form, navigasi
ataupun tampilan, maupun bagian lainnya.
35
5. Deployment
Sistem ini diciptakan untuk dapat berguna bagi kebutuhan
pihak Swalayan Pantes dan kemudian dilakukan evaluasi
secara berkala, memberi masukan – masukan kepada team
pengembang dan apabila diperlukan akan dilakukan modifikasi
pada sistem tersebut.
BAB IV
RANCANGAN SISTEM DAN IMPLEMENTASI
4.1
Perancangan Sistem
Teknik
pemecahan
masalah
pada
analisis
sistem
yang
menggabungkan kembali komponen sistem menjadi sistem yang utuh.
Ada tiga poin utama yang akan dibahas pada tahap perancangan:
4.1.1
Komunikasi dengan Pengguna
Komunikasi yang akan terjadi antara pengguna dengan program
dengan respon yang diberikan oleh sistem. Yaitu kebutuhan user, use case
diagram, activity diagram, dan class diagram.
4.1.1.1 Analisis Kebutuhan User
Analisis
kebutuhan
(business
requirement)
bertujuan
mendefinisikan kebutuhan yang diperlukan dalam pengembangan
perangkat lunak.
Suatu sistem yang akan dibuat harus memenuhi kebutuhan
fungsional sehingga program dapat berjalan dengan optimal dan
kebutuhan non fungsional sehingga mendukung fungsi utama dalam
program agar berjalan sesuai keinginan.
1. Kebutuhan Fungsional
a. Sistem harus menyediakan fungsi untuk memprediksi perilaku
pembelian konsumen.
b. Sistem harus menyediakan fungsi untuk menginputkan dataset
pengunjung berdasarkan atribut yang telah ditentukan.
36
37
2. Kebutuhan non-Fungsional
a. Sistem harus menyediakan fungsi untuk menampilkan dataset yang
telah diinputkan.
b. Sistem harus menyediakan fungsi untuk menampilkan perhitungan
tree yang terbentuk beserta akurasinya.
4.1.1.2 Use Case Diagram
Use Case Diagram yang akan disusun pada sistem ini memerlukan
aktor sebagai pelaku yang menjalankan case-case yang ada. Berikut
adalah langkah membuat diagram use case dalam sistem prediksi perilaku
pembelian konsumen pada swalayan pantes:
1. Identifikasi Aktor/Pelaku Bisnis
Aktor adalah pelaku bisnis atau subjek yang menjalankan
case pada software. Aktor yang terlibat dalam sistem ini secara
khusus adalah pemilik dari Swalayan Pantes.
2. Diagram Model Use Case
Adalah penjabaran secara grafis yang dilakukan oleh
pengguna selama berada didalam sistem atau software.
Gambar 4.1 Use case diagram pada rancangan sistem
38
Use case diagram diatas menggambarkan bahwa pengguna dapat
melakukan input data training, melihat data training, iterasi perhitungan,
tree yang terbentuk dan pengguna juga dapat melakukan pengujian
prediksi perilaku pembelian konsumen.
4.1.1.3 Activity Diagram
Gambar 4.2 Diagram aktivitas untuk melakukan pengujian
Gambar diatas menjelaskan bagaimana pengguna melakukan
proses pengujian prediksi perilaku pembelian konsumen. Ketika pengguna
menjalankan sistem, pengguna akan melakukan login terlebih dahulu.
Aktivitas akan berlanjut jika username dan password yang dimasukan
benar dan pengguna akan masuk ke halaman utama sistem.
39
Untuk melakukan proses uji prediksi perilaku pembelian
konsumen pengguna harus masuk terlebih dahulu ke menu pengujian dan
mengisi form yang ada. Setelah selesai maka sistem akan menampilkan
hasil prediksi perilaku pembelian konsumen dan aktivitas selesai.
4.1.1.4 Class Diagram
Gambar 4.3 Class Diagram
Gambar diatas menunjukkan kelas yang terdiri dari beberapa tabel
didalam sistem. Tabel-tabel diatas menjelaskan relasi antara tabel yang
saling berhubungan antara satu dengan yang lainnya.
40
4.1.2
Desain Antarmuka
Desain antarmuka adalah tahap pembuatan tampilan sistem agar
lebih menarik sehingga pengguna dapat mengoperasikan sistem dengan
mudah.
4.1.2.1 Desain Menu Login
Gambar 4.4 Desain Menu Login
41
4.1.2.2 Desain Menu Utama
Gambar 4.5 Desain Menu Utama
4.1.2.3 Desain Menu Data Training
Gambar 4.6 Desain Menu Data Training
42
4.1.2.4 Desain Menu Input Data Training
Gambar 4.7 Desain Menu Input Data Training
4.1.2.5 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk
Gambar 4.8 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk
43
4.1.2.6 Desain Menu Pengujian
Gambar 4.9 Desain Menu Pengujian
4.1.3
Desain Database Prediksi Perilaku Pembelian Konsumen
Desain database prediksi perilaku pembelian konsumen adalah
tahap perancangan database yang akan digunakan untuk menyimpan data
yang ada pada sistem perilaku pembelian konsumen.
4.1.3.1 Desain Tabel User Login
Gambar 4.10 Desain Tabel User Login
4.1.3.2 Desain Tabel Atribut
Gambar 4.11 Desain Tabel Atribut
44
4.1.3.3 Desain Tabel Dataset
Gambar 4.12 Desain Tabel Dataset
4.2
Pengujian dan Implementasi Sistem
4.2.1
Implementasi Sistem
4.2.1.1 Menu Login
Gambar 4.13 Menu Login
Menu login merupakan halaman awal ketika pengguna membuka
sistem prediksi perilaku pembelian konsumen untuk mengantisipasi
penggunaan yang salah.
4.2.1.2 Menu Utama
Gambar 4.14 Menu Utama
45
Menu utama merupakan halaman pertama yang dilihat pengguna
setelah melakukan login.
4.2.1.3 Menu Data Training
Gambar 4.15 Menu Data Training
Menu data training berisi semua data yang telah di inputkan oleh
pengguna. Jika ingin menghapus datanya pengguna bisa memanfaatkan
aksi hapus pada menu data training.
4.2.1.4 Menu Input Data Training
Gambar 4.16 Menu Input Data Training
46
Menu input data training merupakan input data yang di inputkan
oleh pengguna meliputi age, income, student, credit rating, dan buys.
Input data training merupakan faktor penting dalam proses prediksi untuk
menemukan aturan (rule) dari tree baru yang terbentuk.
4.2.1.5 Menu Iterasi Perhitungan dan Tree yang Terbentuk
Gambar 4.17 Menu Iterasi Perhitungan
Gambar 4.18 Menu Tree yang Terbentuk
47
Pada menu ini, pengguna dapat melihat iterasi perhitungan dari
data training yang telah diinputkan untuk mendapatkan tree baru yang
terbentuk. Pengguna juga dapat melihat tree baru yang terbentuk.
4.2.1.6 Menu Pengujian
Gambar 4.19 Menu Pengujian
Menu pengujian merupakan tujuan dari dibuatnya sistem ini,
dimenu pengujian pengguna dapat melakukan uji prediksi perilaku
pembelian konsumen dan dapat mengetahui konsumen yang membeli atau
tidak berdasarkan hasil uji.
4.2.2
Pengujian Perangkat Lunak
Metode pengujian perangkat lunak yang digunakan pada
pembuatan software analisis data mining ini adalah Black-Box Testing.
Berikut adalah tabel yang menjelaskan tentang poin-poin yang akan diuji
pada tahap pengujian perangkat lunak.
48
Tabel 4.1 Tabel identifikasi dan pelaksanaan pengujian program
No
1
2
Kelas Uji
Butir Uji
Fungsi masuk menu Menekan
utama
login
Fungsi
Menekan
menginputkan
Tingkat
Jenis
Pengujian
Pengujian
tombol Pengujian
Black Box
Sistem
tombol Pengujian
data tambah data
Black Box
Sistem
training
3
Fungsi menampilkan Menekan
hasil uji prediksi
4
Fungsi
submit
menghapus Menekan
data
tombol Pengujian
Black Box
Sistem
tanda Pengujian
silang
Black Box
Sistem
Setelah perangkat lunak melewati tahap pengujian menghasilkan
output yang akan dijelaskan pada tabel dibawah ini:
Tabel 4.2 Tabel hasil pengujian perangkat lunak
No
1
Deskripsi
Fungsi
pengujian
masuk Menekan
menu utama
2
Prosedur
Keluaran
Kriteria
yang
evaluasi
diharapkan
hasil
Hasil yang
didapat
Halaman
Pengguna
Pengguna
tombol
utama
masuk
masuk
login
Sistem
halaman
halaman
utama
utama
sistem
sistem
Fungsi
Menekan
Lokasi
Data
Data
menginputkan
tombol
database
tersimpan
tersimpan
data training
tambah
tabel
dalam
dalam
data
dataset
database
database
tabel
tabel
dataset
dataset
Kesimpulan
Diterima
Diterima
49
3
Fungsi
Menekan
Hasil
menampilkan
tombol
prediksi
hasil
uji Pengguna
uji submit
Diterima
dapat
mengetahui mengetahui
prediksi
4
dapat
Pengguna
uji prediksi
uji prediksi
Fungsi
Menekan
Data
Data yang Data yang Diterima
menghapus data
tanda
terhapus
ada
silang
di ada
database
database
terhapus
terhapus
di
BAB V
HASIL PENELITIAN DAN PEMBAHASAN
5.1
Pembahasan
Pada analisis proses mining menggunakan data pengunjung pada
Swalayan Pantes sebanyak 300 data yang telah diolah menjadi dataset.
Dalam penelitian ini menggunakan 5 atribut. Atribut tersebut ada yang
tergolong atribut prediktor yaitu atribut yang dijadikan sebagai penentu
perilaku konsumen, dan atribut label yaitu atribut yang dijadikan sebagai
hasil learning. Adapaun atribut prediktor yaitu Umur (age), Pendapatan
(income), Pelajar atau Tidak Pelajar (student), dan Tingkat Pinjaman
(credit rating). Sedangkan varaibel tujuannya atau labelnya adalah Jadi
membeli atau tidak membeli (buys).
5.2
Hasil Penelitian
5.2.1
Evaluasi Hasil Data Mining
Aturan algoritma C4.5 yang terbentuk akan dijelaskan sebagai
berikut:
5.2.1.1 Perhitungan Node 1
 Total
Jumlah Kasus (S)
= 300
Jumlah No (S1)
= 72
Jumlah Yes (S2)
= 228
(
) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 72 300 ∗ log 2 72 300 + − 228 300 ∗ log 2 228 300
= (−0,24 ∗ −2,05889) + (−0,76 ∗ −0,39593)
= (0,49413) + (0,30091) = 0,79504
50
51
1. Perhitungan Age
 Age → Anak
Jumlah Kasus (S)
= 62
Jumlah No (S1)
= 18
Jumlah Yes (S2)
= 44
(
, Anak) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 18 62 ∗ log 2 18 62 + − 44 62 ∗ log 2 44 62
= (−0,29032 ∗ −1,78427) + (−0,70968 ∗ −0,49476)
= (0,51801) + (0,35112) = 0,86914
 Age → Dewasa
Jumlah Kasus (S)
= 105
Jumlah No (S1)
= 12
Jumlah Yes (S2)
= 93
(
, Dewasa) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 12 105 ∗ log 2 12 105 + − 93 105 ∗ log 2 93 105
= (−0,11429 ∗ −3,12928) + (−0,88571 ∗ −0,17509)
= (0,35763) + (0,15508) = 0,51271
52
 Age → Remaja
Jumlah Kasus (S)
= 133
Jumlah No (S1)
= 42
Jumlah Yes (S2)
= 91
, Remaja) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 42 133 ∗ log 2 42 133 + − 91 133 ∗ log 2 91 133
(
= (−0,31579 ∗ −1,66297) + (−0,68421 ∗ −0,54749)
= (0,52515) + (0,3746) = 0,89974
∎
(
)=
,
(
)−
|
|
|
∗
|
= 0,79504
−
62
105
300 ∗ 0,86914 +
300 ∗ 0,51271
+ 133 300 ∗ 0,89974
= 0,79504 − (0,17962) + (0,17945) + (0,39889)
= 0,79504 − 0,75796 = 0,03708
(
)
53
2. Perhitungan Income
 Income → High
Jumlah Kasus (S)
= 21
Jumlah No (S1)
=9
Jumlah Yes (S2)
= 12
(
, High) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 9 21 ∗ log 2 9 21 + − 12 21 ∗ log 2 12 21
= (−0,42857 ∗ −1,22239) + (−0,57143 ∗ −0,80735)
= (0,52388) + (0,46135) = 0,98523
 Income → Low
Jumlah Kasus (S)
= 180
Jumlah No (S1)
= 60
Jumlah Yes (S2)
= 120
(
, Low) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 60 180 ∗ log 2 60 180 + − 120 180 ∗ log 2 120 180
= (−0,33333 ∗ −1,58496) + (−0,66667 ∗ −0,58496)
= (0,52832) + (0,38998) = 0,9183
54
 Income → Medium
Jumlah Kasus (S)
= 99
Jumlah No (S1)
=3
Jumlah Yes (S2)
= 96
(
, Medium) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 3 99 ∗ log 2 3 99 + − 96 99 ∗ log 2 96 99
= (−0,0303 ∗ −5,04439) + (−0,9697 ∗ −0,04439)
= (0,15286) + (0,04305) = 0,19591
∎
(
)=
,
(
)−
|
|
|
|
∗
(
)
= 0,79504
−
7
60
33
100 ∗ 0,98523 +
100 ∗ 0,9183 +
100 ∗ 0,19591
= 0,79504 − (0,06897) + (0,55098) + (0,06465)
= 0,79504 − 0,6846 = 0,11045
3. Perhitungan Student
 Student → No
Jumlah Kasus (S)
= 156
Jumlah No (S1)
= 48
Jumlah Yes (S2)
= 108
(
, No) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 48 156 ∗ log 2 48 156 + − 108 156 ∗ log 2 108 156
= (−0,30769 ∗ −1,70044) + (−0,69231 ∗ −0,53051)
= (0,52321) + (0,36728) = 0,89049
55
 Student → Yes
Jumlah Kasus (S)
= 144
Jumlah No (S1)
= 24
Jumlah Yes (S2)
= 120
, Yes) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 24 144 ∗ log 2 24 144 + − 120 144 ∗ log 2 120 144
(
= (−0,16667 ∗ −2,58496) + (−0,83333 ∗ −0,26303)
= (0,43083) + (0,2192) = 0,65002
∎
(
)
,
(
=
)−
= 0,79504 −
52
|
|
|
|
∗
(
)
48
100 ∗ 0,89049 +
100 ∗ 0,65002
= 0,79504 − (0,46306) + (0,31201) = 0,79504 − 0,77507
= 0,01997
4. Perhitungan Credit Rating
 Credit Rating → Excellent
Jumlah Kasus (S)
= 45
Jumlah No (S1)
= 12
Jumlah Yes (S2)
= 33
(
, Excellent)
= − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 12 45 ∗ log 2 12 45 + − 33 45 ∗ log 2 33 45
= (−0,26667 ∗ −1,90689) + (−0,73333 ∗ −0,44746)
= (0,5085) + (0,32814) = 0,83664
56
 Credit Rating → Fair
Jumlah Kasus (S)
= 255
Jumlah No (S1)
= 60
Jumlah Yes (S2)
= 195
(
, Fair)
= − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S
= − 60 255 ∗ log 2 60 255 + − 195 255 ∗ log 2 195 255
= (−0,23529 ∗ −2,08746) + (−0,76471 ∗ −0,38702)
= (0,49117) + (0,29596) = 0,78713
∎
(
)
,
=
(
= 0,79504 −
)−
15
|
|
|
|
∗
(
85
100 ∗ 0,83664 +
100 ∗ 0,78713
= 0,79504 − (0,1255) + (0,66906) = 0,79504 − 0,79455 = 0,00049
)
57
Tabel 5.1 Perhitungan Node 1
Node
Jumlah
Label
Kasus
Yes
300
228
72
Anak
62
44
18
0,86914
Dewasa
105
93
12
0,51271
Remaja
133
91
42
0,89974
300
228
72
High
21
12
9
0,98523
Low
180
120
60
0,9183
Medium
99
96
3
0,19591
300
228
72
No
156
108
48
0,89049
Yes
144
120
24
0,65002
300
228
72
Excellent
45
33
12
0,83664
Fair
255
195
60
0,78713
CREDIT RATING
300
228
72
Nama Atribut
Total Label
AGE
1
INCOME
STUDENT
Label No
Entropy
Gain
,
,
,
,
,
Dari hasil pada Tabel 5.1 dapat diketahui bahwa atribut dengan
Gain tertinggi adalah Income, yaitu sebesar 0,11045, maka Income dapat
menjadi node akar. Kemudian pada Income High memiliki label Ya, maka
Income High menjadi daun atau Leaf. Jika divisualisasikan maka pohon
keputusan tampak seperti Gambar 5.1.
58
Gambar 5.1 Pohon Keputusan Node 1
5.2.1.2 Perhitungan Node 1.1
Tabel 5.2 Perhitungan Node 1.1
Node
Jumlah
Label
Kasus
Yes
180
120
60
Dewasa
62
44
18
0,86914
Remaja
118
76
42
0,93925
180
120
60
No
36
0
36
0
Yes
144
120
24
0,65002
180
120
60
6
6
0
0
Fair
174
114
60
0,92936
CREDIT RATING
180
120
60
Nama Atribut
Income Low
AGE
Label No
Entropy
Gain
,
,
1.1
STUDENT
Excellent
,
,
Dari tabel 5.2, nilai Gain tertinggi ada pada atribut Student sebesar
0,39828. Ada dua nilai atribut pada Student, yaitu Yes dan No. Untuk
59
atribut Yes berisikan label Ya sedangkan No berisikan label Tidak. Lihat
Gambar 5.2.
Gambar 5.2 Pohon Keputusan Node 1.1
5.2.1.3 Perhitungan Node 1.2
Tabel 5.3 Perhitungan Node 1.2
Node
Jumlah
Label
Kasus
Yes
99
96
3
Dewasa
15
15
0
0
Remaja
84
81
3
0,22228
99
96
3
No
99
96
3
0,19591
Yes
0
0
0
0
99
96
3
Excellent
18
15
3
0,65002
Fair
81
81
0
0
CREDIT RATING
99
96
3
Nama Atribut
Income Medium
AGE
Label No
Entropy
Gain
,
,
1.2
STUDENT
,
60
Dari tabel 5.3, nilai Gain tertinggi ada pada atribut Credit Rating
sebesar 0,07772. Dan nilai yang akan dijadikan daun atau leaf adalah Fair.
Lihat Gambar 5.2.
Gambar 5.3 Pohon Keputusan Node 1.2
5.2.1.4 Perhitungan Node 1.2.2
Tabel 5.4 Perhitungan Node 1.2.2
Jumlah
Label
Kasus
Yes
Credit Rating Excellent
18
15
3
Dewasa
3
0
3
0
Remaja
15
15
0
0
18
15
3
No
18
15
3
0,65002
Yes
0
0
0
0
18
15
3
Node
Nama Atribut
1.2.2
AGE
STUDENT
Label No
Entropy
Gain
,
,
61
Dari hasil Tabel 5.4 dapat diketahui bahwa atribut dengan Gain
tertinggi adalah Age sebesar 0,65002. Ada dua nilai atribut pada Age,
yaitu Dewasa dan Remaja. Dari kedua nilai atribut tersebut, nilai atribut
Dewasa sudah mengklasifikasikan kasus dengan keputusan Tidak dan nilai
atribut Remaja sudah mengklasifikasikan kasus dengan keputusan Ya,
sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut
ini. Lihat Gambar 5.4.
Gambar 5.4 Pohon Keputusan Node 1.2.2
BAB VI
KESIMPULAN DAN PENELITIAN SELANJUTNYA
6.1
Kesimpulan
Algoritma C4.5 dapat diterapkan untuk menentukan perilaku
pembelian konsumen yaitu membeli atau tidak membeli dengan
menggunakan 300 dataset konsumen. Dalam Penelitian ini menggunakan
5 atribut, antara lain : umur (age), pendapatan (income), pelajar atau tidak
pelajar (student), tingkat pinjaman (credit rating), dan hendak membeli
atau tidak hendak membeli (buys).
Dari hasil perhitungan Node 1 diketahui bahwa atribut dengan
Gain tertinggi adalah Income, yaitu sebesar 0,11045. Sehingga Income
dapat menjadi node akar. Kemudian pada Income High memiliki label Ya,
maka Income High menjadi daun atau Leaf.
Disamping itu, berdasarkan perhitungan Node 1.1 nilai Gain
tertinggi sebesar 0,39828 terdapat pada atribut Student. Ada dua nilai
atribut pada Student, yaitu Yes dan No. Untuk atribut Yes berisikan label
Ya sedangkan No berisikan label Tidak. Selain itu, berdasarkan nilai
perhitungan Node 1.2 nilai Gain tertinggi terdapat pada atribut Credit
Rating sebesar 0,07772. Dan nilai yang akan dijadikan daun atau leaf
adalah Fair.
Sedangkan berdasarkan hasil perhitungan Node 1.2.2 diketahui
bahwa atribut dengan nilai Gain tertinggi sebesar 0,65002 adalah Age.
Ada dua nilai atribut pada Age, yaitu Dewasa dan Remaja. Dari kedua
nilai atribut tersebut, nilai atribut Dewasa sudah mengklasifikasikan kasus
dengan
keputusan
Tidak
dan
nilai
atribut
Remaja
sudah
mengklasifikasikan kasus dengan keputusan Ya, sehingga tidak perlu
dilakukan perhitungan lebih lanjut untuk nilai atribut ini.
62
63
Akhirnya, dari hasil perhitungan diatas dapat digunakan untuk
memprediksi perilaku pembelian konsumen.
6.2
Penelitian Selanjutnya
Beberapa ide yang dapat digunakan untuk penelitian selanjutnya
adalah sebagai berikut:
1. Penelitian selanjutnya dapat dikembangkan pada atribut data yang
serupa dengan metode dan akurasi yang lebih baik seperti
menggunakan algoritma K-Means ataupun menggunakan metode
yang lain sebagai pembanding dari metode Algoritma C4.5.
2. Penelitian selanjutnya dapat dikembangkan berbasis mobile atau
android, karena sebagian besar orang menggunakan smartphone
terutama android.
DAFTAR PUSTAKA
[1] Ahmad Saikhu, Joko Lianto, and Umi Hanik, "Fuzzy Decision Tree Dengan
Algoritma C4.5 Pada Data Diabetes Indian Pima," in Konferensi Nasional
Sistem dan Informatika, Bali, 2011, pp. 297-302.
[2] Irma Kharis, Rosa Delima, and Joko Purwadi, "Generator Pohon Keputusan
Dengan Menerapkan Algoritma C4.5 Untuk Program Konsultasi,"
Informatika, vol. 9, no. 1, April 2013.
[3] Kumar Nayak Gaurav, Swathi J Narayanan, and Ilango Paramasivam,
"Development and Comparative Analysis Of Fuzzy Inference Systems for
Predicting Customer Buying Behavior," International Journal of
Engineering and Technology (IJET), vol. 5, no. 5, pp. 4093-4108, Oct-Nov
2013.
[4] Goldie Gunadi and Dana Indra Sensuse, "Penerapan Metode Data Mining
Market Basket Analysis Terhadap Data Penjualan Produk Buku Dengan
Menggunakan Algoritma Apriori Dan Frequent Pattern Growth(FPGROWTH)," Jurnal Telematika Mkom, vol. 4, no. 1, pp. 118-132, Maret
2012.
[5] Nuqson Masykur Huda, "Aplikasi Data Mining Untuk Menampilkan
Informasi Tingkat Kelulusan Mahasiswa," Universitas Diponegoro,
Semarang, 2010.
[6] A.A. Gede Bagus Ariana and I Made Dwi Putra Asana, "Analisis Keranjang
Belanja Denagn Algoritma Apriori Pada Perusahaan Retail," in Seminar
Nasional Sistem Informasi Indonesia, Bali, 2013, pp. 522-527.
[7] Mujib Ridwan, Hadi Suyono, and M Saroso, "Penerapan Data Mining Untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive
Bayes Classifier," Jurnal EECCIS, vol. 7, no. 1, pp. 59-64, Juni 2013.
[8] Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining. Yogyakarta: Andi,
2009.
[9] Veronica S Moertini, Benhard Sitohang, and Oerip S Santoso, "Integrasi
Algoritma Pohon Keputusan C4.5 Yang Dikembangkan ke Dalam ObjectRelational DBMS," Institut Teknologi Bandung dan Universitas Katolik
Parahyangan, Bandung,.
64
65
[10] Daniel T Larose, Discovering Knowledge In Data: An Introduction to Data
Mining.: John Wiley & Sons, Inc, 2005.
[11] Wikipedia. [Online]. Available: http://id.wikipedia.org/wiki/Konsumen .
[Accessed 4 Juni 2014].
[12] Noviantika. Pengertian Perilaku Konsumen Menurut Para Ahli. [Online].
Available:
http://www.slideshare.net/noviantika93/pengertian-perilakukonsumen-menurut-para-ahli-27875428 . [Accessed 4 Juni 2014].
[13] Ian Sommervile, Software Engineering, 9th ed. Boston: Pearson Education,
2010.
[14] Roger S Pressman, Software Engineering : A Practitioner’s Approach, 7th
ed. Boston: Raghothaman Srinivasan, 2009.
LAMPIRAN
66
Download