SKRIPSI IMPLEMENTASI ALGORITMA C4.5 UNTUK MEMPREDIKSI PERILAKU PEMBELIAN KONSUMEN PADA SWALAYAN PANTES IMPLEMENTATION OF C4.5 ALGORITHM TO PREDICT CUSTOMERS BUYING BEHAVIOR AT SWALAYAN PANTES Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika Disusun Oleh: NAMA : NURUL HIDAYAT NIM : A11.2010.05672 Program Studi : Teknik Informatika – S1 FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG 2014 PERSETUJUAN SKRIPSI Nama : Nurul Hidayat NIM : A11.2010.05672 Program Studi : Teknik Informatika S-1 Fakultas : Ilmu Komputer Judul Tugas Akhir : Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes Tugas Akhir ini telah diperiksa dan disetujui, Semarang, 16 Oktober 2014 Menyetujui: Mengetahui: Pembimbing Dekan Fakultas Ilmu Komputer Desi Purwanti K, M.Kom Dr. Abdul Syukur i PENGESAHAN DEWAN PENGUJI Nama : Nurul Hidayat NIM : A11.2010.05672 Program Studi : Teknik Informatika S-1 Fakultas : Ilmu Komputer Judul Tugas Akhir : Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes Tugas akhir ini telah diajukan dan dipertahankan dihadapan Dewan Penguji pada Sidang Tugas Akhir tanggal 24 Oktober 2014. Menurut pandangan kami, tugas akhir ini memadai dari segi kualitas maupun kuantitas untuk tujuan penganugrahan gelar Sarjana Komputer (S.Kom) Semarang, 24 Oktober 2014 Dewan Penguji: Noor Ageng Setiyanto, M.Kom Ajib Susanto, M.Kom Anggota Anggota Solichul Huda, M.Kom Ketua Penguji ii PERNYATAAN KEASLIAN SKRIPSI Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah ini, saya: Nama : Nurul Hidayat NIM : A11.2010.05672 Menyatakan bahwa karya ilmiah saya yang berjudul: “Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes” merupakan karya asli saya (kecuali cuplikan dan ringkasan yang masing-masing telah saya jelaskan sumbernya dan perangkat pendukung seperti web cam dll). Apabila di kemudian hari, karya saya disinyalir bukan merupakan karya asli saya, yang disertai dengan bukti-bukti yang cukup, maka saya bersedia untuk dibatalkan gelar saya beserta hak dan kewajiban yang melekat pada gelar tersebut. Demikian surat pernyataan ini saya buat dengan sebenarnya. Dibuat di : Kota Semarang Pada tanggal : 16 Oktober 2014 Yang menyatakan Nurul Hidayat iii PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah ini, saya: Nama : Nurul Hidayat NIM : A11.2010.05672 demi mengembangkan Ilmu Pengetahuan, menyetujui untuk memberikan kepada Universitas Dian Nuswantoro Hak Bebas Royalti Non-Eksklusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul: “Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes” beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti NonEksklusif ini Universitas Dian Nuswantoro berhak untuk menyimpan, mengcopy ulang (memperbanyak), menggunakan, mengelolanya dalam bentuk pangkalan data (database), mendistribusikannya dan menampilkan/ mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis/ pencipta. Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak Universitas Dian Nuswantoro, segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak Cipta dalam karya ilmiah saya ini. Demikian surat pernyataan ini saya buat dengan sebenarnya. Dibuat di : Kota Semarang Pada Tanggal : 16 Oktober 2014 Yang menyatakan Nurul Hidayat iv UCAPAN TERIMA KASIH Dengan memanjatkan puji syukur kehadirat Allah SWT. Tuhan Yang Maha Pengasih dan Maha Penyayang yang telah melimpahkan segala rahmat, hidayah dan inayah-Nya kepada penulis sehingga laporan tugas akhir dengan judul “Implementasi Algoritma C4.5 untuk Memprediksi Pembelian Konsumen Pada Swalayan Pantes” dapat penulis selesaikan sesuai dengan rencana karena dukungan dari berbagai pihak yang tidak ternilai besarnya. Oleh karena itu penulis menyampaikan terima kasih kepada: 1. Dr. Ir. Edi Noersasongko, M.Kom, selaku Rektor Universitas Dian Nuswantoro Semarang. 2. Dr. Abdul Syukur, Drs, MM, selaku Dekan Fasilkom. 3. Heru Agus Santoso, Ph.D selaku Ka. Progdi Teknik Informatika. 4. Desi Purwanti Kusumaningrum, M.Kom selaku pembimbing tugas akhir yang memberikan ide penelitian, informasi referensi yang penulis butuhkan dan bimbingan yang berkaitan dengan penelitian penulis. 5. Dosen-dosen pengampu di Fakultas Ilmu Komputer Teknik Informatika Universitas Dian Nuswantoro Semarang yang telah memberikan ilmu dan pengalamannya masing-masing, sehingga penulis dapat mengimplementasikan ilmu yang telah disampaikan. 6. Kedua Orang tua dan Kedua Kakak tersayang yang selalu memberikan semangat dan dukungan. 7. Teman-teman yang telah mendukung dan membantu pembuatan skripsi. Semoga Tuhan Yang Maha Esa memberikan balasan yang lebih kepada beliaubeliau, dan laporan tugas akhir ini dapat bermanfaat sebagaimana fungsinya. Semarang, 16 Oktober 2014 Penulis v ABSTRAK Belanja merupakan kegiatan yang sangat menyenangkan untuk sebagian besar orang. Belanja bukan hanya sebagai aktivitas rutin untuk memenuhi keinginan dan kebutuhan konsumen, akan tetapi menjadi sarana rekreasi dan hiburan semata. Dari masalah ini manajer pemasaran harus bekerja keras untuk mengetahui perilaku pembelian konsumen dengan cara memprediksi perilaku pembeliannya. Penelitian ini menggunakan suatu teknik data mining yaitu klasifikasi terhadap data konsumen. Dengan menggunakan 4 variabel yaitu umur, pendapatan, status pelajar atau bukan pelajar, dan tingkat pinjaman. Dengan menerapkan teknik data mining pada data konsumen diharapkan dapat ditemukan aturan klasifikasi yang dapat digunakan untuk memprediksi perilaku pembelian konsumen, tanpa harus bertanya secara langsung kepada pengunjung apa mereka berniat membeli atau sekedar melihat-lihat. Keluaran yang dihasilkan adalah sistem yang mampu melakukan analisis data mining dengan Algoritma C4.5 dan menghasilkan tree baru yang terbentuk untuk menentukan perilaku pembelian konsumen. Kata kunci: Perilaku pembelian konsumen, Data mining, Algoritma C4.5. vi DAFTAR ISI PERSETUJUAN SKRIPSI .......................................................................... i PENGESAHAN DEWAN PENGUJI ......................................................... ii PERNYATAAN KEASLIAN SKRIPSI.................................................... iii PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS .................................................. iv UCAPAN TERIMA KASIH....................................................................... v ABSTRAK ................................................................................................. vi DAFTAR ISI............................................................................................. vii DAFTAR TABEL....................................................................................... x DAFTAR GAMBAR ................................................................................. xi BAB I .......................................................................................................... 1 PENDAHULUAN ...................................................................................... 1 1.1 Latar Belakang .............................................................................. 1 1.2 Perumusan Masalah....................................................................... 3 1.3 Batasan Masalah ............................................................................ 3 1.4 Tujuan Penelitian........................................................................... 4 1.5 Manfaat Penelitian......................................................................... 4 BAB II......................................................................................................... 5 TINJAUAN PUSTAKA DAN LANDASAN TEORI ................................ 5 2.1 Tinjauan Studi ............................................................................... 5 2.2 Tinjauan Pustaka ........................................................................... 8 2.2.1 Konsumen................................................................................ 8 2.2.2 Data Mining........................................................................... 10 vii 2.2.3 Algoritma C4.5 ...................................................................... 19 2.2.4 Rekayasa Perangkat Lunak ................................................... 21 2.3 Kerangka Pemikiran .................................................................... 25 BAB III ..................................................................................................... 26 METODOLOGI PENELITIAN................................................................ 26 3.1 Metode Penelitian........................................................................ 26 3.2 Sumber dan Teknik Pengumpulan Data ...................................... 27 3.2.1 Sumber Data .......................................................................... 27 3.2.2 Teknik Pengumpulan Data .................................................... 28 3.3 Ruang Lingkup Penelitian ........................................................... 29 3.4 Instrumen Penelitian.................................................................... 29 3.4.1 Kebutuhan Perangkat Lunak ................................................. 29 3.4.2 Kebutuhan Perangkat Keras .................................................. 30 3.5 Metode Pengembangan Perangkat Lunak ................................... 31 BAB IV ..................................................................................................... 36 RANCANGAN SISTEM DAN IMPLEMENTASI ................................. 36 4.1 Perancangan Sistem..................................................................... 36 4.1.1 Komunikasi dengan Pengguna .............................................. 36 4.1.2 Desain Antarmuka ................................................................. 40 4.1.3 Desain Database Prediksi Perilaku Pembelian Konsumen ... 43 4.2 Pengujian dan Implementasi Sistem ........................................... 44 4.2.1 Implementasi Sistem ............................................................. 44 4.2.2 Pengujian Perangkat Lunak................................................... 47 viii BAB V ...................................................................................................... 50 HASIL PENELITIAN DAN PEMBAHASAN ........................................ 50 5.1 Pembahasan ................................................................................. 50 5.2 Hasil Penelitian ........................................................................... 50 5.2.1 Evaluasi Hasil Data Mining .................................................. 50 BAB VI ..................................................................................................... 62 KESIMPULAN DAN PENELITIAN SELANJUTNYA ......................... 62 6.1 Kesimpulan.................................................................................. 62 6.2 Penelitian Selanjutnya ................................................................. 63 DAFTAR PUSTAKA ............................................................................... 64 LAMPIRAN .............................................................................................. 66 ix DAFTAR TABEL Tabel 2.1 State of the art 1 .............................................................................................5 Tabel 2.2 State of the art 2 .............................................................................................7 Tabel 3.1 Attribut yang digunakan ..............................................................................32 Tabel 4.1 Tabel identifikasi dan pelaksanaan pengujian program ...............................48 Tabel 4.2 Tabel hasil pengujian perangkat lunak ........................................................48 Tabel 5.1 Perhitungan Node 1 .....................................................................................57 Tabel 5.2 Perhitungan Node 1.1 ..................................................................................58 Tabel 5.3 Perhitungan Node 1.2 ..................................................................................59 Tabel 5.4 Perhitungan Node 1.2.2 ...............................................................................60 x DAFTAR GAMBAR Gambar 2.1 Data Mining .............................................................................................10 Gambar 2.2 Tahap-Tahap Data Mining .......................................................................11 Gambar 2.3 Beberapa Metode Data Mining ................................................................12 Gambar 2.4 Proses Data Mining Menurut CRISP-DM ...............................................16 Gambar 2.5 Proses Web Engineering ..........................................................................22 Gambar 3.1 Tabel dataset konsumen ...........................................................................33 Gambar 3.2 Pohon Keputusan Hasil Perhitungan Node ..............................................34 Gambar 4.1 Use case diagram pada rancangan sistem ................................................37 Gambar 4.2 Diagram aktivitas untuk melakukan pengujian ........................................38 Gambar 4.3 Class Diagram ..........................................................................................39 Gambar 4.4 Desain Menu Login ..................................................................................40 Gambar 4.5 Desain Menu Utama.................................................................................41 Gambar 4.6 Desain Menu Data Training .....................................................................41 Gambar 4.7 Desain Menu Input Data Training ...........................................................42 Gambar 4.8 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk....................12 Gambar 4.9 Desain Menu Pengujian ...........................................................................43 Gambar 4.10 Desain Tabel User Login .......................................................................43 Gambar 4.11 Desain Tabel Attribut .............................................................................43 Gambar 4.12 Desain Tabel Dataset .............................................................................44 Gambar 4.13 Menu Login ............................................................................................44 Gambar 4.14 Menu Utama...........................................................................................44 Gambar 4.15 Menu Data Training ...............................................................................45 Gambar 4.16 Menu Input Data Training......................................................................45 Gambar 4.17 Menu Iterasi Perhitungan .......................................................................46 Gambar 4.18 Menu Tree yang Terbentuk, dan Akurasi ..............................................46 Gambar 4.19 Menu Pengujian .....................................................................................47 Gambar 5.1 Pohon Keputusan Node 1 .........................................................................58 Gambar 5.2 Pohon Keputusan Node 1.1 ......................................................................59 Gambar 5.3 Pohon Keputusan Node 1.2 ......................................................................60 xi Gambar 5.3 Pohon Keputusan Node 1.2.2 ...................................................................61 xii BAB I PENDAHULUAN 1.1 Latar Belakang Dunia perdagangan pada masa sekarang ini semakin maju, terbukti dengan banyaknya jumlah supermarket, pasar swalayan, hypermarket dan usaha ritel sejenis yang beroperasi di berbagai tempat baik di kota besar maupun di kota kecil yang dari hari ke hari semakin menarik minat konsumen. Melihat persaingan usaha yang semakin tajam antar pasar swalayan atau hypermarket ini membuat seorang manajer pemasaran harus selalu berpikir cepat dan terus memperbarui strategi yang diterapkan oleh perusahaan. Swalayan Pantes merupakan salah satu pasar swalayan yang didirikan ditengah-tengah pusat Kecamatan Lasem untuk memenuhi kebutuhan konsumen atas segala macam bentuk produk yang dihasilkan oleh perusahaan. Lokasinya yang cukup strategis semakin mempermudah Swalayan Pantes untuk dijangkau oleh konsumen. Selain itu, Swalayan Pantes juga termasuk pendatang baru dan swalayan pertama yang ada di Kecamatan Lasem tersebut. Hal ini membuat banyak konsumen berdatangan dari segala golongan mulai dari golongan bawah sampai golongan atas, bahkan segala umur semua membaur pada Swalayan Pantes Lasem. Belanja merupakan kegiatan yang sangat menyenangkan untuk sebagian besar orang, karena belanja bukan hanya sebagai aktivitas rutin untuk memenuhi keinginan dan kebutuhan konsumen, akan tetapi sering kali kegiatan berbelanja menjadi sarana rekreasi dan hiburan semata. Berbedanya pola perilaku konsumen ini membuat seorang manajer pemasaran harus berfikir beberapa kali untuk menentukan target penjualan, karena tidak semua pengunjung atau konsumen berniat untuk membeli, akan tetapi ada yang sekedar melihat-lihat atau sekedar 1 2 refreshing. Dari masalah ini manajer pemasaran harus bekerja keras untuk mengetahui perilaku pembelian konsumen dengan cara memprediksi perilaku pembeliannya. Karena dengan memprediksi perilaku pembelian konsumen, manajer pemasaran akan mengetahui konsumen yang berniat membeli barang dengan konsumen yang hanya sekedar melihat-lihat atau sekedar refreshing. Data mining merupakan proses ekstraksi informasi atau pola penting dalam basis data berukuran besar [1]. Salah satu proses dalam data mining adalah klasifikasi, pada klasifikasi diberikan sejumlah record yang dinamakan training set, yang terdiri dari beberapa atribut, salah satu atribut menunjukkan kelas untuk record. Tujuan dari klasifikasi adalah untuk menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya. Penelitian ini menggunakan suatu teknik dalam data mining yaitu klasifikasi terhadap data konsumen. Dengan menggunakan 4 variabel yaitu umur, pendapatan, status pelajar atau bukan pelajar, dan tingkat pinjaman. Metode yang digunakan dalam penelitian ini adalah fuzzy decision tree (Pohon Keputusan). Dengan menerapkan teknik data mining pada data konsumen diharapkan dapat ditemukan aturan klasifikasi yang dapat digunakan untuk memprediksi perilaku pembelian konsumen, tanpa harus bertanya secara langsung kepada pengunjung apa mereka berniat membeli atau sekedar melihat-lihat. Pohon keputusan adalah salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasikan oleh manusia. Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhierarki. Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya untuk membreakdown proses pengambilan keputusan yang kompleks menjadi lebih 3 simple sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Algortima C4.5 merupakan salah satu cara yang dapat dilakukan untuk membangun aturan yang direpresentasikan dalam bentuk pohon keputusan. Fakta yang digunakan berasal dari tabel keputusan yang kemudian diproses dengan Algoritma C4.5 [2]. Berdasarkan permasalahan yang telah diuraikan diatas, maka dalam hal ini Penulis memilih judul “Implementasi Algoritma C4.5 untuk Memprediksi Perilaku Pembelian Konsumen Pada Swalayan Pantes”, sebagai judul untuk menyusun laporan Tugas Akhir guna menyelesaikan Program Studi Strata 1 di Universitas Dian Nuswantoro Semarang. 1.2 Perumusan Masalah Berdasarkan latar belakang masalah yang telah diuraikan diatas, diperoleh rumusan masalah untuk melakukan penelitian ini yaitu bagaimana mengimplementasikan Algoritma C4.5 untuk memprediksi perilaku pembelian konsumen dengan data sampel yang ada. 1.3 Batasan Masalah Dalam hal ini penulis melakukan pembatasan ruang lingkup masalah, hal ini dilakukan agar pembahasannya tidak menyimpang dari topik permasalahan tentang Implementasi Algoritma C4.5 untuk memprediksi perilaku pembelian konsumen pada Swalayan Pantes yang ada di Kecamatan Lasem. Batasan masalahnya antara lain : 1. Sistem hanya membantu memberikan prediksi dalam menentukan perilaku pembelian konsumen. 2. Sistem menggunakan 4 variabel, yaitu Umur, Pendapatan, Status Pelajar atau Bukan Pelajar, dan Tingkat Pinjaman. 3. Pengolahan data dilakukan menggunakan Algoritma C4.5. 4 1.4 Tujuan Penelitian Berdasarkan perumusan masalah pada bagian sebelumnya, tujuan yang ingin dicapai dari pengerjaan tugas akhir ini adalah mengimplementasikan Algoritma C4.5 dalam memprediksi perilaku pembelian konsumen. 1.5 Manfaat Penelitian 1. Manfaat Bagi Penulis Dapat menerapkan ilmu dan ketrampilan pemrograman yang telah diperoleh penulis selama di akademik terutama mengenai data mining serta dapat memodelkan sistem perhitungan data dengan menggunakan metode Decission Tree (Pohon Keputusan) yaitu Algoritma C4.5. 2. Manfaat Bagi Perusahaan Diharapkan dapat menyelesaikan masalah perilaku pembelian konsumen yang sebelumnya belum diketahui oleh manajer pemasaran. Dengan adanya sistem ini, manajer dapat memprediksi perilaku pembelian konsumen. 3. Manfaat Bagi Universitas Dian Nuswantoro Mengetahui sejauh mana penguasaan materi yang telah didapatkan oleh mahasiswa selama menempuh perkuliahan di Universitas Dian Nuswantoro serta sebagai bahan evaluasi akademik untuk meningkatkan mutu pendidikan. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Jurnal penelitian yang ditulis oleh Gaurav Kumar Nayak, Swathi J Narayanan, Ilango Paramasivam dengan judul “Development and Comparative Analysis Of Fuzzy Inference Systems for Predicting Buying Behavior” merupakan kajian pustaka dalam penelitian ini. Jurnal penelitian tersebut menjelaskan perbandingan antara metode mamdani dan metode sugeno dalam kasus memprediksi pembelian konsumen. Hasilnya adalah metode sugeno memiliki hasil yang lebih akurat daripada menggunakan metode mamdani dalam memprediksi apakah seseorang yang datang ke suatu toko atau tempat perbelanjaan itu pasti membeli atau tidak membeli. Hasil yang didapatkan diperoleh dari beberapa variabel diantaranya, umur (Age), status pelajar atau bukan pelajar (Student), pendapatan (Income) dan tingkat peminjaman (Credit Rating)[3]. Tabel 1.1 State of the art 1 Penulis Judul Masalah Atribut Gaurav Kumar Development Kurangnya Umur Nayak, Swathi and Comparative informasi J Analysis Narayanan, Of Daripada metode status pelajar atau Mamdani dan mamdani, metode mengenai kapan bukan Metode sugeno mempunyai (Student), Sugeno hasil Fuzzy Inference dan Paramasivam Systems kondisi dalam apa (Age), Hasil Metode Ilango for Metode pelajar pendapatan yang akurat Predicting konsumen (Income) Customer Buying membeli produk tingkat perilaku Behavior tertentu peminjaman konsumen dan (Credit Rating) 5 lebih dalam memprediksi pembelian 6 Jurnal penelitian yang ditulis oleh Ahmad Saikhu, Joko Lianto, dan Umi Hanik dengan judul “FUZZY DECISION TREE DENGAN ALGORITMA C4.5 PADA DATA DIABETES INDIAN PIMA” merupakan kajian pustaka kedua dalam penelitian ini. Penelitian ini menggunakan suatu teknik dalam data mining yaitu klasifikasi terhadap data diabetes. Dengan menggunakan 9 variabel yaitu number of times pregnant (time), plasma glucose concentration a 2 hours in an oral glucose tolerance test (OGTT), diastolic blood pressure (D), triceps skin fold thickness (T), 2-Hour serum insulin (IPOST), body mass index (BMI), diabetes pedigree function (F), Age (T), dan Class variable (Diagnosa). Metode yang digunakan dalam penelitian ini adalah fuzzy decision tree. Penggunaan teknik fuzzy memungkinkan dilakukannya prediksi suatu objek yang dimiliki lebih dari satu kelas. Dengan menerapkan teknik data mining pada diabetes diharapkan dapat ditemukan aturan klasifikasi yang dapat digunakan untuk memprediksi potensi seseorang terserang diabetes, tanpa harus melawan diagnosis penyakit secara langsung dengan diagnosis dini [1]. 7 Tabel 2.2 State of the art 2 Penulis Judul Masalah Atribut Metode Ahmad FUZZY Bagaimana number Saikhu, DECISION memprediksi pregnant Joko TREE potensi plasma Lianto, DENGAN seseorang concentration dan ALGORITMA terserang hours C4.5 diabetes, tanpa glucose tolerance test Algoritma DATA harus melawan (OGTT), C4.5 DIABETES diagnosis blood pressure (D), INDIAN penyakit secara triceps skin fold PIMA langsung thickness (T), 2-Hour dengan serum diagnosis dini (IPOST), body mass Hanik Umi PADA of times Metode a. Fuzzy dihasilkan tingkat akurasi Decision yang lebih tinggi dibanding 2 Tree dengan tanpa pruning, dari 69,14% oral menggunkan ke 78,91%. (time), glucose in a an Hasil diastolic insulin index (BMI), diabetes pedigree function (F), b. Dengan Pembagian himpunan fuzzy menggunakan data standard pruning pruning data dengan referensi dengan memiliki tingkat akurasi lebih tinggi 78,91% dibandingkan dengan referensi kuartil data 76,95%. Age (T), dan Class variable (Diagnosa) c. Semakin tinggi θr dan θn, semakin tinggi tingkat akurasi. 8 2.2 Tinjauan Pustaka 2.2.1 Konsumen 2.2.1.1 Definisi Konsumen Konsumen adalah setiap orang pemakai barang dan/atau jasa yang tersedia dalam masyarakat, baik bagi kepentingan diri sendiri, keluarga, orang lain, maupun makhluk hidup lain dan tidak untuk diperdagangkan. Jika tujuan pembelian produk tersebut untuk dijual kembali, maka dia disebut pengecer atau distributor [11]. Dalam buku A.Z. Nasution yang berjudul “aspek-aspek hukum masalah perlindungan konsumen”, istilah konsumen berasal dari bahasa consumer (Inggris Amerika) atau consument (Belanda). Secara harfiah arti kata consumer adalah lawan dari produsen, setiap orang yang menggunakan barang. 2.2.1.2 Definisi Perilaku Konsumen Menurut Ebert dan Griffin, “Perilaku konsumen dijelaskan sebagai upaya konsumen untuk membuat keputusan tentang suatu produk yang dibeli dan dikonsumsi” [12]. Perilaku Konsumen merupakan suatu tindakan yang tunjukkan oleh konsumen dalam hal mencari, menukar, menggunakan, menilai, mengatur barang atau jasa yang mereka anggap akan memuaskan kebutuhan mereka. Dalam arti lain perilaku ditunjukkan, yakni bagaimana konsumen mau mengeluarkan sumber dayanya yang terbatas seperti uang, waktu, tenaga untuk mendapatkan/menukarkan dengan barang atau jasa yang diinginkannya. Menurut Mowen (2002) bahwa, “perilaku konsumen (consumer behaviour) didefinisikan sebagai studi tentang unit pembelian (buying units) dan proses pertukaran yang melibatkan perolehan, pengalaman serta ide-ide”. konsumsi dan pembuangan barang, jasa, 9 2.2.1.3 Macam-Macam Perilaku Konsumen Jika dilihat dari perilaku konsumen dalam mengonsumsi suatu barang dibedakan menjadi dua macam, yaitu [11]: 1. Perilaku Konsumen Rasional Suatu konsumsi dapat dikatakan rasional jika memerhatikan hal-hal berikut: a) Barang tersebut dapat memberikan kegunaan optimal bagi konsumen. b) Barang tersebut benar-benar diperlukan konsumen. c) Mutu barang terjamin. d) Harga sesuai dengan kemampuan konsumen 2. Perilaku Konsumen Irasional Suatu perilaku dalam mengonsumsi dapat dikatakan tidak rasional jika konsumen tersebut membeli barang tanpa dipikirkan kegunaannya terlebih dahulu. Contohnya, yaitu: a) Tertarik dengan promosi atau iklan baik di media cetak maupun elektronik. b) Memiliki merek yang sudah dikenal banyak konsumen. c) Ada bursa obral atau bonus-bonus dan banjir diskon. d) Prestise atau gengsi. 10 2.2.2 Data Mining 2.2.2.1 Definisi Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [4]. Gambar 2.1 Data Mining Istilah data mining memiliki hakikat sebagai disiplin ilmu yang tujuannya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Data mining, sering juga disebut sebagai knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar [5] . Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu tahapan dalam keseluruhan proses KDD adalah data mining [6]. 11 2.2.2.2 Tahapan - Tahapan Data Mining Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap yang diilustrasikan di Gambar 2.2. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base. Gambar 2.2 Tahap-Tahap Data Mining Tahap-tahap data mining adalah sebagai berikut [7]: 1. Pembersihan data (data cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. 2. Integrasi data (data integration) Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. 12 3. Seleksi data (data ( selection) Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu it hanya data yang sesuai untuk dianalisis yang akan diambil dari database. 4. Transformasi data (data ( transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. 5. Proses mining Merupakan suatu proses utama saat metode diterapk diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Beberapa metode yang yang dapat digunakan berdasarkan pengelompokan data mining dapat dilihat pada Gambar 2.3. Gambar 2.3 Beberapa Metode Data Mining 13 6. Evaluasi pola (pattern evaluation) Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan. 7. Presentasi pengetahuan (knowledge presentation) Merupakan mengenai visualisasi metode yang dan penyajian digunakan untuk pengetahuan memperoleh pengetahuan yang diperoleh pengguna. 2.2.2.3 Pengelompokan Data Mining Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu [8]: 1. Deskripsi Terkadang peneliti dan analis secara sederhana ingin mencoba mencari data untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menentukan keterangan atau fakta bahwa siapa yang tidak cukup professional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan. 2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik dari pada kearah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis 14 kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya. 3. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam predikasi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi bisnis dan penelitian adalah : a) Prediksi harga beras dalam tiga bulan yang akan datang. b) Prediksi persentasi kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi. 4. Klasifikasi Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah : a) Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau tidak. b) Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk. 15 c) Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa. 5. Pengklusteran Pengkluteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objekobjek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogeny), yang mana kemiripan dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah : a) Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari satu suatu produk bagi perusahaan yang tidak memiliki dana pemesaran yang besar. b) Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku financial dalam baik dan mencurigakan. c) Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar. 16 6. Asosiasi Tugas asosiasi dalam data mining adalah menemukan attribute yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah: dalah: a) Meneliti jumlah telekomunikasi pelanggan seluler yang dari perusahaan diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan. b) Menentukan barang dalam supermarket yang dibeli secara bersamaan dan yang tidak pernah dibeli secara bersamaan. 2.2.2.4 Definisi Cross-Industry Industry Standard Process for Data Mining (CRISPDM) Larose dalam bukunya menjelaskan bahwa ada enam fase siklus pada suatu proyek Data Mining.. Seluruh fase memiliki ketergantungan dan berurutan dari fase sebelumnya sebelumn [10]. Gambar 2.4 Proses Data Mining Menurut CRISP-DM 17 Enam fase CRISP-DM menurut Larose yang dikutip dari Kusrini dan digunakan pada penelitian ini adalah [8]: 1. Fase Pemahaman Bisnis (Business Understanding Phase) a) Menentukan tujuan proyek data mining dan kebutuhan detail tentang manfaat untuk bisnis maupun penelitian. b) Menerjemahkan tujuan dan batasan proyek dari permasalahan. c) Persiapan langkah awal untuk mencapai tujuan proyek. 2. Fase Pemahaman Data (Data Understanding Phase) a) Mengumpulkan data dari sumber data. b) Menggunakan analisis data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal. c) Evaluasi kualitas dan integritas data. d) Pilih sebagian kecil group data yang mungkin mengandung pola (pattern) dari permasalahan. 3. Fase Pengolahan Data (Data Preparation Phase) a) Persiapan dataset yang akan digunakan. Pada tahap ini dilakukan pembersihan atribut data yang tidak diperlukan dalam fase permodelan. b) Pilih kasus dan variabel yang ingin dianalisis sesuai dengan tujuan proyek. c) Transformasi variabel jika dibutuhkan. 4. Fase Permodelan (Modeling Phase) a) Pemilihan dan penerapan teknik permodelan yang sesuai dengan kasus yang ingin dianalisis. b) Kalibrasi model untuk mengoptimalkan hasil. 18 c) Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama. d) Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu. 5. Fase Evaluasi (Evaluation Phase) a) Mengevaluasi satu atau lebih model yang digunakan dalam fase permodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan. b) Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal. c) Menentukan apakah terdapat permasalahan penting dari bisnis atau penelitian yang tidak tertangani dengan baik. d) Mengambil keputusan berkaitan dengan penggunaan hasil model dari data mining. 6. Fase Penyebaran (Deployment Phase) a) Menggunakan model yang dihasilkan. b) Contoh sederhana penyebaran: Pembuatan laporan. c) Contoh kompleks penyebaran: Penerapan proses data mining secara paralel pada departemen lain. 19 2.2.3 Algoritma C4.5 Algoritma C4.5 yaitu sebuah algoritma yang digunakan untuk membentuk decision tree (pohon keputusan)[8]. Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Algoritma C4.5 mengkonstruksi pohon keputusan dari data pelatihan, yang berupa kasus-kasus atau record-record (tupel) dalam basis data. Setiap kasus berisikan nilai dari atribut-atribut untuk sebuah kelas. Setiap atribut dapat berisi data diskret atau kontinyu (numerik). Algoritma C4.5 juga menangani kasus yang tidak memiliki nilai untuk sebuah atau lebih atribut. Akan tetapi, atribut kelas hanya bertipe diskret dan tidak boleh kosong [9]. Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut: a) Pilih atribut sebagai akar b) Buat cabang untuk masing-masing nilai c) Bagi kasus dalam cabang d) Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Dasar untuk memilih atribut sebagai akar dari pohon adalah dengan menghitung nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam persamaan 1 berikut : Keterangan : S : himpunan kasus A : Atribut 20 n : Jumlah partisi atribut A |Si| : Jumlah kasus pada partisi ke-i |S| : Jumlah kasus dalam S Perhitungan dari persamaan 1 akan memperoleh nilai gain atribut yang paling tertinggi. Gain adalah salah satu attribute selection measure yang digunakan untuk memilih test atribut tiap node pada pohon. Atribut dengan informasi gain tertinggi dipilih sebagai test atribut dari suatu node. Sementara itu, perhitungan nilai entropi dapat dilihat pada persamaan 2. Keterangan : S : Himpunan Kasus n : Jumlah partisi S pi : Proporsi dari Si terhadap S 21 2.2.4 Rekayasa Perangkat Lunak 2.2.4.1 Perangkat Lunak Ian Sommerville dalam bukunya[13] menjelaskan bahwa perangkat lunak adalah program komputer dan semua dokumentasi yang terkait didalamnya. Software mungkin dapat dibangun untuk konsumen tertentu atau juga mungkin dibangun untuk umum. Software yang dibangun diharapkan memiliki fungsi dan performa yang baik. Selain itu, software yang dibuat dapat diperbaiki (maintainable), dapat membuat ketergantungan kepada user (dependable), dan dapat digunakan (usable). 2.2.4.2 Rekayasa Perangkat Lunak Rekayasa Perangkat Lunak (RPL) adalah disiplin ilmu yang fokus pada semua aspek pembangunan software. RPL memiliki aktifitas dasar atau fase. Fase tersebut adalah penentuan spesifikasi software (Software Specification), pembangunan software (Software Development), validasi software (Software Validation), dan evolusi software (Software Evolution) [13] . RPL bertujuan menghasilkan perangkat lunak berkualitas yang dapat dilihat dari tiga sisi, sponsor (pihak yang mengeluarkan dana untuk pembangunan perangkat lunak), pemakai (semua pihak yang menggunakan perangkat lunak tersebut), dan pengembang (pihak modikasi dan pengembangan perangkat lunak). Selain itu, RPL mempunyai tujuan agar pembuatan perangkat lunak tidak menggunakan biaya produksi berlebih (efisien), dan tepat pada waktunya. 22 2.2.4.3 Rekayasa Web (Web Engineering) Web Engineering adalah suatu proses yang digunakan unt untuk membuat aplikasi web yang berkualitas tinggi [14] . Web Engineering berbeda denga RPL (Rekayasa Perangkat Lunak), tetapi Web Engineering memiliki konsep dan prinsip mendasar dari RPL. Proses di Web Engineering lebih ditekankan pada aktivitas teknis dan manajemen manajemen yang hampir sama. Gambar 2.5 Proses Web Engineering Tahapan-tahapan tahapan dalam Web Engineering antara lain : 1. Communication ommunication Sebelum pengerjaan teknis dapat dimulai, hal ini sangat penting untuk mengkomunikasikan dan membuat kerja kerja sama dengan konsumen (dan stakeholder lain). Hal ini bermaksud supaya stakeholder mengerti tujuan proyek dan untuk mengumpulkan beberapa persyaratan yang membantu dalam menetapkan fitur-fitur fitur dan fungsi-fungsi fungsi perangkat lunak. 23 2. Planning Beberapa proses yang rumit dapat disederhanakan jika terdapat sebuah rancangan. Proyek perangkat lunak merupakan proses yang rumit, dan aktifitas perencanaan membuat sebuah rancangan (pola) yang dapat membantu tim sehingga dapat membentuk suatu proses. Suatu rancangan – yang disebut rencana proyek perangkat lunak – merupakan pengerjaan tehnik perangkat lunak melalui pendeskripsian tugas-tugas teknis yang akan diselenggarakan, resikonya kemungkinan besar, sumber daya akan dapat dipenuhi, produksi kerja akan dapat diproduksi, dan begitu pula jadwal kerja. 3. Modeling (Pemodelan) Ketika Anda sebagai ahli pertamanan, pembangun jembatan, teknisi penerbangan, tukang kayu, ataupun seorang arsitek, Anda bekerja dengan pemodelan setiap hari. Anda membuat “sketsa” dari sebuah sesuatu sehingga Anda akan dapat memahami gambar yang besar yang akan terlihat secara kearsitekturan, bagaimana bagian-bagian dalam unsur pokok dapat menyatu bersama, dan masih banyak karakteristik lainnya. Jika tersedia, anda dapat memperhalus sketsa menjadi lebih besar dan perincian yang lebih besar dalam usaha untuk lebih memahami suatu masalah dan bagaimana Anda akan mengatasinya. Teknisi perangkat lunak melakukan hal yang sama dengan membuat model sehingga dapat lebih memahami persyaratan-persyaratan perangkat lunak dan desain yang akan mendapati persyaratan tersebut. 24 4. Construction (Penyusunan) Aktifitas ini mengkombinasikan kode turunan (baik manual atau otomatis) dan pengujian yang di penuhi untuk membuka kode yang error. 5. Deployment (Penyebaran) Perangkat Lunak (sebagai kesatuan yang lengkap atau sebagai tambahan bagian secara lengkap) yang diterima oleh konsumen sebagai penguji produk yang diterima dan menyediakan timbal balik berdasarkan evaluasi. 25 2.3 Kerangka Pemikiran Masalah Kurangnya informasi mengenai kapan dan dalam kondisi apa konsumen membeli produk tertentu Pendekatan Tools : PHP Hypertext Preprocessor Metode Decision Tree yaitu Algoritma (PHP) C4.5 Implementasi Menerapkan Metode Decision Tree yaitu Inputan : Umur, Status Pelajar atau Bukan Algoritma C4.5 dengan bahasa PHP Pelajar, Gaji, dan Tingkat Pinjaman Hasil Algoritma C4.5 mampu bekerja secara optimal dan dapat mengetahui perilaku pembelian konsumen BAB III METODOLOGI PENELITIAN 3.1 Metode Penelitian Penelitian deskriptif adalah metode penelitian yang digunakan untuk menemukan pengetahuan yang seluas-luasnya terhadap objek penelitian pada suatu masa tertentu. Sedangkan menurut Punaji Setyosari, “penelitian deskriptif adalah penelitian yang bertujuan untuk menjelaskan atau mendeskripsikan suatu keadaan, peristiwa, objek apakah orang, atau segala sesuatu yang terkait dengan variabel-variabel yang bisa dijelaskan baik dengan angka-angka maupun kata-kata”. Sedangkan menurut Sugiyono, “Metode deskriptif adalah metode yang digunakan untuk menggambarkan atau menganalisis suatu hasil penelitian tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas”. Dari pengertian diatas dapat disimpulkan bahwa metode penelitian yang digunakan adalah metode analisis deskriptif dengan pendekatan kuantitatif artinya penelitian yang dilakukan adalah menekankan analisanya pada data-data numerik (angka), yang bertujuan untuk mendapatkan gambaran yang jelas mengenai suatu keadaan berdasarkan data yang diperoleh dengan cara menyajikan, mengumpulkan dan menganalisis data tersebut sehingga menjadi informasi baru yang dapat digunakan untuk menganalisa mengenai masalah yang sedang diteliti. 26 27 3.2 Sumber dan Teknik Pengumpulan Data 3.2.1 Sumber Data 1. Data Primer Data primer adalah data yang diperoleh secara langsung dari objek yang diteliti atau baik yang dilakukan melalui wawancara, pengamatan, pencatatan atau penelitian pada objek penelitian yaitu konsumen yang ada di Swalayan Pantes. Data yang didapatkan dari data primer yaitu data konsumen antara lain : umur, pelajar atau bukan pelajar, gaji, dan tingkat pinjaman. 2. Data Sekunder Data sekunder adalah data yang diperlukan untuk mendukung hasil penelitian berasal dari literatur, artikel, dan berbagai sumber lain yang berhubungan dengan masalah penelitian. Data sekunder umumnya berupa bukti catatan atau laporan historis yang dipublikasikan maupun yang tidak dipublikasikan, data sekunder hanya digunakan untuk pelengkap teori dari data primer yang diperoleh dari bukubuku, laporan skripsi lain, dan internet berupa definisi, dan konsep-konsep yang berhubungan dengan penyusunan tugas akhir ini. 28 3.2.2 Teknik Pengumpulan Data Dalam penyusunan penelitian ini, untuk mendapatkan data dan informasi yang di butuhkan, maka metode yang digunakan dalam proses pengumpulan data dilakukan sebagai berikut : 1. Studi Pustaka Studi Pustaka adalah metode dimana perolehan datadatanya melalui buku-buku atau jurnal yang berkaitan dengan penelitian yang akan dilakukan. Data yang diperoleh dari buku-buku dan jurnal-jurnal mengenai Decision tree, Perilaku konsumen, informasi mengenai metode-metode yang digunakan seperti Algoritma C4.5 dan bahan tertulis lainnya. 2. Observasi Observasi merupakan teknik dimana mengamati secara langsung terhadap objek yang diteliti, teknik ini digunakan untuk melengkapi data hasil wawancara sehingga data yang didapatkan dapat dipertanggungjawabkan kebenarannya oleh peneliti secara langung terhadap objek yang ditelitinya. Dengan menggunakan metode observasi, penulis melakukan pengamatan secara langsung mengenai kegiatan dan kondisi perusahaan tempat penulis melakukan penelitian pada Swalayan Pantes, dan mencatat semua informasi yang ada yang mendukung penyusunan Tugas Akhir ini. 29 3. Wawancara Metode yang dilakukan untuk mengumpulkan sebuah informasi yang dilakukan dengan cara bertanya secara langsung secara lisan maupun tulisan kepada objek penelitian yang terkait dalam permasalahan yang akan dibahas dalam penulisan penelitian, yaitu mengenai perilaku pembelian konsumen pada Swalayan Pantes. Data yang dapat disimpulkan dari hasil wawancara adalah data-data mengenai variabel apa saja yang diperlukan untuk menentukan perilaku pembelian konsumen. 3.3 Ruang Lingkup Penelitian Ruang lingkup penelitian berfungsi untuk memberi batasan pada objek penelitian, agar hasil penelitian tetap terfokus pada objek yang akan diteliti sehingga permasalahan penelitian dapat dimengerti dengan baik dan mudah. Dalam penelitian ini, yang menjadi ruang lingkup penelitian adalah Swalayan Pantes yang berada di Kecamatan Lasem Kabupaten Rembang. 3.4 Instrumen Penelitian Dalam penelitian ini, dibutuhkan beberapa instrumen untuk mendukung penelitian ini antara lain: 3.4.1 Kebutuhan Perangkat Lunak Kebutuhan perangkat lunak merupakan faktor penting yang harus dipenuhi dalam penelitian ini, sehingga perangkat lunak tersebut sesuai dengan maksud dan tujuan dalam penelitian. 30 Adapun perangkat lunak yang dibutuhkan dalam penelitian ini adalah sebagai berikut : 1. Sistem Operasi Program dibuat menggunakan sistem operasi Microsoft Windows 7 Ultimate. 2. Sublime Text 3, XAMPP 1.8.1, SQLyog Ultimate v7.15, RapidMiner5, dan Browser Mozilla Firefox. Software ini digunakan untuk implementasi metode yang digunakan dalam penelitian. 3. Enterprise Architect 7.5, Microsoft Office Word 2007, Microsoft Office Excel 2007, Microsoft Office Visio 2007. Software ini digunakan untuk menulis laporan hasil penelitian. 3.4.2 Kebutuhan Perangkat Keras Selain kebutuhan perangkat lunak, diperlukan pula perangkat keras yang harus dipenuhi dalam penelitian ini. Adapun perangkat keras yang digunakan pada penelitian ini adalah sebagai berikut : a. Personal Computer atau laptop dengan spesifikasi : - Prosesor : AMD A8-4500 APU - Sistem Operasi : Windows 7 Ultimate 64bit - RAM : 4 GB b. Printer 31 3.5 Metode Pengembangan Perangkat Lunak Pada penelitian ini digunakan metode pengembangan perangkat lunak dengan model Web Engineering. Model tersebut dipilih karena memiliki konsep dan prinsip mendasar dari RPL. Proses di Web Engineering lebih ditekankan pada aktivitas teknis dan manajemen yang hampir sama. Berikut tahapan yang digunakan dalam Web Engineering: 1. Communication Komunikasi dalam hal ini berkonsentrasi dalam 2 hal, analisa bisnis dan perumusan. Analisa bisnis akan mendefinisikan hal – hal apa saja yang akan termuat di dalam sistem. Perumusan adalah pengumpulan informasi tentang halhal yang akan dimuat dalam sistem yang melibatkan calon pengguna. 2. Planning Yaitu tahap penggabungan requirement (kebutuhan) dan informasi dari user dan perencanaan teknis serta menanggapi respon (tanggapan) dari user. Perencanaan teknis dilakukan dengan mengidentifikasi perangkat lunak maupun perangkat keras apa saja yang dibutuhkan, tergantung kesepakatan. 3. Modeling Dalam tahapan ini, digunakan Cross Industry Standard Processing-Data Mining (CRISP-DM) sebagai metode analisis data dan pemodelan dengan fase sebagai berikut: 1. Fase Pemahaman Bisnis (Business Understanding Phase) a) Penelitian ini memiliki tujuan menetukan perilaku pembelian konsumen dengan menggunakan aturan klasifikasi. Sehingga dari hasil yang diperoleh dapat bermanfaat untuk lembaga atau instansi terkait. 32 b) Strategi awal yang akan digunakan adalah mencari dataset konsumen. 2. Fase Pemahaman Data (Data Understanding Phase) Pengumpulan data primer dilakukan dengan mengambil data konsumen Swalayan Pantes dengan jumlah data sebanyak 300 record, terdiri dari 5 atribut. Atribut tersebut ada yang tergolong atribut prediktor yaitu atribut yang dijadikan sebagai penentu perilaku konsumen, dan atribut label yaitu atribut yang dijadikan sebagai hasil learning. Adapaun atribut prediktor yaitu Umur (age), Pendapatan (income), Pelajar atau Tidak Pelajar (student), dan Tingkat Pinjaman (credit rating). Sedangkan varaibel tujuannya atau labelnya adalah Jadi membeli atau tidak membeli (buys). Tabel 3.1 Attribut yang digunakan No. Attibut Nilai 1. Age Umur 2. Income Pendapatan 3. Student Pelajar atau Tidak Pelajar 4. Credit rating Tingkat Pinjaman 5. Buy Jadi membeli atau tidak membeli 33 3. Fase Pengolahan Data (Data Preparation Phase) Dataset training kemudian diimpor kedalam microsoft excel. Gambar 3.1 Tabel dataset konsumen 4. Fase Pemodelan (Modeling Phase) Dari fase sebelumnya, dataset dimodelkan dengan algoritma C4.5 sehingga menghasilkan Decision Tree yang digunakan untuk menentukan label dari inputan baru. 5. Fase Evaluasi (Evaluation Phase) Decision Tree yang dihasilkan dari fase sebelumnya digunakan untuk menentukan prediksi inputan baru dengan label yang belum diketahui. 34 6. Fase Pengebaran (Deployment Phase) Fase berikutnya adalah fase penyebaran dimana model yang sudah dievaluasi disebarkan sehingga dapat digunakan untuk menentukan aturan klasifikasi perilaku pembelian konsumen dengan tree yang terbentuk seperti dibawah ini: Gambar 3.2 Pohon Keputusan Hasil Perhitungan Node 4. Construction a. Implementasi (coding) Implementasi dilakukan dengan mengaplikasikan halaman web dalam bentuk HTML berdasarkan hasil perancangan isi pada aktivitas pada non technical member sedangkan implementasi isi dan fungsi logika dibuat dalam bentuk PHP. b. Pengujian (testing) Dilakukan untuk mengetahui kemungkinan terjadinya kesalahan seperti kesalahan pada skrip atau form, navigasi ataupun tampilan, maupun bagian lainnya. 35 5. Deployment Sistem ini diciptakan untuk dapat berguna bagi kebutuhan pihak Swalayan Pantes dan kemudian dilakukan evaluasi secara berkala, memberi masukan – masukan kepada team pengembang dan apabila diperlukan akan dilakukan modifikasi pada sistem tersebut. BAB IV RANCANGAN SISTEM DAN IMPLEMENTASI 4.1 Perancangan Sistem Teknik pemecahan masalah pada analisis sistem yang menggabungkan kembali komponen sistem menjadi sistem yang utuh. Ada tiga poin utama yang akan dibahas pada tahap perancangan: 4.1.1 Komunikasi dengan Pengguna Komunikasi yang akan terjadi antara pengguna dengan program dengan respon yang diberikan oleh sistem. Yaitu kebutuhan user, use case diagram, activity diagram, dan class diagram. 4.1.1.1 Analisis Kebutuhan User Analisis kebutuhan (business requirement) bertujuan mendefinisikan kebutuhan yang diperlukan dalam pengembangan perangkat lunak. Suatu sistem yang akan dibuat harus memenuhi kebutuhan fungsional sehingga program dapat berjalan dengan optimal dan kebutuhan non fungsional sehingga mendukung fungsi utama dalam program agar berjalan sesuai keinginan. 1. Kebutuhan Fungsional a. Sistem harus menyediakan fungsi untuk memprediksi perilaku pembelian konsumen. b. Sistem harus menyediakan fungsi untuk menginputkan dataset pengunjung berdasarkan atribut yang telah ditentukan. 36 37 2. Kebutuhan non-Fungsional a. Sistem harus menyediakan fungsi untuk menampilkan dataset yang telah diinputkan. b. Sistem harus menyediakan fungsi untuk menampilkan perhitungan tree yang terbentuk beserta akurasinya. 4.1.1.2 Use Case Diagram Use Case Diagram yang akan disusun pada sistem ini memerlukan aktor sebagai pelaku yang menjalankan case-case yang ada. Berikut adalah langkah membuat diagram use case dalam sistem prediksi perilaku pembelian konsumen pada swalayan pantes: 1. Identifikasi Aktor/Pelaku Bisnis Aktor adalah pelaku bisnis atau subjek yang menjalankan case pada software. Aktor yang terlibat dalam sistem ini secara khusus adalah pemilik dari Swalayan Pantes. 2. Diagram Model Use Case Adalah penjabaran secara grafis yang dilakukan oleh pengguna selama berada didalam sistem atau software. Gambar 4.1 Use case diagram pada rancangan sistem 38 Use case diagram diatas menggambarkan bahwa pengguna dapat melakukan input data training, melihat data training, iterasi perhitungan, tree yang terbentuk dan pengguna juga dapat melakukan pengujian prediksi perilaku pembelian konsumen. 4.1.1.3 Activity Diagram Gambar 4.2 Diagram aktivitas untuk melakukan pengujian Gambar diatas menjelaskan bagaimana pengguna melakukan proses pengujian prediksi perilaku pembelian konsumen. Ketika pengguna menjalankan sistem, pengguna akan melakukan login terlebih dahulu. Aktivitas akan berlanjut jika username dan password yang dimasukan benar dan pengguna akan masuk ke halaman utama sistem. 39 Untuk melakukan proses uji prediksi perilaku pembelian konsumen pengguna harus masuk terlebih dahulu ke menu pengujian dan mengisi form yang ada. Setelah selesai maka sistem akan menampilkan hasil prediksi perilaku pembelian konsumen dan aktivitas selesai. 4.1.1.4 Class Diagram Gambar 4.3 Class Diagram Gambar diatas menunjukkan kelas yang terdiri dari beberapa tabel didalam sistem. Tabel-tabel diatas menjelaskan relasi antara tabel yang saling berhubungan antara satu dengan yang lainnya. 40 4.1.2 Desain Antarmuka Desain antarmuka adalah tahap pembuatan tampilan sistem agar lebih menarik sehingga pengguna dapat mengoperasikan sistem dengan mudah. 4.1.2.1 Desain Menu Login Gambar 4.4 Desain Menu Login 41 4.1.2.2 Desain Menu Utama Gambar 4.5 Desain Menu Utama 4.1.2.3 Desain Menu Data Training Gambar 4.6 Desain Menu Data Training 42 4.1.2.4 Desain Menu Input Data Training Gambar 4.7 Desain Menu Input Data Training 4.1.2.5 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk Gambar 4.8 Desain Menu Iterasi Perhitungan dan Tree yang Terbentuk 43 4.1.2.6 Desain Menu Pengujian Gambar 4.9 Desain Menu Pengujian 4.1.3 Desain Database Prediksi Perilaku Pembelian Konsumen Desain database prediksi perilaku pembelian konsumen adalah tahap perancangan database yang akan digunakan untuk menyimpan data yang ada pada sistem perilaku pembelian konsumen. 4.1.3.1 Desain Tabel User Login Gambar 4.10 Desain Tabel User Login 4.1.3.2 Desain Tabel Atribut Gambar 4.11 Desain Tabel Atribut 44 4.1.3.3 Desain Tabel Dataset Gambar 4.12 Desain Tabel Dataset 4.2 Pengujian dan Implementasi Sistem 4.2.1 Implementasi Sistem 4.2.1.1 Menu Login Gambar 4.13 Menu Login Menu login merupakan halaman awal ketika pengguna membuka sistem prediksi perilaku pembelian konsumen untuk mengantisipasi penggunaan yang salah. 4.2.1.2 Menu Utama Gambar 4.14 Menu Utama 45 Menu utama merupakan halaman pertama yang dilihat pengguna setelah melakukan login. 4.2.1.3 Menu Data Training Gambar 4.15 Menu Data Training Menu data training berisi semua data yang telah di inputkan oleh pengguna. Jika ingin menghapus datanya pengguna bisa memanfaatkan aksi hapus pada menu data training. 4.2.1.4 Menu Input Data Training Gambar 4.16 Menu Input Data Training 46 Menu input data training merupakan input data yang di inputkan oleh pengguna meliputi age, income, student, credit rating, dan buys. Input data training merupakan faktor penting dalam proses prediksi untuk menemukan aturan (rule) dari tree baru yang terbentuk. 4.2.1.5 Menu Iterasi Perhitungan dan Tree yang Terbentuk Gambar 4.17 Menu Iterasi Perhitungan Gambar 4.18 Menu Tree yang Terbentuk 47 Pada menu ini, pengguna dapat melihat iterasi perhitungan dari data training yang telah diinputkan untuk mendapatkan tree baru yang terbentuk. Pengguna juga dapat melihat tree baru yang terbentuk. 4.2.1.6 Menu Pengujian Gambar 4.19 Menu Pengujian Menu pengujian merupakan tujuan dari dibuatnya sistem ini, dimenu pengujian pengguna dapat melakukan uji prediksi perilaku pembelian konsumen dan dapat mengetahui konsumen yang membeli atau tidak berdasarkan hasil uji. 4.2.2 Pengujian Perangkat Lunak Metode pengujian perangkat lunak yang digunakan pada pembuatan software analisis data mining ini adalah Black-Box Testing. Berikut adalah tabel yang menjelaskan tentang poin-poin yang akan diuji pada tahap pengujian perangkat lunak. 48 Tabel 4.1 Tabel identifikasi dan pelaksanaan pengujian program No 1 2 Kelas Uji Butir Uji Fungsi masuk menu Menekan utama login Fungsi Menekan menginputkan Tingkat Jenis Pengujian Pengujian tombol Pengujian Black Box Sistem tombol Pengujian data tambah data Black Box Sistem training 3 Fungsi menampilkan Menekan hasil uji prediksi 4 Fungsi submit menghapus Menekan data tombol Pengujian Black Box Sistem tanda Pengujian silang Black Box Sistem Setelah perangkat lunak melewati tahap pengujian menghasilkan output yang akan dijelaskan pada tabel dibawah ini: Tabel 4.2 Tabel hasil pengujian perangkat lunak No 1 Deskripsi Fungsi pengujian masuk Menekan menu utama 2 Prosedur Keluaran Kriteria yang evaluasi diharapkan hasil Hasil yang didapat Halaman Pengguna Pengguna tombol utama masuk masuk login Sistem halaman halaman utama utama sistem sistem Fungsi Menekan Lokasi Data Data menginputkan tombol database tersimpan tersimpan data training tambah tabel dalam dalam data dataset database database tabel tabel dataset dataset Kesimpulan Diterima Diterima 49 3 Fungsi Menekan Hasil menampilkan tombol prediksi hasil uji Pengguna uji submit Diterima dapat mengetahui mengetahui prediksi 4 dapat Pengguna uji prediksi uji prediksi Fungsi Menekan Data Data yang Data yang Diterima menghapus data tanda terhapus ada silang di ada database database terhapus terhapus di BAB V HASIL PENELITIAN DAN PEMBAHASAN 5.1 Pembahasan Pada analisis proses mining menggunakan data pengunjung pada Swalayan Pantes sebanyak 300 data yang telah diolah menjadi dataset. Dalam penelitian ini menggunakan 5 atribut. Atribut tersebut ada yang tergolong atribut prediktor yaitu atribut yang dijadikan sebagai penentu perilaku konsumen, dan atribut label yaitu atribut yang dijadikan sebagai hasil learning. Adapaun atribut prediktor yaitu Umur (age), Pendapatan (income), Pelajar atau Tidak Pelajar (student), dan Tingkat Pinjaman (credit rating). Sedangkan varaibel tujuannya atau labelnya adalah Jadi membeli atau tidak membeli (buys). 5.2 Hasil Penelitian 5.2.1 Evaluasi Hasil Data Mining Aturan algoritma C4.5 yang terbentuk akan dijelaskan sebagai berikut: 5.2.1.1 Perhitungan Node 1 Total Jumlah Kasus (S) = 300 Jumlah No (S1) = 72 Jumlah Yes (S2) = 228 ( ) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 72 300 ∗ log 2 72 300 + − 228 300 ∗ log 2 228 300 = (−0,24 ∗ −2,05889) + (−0,76 ∗ −0,39593) = (0,49413) + (0,30091) = 0,79504 50 51 1. Perhitungan Age Age → Anak Jumlah Kasus (S) = 62 Jumlah No (S1) = 18 Jumlah Yes (S2) = 44 ( , Anak) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 18 62 ∗ log 2 18 62 + − 44 62 ∗ log 2 44 62 = (−0,29032 ∗ −1,78427) + (−0,70968 ∗ −0,49476) = (0,51801) + (0,35112) = 0,86914 Age → Dewasa Jumlah Kasus (S) = 105 Jumlah No (S1) = 12 Jumlah Yes (S2) = 93 ( , Dewasa) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 12 105 ∗ log 2 12 105 + − 93 105 ∗ log 2 93 105 = (−0,11429 ∗ −3,12928) + (−0,88571 ∗ −0,17509) = (0,35763) + (0,15508) = 0,51271 52 Age → Remaja Jumlah Kasus (S) = 133 Jumlah No (S1) = 42 Jumlah Yes (S2) = 91 , Remaja) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 42 133 ∗ log 2 42 133 + − 91 133 ∗ log 2 91 133 ( = (−0,31579 ∗ −1,66297) + (−0,68421 ∗ −0,54749) = (0,52515) + (0,3746) = 0,89974 ∎ ( )= , ( )− | | | ∗ | = 0,79504 − 62 105 300 ∗ 0,86914 + 300 ∗ 0,51271 + 133 300 ∗ 0,89974 = 0,79504 − (0,17962) + (0,17945) + (0,39889) = 0,79504 − 0,75796 = 0,03708 ( ) 53 2. Perhitungan Income Income → High Jumlah Kasus (S) = 21 Jumlah No (S1) =9 Jumlah Yes (S2) = 12 ( , High) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 9 21 ∗ log 2 9 21 + − 12 21 ∗ log 2 12 21 = (−0,42857 ∗ −1,22239) + (−0,57143 ∗ −0,80735) = (0,52388) + (0,46135) = 0,98523 Income → Low Jumlah Kasus (S) = 180 Jumlah No (S1) = 60 Jumlah Yes (S2) = 120 ( , Low) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 60 180 ∗ log 2 60 180 + − 120 180 ∗ log 2 120 180 = (−0,33333 ∗ −1,58496) + (−0,66667 ∗ −0,58496) = (0,52832) + (0,38998) = 0,9183 54 Income → Medium Jumlah Kasus (S) = 99 Jumlah No (S1) =3 Jumlah Yes (S2) = 96 ( , Medium) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 3 99 ∗ log 2 3 99 + − 96 99 ∗ log 2 96 99 = (−0,0303 ∗ −5,04439) + (−0,9697 ∗ −0,04439) = (0,15286) + (0,04305) = 0,19591 ∎ ( )= , ( )− | | | | ∗ ( ) = 0,79504 − 7 60 33 100 ∗ 0,98523 + 100 ∗ 0,9183 + 100 ∗ 0,19591 = 0,79504 − (0,06897) + (0,55098) + (0,06465) = 0,79504 − 0,6846 = 0,11045 3. Perhitungan Student Student → No Jumlah Kasus (S) = 156 Jumlah No (S1) = 48 Jumlah Yes (S2) = 108 ( , No) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 48 156 ∗ log 2 48 156 + − 108 156 ∗ log 2 108 156 = (−0,30769 ∗ −1,70044) + (−0,69231 ∗ −0,53051) = (0,52321) + (0,36728) = 0,89049 55 Student → Yes Jumlah Kasus (S) = 144 Jumlah No (S1) = 24 Jumlah Yes (S2) = 120 , Yes) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 24 144 ∗ log 2 24 144 + − 120 144 ∗ log 2 120 144 ( = (−0,16667 ∗ −2,58496) + (−0,83333 ∗ −0,26303) = (0,43083) + (0,2192) = 0,65002 ∎ ( ) , ( = )− = 0,79504 − 52 | | | | ∗ ( ) 48 100 ∗ 0,89049 + 100 ∗ 0,65002 = 0,79504 − (0,46306) + (0,31201) = 0,79504 − 0,77507 = 0,01997 4. Perhitungan Credit Rating Credit Rating → Excellent Jumlah Kasus (S) = 45 Jumlah No (S1) = 12 Jumlah Yes (S2) = 33 ( , Excellent) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 12 45 ∗ log 2 12 45 + − 33 45 ∗ log 2 33 45 = (−0,26667 ∗ −1,90689) + (−0,73333 ∗ −0,44746) = (0,5085) + (0,32814) = 0,83664 56 Credit Rating → Fair Jumlah Kasus (S) = 255 Jumlah No (S1) = 60 Jumlah Yes (S2) = 195 ( , Fair) = − S1 S ∗ log 2 S1 S + − S2 S ∗ log 2 S2 S = − 60 255 ∗ log 2 60 255 + − 195 255 ∗ log 2 195 255 = (−0,23529 ∗ −2,08746) + (−0,76471 ∗ −0,38702) = (0,49117) + (0,29596) = 0,78713 ∎ ( ) , = ( = 0,79504 − )− 15 | | | | ∗ ( 85 100 ∗ 0,83664 + 100 ∗ 0,78713 = 0,79504 − (0,1255) + (0,66906) = 0,79504 − 0,79455 = 0,00049 ) 57 Tabel 5.1 Perhitungan Node 1 Node Jumlah Label Kasus Yes 300 228 72 Anak 62 44 18 0,86914 Dewasa 105 93 12 0,51271 Remaja 133 91 42 0,89974 300 228 72 High 21 12 9 0,98523 Low 180 120 60 0,9183 Medium 99 96 3 0,19591 300 228 72 No 156 108 48 0,89049 Yes 144 120 24 0,65002 300 228 72 Excellent 45 33 12 0,83664 Fair 255 195 60 0,78713 CREDIT RATING 300 228 72 Nama Atribut Total Label AGE 1 INCOME STUDENT Label No Entropy Gain , , , , , Dari hasil pada Tabel 5.1 dapat diketahui bahwa atribut dengan Gain tertinggi adalah Income, yaitu sebesar 0,11045, maka Income dapat menjadi node akar. Kemudian pada Income High memiliki label Ya, maka Income High menjadi daun atau Leaf. Jika divisualisasikan maka pohon keputusan tampak seperti Gambar 5.1. 58 Gambar 5.1 Pohon Keputusan Node 1 5.2.1.2 Perhitungan Node 1.1 Tabel 5.2 Perhitungan Node 1.1 Node Jumlah Label Kasus Yes 180 120 60 Dewasa 62 44 18 0,86914 Remaja 118 76 42 0,93925 180 120 60 No 36 0 36 0 Yes 144 120 24 0,65002 180 120 60 6 6 0 0 Fair 174 114 60 0,92936 CREDIT RATING 180 120 60 Nama Atribut Income Low AGE Label No Entropy Gain , , 1.1 STUDENT Excellent , , Dari tabel 5.2, nilai Gain tertinggi ada pada atribut Student sebesar 0,39828. Ada dua nilai atribut pada Student, yaitu Yes dan No. Untuk 59 atribut Yes berisikan label Ya sedangkan No berisikan label Tidak. Lihat Gambar 5.2. Gambar 5.2 Pohon Keputusan Node 1.1 5.2.1.3 Perhitungan Node 1.2 Tabel 5.3 Perhitungan Node 1.2 Node Jumlah Label Kasus Yes 99 96 3 Dewasa 15 15 0 0 Remaja 84 81 3 0,22228 99 96 3 No 99 96 3 0,19591 Yes 0 0 0 0 99 96 3 Excellent 18 15 3 0,65002 Fair 81 81 0 0 CREDIT RATING 99 96 3 Nama Atribut Income Medium AGE Label No Entropy Gain , , 1.2 STUDENT , 60 Dari tabel 5.3, nilai Gain tertinggi ada pada atribut Credit Rating sebesar 0,07772. Dan nilai yang akan dijadikan daun atau leaf adalah Fair. Lihat Gambar 5.2. Gambar 5.3 Pohon Keputusan Node 1.2 5.2.1.4 Perhitungan Node 1.2.2 Tabel 5.4 Perhitungan Node 1.2.2 Jumlah Label Kasus Yes Credit Rating Excellent 18 15 3 Dewasa 3 0 3 0 Remaja 15 15 0 0 18 15 3 No 18 15 3 0,65002 Yes 0 0 0 0 18 15 3 Node Nama Atribut 1.2.2 AGE STUDENT Label No Entropy Gain , , 61 Dari hasil Tabel 5.4 dapat diketahui bahwa atribut dengan Gain tertinggi adalah Age sebesar 0,65002. Ada dua nilai atribut pada Age, yaitu Dewasa dan Remaja. Dari kedua nilai atribut tersebut, nilai atribut Dewasa sudah mengklasifikasikan kasus dengan keputusan Tidak dan nilai atribut Remaja sudah mengklasifikasikan kasus dengan keputusan Ya, sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut ini. Lihat Gambar 5.4. Gambar 5.4 Pohon Keputusan Node 1.2.2 BAB VI KESIMPULAN DAN PENELITIAN SELANJUTNYA 6.1 Kesimpulan Algoritma C4.5 dapat diterapkan untuk menentukan perilaku pembelian konsumen yaitu membeli atau tidak membeli dengan menggunakan 300 dataset konsumen. Dalam Penelitian ini menggunakan 5 atribut, antara lain : umur (age), pendapatan (income), pelajar atau tidak pelajar (student), tingkat pinjaman (credit rating), dan hendak membeli atau tidak hendak membeli (buys). Dari hasil perhitungan Node 1 diketahui bahwa atribut dengan Gain tertinggi adalah Income, yaitu sebesar 0,11045. Sehingga Income dapat menjadi node akar. Kemudian pada Income High memiliki label Ya, maka Income High menjadi daun atau Leaf. Disamping itu, berdasarkan perhitungan Node 1.1 nilai Gain tertinggi sebesar 0,39828 terdapat pada atribut Student. Ada dua nilai atribut pada Student, yaitu Yes dan No. Untuk atribut Yes berisikan label Ya sedangkan No berisikan label Tidak. Selain itu, berdasarkan nilai perhitungan Node 1.2 nilai Gain tertinggi terdapat pada atribut Credit Rating sebesar 0,07772. Dan nilai yang akan dijadikan daun atau leaf adalah Fair. Sedangkan berdasarkan hasil perhitungan Node 1.2.2 diketahui bahwa atribut dengan nilai Gain tertinggi sebesar 0,65002 adalah Age. Ada dua nilai atribut pada Age, yaitu Dewasa dan Remaja. Dari kedua nilai atribut tersebut, nilai atribut Dewasa sudah mengklasifikasikan kasus dengan keputusan Tidak dan nilai atribut Remaja sudah mengklasifikasikan kasus dengan keputusan Ya, sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut ini. 62 63 Akhirnya, dari hasil perhitungan diatas dapat digunakan untuk memprediksi perilaku pembelian konsumen. 6.2 Penelitian Selanjutnya Beberapa ide yang dapat digunakan untuk penelitian selanjutnya adalah sebagai berikut: 1. Penelitian selanjutnya dapat dikembangkan pada atribut data yang serupa dengan metode dan akurasi yang lebih baik seperti menggunakan algoritma K-Means ataupun menggunakan metode yang lain sebagai pembanding dari metode Algoritma C4.5. 2. Penelitian selanjutnya dapat dikembangkan berbasis mobile atau android, karena sebagian besar orang menggunakan smartphone terutama android. DAFTAR PUSTAKA [1] Ahmad Saikhu, Joko Lianto, and Umi Hanik, "Fuzzy Decision Tree Dengan Algoritma C4.5 Pada Data Diabetes Indian Pima," in Konferensi Nasional Sistem dan Informatika, Bali, 2011, pp. 297-302. [2] Irma Kharis, Rosa Delima, and Joko Purwadi, "Generator Pohon Keputusan Dengan Menerapkan Algoritma C4.5 Untuk Program Konsultasi," Informatika, vol. 9, no. 1, April 2013. [3] Kumar Nayak Gaurav, Swathi J Narayanan, and Ilango Paramasivam, "Development and Comparative Analysis Of Fuzzy Inference Systems for Predicting Customer Buying Behavior," International Journal of Engineering and Technology (IJET), vol. 5, no. 5, pp. 4093-4108, Oct-Nov 2013. [4] Goldie Gunadi and Dana Indra Sensuse, "Penerapan Metode Data Mining Market Basket Analysis Terhadap Data Penjualan Produk Buku Dengan Menggunakan Algoritma Apriori Dan Frequent Pattern Growth(FPGROWTH)," Jurnal Telematika Mkom, vol. 4, no. 1, pp. 118-132, Maret 2012. [5] Nuqson Masykur Huda, "Aplikasi Data Mining Untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa," Universitas Diponegoro, Semarang, 2010. [6] A.A. Gede Bagus Ariana and I Made Dwi Putra Asana, "Analisis Keranjang Belanja Denagn Algoritma Apriori Pada Perusahaan Retail," in Seminar Nasional Sistem Informasi Indonesia, Bali, 2013, pp. 522-527. [7] Mujib Ridwan, Hadi Suyono, and M Saroso, "Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier," Jurnal EECCIS, vol. 7, no. 1, pp. 59-64, Juni 2013. [8] Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining. Yogyakarta: Andi, 2009. [9] Veronica S Moertini, Benhard Sitohang, and Oerip S Santoso, "Integrasi Algoritma Pohon Keputusan C4.5 Yang Dikembangkan ke Dalam ObjectRelational DBMS," Institut Teknologi Bandung dan Universitas Katolik Parahyangan, Bandung,. 64 65 [10] Daniel T Larose, Discovering Knowledge In Data: An Introduction to Data Mining.: John Wiley & Sons, Inc, 2005. [11] Wikipedia. [Online]. Available: http://id.wikipedia.org/wiki/Konsumen . [Accessed 4 Juni 2014]. [12] Noviantika. Pengertian Perilaku Konsumen Menurut Para Ahli. [Online]. Available: http://www.slideshare.net/noviantika93/pengertian-perilakukonsumen-menurut-para-ahli-27875428 . [Accessed 4 Juni 2014]. [13] Ian Sommervile, Software Engineering, 9th ed. Boston: Pearson Education, 2010. [14] Roger S Pressman, Software Engineering : A Practitioner’s Approach, 7th ed. Boston: Raghothaman Srinivasan, 2009. LAMPIRAN 66