LAPORAN TUGAS AKHIR CLUSTERING DATA STOCK DAN MARKET BASKET ANALYSIS UNTUK PERENCANAAN PENJUALAN BERBASIS K-MEANS DAN FUZZY C-COVERING PADA INSHOFMART Disusun Oleh: Nama : Lina Rudianti NIM : A12.2013.04949 Program Studi : Sistem Informasi - S1 FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG 2017 i LAPORAN TUGAS AKHIR CLUSTERING DATA STOCK DAN MARKET BASKET ANALYSIS UNTUK PERENCANAAN PENJUALAN BERBASIS K-MEANS DAN FUZZY C-COVERING PADA INSHOFMART Laporan ini disusun guna memenuhi salah satu syarat untuk menyelesaikan program studi Sistem Informasi S-1 pada Fakultas Ilmu Komputer Universitas Dian Nuswantoro Disusun Oleh: Nama : Lina Rudianti NIM : A12.2013.04949 Program Studi : Sistem Informasi - S1 HALAMAN JUDUL FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG 2017 ii PERSETUJUAN LAPORAN TUGAS AKHIR NB: Silakan Download HalamaninidariSiadin, Tandatangani, dan Scan, lalusisipkanhasil scan padabagianini iii PENGESAHAN DEWAN PENGUJI NB: Silakan Download HalamaninidariSiadin, Tandatangani, dan Scan, lalusisipkanhasil scan padabagianini iv PERNYATAAN KEASLIAN TUGAS AKHIR NB: Silakan Download HalamaninidariSiadin, Tandatangani, dan Scan, lalusisipkanhasil scan padabagianini v PERNYATAANPERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS NB: Silakan Download HalamaninidariSiadin, Tandatangani, dan Scan, lalusisipkanhasil scan padabagianini vi UCAPAN TERIMAKASIH Dengan memanjatkan puji syukur kehadirat Allah SWT, Tuhan yang Maha Esa, Maha Pengasih dan Maha Penyayang yang melimpahkan begitu tidak terhingga segala rahmat, hidayah, inayah, dan segala kebaikan-Nya kepada penulis sehingga dapat menyelesaikan laporan tugas akhir yang merupakan syarat kelulusan dari perguruan tinggi yang telah penulis tempuh selama 4 (empat) tahun dengan judul “Clustering Data Stock Dan Market Basket Analysis untuk Perencanaan Penjualan Berbasis K-Means dan Fuzzy C-Covering pada InshofMart.” Selain itu penulis juga begitu bersyukur telah dirahmati begitu banyak orang-orang yang senantiasa mendukung penulis dari awal kuliah di Universitas Dian Nuswantoro hingga dalam pembuatan tugas akhir ini. Oleh karena itu penulis menyampaikan terimakasih yang tidak bisa disebutkan satu-persatu, kepada : 1. Dr. Ir. Edi Noersasongko, M.Kom, selaku Bapak Rektor Universitas Dian Nuswantoro Semarang. 2. Dr. Abdul Syukur, selaku Dekan Fasilkom. 3. Affandy, Ph. D, selaku Ketua Progdi Sistem Informasi. 4. Amiq Fahmi, S. Kom., M.Kom., selaku dosen pembimbing tugas akhir yang telah memberi bimbingan, bantuan ide penelitian, dan selalu mengusahakan waktu terbaiknya setiap penulis ingin melakukan bimbingan. 5. Dosen-dosen pengampu di Fakultas Ilmu Komputer, Sistem Informasi – S1, Universitas Dian Nuswantoro yang telah memberikan ilmu dan pengalaman, sehingga penulis dapat mengimplementasikan ilmu yang telah disampaikan. 6. Ibu dan Bapak yang telah mengerahkan segala usaha agar penulis bisa sampai pada tahap ini, juga Kakak yang selalu memberi dukungan dan motivasi, dan kedua keponakan kecil penulis yang selalu ikut menyenangkan hati penulis. 7. Saudara-saudara yang baik hati, yang memberikan izin untuk melakukan penelitian pada InshofMart dan selalu mendukung kebutuhan penulis. vii viii 8. Sahabat-sahabatku (Mekar, Purnamasari, Fathoni, Lanjar, Febri, Kim Nathan, Shellyn Dion, dan lainnya yang tidak dapat disebutkan satu-satu) yang selalu mendukung dan menemani di berbagai situasi selama menempuh pendidikan. Terimakasih sudah mau dan masih terus mau menjadi sahabat penulis. 9. Teman-teman seperjuangan yang telah berbagi suka dan dukanya dalam proses penyusunan tugas akhir ini. 10. Keluarga besar HM SISFO, terutama periode 2013/2014, periode 2014/2015, dan periode 2015/2016. 11. Dan semua pihak yang namanya tidak dapat disebutkan satu per satu oleh penulis yang telah berkontribusi dalam menyusun tugas akhir ini. Semoga Tuhan yang Maha Kuasa senantiasa memberikan balasan yang lebih baik kepada beliau-beliau, dan pada akhirnya penulis berharap bahwa tulisan laporan tugas akhir ini dapat bermanfaat dan berguna sebagaimana fungsinya. Semarang, 22 Juli 2017 Penulis ABSTRAK InshofMart masih menggunakan cara manual dalam menentukan stock produk, dan menggunakan kelompok kategori dalam penataan rak-rak barang. Hal ini menyebabkan ketidaktepatan dalam menentukan stock yang sangat laku, laku, atau kurang laku, sehingga berdampak pada perencanaan stock kurang akurat, dan penataan rak barang kurang efektif bagi para pelanggan. Oleh masalah itu perlu dilakukan clustering item dalam tingkatan tertentu, juga mengasosiasikan antara suatu item dengan item lainnya sesuai keakuratan yang terukur, sehingga kegiatan penjualan lebih terencana dengan mengacu pada hasil perhitungan data-data yang lebih mengarah pada fakta dari lapangan. Dengan clustering yang lebih tepat menggunakan algoritma k-means dan market basket analysis dengan algoritma fuzzy c-covering. Clustering menghasilkan output tentang perencanaan stock produk di mana dari penelitian ditentukan 3 cluster dengan hasil 7 produk sangat laku, 28 produk laku, dan 15 produk kurang laku berdasarkan jarak antara data ke pusat cluster-nya. Sedangkan market basket analysis dari 96 data sample transaksi yang mempunyai minimal_support dan minimal_confidence memenuhi syarat yaitu terdapat 8 interesting association rule antara 2 produk (k item-2). Kata kunci : Clustering, Market Basket Analysis, K-Means, Fuzzy C-Covering xvii + 111 halaman; 27 gambar; 27 tabel; 8 lampiran Daftar Acuan: 5 (2012 – 2016) ix DAFTAR ISI Halaman Judul ........................................................................................................ ii Persetujuan Laporan Tugas Akhir ......................................................................... iii Pengesahan Dewan Penguji ................................................................................... iv Pernyataan Keaslian Tugas Akhir ........................................................................... v PernyataanPersetujuan Publikasi Karya Ilmiah Untuk Kepentingan Akademis ... vi Ucapan Terimakasih ............................................................................................. vii Abstrak ................................................................................................................... ix Daftar Isi ................................................................................................................. x Daftar Gambar...................................................................................................... xiii Daftar Tabel .......................................................................................................... xv Daftar Lampiran .................................................................................................. xvii Bab 1 Pendahuluan ................................................................................................. 1 1.1 Latar Belakang Masalah ........................................................................... 1 1.2 Rumusan Masalah .................................................................................... 4 1.3 Batasan Masalah ....................................................................................... 4 1.4 Tujuan Penelitian...................................................................................... 5 1.5 Manfaat Penelitian.................................................................................... 5 Bab 2 TINJAUAN PUSTAKA ............................................................................... 6 2.1 Tinjauan Pustaka ...................................................................................... 6 2.2 Data Mining ............................................................................................. 9 2.2.1 Konsep Data Mining ......................................................................... 9 2.2.2 Konsep Clustering .......................................................................... 11 2.2.3 Konsep Market Basket Analysis...................................................... 13 2.3 Algoritma K-Means ................................................................................ 14 2.3.1 Konsep K-Means ............................................................................ 14 2.3.2 Proses Algoritma K-Means ............................................................. 16 x xi 2.4 Algoritma Fuzzy C-Covering ................................................................. 17 2.4.1 Konsep Fuzzy C-Covering .............................................................. 17 2.4.2 Proses Algoritma Fuzzy C-Covering .............................................. 18 2.5 CRISP-DM (Cross Industry Standard Process For Data Mining) ........ 20 2.5.1 Tentang CRISP-DM ........................................................................ 20 2.5.2 Proses CRISP-DM .......................................................................... 21 2.6 Aplikasi Pendukung Pemodelan............................................................. 23 2.6.1 RapidMiner Versi 5.3.015............................................................... 23 2.6.2 Microsoft Visual Basic Versi 6.0 .................................................... 23 Bab 3 METODE PENELITIAN ........................................................................... 24 3.1 Metode Pengumpulan Data .................................................................... 24 3.2 Metode Analisis...................................................................................... 27 3.2.1 CRISP-DM (Cross Industry Standard Process For Data Mining). 27 3.2.2 Metode Clustering Menggunakan K-Means ................................... 28 3.2.3 Metode Market Basket Analysis Menggunakan Fuzzy C-Covering 29 Bab 4 HASIL DAN PEMBAHASAN .................................................................. 31 4.1 Hasil Penelitian ...................................................................................... 31 4.1.1 Business Understanding.................................................................. 31 4.1.2 Data Understanding........................................................................ 33 4.1.3 Data Preparation ............................................................................ 36 4.1.4 Modelling ........................................................................................ 40 4.2 Analisa Model dengan Aplikasi Pendukung .......................................... 75 4.2.1 Perhitungan K-Means dengan Bantuan RapidMiner Versi 5.3.015 75 4.2.2 Perhitungan Fuzzy C-Covering dengan Implementasi Algoritma ke dalam Aplikasi Microsoft Visual Basic 6.0................................................... 79 4.3 Pembahasan Hasil Penelitian ................................................................. 82 xii 4.3.1 Pembahasan Hasil Clustering Berbasis K-Means ........................... 82 4.3.2 Pembahasan Hasil Market Basket Analysis Berbasis Fuzzy C- Covering ........................................................................................................ 85 Bab 5 PENUTUP .................................................................................................. 88 5.1 Simpulan................................................................................................. 88 5.2 Saran ....................................................................................................... 89 DAFTAR PUSTAKA ........................................................................................... 90 LAMPIRAN .......................................................................................................... 92 DAFTAR GAMBAR Gambar 2.1 Proses Diagram CRISP-DM ............................................................. 21 Gambar 4.1 Atribut Tabel Data Stock ................................................................... 34 Gambar 4.2 Atribut Tabel Data Transaksi ............................................................ 35 Gambar 4.3 Nilai Data Pada Tabel Data Stock ..................................................... 35 Gambar 4.4 Nilai Data Pada Tabel Data Transaksi .............................................. 35 Gambar 4.5 Item tanpa Kode Produksi ................................................................. 36 Gambar 4.6 Tidak Adanya Kode Transaksi .......................................................... 36 Gambar 4.7 Mencari Total Transaksi dan Volume Jual ....................................... 37 Gambar 4.8 Integrasi Atribut Jumlah Transaksi, Volume Jual, Rataan Jual ........ 38 Gambar 4.9 Penambahan Atribut Kode Produksi ................................................. 38 Gambar 4.10 Penambahan Atribut Kode Transaksi.............................................. 39 Gambar 4.11 Format Tabel Data Stock ................................................................. 39 Gambar 4.12 Format Tabel Data Transaksi .......................................................... 39 Gambar 4.13 Data Set Clustering pada RapidMiner ............................................ 75 Gambar 4.14 Pemodelan Algoritma K-Means ...................................................... 76 Gambar 4.15 Halaman Main Process Clustering ................................................. 76 Gambar 4.16 Tabel Data Hasil Proses Clustering ................................................ 77 Gambar 4.17 Cluster Model pada RapidMiner ..................................................... 77 Gambar 4.18 Titik Pusat Cluster yang Terbentuk ................................................ 78 Gambar 4.19 Plot View Hasil Clustering .............................................................. 78 Gambar 4.20 Halaman Utama / Menu Aplikasi Fuzzy C-Covering ..................... 79 Gambar 4.21 Halaman Input Data Transaksi ........................................................ 80 xiii xiv Gambar 4.22 Data Transaksi yang Berhasil Diinput ............................................ 80 Gambar 4.23 Halaman Tabel Master Produk........................................................ 81 Gambar 4.24 Halaman Tabel Hasil Proses ........................................................... 81 Gambar 4.25 Denah Rak-rak Barang Sebelum Rekomendasi .............................. 86 Gambar 4.26 Rekomendasi Denah Rak-rak Barang ............................................. 87 DAFTAR TABEL Tabel 2.1 Penelitian Terkait .................................................................................... 8 Tabel 3.1 Sampel Data Pada Tabel Stock ............................................................. 26 Tabel 3.2 Sampel Data Pada Tabel Transaksi....................................................... 26 Tabel 4.1 Entitas (Kategori Produk) Pada Tabel Data Stock ................................ 34 Tabel 4.2 Data Sampel Perhitungan K-Means Manual pada Iterasi ke-1 ............. 40 Tabel 4.3 Titik Pusat Cluster (Centroid) .............................................................. 42 Tabel 4.4 Hasil Perhitungan K-Means pada Iterasi ke-1 ...................................... 46 Tabel 4.5 Titik Pusat Cluster Baru dari Iterasi ke-1 ............................................. 50 Tabel 4.6 Hasil Perhitungan K-Means pada Iterasi ke-2 ...................................... 53 Tabel 4.7 Titik Pusat Cluster Baru dari Iterasi ke-2 ............................................. 56 Tabel 4.8 Hasil Perhitungan K-Means pada Iterasi ke-4 ...................................... 57 Tabel 4.9 Titik Pusat Cluster Akhir pada Iterasi ke-4 .......................................... 58 Tabel 4.10 Nilai Terbesar (Himpunan Sangat Laku) pada Cluster 2................... 59 Tabel 4.11 Nilai Sedang (Himpunan Laku) pada Cluster 1.................................. 59 Tabel 4.12 Nilai Paling Kecil (Himpunan Kurang Laku) pada Cluster 0............. 60 Tabel 4.13 Data Sampel Perhitungan Fuzzy C-Covering secara Manual ............. 61 Tabel 4.14 Tabel Data yang Masuk QT (Qualified Transaction) ......................... 63 Tabel 4.15 Tabel Hasil Perhitungan Mencari Minimum_ Support_1 ................... 67 Tabel 4.16 Tabel Item yang memenuhi minimum_ support_1.............................. 68 Tabel 4.17 Tabel Item yang akan Dicari Minimum_ Support_2 ........................... 69 Tabel 4.18 Tabel Hasil Perhitungan Mencari Minimum_ Support_2 ................... 70 Tabel 4.19 Tabel Item yang Dicari Confidence-nya ............................................. 71 xv xvi Tabel 4.20 Tabel Item yang Memenuhi Confidence ............................................. 74 Tabel 4.21 Nilai Terbesar (Himpunan Sangat Laku) pada Cluster 2................... 82 Tabel 4.22 Nilai Sedang (Himpunan Laku) pada Cluster 1.................................. 82 Tabel 4.23 Nilai Paling Kecil (Himpunan Kurang Laku) pada Cluster 0............. 83 Tabel 4.24 Tabel Item yang Memenuhi Confidence ............................................. 85 DAFTAR LAMPIRAN Lampiran 1. Surat Ijin Penelitian Survey .............................................................. 92 Lampiran 2. Surat Keterangan .............................................................................. 93 Lampiran 3. Tabel Data Stock ............................................................................... 94 Lampiran 4. Tabel Data Transaksi ........................................................................ 99 Lampiran 5. Lampiran Total Data Kategori Produk ........................................... 108 Lampiran 6. Lampiran Total Data Nama Produk ............................................... 109 Lampiran 7. Lampiran Total Data Tanggal (Jumlah) terjadi Transaksi ............. 110 Lampiran 8. Lampiran Total Data Nama Produk dari Semua Transaksi ............ 111 xvii BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Menurut analisa dari Ketua Umum Asosiasi Pengusaha Ritel Indonesia (Aprindo), menyatakan total penjualan ritel tahun 2015 sebesar Rp 181 triliun dan meningkat tahun 2016 menembus Rp 200 triliun [1]. Dan diprediksi pada tahun 2017, penjualan sektor ritel akan melebihi tahun 2016. Hal ini memicu beberapa pelaku bisnis ingin menanamkan modal di bidang ritel yang terlihat berkembang pesat dan menimbulkan asumsi menghasilkan banyak untung. Jumlah gerai minimarket menurut Badan Pusat Statistik (BPS), tahun 2014 berjumlah 11.468 toko. Indomaret saja di awal 2016 sudah 12.100 gerai sedangkan alfamart 11.115 gerai / Juni 2016 [2]. Itu belum yang di luar bisnis waralaba. Hal tersebut seperti membuktikan bahwa ritel memang bisnis yang sangat menjanjikan, meski tidak semuanya sukses. Ada yang gulung tikar karena tidak mampu bersaing, terutama yang tidak memperhatikan kelola toko. InshofMart merupakan minimarket beralamatkan di desa Plesungan, Gondangrejo, Kota Karanganyar. Dari segi lokasi, InshofMart terletak di wilayah yang bagus untuk mendirikan minimarket. Meski perkampungan, tapi peradaban di wilayah tersebut akan terus berkembang. Pertama, InshofMart adalah minimarket kerja sama dengan pondok pesantren yang semakin tahun santri-santrinya bertambah. Kedua, pondok pesantren tersebut rutin mengadakan event-event akbar tiap bulan, bahkan bisa 2 kali dalam satu bulan. Dan tamu-tamu yang hadir, datang dari berbagai wilayah bahkan luar provinsi Jawa Tengah, yang bisa mencapai ribuan tamu. Sehingga tamu-tamu tersebut merupakan target InshofMart juga. Ketiga, pengusaha property ada yang beberapa telah menyelesaikan dan ada yang dalam tahap pembangunan perumahan di sekitarnya. Hal ini turut menjadi pendukung semakin meningkatnya pangsa pasar InshofMart. Dan yang terakhir juga paling penting, InshofMart belum mempunyai saingan ampuh sekelas Indomaret atau 1 2 alfamart karena kedua minimarket kelas atas itu belum ada tanda-tanda masuk ke wilayah tersebut, meski suatu saat bisa saja terjadi. Karena dilihat dari regulasi pemerintah Kota Karanganyar yang mengizinkan adanya minimarket modern berdiri di wilayahnya, meski hal itu dibatasi dan dengan syarat-syarat tertentu. Saat ini InshofMart bisa bersantai karena belum punya saingan, namun lebih baik bersiap menghadapi kemungkinan tersebut. Dibutuhkan beberapa hal agar dapat mengoptimalkan penjualan, yang itu perlu dilakukan mulai saat ini sebelum para pesaing berdatangan. Menurut sebuah postingan website menjelaskan ada 5 kunci sukses dalam bisnis minimarket yang salah satunya adalah penggunaan teknologi sehingga mampu membantu menyelesaikan masalah [3]. Penggunaan teknologi di InshofMart sebenarnya bagus, dengan sistem informasi minimarket yang memuat tabel-tabel seperti tabel pengendalian stock dan tabel transaksi yang mana paling diperhatikan dalam penelitian kali ini karena data-data tersebut dapat diolah. Dan saat ini, InshofMart belum tahu jika data tersebut ternyata dapat diolah untuk tujuan bermanfaat. Seperti tabel pengendalian stock hanya untuk mengetahui stock barang habis dan jumlah terjual tanpa tahu item-item yang berpotensi laku. Sehingga jika stock habis, pegawai memesan sejumlah barang sesuai instinct tanpa analisa apakah jika dibeli sedikit cepat habis (akan membuang kesempatan untung jika ada pembeli tapi stock habis) atau jika dibeli banyak, barang kurang laku mengakibatkan biaya simpan tinggi. Belum lagi jika barang tidak tahan lama atau cepat kadaluwarsa. Kemudian untuk tabel transaksi saat ini hanya untuk mengetahui berapa kali transaksi dilakukan. Padahal data-data yang terlihat tidak ada artinya (hanya deret item terjual dan total terbeli). Untuk menangani masalah perencanaan penjualan pada InshofMart, perlu metode yang bisa meng-cluster tabel stock penjualan dan market basket analysis tabel transaksi, sehingga diketahui item-item apa yang sering dibeli bersamaan. Dalam menyelesaikan masalah tersebut khususnya clustering, ada banyak algoritma yang dapat digunakan seperti yang berlogika fuzzy atau crisp. Tapi dalam penelitian ini akan digunakan logika crisp yang hasil cluster-nya lebih tegas dari pada logika fuzzy, karena dalam menemukan hasil clustering untuk InshofMart dibutuhkan 3 konsep clustering yang tegas yang hanya menghasilkan 2 kemungkinan keluaran yaitu tidak atau iya. Berbeda dengan logika fuzzy yang keluarannya kurang tegas dan memungkinkan sebuah item masuk ke 2 himpunan, yaitu ke himpunan sangat laku atau laku, dan laku atau kurang laku. Tergantung besar nilai keanggotaannya, lebih berat ke mana. Hal ini mengakibatkan kebingungan akan masuk ke dalam kategori apa suatu produk, apalagi data-data penjualan yang dimiliki InshofMart hampir sama jumlah-jumlahnya. Sehingga jika ada 2 data dengan total penjualan yang sama, satunya dapat masuk ke himpunan laku dan satunya kurang laku atau sebagainya yang membuat justru kurang konsistennya hasil clustering. Maka dari itu untuk clustering, dalam kasus ini akan diselesaikan menggunakan k-means. Kemudian untuk association rule diselesaikan dengan algoritma fuzzy c-covering. Sebenarnya yang sering digunakan adalah apriori, namun boros memori dan butuh banyak waktu scanning data. Ini karena apriori melakukan scanning database tiap iterasi, sedangkan iterasinya tidak cukup sekali dua kali. Kelemahan lain, cenderung fokus pada hubungan antar item tanpa pertimbangan hubungan setiap item di setiap transaksi. Misal mencari relasi antara kopi dan roti, apriori hanya menghitung berapa kali kedua item muncul dari seluruh transaksi yang ada. Padahal meski keduanya banyak dibeli, tapi sebenarnya dipicu item lain. Misalnya pembelian kopi dipicu pembelian rokok, sehingga hasil kurang akurat. Untuk itu diajukan fuzzy c-covering, untuk memperbaiki kekurangan apriori. Proses awal fuzzy c-covering adalah menentukan max_item_threshold, sehingga jumlah item melebihi max_item_threshold tidak perlu ikut di proses berikutnya. Dengan proses tersebut, waktu eksekusi lebih cepat dan mengurangi pemborosan memori. Sehingga seperti yang sudah dijelaskan tentang masalah InshofMart yang belum mengoptimalkan pengelolaan data-data mereka menjadi sebuah pengetahuan yang berarti, yang masalah tersebut dapat berakibat pada kurang optimalnya penjualan. Untuk itu dilakukan penelitian yang bertujuan membantu InshofMart menemukan formula yang sesuai, untuk menghasilkan pengetahuan berarti yang bermanfaat sebagai strategi bisnis baru terutama dalam pengelolaan stock dan penataan rakrak barang sehingga mampu membantu perencanaan penjualan pada InshofMart. 4 1.2 Rumusan Masalah Berdasar dari latar belakang masalah sesuai penjelasan sebelumnya maka dapat dirumuskan berbagai masalah yang akan dibahas, diantaranya yaitu : 1. Bagaimana algoritma untuk meng-cluster item apa saja pada tabel data stock yang masuk dalam himpunan sangat laku, laku, dan kurang laku dan dalam melakukan penelitian ini akan menggunakan algoritma k-means. 2. Bagaimana algoritma untuk market basket analysis antar item pada tabel data transaksi yang menghasilkan nilai aosisasi paling tinggi dan dalam penelitian ini akan digunakan algoritma fuzzy c-covering. 1.3 Batasan Masalah Agar pembahasan masalah yang dilakukan tidak meluas sehingga menimbulkan ketidakfokusan materi, maka penulis menentukan batasan-batasan masalah yaitu : 1. Data-data yang diolah untuk proses clustering dan market basket analysis merupakan data-data pengendalian stock barang dan transaksi mulai tanggal 01 November 2016 s/d 31 Maret 2017 (studi kasus Minimarket InshofMart Dukuh Sulurejo, Plesungan, Kecamatan Gondangrejo, Kota Karanganyar). 2. Dalam melakukan proses clustering digunakan algoritma k-means yang akan mengelompokkan item-item menjadi 3 (tiga) cluster, yang akan menghasilkan kriteria antara sangat laku, laku, atau kurang laku. Sedangkan untuk proses market basket analysis akan digunakan algoritma fuzzy c-covering. 3. Metodologi yang digunakan di dalam menyusun fase pengolahan data mining adalah CRISP-DM (Cross Industry Standard Process For Data Mining), dan hanya beberapa sub-sub fasenya yang dilakukan analisa. 4. Pengujian clustering menggunakan algoritma k-means akan didukung dengan bantuan aplikasi yang sudah ada yaitu RapidMiner versi 5.3.015. 5. Pengujian market basket analysis menggunakan algoritma fuzzy c-covering akan didukung dengan bantuan rancangan aplikasi sederhana menggunakan Microsoft Visual Basic versi 6.0. 5 1.4 Tujuan Penelitian Berdasar pada rumusan masalah sesuai penjelasan pada poin sebelumnya, didapat tujuan penelitian ini diantaranya yaitu : 1. Penerapan algoritma k-means yang bertujuan membantu InshofMart dalam penentuan jumlah stock barang dengan mengelompokkan item apa saja yang masuk ke dalam himpunan sangat laku, laku, atau kurang laku. 2. Penerapan algoritma fuzzy c-covering yang bertujuan untuk membantu InshofMart menemukan pola association rule antar item barang sehingga hasilnya dapat digunakan untuk perencanaan penataan rak-rak barang. 1.5 Manfaat Penelitian Harapan penulis bahwa penelitian yang dilakukan ini berguna, tidak hanya bagi InshofMart selaku objek penelitian tetapi siapa pun yang ingin memanfaatkan penelitian ini untuk kepentingan yang bermanfaat. Berikut manfaat penelitian : 1. Diharapkan algoritma k-means berguna untuk menyelesaikan berbagai masalah clustering di berbagai bidang kehidupan. Terutama pada penelitian ini, dapat membantu InshofMart dalam menentukan stock item-item dengan mengelompokkan ke dalam himpunan sangat laku, laku, atau kurang laku. 2. Diharap algoritma fuzzy c-covering berguna untuk menyelesaikan berbagai masalah association rule di berbagai bidang kehidupan. Terutama penelitian ini, dapat membantu InshofMart menemukan pola association rule antar itemitem sehingga dapat digunakan untuk perencanaan penataan rak-rak. BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Penelitian terkait data mining untuk clustering maupun market basket analysis sudah banyak dilakukan sebelumnya oleh beberapa peneliti dari berbagai instansi, terutama yang berobjek di minimarket dan menggunakan metode k-means untuk clustering stock barang dan metode fuzzy c-covering untuk market basket analysis. Berikut ini adalah beberapa penelitian yang menggunakan metode k-means untuk clustering dan fuzzy c-covering untuk market basket analysis : 1. Penelitian yang dilakukan tahun 2012 oleh Zahedi dan juga Charies Chandra, yang berjudul “Perancangan Program Aplikasi Market Basket Analysis Untuk Mendukung Persediaan Barang Dengan Metode Fuzzy C-Covering.” Pada penelitian tersebut, para peneliti mengusung masalah tentang sulitnya menganalisa data transaksi penjualan karena jumlah datanya banyak dan alat pengolah data terbatas yang menyulitkan memperkirakan persediaan barang untuk penjualan berikutnya. Untuk itu dirancangkan aplikasi market basket analysis berbasis fuzzy c-covering. Nilai support dan confidence merupakan bagian perhitungan dengan fuzzy c-covering. Semakin besar tingkat batasan, output dari analisis pun semakin terseleksi [4]. 2. Penelitian yang dilakukan pada tahun 2016 oleh Nita Arianty, Oni Soesanto, dan Fatma Indriani, berjudul “Penerapan Metode Fuzzy c-Covering Untuk Analisis Pola Pembelian Pada Minimarket.” Pada penelitian tersebut, peneliti mengusung masalah tentang proses data mining pada analisa pola pembelian di minimarket berbasis fuzzy c-covering untuk mencari nilai support dan nilai confidence. Metode fuzzy c-covering ini akan mengklasifikasi elemen-elemen himpunan universal yakni keseluruhan item pada minimarket menjadi partisi-partisi yang lebih fokus dan detail berdasarkan jenis produk item apa saja yang ada. Karena itu fuzzy c-covering 6 7 diterapkan agar dapat mengatasi hambatan yang selama ini terjadi pada proses market basket di dalam mencari hubungan antar item [5]. 3. Penelitian yang dilakukan pada tahun 2015 oleh Benri Melpa Metisen dan Herlina Latipa Sari, berjudul “Analisis Clustering Menggunakan Metode KMeans Dalam Pengelompokkan Penjualan Produk Pada Swalayan Fadhila.” Pada penelitian tersebut, para peneliti mengusung masalah tentang swalayan Fadhila yang bisnisnya masih dengan cara manual sehingga sering terjadi kesalahan pencatatan data. Selain itu juga tidak dapat mengelompokkan produk antara yang laris atau kurang laku, sehingga sulit menentukan stock. Untuk itu dibutuhkan sistem clustering yang mana menggunakan algoritma kmeans agar dapat menunjang kebutuhan bisnis dari proses tersebut [6]. 4. Penelitian yang masuk di dalam sebuah proceedings Seminar Nasional Riset Ilmu Komputer Universitas Muslim Indonesia Makassar tahun 2016, dengan peneliti Warnia Nengsih berjudul “Descriptive Modelling Menggunakan KMeans untuk Pengclusteran Tingkat Kemiskinan di Propinsi Riau.” Penelitian tersebut membahas tentang kemiskinan Propinsi Riau yang terus meningkat sehingga perlu ditangani oleh pemerintah. Namun karena adanya persebaran daerah tingkat keparahan kemiskinan sangat beragam, sehingga terjadi kesulitan menentukan wilayah mana yang kemiskinan paling tinggi. Untuk itu diperlukan metode k-means yang mampu meng-cluster wilayahwilayah tersebut masuk ke dalam tingkat kemiskinan yang mana [7]. 5. Penelitian yang dilakukan pada tahun 2015 oleh Elly Muningsih dan Sri Kiswati, berjudul “Penerapan Metode K-Means untuk Clustering Produk Online Shop dalam Penentuan Stok Barang.” Penelitian tersebut, para peneliti mengusung masalah tentang bagaimana permintaan konsumen yang fluktuatif sehingga persediaan stock yang tidak stabil. Pada online shop tersebut ada beberapa kesulitan yang dialami seperti menentukan stock minimun tiap barang, yang harus dipenuhi sesuai minat konsumen. Untuk menangani masalah tersebut, diperlukan sebuah metode yang dapat mengelompokkan tingkat stock barang yang banyak, sedang, atau sedikit menggunakan algoritma k-means clustering [8]. 8 Tabel 2.1 Penelitian Terkait No Nama Peneliti dan Tahun Masalah Metode Hasil 1. - Zahedi Menganalisa data transaksi Fuzzy C- Program aplikasi yang - Charies penjualan yang banyak dan Covering digunakan perusahaan Chandra alat pengolah data terbatas melakukan analisa data (Tahun 2012) sehingga menyulitkan guna memperkirakan memperkirakan persediaan persediaan barang untuk barang dijual berikutnya. masa mendatang [4]. 2. - Nita Arianty Klasifikasi elemen dari Fuzzy C- Dari data sampel, nilai - Oni Soesanto himpunan keseluruhan item Covering confidence paling tinggi - Fatma Indriani menjadi partisi yang lebih adalah “jika peralatan (Tahun 2016) fokus, detail berdasar jenis bayi maka susu” (support item agar mengatasi proses = 1,13181% dan market basket di dalam confidence = mencari asosiasi antar item. 38,70967%) [5]. 3. - Benri Melpa Analisa data clustering Metisen produk untuk mengatasi 2 jenis kelompok data, kesulitan penentuan tingkat yaitu dengan penjualan Sari stock barang, sekaligus rendah dan tinggi. (Tahun 2015) merancang sistem aplikasi Sehingga diketahu mana pendukung clustering-nya. produk laris / tidak [6]. - Herlina Latipa K-Means Dari data sampel didapat 4. - Warnia Nengsih Analisa wilayah persebaran K-Means Dari 12 kecamatan yang (Tahun 2016) tingkat kemiskinan yang di-cluster, didapatkan 3 terjadi di Propinsi Riau kelompok cluster dimana yang sangat beragam, perlu cluster 2 terdapat ada 2 dilakukan clustering untuk record, cluster 3 ada 10 mengetahui tingkatannya. record, sedang cluster 1 tidak ada record [7]. 9 Nama Peneliti No Masalah dan Tahun Metode Hasil 5. - Elly Muningsih Terjadinya kesulitan online K-Means Rancangan aplikasi yang - Sri Kiswati (Tahun 2015) shop dalam menentukan dapat mengelompokkan stock minimum tiap barang produk menjadi 3 cluter sesuai minat konsumen, dengan kategori stock sehingga sering terjadinya banyak, sedang, dan kesalahan perkiraan atau sedikit berdasarkan pada stock yang tidak akurat. transaksi penjualan [8]. Dari beberapa penelitian yang sudah dicantumkan di atas, dapat diketahui bahwa penggunaan algoritma k-means dapat memudahkan dalam melakukan clustering terhadap ribuan bahkan jutaan data sehingga diperoleh informasi yang mulanya tidak nampak menjadi nampak yang dapat digunakan untuk menindaklanjuti suatu penyelesaian masalah. Sedangkan untuk penggunaan algoritma fuzzy c-covering dapat memudahkan dalam mencari association rule antar item, mana item paling sering keluar secara bersamaan di suatu transaksi dari banyaknya transaksi yang pernah terjadi atau sering dikenal dengan analisa keranjang belanja. 2.2 2.2.1 Data Mining Konsep Data Mining Ada banyak buku membahas tentang data mining, dan setiap penulis mempunyai definisinya masing-masing. Seperti buku yang ditulis oleh Gordon S. Linoff dan Michael J. A. Berry berjudul “Data Mining Techniques For Marketing, Sales, and Customer Relationship Management”, mendefinisikan tentang data mining adalah sebuah proses bisnis untuk mengeksplorasi data-data yang berjumlah besar untuk menemukan pola dan kaidah berarti [9]. Definisi lain tentang data mining dalam buku yang ditulis oleh Charu C. Aggarwal berjudul “Data Mining The Textbook”, mendefinisikan bahwa data mining merupakan pembelajaran dari mengoleksi, membersihkan, menganalisa, dan memperoleh beberapa pengetahuan yang sangat 10 berguna dari data [10]. Sedangkan definisi menurut Ian H. Witten dan kawankawan dalam bukunya yang berjudul “Data Mining Practical Machine Learning Tools and Techniques”, mendefinisikan data mining adalah kegiatan menemukan pola-pola dari banyak data. Proses harus otomatis atau semiotomatis. Pola yang ditemukan harus berarti karena menghasilkan beberapa keuntungan [11]. Dilihat dari beberapa definisi tentang data mining yang telah dijelaskan oleh para penulis dalam buku-buku mereka, sebenarnya mempunyai maksud sama. Bahwa data mining merupakan proses mengeksplorasi data berjumlah besar untuk dicari pola-polanya sehingga menjadi pengetahuan yang mempunyai arti dan berguna. Secara garis besarnya tentang metode, data mining dibedakan dalam 2 pendekatan diantaranya Supervised Learning yaitu metode yang mencoba mencari hubungan antara atribut yang bervariable bebas dan sebuah atribut bervariabel tidak bebas. Hubungan dapat ditemukan dan diwakili dalam struktur yang disebut model. Biasanya model menjelaskan fenomena tersembunyi dalam dataset dan digunakan untuk memprediksi nilai atribut target hanya dengan mengetahui nilai-nilai atribut input [12]. Sedangkan Unsupervised Learning yaitu kebalikan dari supervised learning, di mana label masing-masing data pelatihan tidak diketahui sebelumnya. Berdasarkan pada tugas yang dapat dilakukan oleh data mining untuk mencari pola-pola data, dibedakan menjadi beberapa kelompok yaitu [13] : 1. Description, merupakan penggambaran pola dan kecenderungan yang ada di dalam data secara sederhana. Deskripsi tersebut sering memberi kemungkinan penggambaran untuk sebuah pola atau kecenderungan. 2. Classification, teknik memperhatikan tingkah laku dan atribut himpunan yang sudah didefinisikan. Teknik ini memberi klasifikasi untuk data baru dengan manipulasi data yang telah terklasifikasi dan output-nya berguna memberikan sejumlah aturan. Dalam kasusnya, klasifikasi merupakan supervised learning. 3. Prediction, hampir sama seperti klasifikasi dan estimasi. Namun nilai output prediksi akan adanya di masa mendatang. Beberapa teknik untuk klasifikasi juga estimasi bisa digunakan (dalam keadaan tepat) di dalam prediksi. Dalam kasusnya, prediksi merupakan supervised learning. 11 4. Estimation, hampir mirip klasifikasi. Namun variabel targetnya lebih bersifat numerik daripada kategori. Model dibangun berdasarkan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Dalam kasusnya, estimasi merupakan supervised learning. 5. Clustering, adalah pengelompokan record atau pengamatan juga menciptakan kelas objek-objek yang ada kemiripan antara satu dengan lain dan memiliki ketidakmiripan dengan record dari cluster lain. Pada kasusnya, clustering merupakan unsupervised learning. 6. Association Rule, tugas asosiasi yang disebut juga “market basket analysis” adalah mencari relasi antara himpunan item dan menemukan atribut yang sering muncul dalam satu waktu dari banyak waktu yang pernah terjadi. Dalam kasusnya, asosiasi menggunakan metode unsupervised learning. 2.2.2 Konsep Clustering Clustering merupakan proses melakukan partisi atau pemisahan satu set item data ke himpunan bagian yang disebut cluster. Item yang dalam cluster-nya memiliki karakteristik hampir sama antara satu dengan yang lain dan akan berbeda dengan item dalam cluster lain. Partisi tidak dilakukan secara manual karena pasti akan sulit mengingat banyaknya data yang akan dipartisi, sehingga dibutuhkan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna terlebih dalam menemukan kelompok yang tidak dikenal dalam data. Di bussniness inteligence khususnya minimarket, clustering membantu mengatur banyaknya item barang yang dijual menjadi beberapa kelompok. Contoh mengelompokkan item barang dalam beberapa cluster dengan kesamaan karakteristik seperti item barang mana yang kurang laku, laku, atau sangat laku. Clustering juga dikenal sebagai data segmentasi karena mempartisi banyak data ke banyak grup berdasar kesamaan. Berikut beberapa manfaat yang diberikan oleh proses clustering [14] : 1. Clustering adalah metode segmentasi data yang berguna dalam memprediksi dan menganalisa masalah bisnis tertentu, misalnya segmentasi pasar 2. Identifikasi objek dalam berbagai bidang penelitian seperti computer vision dan image processing. 12 Sebetulnya ada beberapa tipe clustering yang dapat digunakan dalam melakukan pengelompokkan data sesuai kebutuhan dan tujuan, berikut tipe-tipe clustering : 1. Partitioning algorithms, merupakan algoritma yang cara kerjanya membentuk berbagai macam partisi lalu mengevaluasinya berdasarkan kriteria tertentu. 2. Hierarchial algorithms, merupakan algoritma yang membentuk dekomposisi hirarki dari sekumpulan data menggunakan beberapa kriteria. 3. Density based, merupakan algoritma yang membentuk cluster berdasar pada koneksi dan fungsi densitas. 4. Grid-based, membentuk cluster berdasar struktur multiple level granularity. 5. Model-based, menganggap jika sebuah model adalah hipotesa untuk masingmasing cluster dan model yang baik dipilih diantara model hipotesa tersebut. Dalam melakukan proses clustering pun ada syarat-syaratnya sekaligus tantangan yang harus dipenuhi oleh suatu algoritma clustering, menurut Jiawei Han dan Micheline Kamber di dalam bukunya yang berjudul “Data Mining Concepts And Techniques” yang dijelaskan sebagai berikut [15] : 1. Skalabilitas, yang artinya mengharuskan bahwa suatu metode clustering harus mampu menangani data dalam jumlah yang besar bahkan sampai jutaan data. 2. Kemampuan analisa beragam bentuk data, yang artinya algoritma clustering harus mampu diimplementasikan ke berbagai macam bentuk data seperti data nominal, ordinal maupun gabungannya. 3. Menemukan cluster dengan bentuk-bentuk yang tidak terduga, artinya hasil dari clustering dapat berbentuk aneh dan tidak sama antara satu data dengan lainnya. Karena itu butuh kemampuan analisa cluster dengan bentuk apapun pada suatu algoritma clustering. 4. Kemampuan untuk dapat menangani noise, yang artinya data itu tidak selalu dalam keadaan baik. Terkadang ada data rusak, tidak dimengerti, atau hilang. Karena itu, algoritma clustering harus mampu menangani data yang rusak. 5. Sensitifitas pada perubahan input, artinya perubahan input data menyebabkan perubahan cluster yang ada bahkan menyebabkan perubahan mencolok jika menggunakan algoritma clustering yang memiliki tingkat sensitifitas rendah. 13 6. Mampu meng-clustering data-data berdimensi tinggi, artinya suatu kelompok data dapat berisi banyak dimensi atau atribut. Untuk itu algoritma clustering harus mampu menangani data berdimensi tinggi tersebut. 7. Interpresasi dan kegunaan, artinya mengharuskan bahwa hasil dari proses clustering dapat diinterpretasikan dan juga berguna. 2.2.3 Konsep Market Basket Analysis Association rule merupakan bentuk dari suatu formula jika “kejadian sebelumnya” kemudian “konsekuensinya” (IF antecedent, THEN consequent). Association rule terkenal karena aplikasi analisa keranjang belanja, sehingga sering disebut market basket analysis. Tugas association rule adalah mencari pola dari banyak data yang ada yang mempunyai pola asosiasi antara dua atau lebih item. Dalam association rule, terdapat ukuran keterkaitan yang didapat dari mengolah data menggunakan proses hitung tertentu. Secara umum ada 2 ukuran tersebut, diantaranya : 1. Support, ukuran yang mempresentasikan besaran tingkat dominasi item atau itemset dari seluruh transaksi untuk memutuskan apakah item itu layak dicari confidence-nya (misalnya dari kesemua total transaksi, berapa besaran tingkat dominasi yang mempresentasikan item X dan Z dibeli secara bersama). 2. Confidence, ukuran yang menunjukkan hubungan 2 item secara conditional (misalnya, seberapa sering item X dibeli jika orang membeli item Z). Kedua ukuran tersebut nanti bermanfaat saat mencari interesting association rule, yaitu guna dibandingkan dengan pembatas (threshold) yang ditentukan user. Batas tersebut biasanya terdiri dari min_support dan min_confidence. Market basket analysis mengacu pada berbagai metode yang mempelajari tentang item-item di suatu keranjang belanja yang dibeli pada satu penotalan dari banyak kejadian transaksi yang telah terjadi. Data keranjang belanja dalam bentuk yang paling mentah merupakan daftar transaksi belanja yang dilakukan oleh pelanggan, yang mengidentifikasikan hanya barang-barang yang dibeli secara bersamaan oleh ribuan pelanggan. Datanya ini menantang karena beberapa hal [16] : 14 1. Jumlah data yang digunakan dalam jumlah besar (biasanya dapat mencapai jutaan transaksi per hari jika pangsa pasarnya besar, seperti pada swalayan). 2. Pembagiannya barangnya luas (setiap keranjang belanja hanya mengandung sebagian kecil item dari ribuan item yang dijual). 3. Heterogenitas (orang-orang dengan selera yang berbeda cenderung membeli sekelompok barang yang spesifik). Tujuan analisis keranjang belanja adalah mengidentifikasi produk-produk mana yang cenderung dibeli secara bersamaan. Dengan menganalisis data pada tingkat transaksi maka akan dapat diidentifikasikan pola-pola pembelian, seperti misalnya jenis camilan ringan mana dan jenis roti mana yang dibeli secara bersama dengan minuman untuk bersantai jika orang ingin mengadakan suatu acara seperti piknik atau yang sering dilakukan ketika event-event sepakbola yang biasanya dilakukan nonton bareng. Informasi tersebut kemudian dapat digunakan untuk menentukan di mana suatu item dengan tingkat asosiasi tertentu dengan item lain ditempatkan pada rak-rak di toko yang memungkinkan item-item tersebut saling berdekatan, dan hal ini juga akan dapat membantu manajemen persediaan. 2.3 2.3.1 Algoritma K-Means Konsep K-Means Algoritma K-Means merupakan salah satu algoritma clustering pada data mining non hierarki yang menganalisa data dengan pemodelan unsupervised learning dan melakukan pengelompokan data dengan sistem partisi. Konsep dalam clustering yaitu dengan mengelompokkan data-data menjadi beberapa himpunan, yang mana data dalam satu kelompok mempunyai karakteristik yang sama antara data satu dengan yang lainnya dan mempunyai karakteristik berbeda dengan data yang ada dalam kelompok berbeda. Dengan maksud lain, metode k-means ini melakukan peminimalan variasi antar data yang ada dalam suatu cluster dan memaksimalkan variasi dengan data yang ada dalam cluster lainnya. Dalam mengelompokkan data dengan k-means, didasarkan pada titik pusat yang telah ditentukan sebelumnya. Dengan menggunakan rumus Euclidean Distances, Clustering objek dilihat dari 15 jarak objek dengan titik pusatnya yang paling dekat, yang mana dalam mencari jarak terdekat kadang dibutuhkan hingga beberapa perulangan atau iterasi sampai objek benar-benar mendekati ke titik pusat cluster. Euclidean Distances sendiri merupakan perhitungan jarak dari 2 titik di euclidean space, dengan menghitung akar dari kuadrat perbedaan 2 vektor. Setelah diketahui titik pusat terdekatnya dan posisi objek terhadap cluster-nya tidak berubah-ubah lagi, objek dapat dipastikan masuk sebagai anggota cluster tersebut. Sehingga diketahui bagaimana k-means mempartisi data-data ke dalam kelompok masing-masing cluster, melalui proses perubahan posisi data yang awalnya bergejolak menjadi tetap. Beberapa kelebihan dari algoritma k-means antara lain sebagai berikut : 1. Karena algoritma k-means lebih sederhana dibandingkan algoritma lain seperti fuzzy c-means, maka dalam implementasinya mudah dilakukan. 2. Dalam mempelajari k-means relatif cepat sehingga tidak perlu waktu lama. 3. Mudah untuk diadaptasikan dari satu masalah ke masalah lain selama data-data yang digunakan juga cocok dilakukan peng-cluster-an. 4. Algoritma k-means sudah begitu banyak digunakan dalam berbagai masalah, terlebih dalam penelitian-penelitian terdahulu. Selain algoritma k-means itu sendiri, ternyata banyak algoritma yang didapat dari hasil pengembangan atau variasi dari metode k-means sebagai berikut [17] : 1. K-means++, merupakan metode untuk menentukan nilai awal pada k-means. Algoritma ini diperlukan dalam meminimalkan dampak buruk dari metode kmeans yang begitu bergantungan dari nilai awalnya. 2. K-medoids, merupakan algoritma yang berbasis prototype. Jika k-means perlu titik tengah sebagai model dari peng-cluster-annya, maka untuk k-medoids ini menggunakan rata-rata tengah. 3. Bisecting k-means, dasarnya memerlukan k-means sebagai pembagi 2 cluster. Mulanya tiap-tiap objek tergabung dalam suatu cluster. Di tiap iterasi, dipilih satu cluster untuk dibagikan 2 menggunakan k-means. Ini dilakukan sampai tercipta k-cluster. Algoritma bisecting k-means kerjanya lebih cepat dibanding k-means karena mereduksi jumlah objek yang dibandingkan di tiap iterasinya. 16 2.3.2 Proses Algoritma K-Means Untuk menemukan pola-pola data dari proses clustering berbasis k-means, berikut langkah-langkah yang perlu dilakukan [6], [7], [8] : 1. Menentukan dahulu berapa jumlah cluster yang akan dibentuk (k-cluster). 2. Menentukan titik pusat cluster (centroid) secara acak. Untuk menghasilkan cluster maksimal, titik awal partisi merupakan salah satu faktor yang berpengaruh untuk itu pemilihan titik awal harus beralasan. Dalam menentukan titik pusat awal cluster dapat dengan mengukur nilai titik tengah segmentasi berdasarkan jumlah jarak terpendek antar anggota kelas tersebut. 3. Menghitung jarak antara setiap data ke titik pusat terdekat. Distance space digunakan dalam perhitungan jarak antara data dan titik pusat. Salah satu persamaan yang dapat digunakan adalah Euclidean Distance Space, yang sering digunakan dalam menghitung jarak. Hal tersebut dikarenakan hasil perhitungan merupakan jarak terpendek antara dua titik yang diperhitungkan. Berikut ini merupakan persamaannya yaitu : Dn (x,y) = √∑ππ=1(ππ₯π − ππ¦π ) 2 (2.1) Dengan : Dn (x,y) = jarak objek antara objek i dan j P = dimensi data ππ₯π = koordinat dari objek x pada dimensi k ππ¦π = koordinat dari objek y pada dimensi k 4. Mengalokasikan masing-masing data ke titik pusat terdekat, sehingga dalam tahap ini setiap data sudah mulai bergerak ke cluster-nya masing-masing. 5. Menghitung titik pusat baru menggunakan jumlah keseluruhan per cluster. Untuk menghitung titik pusat cluster yang baru ditentukan berdasarkan ratarata dari data-data yang ada di titik pusat yang sama. Berikut persamaannya : 1 πΆπ = ( ) ∑ ππ π π (2.2) 17 Dengan : πΆπ = titik pusat baru ππ = jumlah dokumen dalam cluster k ππ = dokumen dalam cluster k 6. Kembali ke langkah 3, jika ada data yang berubah-ubah dari cluster atau jika berubahnya nilai centroid melebihi nilai threshold atau jika berubahnya nilai objective function yang digunakan melebihi nilai threshold yang digunakan. 2.4 2.4.1 Algoritma Fuzzy C-Covering Konsep Fuzzy C-Covering Fuzzy c-covering merupakan suatu algoritma yang digunakan dalam klasifikasi elemen-elemen dari himpunan universal ke dalam partisi-partisi berupa fuzzy sets. Fuzzy c-covering merupakan bentuk generalisasi dari metode fuzzy c-partition yang mana fuzzy c-partition diidentifikasikan sebagai berikut [4] : Misal I= {π1 , π2 , … , ππ } adalah domain data. Fuzzy c-partition dari I adalah fuzzy subset atau fuzzy classes dari T, ditandai oleh T= {π‘1 , π‘2 , … , π‘π } yang memenuhi : ∑ππ=1 π π‘π (ππ ) = 1, untuk semua k ∈ Nπ (2.3) Sedangkan berikutnya 0 < ∑ππ=1 π π‘π (ππ ) < n, untuk semua m ∈ Nπ (2.4) Di mana c merupakan positive integer (0 < c ≤ n) dan ππ‘π (ππ ) ∈ [0,1]. Untuk lebih jelasnya rumus (2.3) dan (2.4), berikut contoh 1 : μt1 = {0.3/i1, 0.7/i2 , 1/i3 }, μt2 = {0.6/i2 , 0.5/i3 , 1/i4 }, μt3 = {0.3/i4 , 0.6/i5, 0.7/i6 }. Di contoh 1 diketahui total elemen terlibat (n = 6) dan partisinya (c = 3). Fuzzy class tersebut bisa diistilahkan sebagai fuzzy c-partition dari suatu domain I = {i1 , i2 , i3 , i4 , i5 , i6 } karena memenuhi rumus (2.3) dan (2.4). Di dalam fuzzy ccovering, rumus (2.3) dari teori fuzzy c-partition digeneralisasikan menjadi : 18 ∑ππ=1 π π‘π (ππ ) ≥ 1, untuk semua k ∈ Nπ (2.5) Untuk memperjelasnya diberikan contoh ke 2, yang misalnya suatu fuzzy classes disebutkan seperti di bawah ini : μt1 = {0.3/i1, 0.7/i2 , 0.6/i3 }, μt2 = {0.7/i6 , 0.5/i3 , 1/i4, 0.3/i5 }, μt3 = {0.3/i4 , 0.6/i1, 0.7/i5 }. Dari contoh 2 bisa diketahui (n = 6) dan jumlah partisinya (c = 3). Fuzzy class itu dikatakan sebagai fuzzy c-covering suatu domain I = {i1 , i2 , i3 , i4 , i5 , i6 } karena telah memenuhi rumus (2.4) serta (2.5). 2.4.2 Proses Algoritma Fuzzy C-Covering Untuk menemukan pola data dari proses market basket analysis berbasis fuzzy ccovering, berikut langkah-langkah yang perlu dilakukan [4], [5]: 1. Menentukan max_item_threshold sesuai yang dibutuhkan. Max_item_threshold merupakan pembatas untuk menyaring transaksi berdasar pada jumlah item di dalam transaksi. Hal ini didasarikan pada pengetahuan bahwa makin banyak item yang dibeli dalam suatu transaksi, hubungan antar item dalam transaksi tersebut pun akan semakin lemah. 2. Mencari record-record yang berada di dalam tabel transaksi yang memenuhi max_item_threshold dan menyimpannya ke dalam QT, di mana : QT = {t β |t| ≤ ith, ith ∈ positive integer} (2.6) Dengan : QT (Qualified Transaction) = himpunan transaksi yang sudah memenuhi max_item_threshold t = transaksi |t| = jumlah produk dalam suatu transaksi ith = max_item_threshold 3. Set k = 1 (k adalah variabel untuk menentukan jumlah kombinasi). 19 4. Menentukan min_support ke-k yang sebagai threshold bagi kombinasi k-item terhadap tingkat dominasinya dari keseluruhan transaksi. 5. Mencari support dari setiap kombinasi k-item yang memungkinkan yang ada di dalam transaksi tersebut dengan rumus : π π’πππππ‘ (π’) = ∑π π‘=1 1 ∑π π‘=1 π πΆ |ππ‘ | π (π’, ππ‘ ) π = 1 |ππ‘ |! π (π’, ππ‘ ) π!(|ππ‘ |− π)! π (2.7) Dengan : u = kombinasi k-item yang akan dicari support-nya. Jika I merupakan universal set dari item-item, u ⊆ πΌ |u| = k : jumlah produk dalam u ππ‘ = transaksi ke-t (ππ‘ ⊆ πΌ) |ππ‘ | = jumlah produk dalam ππ‘ π πΆ|π = kombinasi k-item terhadap |ππ‘ | π‘| π = jumlah record atau tuple dalam QT s(u, Tt ) ∈ {0, 1} adalah suatu function, di mana jika u ∈ ππ‘ , s(u, Tt ) = 1, selain itu s(u, Tt ) = 0. 6. Melakukan penyaringan terhadap kombinasi produk yang ada dalam transaksi tersebut yang tidak memenuhi : support (u) ≥ min_support ke-k. 7. Set k = k + 1, di mana jika k > ith, maka ke langkah 9 (sembilan). 8. Mencari kombinasi k-item yang memungkinkan dari tiap kombinasi (k-1)item yang memenuhi minimum_support yang telah ditentukan, dengan cara : a. Untuk mendapat kombinasi k-item, u, harus ada kombinasi (k-1)-item, u’, di mana u’ ⊂ u. Misalnya untuk mendapatkan u = {I1 , I2 , I3 , I4 } harus ada u’ = {I1 , I2 , I3 }, {I1 , I2 , I4 }, {I1 , I3 , I4 }, {I2 , I3 , I4 }. b. Jika tidak ada lagi kombinasi k-item yang munkin memenuhi min_support yang ditentukan, dapat ke langkah 9, selain itu ulangi langkah 4 sampai 7. 9. Mendefinisikan tiap produk yang telah didapatkan dari langkah sebelumnya sebagai fuzzy set atau juga disebut item fuzzy set terhadap transaksi QT. 20 10. Mencari candidate rules dengan menghitung confidence di tiap kombinasi kitem yang mencapai min_support ke-k (k ≥ 2) dari item fuzzy set yang sudah didapatkan dari langkah 9 (sembilan) dengan rumus : R (X, Y) = confidence (Y ο X) = (μ (t)) ∑t ∈T i ∈ inf X ∪Y i (μ (t)) ∑t ∈T i inf ∈ Y i (2.8) Dengan : X, Y ⊆ πΌ T = himpunan kode-kode transaksi yang terdapat di QT μi (t) ∈ [0, 1] = fungsi anggota terhadap T 2.5 2.5.1 CRISP-DM (Cross Industry Standard Process For Data Mining) Tentang CRISP-DM CRISP-DM (Cross Industry Standard Process For Data Mining) adalah sebuah metodologi yang menyediakan sebuah pendekatan terstruktur untuk perencanaan proyek data mining, yang merupakan suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa tahun 1996 dan telah ditetapkan sebagai proses standar dalam data mining yang dapat diaplikasikan di berbagai sektor industri. Adapun proses ini salah satu tujuannya ialah menemukan pola yang menarik dan bermakna dalam data, serta melibatkan beberapa disiplin ilmu seperti statistika, machine learning, artificial intelligence, dan data mining. Salah satu keuntungan dari menggunakan proses ini adalah menjelaskan langkah paling umum dalam proses-prosesnya yang bukanlah suatu prosedur yang kaku dan harus dilakukan secara beruntun. Bahkan beberapa kasus ada yang dilakukan tidak dari awal tahap, bisa jadi dari pemodelan dahulu atau dari mengenali data-data yang dimiliki terlebih dahulu. CRISP-DM juga tidak hanya bisa dilakukan oleh para analis ahli, karena prosesnya yang tidak terlalu sulit maka para pemula atau pelajar pun dapat menggunakannya. Namun meski demikian, CRISP-DM memberikan kerangka kerja yang berguna dalam penggalian data sehingga lebih tahu tentang apa saja yang perlu dilakukan. Untuk lebih jelasnya bagaimana fase-fase CRISP-DM dan apa saja yang biasa dilakukan juga diperlukan dalam setiap fase, akan dijelaskan pada poin selanjutnya. 21 2.5.2 Proses CRISP-DM Gambar 2.1 Proses Diagram CRISP-DM (Cross Industry Standard Process For Data Mining)[18] Dilihat dari gambar, nampak terdapat beberapa proses atau fase-fase yang perlu dilakukan pada analisa data mining menggunakan CRISP-DM. Secara garis besar ada 6 alur proses yang mana proses pertama dimulai dari business understanding, lalu data understanding yang perlu dianalisa berdasarkan business understanding yang jika sudah sesuai maka belanjut ke data preparation, kemudian modelling. Pada tahap modelling sangat erat kaitannya dengan data preparation, sehingga di tahap data preparation tidak boleh ada kesalahan saat menyiapkan data-datanya. Setelah modeling selesai, perlu dilakukan evaluasi terhadap hasil dari modeling. Dari evaluasi dapat berlanjut ke 2 arah, yaitu siap untuk deployment atau diulang kembali ke tahap business understanding. Untuk pengulangan bisa dikarenakan perlu adanya penelitian ulang terhadap keseluruhan proses yang sudah dilakukan, atau melakukan kembali analisa data mining dengan business understanding yang berbeda, atau juga sebagai siklus hidup sebuah sistem informasi. Berikut ini akan dijelaskan lebih mendalam setiap tahap proses CRISP-DM [19] : 22 1. Business Understanding Dinamakan juga sebagai pemahaman penelitian. Tahap ini sangat diperlukan kapasitas pemahaman yang bagus tentang substansi dari kegiatan data mining yang akan dilakukan, atau merupakan kebutuhan dari sudut pandang bisnis. Business understanding terdiri dari beberapa sub tahapan, yang diantaranya yaitu: menentukan tujuan atau sasaran bisnis, memahami proses bisnis yang sedang berjalan, menentukan tujuan dari datamining, dan pengaturan rencana strategi serta jadwal pelaksanaan kegiatan. 2. Data Understanding Merupakan fase di mana data-data mentah atau data awal dikumpulkan, lalu memahami data-data tersebut untuk dapat mengenal data apa saja yang akan digunakan dalam proses data mining. Fase ini mencoba mengidentifikasikan masalah apa saja yang berkaitan dengan kualitas data, mendeteksi subset yang menarik dari data untuk membuat hipotesa awal. 3. Data Preparation Disebut juga sebagai persiapan data, yang mana tahapan ini lah yang dapat dikatakan paling rumit atau banyak membutuhkan waktu karena ada banyak sub-sub fase yang memang perlu dilakukan seperti cleaning data, integrating, selecting, bahkan pembuatan atribut baru jika dibutuhkan, dan sebagainya. 4. Modeling Merupakan fase penentuan tehnik atau algoritma data mining yang akan digunakan, tools yang dapat digunakan untuk mendukung algoritma, dan juga parameter dengan nilai yang optimal. 5. Evaluation Merupakan tahap menginterpretasikan hasil datamining yang ditunjukkan pada tahap pemodelan dari fase modeling. Evaluasi dilaksanakan secara lebih mendetail dengan tujuan menyesuaikan model yang diperoleh agar sesuai dengan tujuan yang ingin dicapai dalam fase pertama. 6. Deployment Merupakan tahap penyebaran, di mana penyusunan laporan atau presentasi dari pengetahuan yang didapat dari evaluasi di proses data mining dilakukan. 23 2.6 2.6.1 Aplikasi Pendukung Pemodelan RapidMiner Versi 5.3.015 RapidMiner merupakan software pengolahan data mining yang dapat digunakan pada lingkungan untuk machine learning, data mining, text mining, dan lain-lain. RapidMiner menyediakan prosedur data mining dan machine learning termasuk: ETL (extraction, transformation, loading), data preprocessing, modelling, dan evaluasi. Proses data mining merupakan susunan dari operator-operator yang nestable, dideskripsikan dengan XML, didukung GUI, juga ditulis dalam bahasa pemrograman Java. Berikut beberapa fungsi menu utama RapidMiner seperti : 1. Process control, merupakan fungsi yang diperuntukkan guna mengontrol aliran pemprosesan, seperti perulangan atau conditional branch. 2. Utility, digunakan pada pengelompokan sub process, juga macro dan logger. 3. Repository access, diperuntukkan dalam pembacaan dan penulisan repository. 4. Import, digunakan untuk membaca dari berbagai format external. 5. Export, digunakan untuk menulis data ke berbagai format external. 6. Data Transformation, berfungsi untuk mentransformasi data dan metadata. 7. Modelling, untuk proses data mining yang sesungguhnya. Seperti klasifikasi, regresi, clustering, aturan asosiasi, dan sebagainya. 8. Evaluation, untuk menghitung kualitas dari modelling. 2.6.2 Microsoft Visual Basic Versi 6.0 Secara singkat tentang Microsoft Visual Basic yang sering digunakan dalam dunia pemrograman merupakan sebuah bahasa pemrograman yang mana menyediakan Integrated Development Environtment (IDE) visual untuk merancang program perangkat lunak berbasis sistem operasi Microsoft Windows dengan berbasis pada model pemrograman (COM). Para programmer dapat membangun aplikasi bisnis dengan menggunakan komponen yang sudah ada di Microsoft Visual Basic itu sendiri, meski beberapa karakteristik obyek ada yang tidak dapat dilakukan pada visual basic. Visual Basic menjadi populer karena kemudahan desain form secara visual dan kemampuannya untuk menggunakan komponen yang dibuat pihak lain. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Untuk memperoleh data-data penelitian, penulis menggunakan beberapa metode pengumpulan data yang dilakukan untuk menunjang penelitian tugas akhir ini. Berikut beberapa metode yang dilakukan : 1. Observasi Dalam proses observasi, peneliti melakukan pengamatan langsung terhadap InshofMart. Tentang bagaimana sistem informasi yang ada saat ini sedang berjalan, dapat digunakan untuk apa saja data-data yang tersimpan dalam database sistem tersebut, intinya bagaimana InshofMart memberdayakan sistem informasi mereka dan data-data yang dimiliki. Selain mengamati sistemnya, peneliti juga mengamati keadaan InshofMart secara fisik yang mempunyai hubungan dengan masalah yang diangkat dalam penelitian ini. Yaitu gudang penyimpanan barang yang hubungannya dengan pengendalian stock barang, dan tatanan rak-rak barang yang hubungannya dengan asosiasi antar item (market basket analysis). 2. Studi Kepustakaan Untuk menunjang penelitian ini agar dapat dilakukan dengan baik dan setiap materi yang dicantumkan dapat dipertanggungjawabkan keabsahannya dan sitasinya, maka dilakukan studi pustaka dengan mempelajari buku-buku literature, laporan-laporan yang berkaitan dengan penelitian dan juga hasil penelitian terdahulu atau yang pernah dilakukan oleh peneliti lain yang ada hubungannya dengan masalah yang penulis teliti saat ini. Dalam melaksanakan penelitian, diperlukan adanya data-data untuk mendukung penelitian agar sesuai dengan objek yang diteliti. Ada beberapa jenis dan sumber data-data yang perlu diperhatikan dalam memperolehnya, diantaranya adalah : 24 25 1. Jenis Data Adapun jenis data-data yang penulis gunakan di dalam melakukan penelitian tugas akhir ini adalah sebagai berikut : a. Data Kuantitatif Merupakan jenis data yang dapat dihitung dan menunjukkan jumlah sesuatu. Data kuantitatif yang digunakan dalam penelitian ini misalnya data jumlah sisa item produk, jumlah produk yang terjual, jumlah berapa kali transaksi terjadi, dan sebagainya. Untuk data transaksi yang akan digunakan pada proses market basket analysis adalah yang dikumpulkan InshofMart mulai tanggal 01 November 2016 s/d 31 Maret 2017. Sedangkan untuk clustering merupakan data pembelian ke distributor yang dikumpulkan sekitar tanggal 01 November 2016 s/d 31 Maret 2017. Karena tidak semua produk dibeli tepat tanggal 01 November 2016, sehingga digunakan data yang terjadi pada satu kali pembelian tanggal sebelumnya. Namun data dalam transaksi yang digunakan adalah jumlah sisa produk tepat pada tanggal 01 November 2016, sehingga tidak semua jumlah yang dibeli di kejadian tanggal sebelumnya digunakan. Dan untuk data nama-nama produk yang ada dalam clustering juga diambil dari jenis produk yang dibeli oleh pelanggan saja, atau produk yang terdapat di tabel transaksi selama 01 November 2016 s/d 31 Maret 2017 tersebut. Sehingga untuk jenis produk yang tidak terdapat dalam tabel transaksi di kisaran periode tersebut, dihapus atau tidak disertakan dalam himpunan data-data untuk di dalam melakukan proses clustering nantinya. Jumlah data yang terdapat dalam tabel transaksi selama 01 November 2016 s/d 31 Maret 2017, berjumlah 3.623 record data transaksi. Sedangkan untuk data jenis-jenis produk yang dibeli pada distributor dan terdapat dalam tabel transaksi 01 November 2016 s/d 31 Maret 2017 berjumlah 1.005 item. Untuk data transaksi yang diminta dari InshofMart terdiri dari 4 atribut, yaitu nomor, tanggal, nama produk, dan jumlah. Sedangkan untuk data stock item yang diminta terdiri dari 2 atribut, yaitu kategori dan nama produk. Berikut ini adalah merupakan bentuk tabel yang akan digunakan dalam proses penelitian, atribut-atribut dalam tabel stock dan transaksi : 26 Tabel 3.1 Sampel Data Pada Tabel Stock Kategori Nama Produk Joyko Correction Tape CF-S201-PT Alat-alat Tulis (AT) Joyko Correction Tape JK-101 Joyko Isi Pensil PL-05 (2B) Pronas Chicken Sausage (325 gr) Canned & Lauk Pauk (CN) ABC Sardines Sauce Chilli (155 gr) ABC Sardines Sauce Tomato (155 gr) Silver Queen Almond Milk Chocolate (33 gr) Coklat (CK) Silver Queen Cashew Milk Chocolate (33 gr) Delfi Fruit & Nut (30 gr) Gatsby Watergloss Hard (150 gr) Kosmetik Rambut (KR) Gatsby Watergloss Hyper Solid (75 gr) Gatsby Styling Pomade Supreme Grease (80 gr) Tabel 3.2 Sampel Data Pada Tabel Transaksi No Tanggal 1 01/11/2016 2 01/11/2016 3 01/11/2016 5 01/11/2016 Nama Produk Baby Happy Pants XL 1 Pcs Mitu Baby Wet Tissue Pink 10s My Baby Powder Soft & Gentle (150 gr) Aqua (1500 ml) Snack Kerupuk Tengiri Original Snack Ring Balado Aqua (1500 ml) Indofood Saus Pedas Sachet Isi 6 (9 gr) Okey Sosis Ayam / 1 Potong Sarimi isi 2 Koya jeruk Nipis (112 gr) So Good Bakso Kuah Ayam Campina Concerto Sundae Blueberry Bayclin Botol (100 ml) Milkuat Rasa Strawberry Nuvo Bar Soap Family Biru (80 gr) So Klin Smart Color Deterjen (800 gr) Jumlah 3 1 1 1 1 1 1 1 3 2 1 2 1 2 2 1 27 2. Sumber Data a. Data Sekunder Merupakan data yang didapatkan secara tidak langsung untuk menambah pengetahuan, antara lain data dari literatur, jurnal, atau data pendukung lain yang bukan dari sumber utama yang berhubungan dengan topik penelitian. Misal dalam penelitian ini penulis menggunakan data stock produk dan data transaksi yang didapatkan dari InshofMart, bukan memperolehnya langsung dari kegiatan jual beli yang setiap harinya dilakukan antara penjual dengan pembeli dan distributor. 3.2 Metode Analisis 3.2.1 CRISP-DM (Cross Industry Standard Process For Data Mining) Ada 6 tahap dalam fase CRISP-DM, namun pada penelitian ini hanya sampai fase ke-4 dikarenakan tahap evaluasi dan deployment perlu penelitian lebih lanjut dan dukungan dari pihak luar. Berikut 4 fase yang digunakan dalam penelitian : 1. Business Understanding Dinamakan juga sebagai pemahaman penelitian. Tahap ini sangat diperlukan kapasitas pemahaman yang bagus tentang substansi dari kegiatan datamining yang akan dilakukan, atau merupakan kebutuhan dari sudut pandang bisnis. Business understanding terdiri dari beberapa sub tahapan, yang diantaranya yaitu: menentukan tujuan atau sasaran bisnis, memahami proses bisnis yang sedang berjalan, dan menentukan tujuan dari data mining. 2. Data Understanding Merupakan fase di mana data-data mentah atau data awal dikumpulkan, lalu memahami data-data tersebut untuk dapat mengenal data apa saja yang akan digunakan dalam proses data mining. Fase ini mencoba mengidentifikasikan masalah apa saja yang berkaitan dengan kualitas data, mendeteksi subset yang menarik dari data untuk membuat hipotesa awal. 3. Data Preparation Disebut juga sebagai persiapan data, yang mana tahapan ini lah yang dapat dikatakan paling rumit atau banyak membutuhkan waktu karena ada banyak 28 sub-sub fase yang memang perlu dilakukan seperti cleaning data, integrating, selecting, bahkan pembuatan atribut baru jika dibutuhkan, dan sebagainya. 4. Modeling Merupakan fase penentuan tehnik atau algoritma data mining yang akan digunakan, tools yang dapat digunakan untuk mendukung algoritma, dan juga parameter dengan nilai yang optimal. 3.2.2 Metode Clustering Menggunakan K-Means Untuk menemukan pola-pola data dari proses clustering berbasis k-means dan mendukung tahap pemodelan pada CRISP-DM, berikut langkah-langkah yang perlu dilakukan [6], [7], [8] : 1. Menentukan dahulu berapa jumlah cluster yang akan dibentuk (k-cluster). 2. Menentukan titik pusat cluster (centroid) secara acak. 3. Menghitung jarak antara setiap data ke titik pusat terdekat menggunakan rumus Euclidean Distance. Berikut ini merupakan persamaannya yaitu : Dn (x,y) = √∑ππ=1(ππ₯π − ππ¦π ) 2 (3.1) Dengan : Dn (x,y) = jarak objek antara objek i dan j P = dimensi data ππ₯π = koordinat dari objek x pada dimensi k ππ¦π = koordinat dari objek y pada dimensi k 4. Mengalokasikan masing-masing data ke titik pusat terdekat, sehingga dalam tahap ini setiap data sudah mulai bergerak ke cluster-nya masing-masing. 5. Menghitung titik pusat baru menggunakan jumlah keseluruhan per cluster. Untuk menghitung titik pusat cluster yang baru ditentukan berdasarkan ratarata dari data-data yang ada di titik pusat yang sama. Berikut persamaannya : 1 πΆπ = ( ) ∑ ππ π π (3.2) 29 Dengan : πΆπ = titik pusat baru ππ = jumlah dokumen dalam cluster k ππ = dokumen dalam cluster k 6. Kembali ke langkah 3, jika masih ada data yang berpindah cluster atau apabila perubahan nilai centroid ada yang di atas nilai threshold atau jika perubahan nilai objective function yang digunakan di atas nilai threshold yang ditentukan. 3.2.3 Metode Market Basket Analysis Menggunakan Fuzzy C-Covering Fuzzy c-covering adalah salah satu metode pengklasifikasian item-item dari suatu himpunan yang universal ke dalam partisi-partisi berbentuk fuzzy sets. Untuk menemukan pola data dari proses market basket analysis berbasis fuzzy c-covering berikut langkah-langkah yang perlu dilakukan [4], [5]: 1. Menentukan max_item_threshold sesuai yang diperlukan. Max_item_threshold merupakan pembatas untuk menyaring transaksi berdasar pada jumlah itemitem yang ada dalam transaksi tersebut. 2. Mencari record data yang berada di tabel transaksi yang sesuai dengan batasan max_item_threshold dan kemudian disimpan ke dalam QT. 3. Set k = 1 (k merupakan variabel yang menentukan berapa jumlah kombinasi). 4. Menentukan min_support ke-k yang merupakan threshold untuk kombinasi kitem terhadap besaran dominasinya dari semua transaksi yang terjadi. 5. Mencari support yang terjadi di tiap kombinasi k-item yang mungkin terdapat di dalam transaksi tersebut. 6. Melakukan penyaringan pada kombinasi item yang terdapat di dalam transaksi yang tidak memenuhi : support (u) ≥ min_support ke-k. 7. Set k = k + 1, di mana jika k > ith, maka melanjutkan langkah 9 (sembilan). 8. Mencari kombinasi k-item yang mungkin terdapat di tiap kombinasi (k-1)-item yang mencapai minimum_support yang sudah ditentukan, dengan langkah : 30 a. Untuk memperoleh kombinasi k-item, u, harus ada kombinasi (k-1)-item, u’, di mana u’ ⊂ u. Misalkan untuk mendapat u = {I01 , I02 , I03 , I04 } harus ada u’ = {I01 , I02 , I03 }, {I01 , I02 , I04 }, {I01 , I03 , I04 }, {I02 , I03 , I04 }. b. Jika tidak ada kombinasi k-item lain yang memenuhi min_support yang telah ditentukan, dapat ke langkah 9, selain itu ulangi langkah 4 sampai 7. 9. Mendefinisikan setiap item yang didapat dari langkah sebelumnya menjadi fuzzy set atau bisa juga disebut sebagai item fuzzy set terhadap transaksi QT. 10. Mencari candidate rules dengan menghitung confidence per kombinasi k-item yang mencapai min_support ke-k (k ≥ 2) dari item fuzzy set yang sudah didapat pada langkah 9 (sembilan). BAB 4 HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian Pada bagian ini berisi tentang uraian hasil penelitian yang telah dilakukan, analisis hasil penelitian, dan pembahasan lebih mendalam tentang hasil penelitian. Dalam melakukan penelitian ini, CRISP-DM (Cross Industry Standard Process For Data Mining) digunakan sebagai metodologi agar proses penelitiannya tersusun secara berurutan sehingga lebih mudah dipahami. Berikut penjelasan dari implementasi fase-fase CRISP-DM yang digunakan dalam proses penelitian. 4.1.1 Business Understanding Business Understanding merupakan tahapan pertama dari fase CRISP-DM yang berarti menjadi tahapan pertama dalam melakukan analisa hasil dalam penelitian ini. Business Understanding dilakukan agar dapat memahami inti kegiatan analisa data dan kebutuhan dari perspektif bisnis. 1. Determine Business Objectives Pada tahap ini akan ditentukan tujuan bisnis dan faktor-faktor pentingnya yang terlibat dalam penelitian. Tujuan bisnis yang dimaksudkan ialah tujuan jangka panjang yang dapat diterapkan dalam jangka waktu tahunan dan berguna bagi objek, bukan hanya sekedar berguna dalam penelitian ini. Untuk itu dijelaskan tujuan penelitian ini yang berakar dari dua masalah, yaitu penataan lokasi rakrak barang dan penentuan jumlah stok pada InshofMart yang masih dilakukan dengan cara ber-instinct dari pada dengan analisa data yang lebih mendekati fakta. Untuk itu analisa data ini dilakukan dengan tujuan agar menghasilkan sebuah formulasi yang lebih menonjolkan fakta dari data-data yang dihasilkan oleh InshofMart dari pada sekedar instinct. Sehingga formula tersebut dapat membantu dalam proses perencanaan penjualan selanjutnya. 31 32 2. Assess the Situation Kegiatan menilai situasi yang kini sedang berjalan pada InshofMart tentang bagaimana mereka mengelola sub bisnis yang kini dijadikan masalah di dalam penelitian, yaitu bagaimana mereka menentukan penataan rak-rak barang agar antara satu item dapat berelasi dengan item lainnya sesuai data di lapangan dan menentukan jumlah stock barang yang harus dibeli maupun dijual. a. Saat ini InshofMart masih menggunakan acuan kategori barang sebagai cara mereka menata rak-rak barang, hal itu lumayan disayangkan karena bisa jadi satu nama dari suatu kategori produk justru penjualan tertingginya disertai oleh satu nama dari suatu kategori produk lain. Sehingga jika kedua produk tersebut tidak saling didekatkan akan mengurangi minat pelanggan untuk membeli keduanya, dan hanya membeli yang mereka lihat pertama saja. b. Dalam penentuan stock pun masih menggunakan instinct, sehingga kadang rasio produk tidak seimbang. Mengakibatkan seringnya kehabisan beberapa produk paling laku sebelum sempat memesan ke distributor, atau beberapa produk yang masa penggunannya berakhir sebelum terjual ke pelanggan. 3. Determine the Data Mining Goals Tahap ini merupakan tahap pengubahan dari masalah bisnis menjadi masalah data mining, sehingga dari masalah itu dapat ditentukan tujuan data mining. Dari masalah bisnis yang telah dijelaskan pada tahap Determine Business Objectives dapat disimpulkan bahwa masalah data mining-nya yaitu bagaimana agar dapat meng-cluster item apa saja pada tabel data stock yang masuk dalam himpunan sangat laku, laku, dan kurang laku. Dan juga market basket analysis antar item pada tabel data transaksi yang akan menghasilkan nilai asosiasi antar item mana yang relasinya tertinggi. Sehingga hasil dari kedua analisa tersebut dapat dimanfaatkan dalam melakukan perencaan penjualan (penentuan stock item yang lebih akurat dan penataan rak-rak barang yang saling terasosiasi antar satu item dengan item lainnya) pada berbagai minimarket, namun dalam penelitian ini lebih dikhususkan pada objek penelitian utama yaitu InshofMart. 33 4.1.2 Data Understanding Pada tahap pemahaman data ini, data-data sekunder yang telah dikumpulkan dari objek akan menjadi data awal atau data mentah untuk penelitian ini. Kemudian data-data tersebut dipelajari guna mengenal dan memahami apa saja yang dapat dilakukan pada data-data itu. Pemahaman akan data mengacu pada permasalahan di InshofMart seperti yang dijelaskan pada tahap business understanding. 1. Collect the Initial Data Pada tahap ini data-data yang berhubungan dengan masalah data mining akan dikumpulkan, untuk itu dibutuhkan semua data dari tabel data stock untuk kepentingan clustering dan tabel data transaksi untuk market basket analysis. Data-data yang diambil adalah data stock dan data transaksi yang dikumpulkan InshofMart mulai tanggal 01 November 2016 s/d 31 Maret 2017. Sedangkan untuk data stock, karena tidak semua produk dibeli kepada distributor tepat tanggal 01 November 2016, sehingga digunakan data yang terjadi pada satu kali pembelian yang sebelumnya. Namun data transaksi yang digunakan adalah jumlah sisa produk tepat pada tanggal 01 November 2016, sehingga tidak semua jumlah yang dibeli pada kejadian sebelumnya digunakan. Dan untuk data nama-nama produk dalam clustering juga diambil dari jenis produk yang terdapat dalam tabel transaksi selama 01 November 2016 s/d 31 Maret 2017. Sehingga produk yang tidak ada dalam tabel transaksi di periode tersebut, tidak disertakan ke himpunan data-data dalam melakukan proses clustering nantinya. 2. Describe the Data Merupakan tahap memahami data yang terlihat seperti laporan stock maupun laporan hasil transaksi, memeriksa format data, berapa jumlahnya, bagaimana atribut-atribut datanya, dan fitur lain dari data. Dari InshofMart, data-data yang diberikan sudah dalam bentuk excel sehingga lebih memudahkan karena dapat langsung diolah tanpa berurusan dengan database. Dalam mempelajari datanya pun lebih cepat karena tidak perlu mempelajari bagaimana sistem database-nya terlebih dahulu. Karena tahap ini memang difokuskan untuk membiasakan diri terhadap data-data yang terkumpul dan juga berusaha menemukan pengetahuan 34 awal tentang informasi yang bisa diperoleh. Seperti yang telah dijelaskan pada tahap Collect the Initial Data, terdapat dua tabel data yang diperlukan dalam penelitian ini yaitu tabel data stock untuk kepentingan clustering dan tabel data transaksi untuk market basket analysis. Data-data mentah yang langsung dari InshofMart tersebut terdiri dari beberapa entitas, nilai, dan atribut : a. Terdapat 58 entitas yang merupakan kategori produk pada tabel data stock. Tabel 4.1 Entitas (Kategori Produk) Pada Tabel Data Stock Kategori Alat-alat Tulis (AT) Alat-alat Kebersihan (AR) Alat Masak / Alumunium (AP) Baby Alat (BA) Baby Food (BF) Bahan Mentah (BM) Bahan Roti / Makanan (BR) Bedak / Cream Baby (BB) ............. dst. (58 kategori) b. Terdapat beberapa atribut dari tabel data stock dan juga tabel data transaksi. Untuk data stock sebenarnya ada banyak atribut antara lain kode produk, nama produk, harga, jumlah tersedia, volume jual per bulan, dan lainnya. Namun karena tujuan penelitian, untuk data stock hanya diminta kategori dan nama produk. Sedangkan untuk data transaksi hanya diminta nomor, tanggal transaksi, nama produk, dan jumlah. Berikut gambarannya : Gambar 4.1 Atribut Tabel Data Stock 35 Gambar 4.2 Atribut Tabel Data Transaksi c. Terdapat 1.005 baris nilai data dari atribut nama produk di tabel data stock. Untuk tabel data transaksi terdapat 3.623 baris nilai data dari atribut nomor dan tanggal, dan 8.737 baris nilai data dari atribut nama produk dan jumlah. Gambar 4.3 Nilai Data Pada Tabel Data Stock Gambar 4.4 Nilai Data Pada Tabel Data Transaksi 3. Verify Data Quality Pada tahap ini kualitas data dan kelengkapannya perlu dievaluasi, karena sering terjadi ketidaklengkapan atau hilangnya nilai-nilai data terutama jika data yang terkumpul begitu banyak dan dalam jangka waktu lama. Untuk itu diperlukan pemeriksaan atribut yang hilang atau kosong, kejelasan atau keambiguan nilai, ejaannya, dan apakah atribut yang nilainya berbeda mempunyai arti sama. Dan dari hasil pengamatan ditemukan beberapa kekurangan, diantaranya: a. Pada tabel data stock, barcode digunakan sebagai primary key. Namun ada beberapa produk yang tidak mempunyai barcode karena produk merupakan titipan dari bisnis mikro warga sekitaran yang masih sederhana. Sedangkan produk yang sudah ber-barcode, barcode-nya pun terlalu panjang sehingga untuk proses penelitian kurang praktis. 36 Gambar 4.5 Item tanpa Kode Produksi b. Pada tabel data transaksi tidak terdapat kode transaksinya, hanya tanggal kapan terjadi sebuah transaksi dan nomor urut transaksi tersebut pada satu tanggal. Sehingga untuk tanggal selanjutnya, nomor urut akan dimulai dari angka 1 (satu) kembali begitu seterusnya ke tanggal berikut. Gambar 4.6 Transaksi tanpa Kode Transaksi 4.1.3 Data Preparation Data preparation merupakan tahap pembentukan data set yang digunakan pada tahap pemodelan dari data mentah. Untuk data set ini akan dibedakan menjadi 2 tabel seperti pada data mentahnya yang terdiri dari tabel data stock dan tabel data transaksi, karena akan dilakukan analisa berbeda pada 2 tabel tersebut sehingga harus dipisahkan meski beberapa atribut dihasilkan dari integrasi kedua tabel. 1. Data Set Description Pada tahap ini dilakukan pemformatan terhadap data set awal, ke dalam sheet excel yang berbeda dari sheet excel data mentah. Karena untuk kepentingan tahap pemodelan data mining agar data mentah dan data set tidak bercampur. Rancangan data set menyesuaikan rumusan pada tahap business understanding, sub determine the data mining goal. Untuk itu perlu perancangan tabel baru 37 yang mendeskripsikan pola clustering data stock dan market basket analysis data transaksi. Setiap tabel data dibedakan ke 2 set, yaitu untuk kepentingan data training dan data testing. Untuk data training pada clustering data stock hanya digunakan 50 item data set, dan market basket analysis data transaksi digunakan yang terdapat nama produk gula pasir putih (1 kg) saja. Sedangkan sisanya akan digunakan sebagai data testing menggunakan bantuan aplikasi. 2. Select Data Data-data yang akan digunakan untuk proses analisa mulai dipilih pada tahap ini, dan pemilihan berdasarkan pada beberapa kriteria termasuk relevansinya terhadap the data mining goal, serta kualitas dan kendala teknis seperti batas volume data atau jenis data. Adapun data yang terpilih merupakan data yang berhubungan dengan clustering dan market basket analysis, diambil dari tabel data stock dan tabel data transaksi. 3. Construct Data Merupakan tahapan yang mana akan dilakukan pengembangan atribut turunan melalui kegiatan transformasi data yang sesuai dengan kebutuhan pemodelan. Transformasi melibatkan agregasi yang mengacu ke operasi dimana nilai-nilai baru dihitung dengan meringkas dari beberapa tabel. Agregasi yang dilakukan pada penelitian ini di antaranya mencari total berapa kali terjadi transaksi dari suatu item dan berapa volume terjualnya selama tanggal 01 November 2016 s/d 31 Maret 2017 dan nilai rata-rata dari jumlah transaksi dan volume penjualan tersebut yang dicari dari tabel data transaksi. Dan setelah didapatkan, data baru tersebut akan diintegrasikan ke dalam tabel data stock yang akan dibahas pada langkah selanjutnya yaitu integrate data dengan atribut yang baru yaitu jumlah transaksi, volume jual, dan rata-rata penjualan. Gambar 4.7 Mencari Total Transaksi dan Volume Jual 38 4. Integrate Data Tahap penggabungan 2 tabel yang memiliki informasi berbeda tentang objek sama menjadi set data baru yang disiapkan pada bagian data preparation. Data yang diintegrasikan merupakan hasil transformasi data di tahap construct data. Hasil perhitungan total transaksi, volume jual, dan rata-rata jual, diintegrasikan pada tabel data stock sebagai atribut turunan untuk kepentingan clustering. Gambar 4.8 Integrasi Atribut Jumlah Transaksi, Volume Jual, Rataan Jual 5. Clean Data Data-data yang diintegrasikan sebelumnya, akan dilakukan cleaning pada tahap ini guna memastikan sudah layak dieksekusi atau belum. Diperlukan cleaning dan repairing data failed, menghapus yang tidak perlu, mengkonsistenkan data yang belum konsisten. Dari hasil penelusuran pada tahap data understanding terdapat beberapa data yang perlu diperbaiki, berikut data-data tersebut : a. Seperti yang telah dijelaskan pada tahap describe the data sub pembahasan verify data quality, terdapat masalah pada kode produksi. Untuk itu perlu dilakukan manipulasi kode produk, guna memudahkan clustering. Sehingga tidak perlu menyertakan nama produk yang panjang, tapi dengan kode singkat. Untuk pembuatannya dilakukan sesuai inisial kategori, diikuti tanda hyphen (-), lalu nomor urut produk dalam baris kategori. Adapun kegiatan itu hanya untuk kepentingan penelitian, tidak untuk selain penelitian ini. Gambar 4.9 Penambahan Atribut Kode Produksi 39 b. Pada tabel transaksi juga bermasalah dengan kode transaksinya, yaitu tidak terdapat kode transaksi melainkan hanya tanggal dan nomor urut. Sehingga untuk kepentingan penelitian akan dilakukan penggabungan tanggal dengan nomor. Adapun formatnya dimulai dari 2 digit angka belakang tahun, 2 digit bulan, 2 digit tanggal, diikuti hyphen (-) yang kemudian 4 digit nomor urut. Gambar 4.10 Penambahan Atribut Kode Transaksi 6. Format Data Merupakan tahap akhir dalam pembangunan data set yang siap dieksekusi atau diolah ke dalam tahap pemodelan data mining. Format data set akhir berupa tabel yang mana dalam penelitian ini terdapat dua tabel yaitu untuk pemodelan clustering dan market basket analysis. Data yang sudah siap diolah dari tabel data stock antara lain kategori, kode, nama produk, jumlah transaksi, volume penjualan, dan rata-rata penjualan. Sedangkan untuk tabel data transaksi antara lain nomor, tanggal, kode transaksi, nama produk, dan jumlah. Gambar 4.11 Format Tabel Data Stock Gambar 4.12 Format Tabel Data Transaksi 40 4.1.4 Modelling Tahap Modelling merupakan tahap di mana model teknik (algoritma data mining) dipilih kemudian digunakan untuk mengolah data, dan parameternya disesuaikan untuk mengoptimalkan nilai-nilai. Untuk itu dalam melakukan pengolahan data pada penelitian, algoritma yang digunakan adalah k-means dan fuzzy c-covering. Kedua algoritma tersebut telah disesuaikan dengan permasalahan dan format datadatanya. Yang mana untuk clustering data stock, lebih cocok dengan algoritma clustering yang salah satunya adalah k-means dan untuk market basket analysis, lebih cocok dengan algoritma asosiasi yang salah satunya adalah fuzzy c-covering yang juga merupakan perluasan dari fuzzy c-partition. 4.1.4.1 Perhitungan K-Means secara Manual Dalam perhitungan menggunakan algoritma k-means secara manual, data yang digunakan diambil secara acak berjumlah 50 sampel data dari keseluruhan data yang sudah bersih dan siap digunakan berjumlah 1005 nama item. Pada tabel 4.2 berikut, akan dijelaskan mengenai sampel data yang akan digunakan tersebut. Tabel 4.2 Data Sampel Perhitungan K-Means Manual pada Iterasi ke-1 No. Kode Jumlah Transaksi Volume Jual Rata-rata Penjualan 1 AT-001 3 3 1,00 2 AT-013 26 27 1,04 3 AT-014 10 11 1,10 4 BM-001 93 94 1,01 5 BM-002 24 26 1,08 6 BM-003 69 103 1,49 7 BM-005 40 98 2,45 8 BM-007 43 100 2,33 9 DR-004 28 30 1,07 10 DR-005 78 86 1,10 11 DR-006 14 23 1,64 12 KP-009 24 24 1,00 13 KP-010 28 28 1,00 41 14 KP-011 104 106 1,02 15 MI-003 12 38 3,17 16 MI-004 10 25 2,50 17 MI-005 6 14 2,33 18 MI-007 6 15 2,50 19 MI-008 3 10 3,33 20 MI-009 4 8 2,00 21 MI-010 6 14 2,33 22 MI-011 27 79 2,93 23 MI-012 1 2 2,00 24 MI-013 3 5 1,67 25 MI-014 10 31 3,10 26 MI-015 20 48 2,40 27 RB-017 35 35 1,00 28 RB-019 16 49 3,06 29 RB-020 15 45 3,00 30 RB-021 11 36 3,27 31 RB-022 13 39 3,00 32 RG-011 4 4 1,00 33 SC-002 24 31 1,29 34 SK-006 67 68 1,01 35 SB-019 29 32 1,10 36 SN-011 46 46 1,00 37 SN-012 33 33 1,00 38 SN-032 21 35 1,67 39 SN-033 4 7 1,75 40 SN-034 31 32 1,03 41 SN-035 18 26 1,44 42 SN-036 11 21 1,91 43 SS-001 31 31 1,00 44 SS-002 33 33 1,00 45 SS-004 51 51 1,00 46 TK-013 42 42 1,00 42 47 TK-014 10 10 1,00 48 TK-022 37 47 1,27 49 TK-025 21 28 1,33 50 TP-014 34 34 1,00 Dari tabel data sampel perhitungan K-Means secara manual, berikut perhitungan atau langkah-langkah dalam pengolahan data-data menggunakan K-Means : 1. Menentukan Dahulu Berapa Jumlah Cluster yang akan Dibentuk Dalam penelitian ini, peneliti menentukan cluster yang akan dibentuk adalah k-3. Dengan pertimbangan dibentuknya 3 cluster agar dapat diketahui tingkat yang lebih bervariasi dari kelompok produk berdasarkan daya jualnya. 2. Menentukan Titik Pusat Cluster Tabel 4.3 Titik Pusat Cluster (Centroid) Atribut Cluster 0 Cluster 1 Cluster 2 Jumlah Transaksi 1,00 24,00 104,00 Volume Jual 2,00 31,00 106,00 Rata-rata Penjualan 2,00 1,29 1,02 3. Menghitung Jarak antara Data ke Titik Pusat Terdekat (Euclidean Distances) Peneliti menggunakan rumus Euclidean Distances dalam penelitian ini, untuk menghitung jarak antara data dengan titik pusat (centroid). Berikut langkah dalam perhitungan K-Means menggunakan rumus Euclidean Distances : D (x,y) = √(π1 − π1 )2 + (π2 − π2 )2 + (π3 − π3 )2 (4.1) Melihat dari persamaan di atas mengapa π1 sampai dengan π3 begitu juga π1 sampai dengan π3 , itu karena terdapat 3 atribut dalam tabel data stock yang digunakan dalam pemodelan k-means. Untuk lebih jelasnya, berikut beberapa contoh perhitungan yang dilakukan dengan rumus Euclidean Distances : 43 a. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-0 : D (1,0) = √(X1.1 − Y0.1 )2 + (X1.2 − Y0.2 )2 + (X1.3 − Y0.3 )2 = √(3 − 1,00)2 + (3 − 2,00)2 + (1,00 − 2,00)2 = √4 + 1 + 1 = 2,45 b. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-1 : D (1,1) = √(X1.1 − Y1.1 )2 + (X1.2 − Y1.2 )2 + (X1.3 − Y1.3 )2 = √(3 − 24,00)2 + (3 − 31,00)2 + (1,00 − 1,29)2 = √441 + 784 + 0,084 = 35,00 c. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-2 : D (1,2) = √(X1.1 − Y2.1 )2 + (X1.2 − Y2.2 )2 + (X1.3 − Y2.3 )2 = √(3 − 104,00)2 + (3 − 106,00)2 + (1,00 − 1,02)2 = √10.201 + 10.609 + 0,0004 = 144,26 d. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-0 : D (2,0) = √(X 2.1 − Y0.1 )2 + (X 2.2 − Y0.2 )2 + (X 2.3 − Y0.3 )2 = √(26 − 1,00)2 + (27 − 2,00)2 + (1,04 − 2,00)2 = √625 + 625 + 0,92 = 35,37 e. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-1 : D (2,1) = √(X 2.1 − Y1.1 )2 + (X 2.2 − Y1.2 )2 + (X 2.3 − Y1.3 )2 = √(26 − 24,00)2 + (27 − 31,00)2 + (1,04 − 1,29)2 = √4 + 16 + 0,06 = 4,48 44 f. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-2 : D (2,2) = √(X 2.1 − Y2.1 )2 + (X 2.2 − Y2.2 )2 + (X 2.3 − Y2.3 )2 = √(26 − 104,00)2 + (27 − 106,00)2 + (1,04 − 1,02)2 = √6.084 + 6.241 + 0,0004 = 111,02 g. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-0 : D (3,0) = √(X 3.1 − Y0.1 )2 + (X 3.2 − Y0.2 )2 + (X 3.3 − Y0.3 )2 = √(10 − 1,00)2 + (11 − 2,00)2 + (1,10 − 2,00)2 = √81 + 81 + 0,81 = 12,76 h. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-1 : D (3,1) = √(X 3.1 − Y1.1 )2 + (X 3.2 − Y1.2 )2 + (X 3.3 − Y1.3 )2 = √(10 − 24,00)2 + (11 − 31,00)2 + (1,10 − 1,29)2 = √196 + 400 + 0,04 = 24,41 i. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-2 : D (3,2) = √(X 3.1 − Y2.1 )2 + (X 3.2 − Y2.2 )2 + (X 3.3 − Y2.3 )2 = √(10 − 104,00)2 + (11 − 106,00)2 + (1,10 − 1,02)2 = √8.836 + 9.025 + 0,00 = 133,65 j. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-0 : D (4,0) = √(X 4.1 − Y0.1 )2 + (X 4.2 − Y0.2 )2 + (X 4.3 − Y0.3 )2 = √(93 − 1,00)2 + (94 − 2,00)2 + (1,01 − 2,00)2 = √8.464 + 8.464 + 0,98 = 130,11 45 k. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-1 : D (4,1) = √(X 4.1 − Y1.1 )2 + (X 4.2 − Y1.2 )2 + (X 4.3 − Y1.3 )2 = √(93 − 24,00)2 + (94 − 31,00)2 + (1,01 − 1,29)2 = √4.761 + 3.969 + 0,08 = 93,43 l. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-2 : D (4,2) = √(X 4.1 − Y2.1 )2 + (X 4.2 − Y2.2 )2 + (X 4.3 − Y2.3 )2 = √(93 − 104,00)2 + (94 − 106,00)2 + (1,01 − 1,02)2 = √121 + 144 + 0,00 = 16,28 m. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-0 : D (5,0) = √(X 5.1 − Y0.1 )2 + (X 5.2 − Y0.2 )2 + (X 5.3 − Y0.3 )2 = √(24 − 1,00)2 + (26 − 2,00)2 + (1,08 − 2,00)2 = √529 + 576 + 0,85 = 33,25 n. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-1 : D (5,1) = √(X 5.1 − Y1.1 )2 + (X 5.2 − Y1.2 )2 + (X 5.3 − Y1.3 )2 = √(24 − 24,00)2 + (26 − 31,00)2 + (1,08 − 1,29)2 = √0,00 + 25 + 0,04 = 5,00 o. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-2 : D (5,2) = √(X 5.1 − Y2.1 )2 + (X 5.2 − Y2.2 )2 + (X 5.3 − Y2.3 )2 = √(24 − 104,00)2 + (26 − 106,00)2 + (1,08 − 1,02)2 = √6.400 + 6.400 + 0,06 = 113,14 46 Berikut merupakan tabel dari hasil perhitungan menggunakan algoritma k-means dengan rumus Euclidean Distances, untuk menentukan jarak terdekat antara data dengan titik pusat pada iterasi ke-1. Tabel 4.4 Hasil Perhitungan K-Means pada Iterasi ke-1 No. Kode J.T. V.J. Rr.P. C.0 C.1 C.2 C.0 C.1 C.2 1 AT-001 3 3 1,00 2,45 35,00 144,26 2 AT-013 26 27 1,04 35,37 4,48 3 AT-014 10 11 1,10 12,76 24,41 133,65 4 BM-001 93 94 1,01 130,11 93,43 16,28 5 BM-002 24 26 1,08 33,25 5,00 113,14 6 BM-003 69 103 1,49 121,76 84,91 35,13 * 7 BM-005 40 98 2,45 103,62 68,89 64,51 * 8 BM-007 43 100 2,33 106,62 71,58 61,31 * 9 DR-004 28 30 1,07 38,91 4,13 107,48 10 DR-005 78 86 1,10 113,96 77,08 32,80 11 DR-006 14 23 1,64 24,70 12,81 122,43 * 12 KP-009 24 24 1,00 31,84 7,01 114,56 * 13 KP-010 28 28 1,00 37,50 5,01 108,90 * 14 KP-011 104 106 1,02 146,38 109,66 15 MI-003 12 38 3,17 37,66 14,02 114,42 * 16 MI-004 10 25 2,50 24,70 15,28 124,09 * 17 MI-005 6 14 2,33 13,00 24,78 134,42 * 18 MI-007 6 15 2,50 13,94 24,11 133,74 * 19 MI-008 3 10 3,33 8,35 29,77 139,36 * 20 MI-009 4 8 2,00 6,71 30,49 140,02 * 21 MI-010 6 14 2,33 13,00 24,78 134,42 * 22 MI-011 27 79 2,93 81,28 48,12 23 MI-012 1 2 2,00 0,00 37,02 146,38 * 24 MI-013 3 5 1,67 3,62 33,42 142,84 * * 111,02 * * * * * * 0,00 * 81,62 * 47 25 MI-014 10 31 3,10 30,38 14,12 120,27 * 26 MI-015 20 48 2,40 49,77 17,50 102,09 * 27 RB-017 35 35 1,00 47,39 11,71 99,01 * 28 RB-019 16 49 3,06 49,35 19,78 104,87 * 29 RB-020 15 45 3,00 45,23 16,73 107,92 * 30 RB-021 11 36 3,27 35,46 14,07 116,42 * 31 RB-022 13 39 3,00 38,91 13,71 113,02 * 32 RG-011 4 4 1,00 3,74 33,60 142,84 33 SC-002 24 31 1,29 37,02 0,00 109,66 34 SK-006 67 68 1,01 93,34 56,73 53,04 35 SB-019 29 32 1,10 41,05 5,10 105,36 * 36 SN-011 46 46 1,00 62,94 26,63 83,45 * 37 SN-012 33 33 1,00 44,56 9,22 101,83 * 38 SN-032 21 35 1,67 38,59 5,01 109,23 * 39 SN-033 4 7 1,75 5,84 31,24 140,72 40 SN-034 31 32 1,03 42,44 7,08 103,95 * 41 SN-035 18 26 1,44 29,42 7,81 117,46 * 42 SN-036 11 21 1,91 21,47 16,41 126,00 * 43 SS-001 31 31 1,00 41,74 7,01 104,66 * 44 SS-002 33 33 1,00 44,56 9,22 101,83 * 45 SS-004 51 51 1,00 70,01 33,60 76,38 * 46 TK-013 42 42 1,00 57,29 21,10 89,11 * 47 TK-014 10 10 1,00 12,08 25,24 134,36 48 TK-022 37 47 1,27 57,63 20,62 89,28 * 49 TK-025 21 28 1,33 32,81 4,24 113,90 * 50 TP-014 34 34 1,00 45,98 10,44 100,42 * * * * * * Keterangan : J.T. = Jumlah Transaksi C.0 = Cluster 0 V.J. = Volume Jual C.1 = Cluster 1 Rr.P. = Rata-rata Penjualan C.2 = Cluster 2 48 Dengan menggunakan Euclidean Distances dalam perhitungan K-Means pada tabel di atas, kemudian dipilih data atau item yang mempunyai jarak terdekat (terkecil) dengan titik pusat pada masing-masing cluster. Data atau item yang jaraknya ke titik pusat paling dekat, maka akan menjadi anggota pada cluster tersebut. Dilihat dari tabel perhitungan terdapat data yang diberi tanda dengan tulisan tebal atau kolom dengan tanda bintang, misalnya pada item berkode AT-001 di mana cluster 0 = 2,45; cluster 1 = 35,00; cluster 2 = 144,26. Karena jarak terkecil ada di cluster 0, maka item AT-001 untuk iterasi-1 merupakan anggota dari cluster 0 dengan tanda font bold dan tanda bintang pada kolom di sebelahnya. Sedangkan untuk yang lain seperti item MI-003 masuk dalam cluster 1 = 14,02 dan untuk item SS-001 masuk cluster 1 = 7,01 begitu pun yang lainnya dapat dilihat dengan bantuan tanda-tandanya. 4. Menghitung Titik Pusat Baru Menggunakan Jumlah Keseluruhan per Cluster Untuk menghitung titik pusat cluster yang baru ditentukan berdasarkan ratarata anggota dari tiap cluster. Berikut perhitungannya : a. Perhitungan titik pusat baru pada cluster 0, yang mana terdapat 12 anggota data ke-{1, 3, 17, 18, 19, 20, 21, 23, 24, 32, 39, 47} : 3+10+6+6+3+4+6+1+3+4+4+10 C.0 (1) = ( ) 12 = 5,00 3+11+14+15+10+8+14+2+5+4+7+10 C.0 (2) = ( ) 12 = 8,58 1,00+1,10+2,33+2,50+3,33+2,00+2,33+ 2,00+1,67+1,00+1,75+1,00 C.0 (3) = ( ) 12 = 1,83 b. Perhitungan titik pusat baru pada cluster 1, yang mana terdapat 31 anggota data ke-{2, 5, 9, 11, 12, 13, 15, 16, 22, 25, 26, 27, 28, 29, 30, 31, 33, 35, 36, 37, 38, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50} : 49 26+24+28+14+24+28+12+10+27+10+20+ 35+16+15+11+13+24+29+46+33+21+ 31+18+11+31+33+51+42+37+21+34 C.1 (1) = ( ) 31 = 25,00 27+26+30+23+24+28+38+25+79+31+48+35+ 49+45+36+39+31+32+46+33+35+32+ 26+21+31+33+51+42+47+28+34 C.1 (2) = ( ) 31 = 35,65 1,04+1,08+1,07+1,64+1,00+1,00+3,17+2,50+2,93+3,10+ 2,40+1,00+3,06+3,00+3,27+3,00+1,29+1,10+1,00+1,00+ 1,67+1,03+1,44+1,91+1,00+1,00+1,00+1,00+1,27+1,33+1,00 C.1 (3) = ( ) 31 = 1,69 c. Perhitungan titik pusat baru pada cluster 2, yang mana terdapat 7 anggota data ke-{4, 6, 7, 8, 10, 14, 34} : 93+69+40+43+78+104+67 C.2 (1) = ( ) 7 = 70,57 94+103+98+100+86+106+68 C.2 (2) = ( ) 7 = 93,57 1,01+1,49+2,45+2,33+1,10+1,02+1,01 C.2 (3) = ( ) 7 = 1,49 Setelah didapatkan titik pusat baru dari perhitungan di atas yang mana hasilnya untuk cluster 0 {(5,00), (8,58), (1,83)}, cluster 1 {(25,00), (35,65), (1,69)}, cluster 2 {(70,57), (93,57), (1,49)}. Selanjutnya titik pusat tersebut digunakan dalam pengolahan data selanjutnya. Berikut tabel titik pusat baru yang akan digunakan untuk pengolahan data pada iterasi ke-2. 50 Tabel 4.5 Titik Pusat Cluster Baru dari Iterasi ke-1 Atribut Cluster 0 Cluster 1 Cluster 2 Jumlah Transaksi 5,00 25,00 70,57 Volume Jual 8,58 35,65 93,57 Rata-rata Penjualan 1,83 1,69 1,49 5. Mengulang kembali langkah ke 3 dan 4, dan iterasi terus berlanjut hingga tidak ditemukan lagi perubahan posisi data terhadap titik pusatnya di dalam cluster. Berikut perhitungan pada iterasi ke-2 yang sama seperti pada iterasi ke-1 yang dilakukan menggunakan rumus Euclidean Distances : a. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-0 : D (1,0) = √(X1.1 − Y0.1 )2 + (X1.2 − Y0.2 )2 + (X1.3 − Y0.3 )2 = √(3 − 5,00)2 + (3 − 8,58)2 + (1,00 − 1,83)2 = √4 + 31,14 + 0,69 = 5,99 b. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-1 : D (1,1) = √(X1.1 − Y1.1 )2 + (X1.2 − Y1.2 )2 + (X1.3 − Y1.3 )2 = √(3 − 25,00)2 + (3 − 35,65)2 + (1,00 − 1,69)2 = √484 + 1.066,02 + 0,48 = 39,37 c. Jarak terhadap data item pertama dengan titik pusat dari cluster ke-2 : D (1,2) = √(X1.1 − Y2.1 )2 + (X1.2 − Y2.2 )2 + (X1.3 − Y2.3 )2 = √(3 − 70,57)2 + (3 − 93,57)2 + (1,00 − 1,49)2 = √4.565,70 + 8.202,92 + 0,24 = 113,00 51 d. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-0 : D (2,0) = √(X 2.1 − Y0.1 )2 + (X 2.2 − Y0.2 )2 + (X 2.3 − Y0.3 )2 = √(26 − 5,00)2 + (27 − 8,58)2 + (1,04 − 1,83)2 = √441 + 339,30 + 0,62 = 27,94 e. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-1 : D (2,1) = √(X 2.1 − Y1.1 )2 + (X 2.2 − Y1.2 )2 + (X 2.3 − Y1.3 )2 = √(26 − 25,00)2 + (27 − 35,65)2 + (1,04 − 1,69)2 = √1 + 74,82 + 0,42 = 8,73 f. Jarak terhadap data item kedua dengan titik pusat dari cluster ke-2 : D (2,2) = √(X 2.1 − Y2.1 )2 + (X 2.2 − Y2.2 )2 + (X 2.3 − Y2.3 )2 = √(26 − 70,57)2 + (27 − 93,57)2 + (1,04 − 1,49)2 = √1.986,48 + 4.431,56 + 0,20 = 80,12 g. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-0 : D (3,0) = √(X 3.1 − Y0.1 )2 + (X 3.2 − Y0.2 )2 + (X 3.3 − Y0.3 )2 = √(10 − 5,00)2 + (11 − 8,58)2 + (1,10 − 1,83)2 = √25 + 5,86 + 0,53 = 5,60 h. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-1 : D (3,1) = √(X 3.1 − Y1.1 )2 + (X 3.2 − Y1.2 )2 + (X 3.3 − Y1.3 )2 = √(10 − 25,00)2 + (11 − 35,65)2 + (1,10 − 1,69)2 = √225 + 607,62 + 0,35 = 28,86 52 i. Jarak terhadap data item ketiga dengan titik pusat dari cluster ke-2 : D (3,2) = √(X 3.1 − Y2.1 )2 + (X 3.2 − Y2.2 )2 + (X 3.3 − Y2.3 )2 = √(10 − 70,57)2 + (11 − 93,57)2 + (1,10 − 1,49)2 = √3.668,72 + 6.817,80 + 0,15 = 102,41 j. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-0 : D (4,0) = √(X 4.1 − Y0.1 )2 + (X 4.2 − Y0.2 )2 + (X 4.3 − Y0.3 )2 = √(93 − 5,00)2 + (94 − 8,58)2 + (1,01 − 1,83)2 = √7.744 + 7.296,58 + 0,67 = 122,64 k. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-1 : D (4,1) = √(X 4.1 − Y1.1 )2 + (X 4.2 − Y1.2 )2 + (X 4.3 − Y1.3 )2 = √(93 − 25,00)2 + (94 − 35,65)2 + (1,01 − 1,69)2 = √4.624 + 3.404,72 + 0,46 = 89,61 l. Jarak terhadap data item keempat dengan titik pusat dari cluster ke-2 : D (4,2) = √(X 4.1 − Y2.1 )2 + (X 4.2 − Y2.2 )2 + (X 4.3 − Y2.3 )2 = √(93 − 70,57)2 + (94 − 93,57)2 + (1,01 − 1,49)2 = √503,10 + 0,18 + 0,23 = 22,44 m. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-0 : D (5,0) = √(X 5.1 − Y0.1 )2 + (X 5.2 − Y0.2 )2 + (X 5.3 − Y0.3 )2 = √(24 − 5,00)2 + (26 − 8,58)2 + (1,08 − 1,83)2 = √361 + 303,46 + 0,56 = 25,79 53 n. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-1 : D (5,1) = √(X 5.1 − Y1.1 )2 + (X 5.2 − Y1.2 )2 + (X 5.3 − Y1.3 )2 = √(24 − 25,00)2 + (26 − 35,65)2 + (1,08 − 1,69)2 = √1 + 93,12 + 0,37 = 9,72 o. Jarak terhadap data item kelima dengan titik pusat dari cluster ke-2 : D (5,2) = √(X 5.1 − Y2.1 )2 + (X 5.2 − Y2.2 )2 + (X 5.3 − Y2.3 )2 = √(24 − 70,57)2 + (26 − 93,57)2 + (1,08 − 1,49)2 = √2.168,76 + 4.565,70 + 0,17 = 82,07 Berikut merupakan tabel dari hasil perhitungan menggunakan algoritma k-means dengan rumus Euclidean Distances, untuk menentukan jarak terdekat antara data dengan titik pusat pada iterasi ke-2. Tabel 4.6 Hasil Perhitungan K-Means pada Iterasi ke-2 No. Kode J.T. V.J. Rr.P. C.0 1 AT-001 3 3 1,00 5,99 39,37 113,00 2 AT-013 26 27 1,04 27,94 8,73 3 AT-014 10 11 1,10 5,60 28,86 102,41 4 BM-001 93 94 1,01 122,64 89,61 22,44 5 BM-002 24 26 1,08 9,72 82,07 6 BM-003 69 103 1,49 114,06 80,45 9,56 * 7 BM-005 40 98 2,45 96,02 64,14 30,91 * 8 BM-007 43 100 2,33 99,00 66,83 28,32 * 9 DR-004 28 30 1,07 31,44 6,42 76,51 10 DR-005 78 86 1,10 106,41 73,11 10,61 11 DR-006 14 23 1,64 17,00 16,76 90,45 * 12 KP-009 24 24 1,00 24,48 11,71 83,72 * 13 KP-010 28 28 1,00 30,11 8,24 78,18 * 25,79 C.1 C.2 C.0 C.1 C.2 * 80,12 * * * * * * 54 14 KP-011 104 106 1,02 138,89 105,79 35,67 * 15 MI-003 12 38 3,17 30,27 13,29 80,76 16 MI-004 10 25 2,50 17,17 18,41 91,50 * 17 MI-005 6 14 2,33 5,53 28,81 102,48 * 18 MI-007 6 15 2,50 6,53 28,07 101,71 * 19 MI-008 3 10 3,33 2,87 33,83 107,49 * 20 MI-009 4 8 2,00 1,17 34,72 108,42 * 21 MI-010 6 14 2,33 5,53 28,81 102,48 * 22 MI-011 27 79 2,93 73,78 43,42 23 MI-012 1 2 2,00 7,71 41,33 115,00 * 24 MI-013 3 5 1,67 4,11 37,72 111,40 * 25 MI-014 10 31 3,10 23,00 15,77 87,10 * 26 MI-015 20 48 2,40 42,18 13,35 68,08 * 27 RB-017 35 35 1,00 39,98 10,04 68,53 * 28 RB-019 16 49 3,06 41,90 16,16 70,48 * 29 RB-020 15 45 3,00 37,78 13,76 73,82 * 30 RB-021 11 36 3,27 28,10 14,09 82,86 * 31 RB-022 13 39 3,00 31,47 12,53 79,34 * 32 RG-011 4 4 1,00 4,76 37,99 111,60 33 SC-002 24 31 1,29 29,39 4,77 78,00 34 SK-006 67 68 1,01 85,88 53,02 25,82 35 SB-019 29 32 1,10 33,54 5,44 74,29 * 36 SN-011 46 46 1,00 55,51 23,42 53,54 * 37 SN-012 33 33 1,00 37,16 8,45 71,28 * 38 SN-032 21 35 1,67 30,88 4,05 76,73 * 39 SN-033 4 7 1,75 1,87 35,52 109,21 40 SN-034 31 32 1,03 35,00 7,05 73,19 * 41 SN-035 18 26 1,44 21,74 11,92 85,61 * 42 SN-036 11 21 1,91 13,79 20,26 93,89 43 SS-001 31 31 1,00 34,34 7,62 74,04 * 44 SS-002 33 33 1,00 37,16 8,45 71,28 * * 45,97 * * * * * * 55 45 SS-004 51 51 1,00 62,58 30,20 46,86 * 46 TK-013 42 42 1,00 49,86 18,16 58,96 * 47 TK-014 10 10 1,00 5,26 29,72 103,21 48 TK-022 37 47 1,27 50,00 16,53 57,41 * 49 TK-025 21 28 1,33 25,16 8,64 82,20 * 50 34 34 1,00 38,57 9,17 69,90 * TP-014 * 6. Menghitung Titik Pusat Baru Menggunakan Jumlah Keseluruhan per Cluster a. Perhitungan titik pusat baru pada cluster 0, yang mana terdapat 14 anggota data ke-{1, 3, 16, 17, 18, 19, 20, 21, 23, 24, 32, 39, 42, 47} : 3+10+10+6+6+3+4+6+1+3+4+4+11+10 C.0 (1) = ( ) 14 = 5,79 3+11+25+14+15+10+8+14+2+5+4+7+21+10 C.0 (2) = ( ) 14 = 10,64 1,00+1,10+2,50+2,33+2,50+3,33+2,00+2,33+ 2,00+1,67+1,00+1,75+1,91+1,00 C.0 (3) = ( ) 14 = 1,89 b. Perhitungan titik pusat baru pada cluster 1, yang mana terdapat 29 anggota data ke-{2, 5, 9, 11, 12, 13, 15, 22, 25, 26, 27, 28, 29, 30, 31, 33, 35, 36, 37, 38, 40, 41, 43, 44, 45, 46, 48,49,50} : 26+24+28+14+24+28+12+27+10+20+35+16+15+11+13+ 24+29+46+33+21+31+18+31+33+51+42+37+21+34 C.1 (1) = ( ) 29 = 26,00 27+26+30+23+24+28+38+79+31+48+35+49+45+36+39+ 31+32+46+33+35+32+26+31+33+51+42+37+21+34 C.1 (2) = ( ) 29 = 36,52 56 1,04+1,08+1,07+1,64+1,00+1,00+3,17+2,93+3,10+2,40+ 1,00+3,06+3,00+3,27+3,00+1,29+1,10+1,00+1,00+1,67+ 1,03+1,44+1,00+1,00+1,00+1,00+1,27+1,33+1,00 C.1 (3) = ( ) 29 = 1,65 c. Perhitungan titik pusat baru pada cluster 2, yang mana terdapat 7 anggota data ke-{4, 6, 7, 8, 10, 14, 34} : 93+69+40+43+78+104+67 C.2 (1) = ( ) 7 = 70,57 94+103+98+100+86+106+68 C.2 (2) = ( ) 7 = 93,57 1,01+1,49+2,45+2,33+1,10+1,02+1,01 C.2 (3) = ( ) 7 = 1,49 Berikut tabel titik pusat baru yang akan digunakan untuk pengolahan data pada iterasi selanjutnya jika posisi data masih berubah terhadap titik pusatnya. Tabel 4.7 Titik Pusat Cluster Baru dari Iterasi ke-2 Atribut Cluster 0 Cluster 1 Cluster 2 Jumlah Transaksi 5,79 26,00 70,57 Volume Jual 10,64 36,52 93,57 Rata-rata Penjualan 1,89 1,65 1,49 7. Karena posisi data terhadap titik pusat cluster masih berubah, maka dilanjutkan ke iterasi berikutnya dengan mengulangi langkah 5 dan 6. Pada penelitian ini, untuk mendapatkan hasil titik pusat cluster yang tidak berubah atau titik pusat akhir terdapat pada iterasi ke-4. Pada iterasi ke-4 jika dilanjutkan ke iterasi 5, posisi data sudah tidak berubah-ubah lagi. Itu tandanya data sudah mantap menempati clusternya masing-masing, yang artinya iterasi dapat diakhiri pada iterasi ke-4. Berikut hasil akhir posisi data dan titik pusatnya pada iterasi ke-4 : 57 Tabel 4.8 Hasil Perhitungan K-Means pada Iterasi ke-4 No. Kode J.T. V.J. Rr.P. C.0 1 AT-001 3 3 1,00 9,14 41,30 113,00 2 AT-013 26 27 1,04 25,08 10,03 3 AT-014 10 11 1,10 3,78 30,76 102,41 4 BM-001 93 94 1,01 119,68 87,64 22,44 5 BM-002 24 26 1,08 11,28 82,07 6 BM-003 69 103 1,49 110,93 78,54 9,56 * 7 BM-005 40 98 2,45 92,85 62,50 30,91 * 8 BM-007 43 100 2,33 95,83 65,15 28,32 * 9 DR-004 28 30 1,07 28,52 7,20 76,51 10 DR-005 11 DR-006 78 86 1,10 103,40 71,14 10,61 14 23 1,64 13,85 18,72 90,45 12 KP-009 24 24 1,00 21,68 13,24 83,72 * 13 KP-010 28 28 1,00 27,27 9,16 78,18 * 14 KP-011 104 106 1,02 135,93 103,82 35,67 15 MI-003 12 38 3,17 27,16 14,54 80,76 16 MI-004 10 25 2,50 14,04 20,36 91,50 * 17 MI-005 6 14 2,33 2,60 30,77 102,48 * 18 MI-007 6 15 2,50 3,60 30,03 101,71 * 19 MI-008 3 10 3,33 3,92 35,79 107,49 * 20 MI-009 4 8 2,00 4,18 36,66 108,42 * 21 MI-010 6 14 2,33 2,60 30,77 102,48 * 22 MI-011 27 79 2,93 70,63 42,02 23 MI-012 1 2 2,00 10,87 43,26 115,00 * 24 MI-013 3 5 1,67 7,28 39,66 111,40 * 25 MI-014 10 31 3,10 19,91 17,55 87,10 * 26 MI-015 20 48 2,40 39,01 12,76 68,08 * 27 RB-017 35 35 1,00 37,10 8,83 68,53 * 28 RB-019 16 49 3,06 38,78 15,96 70,48 * 29 RB-020 15 45 3,00 34,65 14,02 73,82 * 30 RB-021 11 36 3,27 25,01 15,55 82,86 * 31 RB-022 13 39 3,00 28,35 13,64 79,34 * 32 RG-011 4 4 1,00 7,87 39,91 111,60 22,89 C.1 C.2 C.0 C.1 C.2 * 80,12 * * * * * * * * * 45,97 * * 58 33 SC-002 24 31 1,29 26,34 6,48 78,00 34 SK-006 67 68 1,01 82,93 51,06 25,82 35 SB-019 29 32 1,10 30,59 5,65 74,29 * 36 SN-011 46 46 1,00 52,60 21,55 53,54 * 37 SN-012 33 33 1,00 34,29 7,72 71,28 * 38 SN-032 21 35 1,67 27,73 5,79 76,73 * 39 SN-033 4 7 1,75 5,04 37,46 109,21 40 SN-034 31 32 1,03 32,11 6,80 73,19 * 41 SN-035 18 26 1,44 18,64 13,86 85,61 * 42 SN-036 11 21 1,91 10,61 22,23 93,89 43 SS-001 31 31 1,00 31,48 7,57 74,04 * 44 SS-002 33 33 1,00 34,29 7,72 71,28 * 45 SS-004 51 51 1,00 59,66 28,29 46,86 * 46 TK-013 42 42 1,00 46,96 16,37 58,96 * 47 TK-014 10 10 1,00 4,04 31,61 103,21 48 TK-022 37 47 1,27 46,94 14,56 57,41 * 49 TK-025 21 28 1,33 22,11 10,52 82,20 * 50 TP-014 34 34 1,00 35,69 8,17 69,90 * * * * * * Tabel 4.9 Titik Pusat Cluster Akhir pada Iterasi ke-4 Atribut Cluster 0 Cluster 1 Cluster 2 Jumlah Transaksi 6,33 26,43 70,57 Volume Jual 11,47 37,00 93,57 Rata-rata Penjualan 1,87 1,65 1,49 8. Dilihat hasil akhir pengolahan data stock berbasis algoritma k-means dengan rumus Euclidean Distances, 3 cluster telah memastikan data-data yang menjadi himpunannya. Nampak kelompok data dari atribut jumlah transaksi, volume transaksi, dan rata-rata penjualan, yang mempunyai nilai terbesar masuk ke himpunan cluster 2. Kemudian yang nilainya sedang masuk cluster 1, dan nilai terkecil masuk cluster 0. Berikut tabel himpunan tiap clusternya : 59 Tabel 4.10 Nilai Terbesar (Himpunan Sangat Laku) pada Cluster 2 Kode Nama Produk BM-001 BM-003 BM-005 BM-007 DR-005 KP-011 Telur Ayam Isi 4 / Pack So Nice Sosis Sapi / 1 Potong Champ Sosis Ayam / 1 Potong Okey Sosis Ayam / 1 Potong Aqua Gelas (240 ml) Gula Pasir Putih (1 kg) Indofood Saus Pedas Sachet Isi 6 (9 gr) SK-006 Jumlah Transaksi Volume Jual Rata-rata Penjualan 93 69 40 43 78 104 94 103 98 100 86 106 1,01 1,49 2,45 2,33 1,10 1,02 67 68 1,01 Tabel 4.11 Nilai Sedang (Himpunan Laku) pada Cluster 1 Kode Nama Produk AT-013 Staedler Pencil 2B BM-002 Telur Ayam Isi 10 / Pack DR-004 Teh Gelas Kotak (330 ml) KP-009 Beras Cap Raja Lele (5 kg) KP-010 Gulaku Premium Gula Tebu (1 kg) Indomie Goreng Jumbo Ayam MI-003 Panggang (127 gr) MI-011 Indomie Instant Rasa Soto (75 gr) Mie Sukses Kuah Ayam Bawang MI-014 (122 gr) Mie Sukses Kuah Kari Ayam MI-015 (122 gr) RB-017 Roti Tawar Pandan RB-019 Roti Isi Abon RB-020 Roti Isi coklat RB-021 Roti Isi Keju RB-022 Roti Isi Pisang Coklat SC-002 Dangdut Sabun Cream Jeruk SB-019 Roma Better Sachet Dua Kelinci Kacang Panggang SN-011 Bawang SN-012 Sukro Kacang Atom Original SN-032 Qtela Tempe Rasa Cabai Rawit Jumlah Transaksi Volume Jual Rata-rata Penjualan 26 24 28 24 28 27 26 30 24 28 1,04 1,08 1,07 1,00 1,00 12 38 3,17 27 79 2,93 10 31 3,10 20 48 2,40 35 16 15 11 13 24 29 35 49 45 36 39 31 32 1,00 3,06 3,00 3,27 3,00 1,29 1,10 46 46 1,00 33 21 33 35 1,00 1,67 60 SN-034 JetZ Stick Chocofiesta SN-035 Taro Snack Net Potato Barbeque Bendera SKM Putih Gold Kaleng SS-001 (385 gr) Bendera SKM Putih Sachet SS-002 Isi 6 (45 gr) Indomilk SKM Coklat Kaleng SS-004 (385 gr) Kopi Kapal Api Kopi Susu TK-013 Renteng Isi 10 (31 gr) TK-022 Teh Celup Sosro Sachet Isi 5 TK-025 Teh Serbuk Cap Bandulan (40 gr) TP-014 Selection Facial Cotton 31 18 32 26 1,03 1,44 31 31 1,00 33 33 1,00 51 51 1,00 42 42 1,00 37 21 34 47 28 34 1,27 1,33 1,00 Tabel 4.12 Nilai Paling Kecil (Himpunan Kurang Laku) pada Cluster 0 Kode Nama Produk AT-001 Joyko Correction Tape CF-S201-PT AT-014 Faber Castell Pencil 2B DR-006 ABC Juice Rasa Mangga (250 ml) MI-004 Indomie Goreng Rasa Soto (85 gr) Indomie Goreng Rasa Ayam MI-005 Bawang (85 gr) MI-007 Indomie Kriting Bulgogi (90 gr) Indomie Keriting Goreng Spesial MI-008 (90 gr) Indomie Instan Rasa Ayam MI-009 Spesial (69 gr) Indomie Instan Rasa Ayam MI-010 Bawang (69 gr) Indomie Instant Rasa Kari Ayam MI-012 (72 gr) Mie Sukses Goreng Ayam MI-013 Kremes (133 gr) RG-011 Kue Kering Kembang Goyang SN-033 Qtela Tempe Rasa Daun Jeruk SN-036 Taro Snack Net Seaweed Kopi Kapal Api Grande White TK-014 Coffe Isi 10 (20 gr) Jumlah Transaksi Volume Jual Rata-rata Penjualan 3 10 14 10 3 11 23 25 1,00 1,10 1,64 2,50 6 14 2,33 6 15 2,50 3 10 3,33 4 8 2,00 6 14 2,33 1 2 2,00 3 5 1,67 4 4 11 4 7 21 1,00 1,75 1,91 10 10 1,00 61 4.1.4.2 Perhitungan Fuzzy C-Covering secara Manual Dalam perhitungan menggunakan algoritma fuzzy c-covering secara manual, data yang digunakan adalah data sampel dari tabel transaksi dimana sampel tersebut adalah data transaksi yang hanya mengandung gula pasir putih (1 kg). Pada tabel berikut, akan dijelaskan mengenai sampel data yang akan digunakan tersebut. Tabel 4.13 Data Sampel Perhitungan Fuzzy C-Covering secara Manual Kode Transaksi 161105-0004 161105-0010 161106-0034 161107-0013 161114-0009 161114-0023 161129-0017 Kode Jenis Item KP-001 Minyak Goreng Cemara Pouch (1 liter) KP-011 Gula Pasir Putih (1 kg) TK-013 Kopi Kapal Api Kopi Susu Renteng Isi 10 (31 gr) ST-006 Snack Marning Jagung Pedas Garuda SN-012 Sukro Kacang Atom Original DB-022 ABC Syrup Squash Orange (625 ml) KP-011 Gula Pasir Putih (1 kg) TK-010 Kopi Jahe 1001 Banded KP-011 Gula Pasir Putih (1 kg) TK-022 Teh Celup Sosro Sachet Isi 5 TK-002 Kopi ABC STJM Bandit KP-011 Gula Pasir Putih (1 kg) .................................................... SB-051 Simba Choco Chips Sereal SS-002 Bendera SKM Putih Sachet Isi 6 (45 gr) BR-012 Forvita Margarine Sachet (200 gr) TK-010 Kopi Jahe 1001 Banded KP-011 Gula Pasir Putih (1 kg) BM-001 Telur Ayam Isi 4 / Pack KP-011 Gula Pasir Putih (1 kg) TK-021 Teh Celup Sariwangi Sachet Isi 5 SK-005 ABC Kecap Pedas Botol (135 ml) KP-002 Minyak Goreng Hemart Pouch (1 liter) RB-015 Roti Tawar Original SS-004 Indomilk SKM Coklat Kaleng (385 gr) .................................................... JL-008 Nutrijell Puding Santan Pandan JL-009 Nutrijell Puding Lapis Coco Pandan BD-023 Kara Sun Coconut Cream (65 ml) 62 161130-0001 161201-0022 161202-0010 161203-0010 170118-0009 170224-0009 170326-0038 170327-0018 BR-015 Koepoe-Koepoe Pewarna Makanan Pandan (30 ml) KP-011 Gula Pasir Putih (1 kg) KP-007 Minyak Goreng Kunci Mas Pouch (1 liter) KP-011 Gula Pasir Putih (1 kg) TK-022 Teh Celup Sosro Sachet Isi 5 MI-011 Indomie Instant Rasa Soto (75 gr) SK-006 Indofood Saus Pedas Sachet Isi 6 (9 gr) TK-002 Kopi ABC STJM Bandit KP-011 Gula Pasir Putih (1 kg) KP-003 Minyak Goreng Sania Botol (1 liter) KP-011 Gula Pasir Putih (1 kg) RG-006 Roti Bolu Kering Original RG-008 Roti Bolu Iris Kering ST-010 Snack Stick Bawang Plesungan Raya ST-011 Snack Kerupuk Bawang Plesungan Raya BR-002 Tepung Terigu Segitiga Biru (1 kg) BR-009 Koepoe-Koepoe Pelembut Kue VX (75 gr) BR-013 Mentega Batangan (250 gr) BR-017 Koepoe-Koepoe Pewarna Makanan Coffee (30 ml) BR-021 MR Cocoa Chocolate Powder (250 gr) KP-011 Gula Pasir Putih (1 kg) .................................................... RB-019 Roti Isi Abon SB-086 Khong Guan Creamy Chocolate Biscuit TK-023 Teh Celup Cap Poci Kotak Isi 25 KP-011 Gula Pasir Putih (1 kg) ST-012 Snack Kerupuk Tengiri Original .................................................... TK-002 Kopi ABC STJM Bandit KP-011 Gula Pasir Putih (1 kg) BR-017 Koepoe-Koepoe Pewarna Makanan Coffee (30 ml) BR-009 Koepoe-Koepoe Pelembut Kue VX (75 gr) BR-002 Tepung Terigu Segitiga Biru (1 kg) BR-007 Koepoe-Koepoe Ovalett (75 gr) .................................................... TK-002 Kopi ABC STJM Bandit KP-011 Gula Pasir Putih (1 kg) TK-009 Kopi Indocafe OB Refil (100 gr) KP-011 Gula Pasir Putih (1 kg) KP-005 Minyak Goreng Bimoli Pouch (1 liter) 63 Dari tabel data sampel perhitungan fuzzy c-covering secara manual, berikut akan dilakukan perhitungan atau pengolahan data-data menggunakan fuzzy c-covering : 1. Menentukan max_item_threshold sesuai yang dibutuhkan, dan dalam penelitian ini akan digunakan max_item_threshold (batas jumlah item) = 4. 2. Mencari record dalam tabel transaksi yang memenuhi max_item_threshold = 4, untuk itu dari tabel data sampel yang jumlah item tiap transaksinya lebih dari 4 tidak disertakan dalam proses selanjutnya atau ditiadakan. Data transaksi yang melebihi max_item_threshold dan perlu dihilangkan ada 8 kode transaksi yang diantaranya adalah 161105-0004, 161114-0009, 161114-0023, 161129-0017, 161202-0010, 161203-0010, 170118-0009, 170224-0009. Berikut tabel data transaksi yang masuk ke dalam QT (Qualified Transaction) : Tabel 4.14 Tabel Data yang Masuk QT (Qualified Transaction) Kode Transaksi 161105-0010 161106-0034 161107-0013 161108-0021 161108-0024 161111-0008 161112-0004 161112-0026 161112-0028 161113-0019 161113-0021 161114-0030 161115-0031 161120-0007 161120-0026 161121-0011 161123-0022 161124-0019 161126-0015 161127-0007 161130-0001 161201-0022 161204-0001 Kode Barang DB-022, KP-011, TK-010 KP-011, TK-022 TK-002, KP-011 KP-011, TK-022, RB-019 MI-033, KP-011, TK-021 RB-014, RB-021, KP-011, TK-022 KP-011, TK-021 KP-011, TK-022, MI-034, SK-006 TK-002, KP-011, SB-044, SB-078 KP-011, TK-022 RK-015, KA-001, TK-015, KP-011 RK-033, TK-002, KP-011 PC-012, KP-011, TK-008 RG-004, RG-008, KP-011, KP-005 KP-011, TK-022 DB-017, TK-021, KP-011 KP-011, TK-022, ST-004, ST-010 KP-011, TK-021 KP-011, TK-022 DB-018, TK-002, KP-011 KP-007, KP-011, TK-022 MI-011, SK-006, TK-002, KP-011 RB-006, RB-008, TK-020, KP-011 64 161206-0005 161207-0012 161209-0006 161210-0014 161211-0062 161213-0005 161213-0012 161215-0012 161216-0003 161220-0004 161220-0012 161224-0001 161224-0017 161225-0010 161226-0005 161228-0002 161230-0017 161231-0026 170102-004 170103-0017 170104-0013 170104-0018 170107-0013 170113-0001 170113-0010 170114-0009 170114-0024 170115-0044 170116-0015 170119-0003 170119-0017 170122-0017 170125-0003 170127-0015 170128-0003 170201-0001 170202-0011 170206-0027 170207-0003 170208-0001 170210-0003 170212-0007 170213-0004 AR-008, SC-002, KP-011, KP-005 KP-011, TK-022, ST-011, SN-015 DB-018, TK-002, KP-011 TK-020, KP-011 MI-018, SK-001, TK-023, KP-011 KP-011, TK-013 TK-020, KP-011 TK-020, KP-011 TK-002, KP-011 KP-011, TK-023, SN-014, ST-001 KP-011, TK-022 KP-011, TK-013, BD-023, JL-007 KP-011, TK-022 TK-020, KP-011 KP-011, TK-013, SK-013 RB-006, KP-011, TK-023 KP-011, TK-010 TK-002, KP-011, SB-044, SB-078 KP-011, TK-013, SK-013, BD-019 TK-020, KP-011 MI-021, KP-011, DB-018 KP-011, TK-022 KP-011, TK-023 KP-011, TK-013 DB-017, TK-002, KP-011 RB-016, SS-001, KP-011, TK-022 TK-020, KP-011 TK-002, KP-011 TK-009, KP-011 KP-011, TK-010, RB-019 KP-011, TK-022 DB-017, TK-021, KP-011 KP-007, KP-011, TK-022 TK-002, KP-011 TK-023, KP-011 KP-003, TK-023, KP-011 TK-023, KP-011 TK-002, KP-011 KP-011, TK-013, MI-029 MI-015, KP-011, TK-013 KP-007, KP-011 TK-020, KP-011, RB-010 KP-011, TK-013 65 170214-0019 170214-0021 170215-0018 170216-0010 170218-0032 170219-0039 170220-0001 170222-0002 170224-0004 170225-0003 170227-0019 170228-0007 170301-0003 170301-0011 170302-0012 170303-0022 170304-0003 170307-0001 170309-0006 170310-0015 170312-0011 170316-0015 170319-0004 170320-0002 170320-0019 170323-0006 170324-0014 170326-0038 170327-0004 170327-0018 DK-010, KP-011, TK-022 DB-010, KP-011 TK-010, KP-011, MI-003 TK-020, KP-011, ST-006, ST-011 RB-013, TK-023, KP-011 TK-010, KP-011 KP-003, TK-023, KP-011 TK-002, KP-011 AR-008, SC-002, KP-011, TK-022 TK-020, KP-011 TK-010, KP-011 BR-012, RB-017, KP-011, TK-013 KP-011, TK-013, SK-013, BD-019 MI-030, BM-001, KP-011, TK-023 KP-011, TK-023, MI-031, BM-001 TK-002, KP-011 KP-011, TK-022, KP-002 KP-007, KP-011, TK-022 KP-011, TK-022, ST-013 TK-023, KP-011, ST-012 TK-023, KP-011 TK-010, KP-011 RB-016, SS-001, KP-011 ,TK-022 KP-001, KP-011, TK-013 TK-002, KP-011 TK-020, KP-011 KP-011, TK-022 TK-002, KP-011 KP-011, TK-023 TK-009, KP-011, KP-005 3. Melakukan set k = 1, sehingga kombinasi variabel yang dicari berjumlah 1 atau tiap nama produk akan diikutkan dalam proses pencarian minimum support_1 tanpa perlu diasosiakan terlebih dahulu dengan produk yang lain. Ini ditujukan untuk mengetahui seberapa support suatu produk itu dalam seluruh transaksi. 4. Menentukan minimum support_1 = 5%, sehingga yang kurang dari 5% berarti item tersebut tidak support dalam seluruh transaksi dan nama produk itu perlu dihilangkan pada iterasi berikutnya. 5. Mencari minimum support_1 dari tiap kombinasi k-1 yang mungkin ada dalam transaksi, dengan menentukan dahulu kombinasinya. Yaitu setiap item dalam 66 sebuah transaksi dibagi totalnya item dalam transaksi itu. Misal dalam suatu transaksi ada 4 item, berarti kombinasi tiap item kombinasinya 1 4 begitu juga jika 3 berarti 1 . Kemudian kombinasi tersebut dijumlahkan dengan kombinasi 3 item yang sama dari transaksi lain. Jika sudah dijumlah semua, lalu dibagikan dengan total jumlah transaksi keseluruhan. Berikut rumus support (U) : π π’πππππ‘ (π’) = ∑π π‘=1 1 ∑π π‘=1 π πΆ |ππ‘ | π (π’, ππ‘ ) π = 1 |ππ‘ |! π (π’, ππ‘) π!(|ππ‘ |− π)! π (4.2) Untuk lebih jelasnya bagaimana langkah mencari minimum_ support_1, berikut diberikan contoh sederhananya : a. Gula Pasir Putih (1 kg) / KP-011 = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + + + + + 3 2 2 3 3 4 2 4 4 2 4 3 3 4 2 3 4 2 2 3 3 4 4 4 4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + + + + + 3 2 4 2 2 2 2 4 2 4 2 2 3 3 2 4 4 2 3 2 2 2 3 4 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + + + + + 2 2 3 2 3 3 2 2 3 2 2 3 3 2 3 2 3 2 3 4 3 2 3 2 4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + 2 2 4 4 4 4 2 3 3 3 3 2 2 4 3 2 2 2 2 2 3 96 = 0,3880 Semua transaksi yang berjumlah 96 kejadian, memang disengaja oleh peneliti terdapat produk Gula Pasir Putih (1 kg) seperti yang telah dijelaskan pada data sampel sebelumnya. Untuk itu, semua kejadian transaksi pasti ada kombinasi untuk item KP-011. Dari 96 kombinasi yang telah dijumlahkan, lalu dibagi dengan total kejadian transaksi yang jumlahnya 96. b. Kopi ABC STJM Bandit / TK-002 = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + 2 4 3 3 4 3 2 4 3 2 2 2 2 2 2 2 96 = 0,0686 c. Minyak Goreng Kunci Mas Pouch (1 liter) / KP-007 = 1 1 1 1 + + + 3 3 2 3 96 = 0,0156 67 d. Hatari Malkist Sugar Crackers Family Pack / SB-078 = 1 1 + 4 4 96 = 0,0052 e. Bango Kecap Manis Botol (275 ml) / SK-013 = 1 1 1 + + 3 4 4 96 = 0,0087 Berikut merupakan tabel hasil perhitungan mencari minimum_ support_1 dengan kombinasi k-1. Untuk item yang memiliki support lebih dari 5%, akan digunakan untuk iterasi selanjutnya minimum_ support_2 dengan kombinasi k-2. Tabel 4.15 Tabel Hasil Perhitungan Mencari Minimum_ Support_1 Kode Min_support_1 (5%) SK-001 0,0026 DB-022 0,0035 DB-010 0,0052 SK-013 0,0087 SS-001 0,0052 AR-008 0,0052 SC-002 0,0052 RK-015 0,0026 DB-017 0,0104 BR-012 0,0026 KP-011 0,3880 SB-078 0,0052 BD-019 0,0052 SK-006 0,0052 MI-003 0,0035 MI-011 0,0026 DB-018 0,0104 BD-023 0,0026 68 PC-012 0,0035 TK-002 0,0686 ............................................. ST-013 0,0035 ST-006 0,0026 ST-001 0,0026 ST-010 0,0026 SN-014 0,0026 TK-023 0,0538 TK-020 0,0503 TK-021 0,0208 TK-022 0,0894 BM-001 0,0052 RK-033 0,0035 6. Dari tabel di atas, terlihat hanya ada 5 nama produk yang minimum_ support_1 memenuhi 5%. Diantaranya yaitu gula pasir putih (1 kg) = 38,8%, kopi ABC STJM bandit = 6,8%, teh celup cap poci kotak isi 25 = 5,3%, teh celup sariwangi kotak isi 25 = 5%, dan teh celup sosro sachet isi 5 = 8,9%. Untuk itu, kelima item tersebut akan dilanjutkan ke iterasi minimum_ support_2 dengan kombinasi k-2 sehingga akan ditemukan support item yang berelasi. Tabel 4.16 Tabel Item yang memenuhi minimum_ support_1 Kode KP-011 TK-002 TK-023 TK-020 TK-022 Min_support_1 (5%) 0,3880 0,0686 0,0538 0,0503 0,0894 7. Mencari minimum_ support_2 dengan kombinasi k-2. Caranya hampir sama dengan cara mencari minimum_ support_1, namun yang ini kombinasi itemnya ada 2 dengan mengasosiasikan antara item satu dengan item yang lain. Apakah kedua item tersebut, jika diasosiasikan akan memenuhi support atau tidak. Berikut tabel asosiasinya untuk item yang memenuhi minimum_ support_1. 69 Tabel 4.17 Tabel Item yang akan Dicari Minimum_ Support_2 Kode {KP-011, TK-002} {KP-011, TK-023} {KP-011, TK-020} {KP-011, TK-022} {TK-002, TK-023} {TK-002, TK-020} {TK-002, TK-022} {TK-023, TK-020} {TK-023, TK-022} {TK-020, TK-022} Untuk lebih jelasnya bagaimana langkah mencari minimum_ support_2 dengan kombinasi item k-2, yang mengasosiasikan kedua item guna dicari support-nya pada keseluruhan transaksi. Berikut diberikan contoh sederhananya : a. Untuk item {KP-011, TK-002} 1 1 1 1 1 = 1 1 1+4+3+3+4+3+1+4+3+1+1+1+1+1+1+1 96 = 0,1155 Dicari yang dalam satu transaksinya terdapat item {KP-011, TK-002} secara bersamaan, kemudian dicari kombinasinya seperti pada perhitungan minimum_ support_1. Namun untuk yang ini, terlihat ada kombinasi dengan angka 1 saja. Itu dimaksudkan karena dalam satu transaksi hanya ada 2 item {KP-011, TK002} saja tanpa ada item lain yang dapat mempengaruhi kombinasi, sehingga dianggap sebagai satu kesatuan dan diberi nilai 1. b. Untuk item {KP-011, TK-023} = 1 1 1 1 1 1 1 1 1 + + +1+1+3+1+3+3+4+4+3+1+1 4 4 3 = 0,0799 96 70 Tabel 4.18 Tabel Hasil Perhitungan Mencari Minimum_ Support_2 Kode Min_support_2 (5%) {KP-011, TK-002} {KP-011, TK-023} {KP-011, TK-020} {KP-011, TK-022} {TK-002, TK-023} {TK-002, TK-020} {TK-002, TK-022} {TK-023, TK-020} {TK-023, TK-022} {TK-020, TK-022} 0,1155 0,0799 0,0920 0,1363 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 Dari tabel di atas terdapat 4 asosiasi item yang memenuhi minimum_ support_2 5%, untuk itu item-item tersebut akan digunakan pada iterasi selanjutnya dalam mencari minimum_ support_3 dengan kombinasi item k-3. Namun dari semua transaksi tidak ada dari ketiga item tersebut yang keluar bersamaan. iterasi dihentikan pada minimum_ support_2 dengan kombinasi item k-2. Untuk itu, item-item yang telah didapatkan tersebut dapat didefinisikan sebagai fuzzy set terhadap (T) atau himpunan dari kode-kode transaksi yang ada dalam QT. 8. Mendefinisikan KP-011, TK-002, TK-023, TK-020, dan TK-022 sebagai fuzzy set terhadap T. Berikut pendefinisiannya di mana pembilang sebagai kombinasi item dan penyebut sebagai nomor transaksinya : a. πKP−011 = 1 1 3 2 1 1 1 1 3 3 4 1 1 1 1 1 1 1 1 3 3 4 1 1 , , , , , , , , , , , , , , , 3 , 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 2 4 4 2 4 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 4 2 2 3 3 4 4 4 4 3 2 4 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 , , , , , , , , , , , , , , , 2 , 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 1 4 , 2 , 4 , 2 , 2 , 3 , 3 , 2 , 4 , 4 , 2 , 3 , 2 , 2 , 2 , 3 , 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 4 , 2 , 2 , 2 , 3 , 2 , 3 , 3 , 2 , 2 , 3 , 2 , 2 , 3 , 3 , 2 , 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 , 2 , 3 , 2 , 3 , 4 , 3 , 2 , 3 , 2 , 4 , 2 , 2 , 4 , 4 , 4 , 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 4 2 3 3 3 3 2 2 4 3 2 2 2 2 2 3 { 81 , 82 , 83 , 84 , 85 , 86 , 87 , 88 , 89 , 90 , 91 , 92 , 93 , 94 , 95 , 96 } 71 b. πTK−002 = 1 { 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 , , , , , , , , , , , , , , , 2 } 3 9 12 20 22 26 32 41 48 51 57 61 74 82 91 94 2 3 4 3 3 4 2 3 4 2 2 2 2 2 2 c. πTK−023 = { 1 1 1 1 1 1 1 1 1 1 1 1 1 4 4 3 2 2 3 2 3 3 4 4 3 2 , , , , , , , , , , , , 1 , 2 } 28 33 39 46 58 59 60 71 73 80 81 86 87 95 d. πTK−020 = 1 { 1 1 1 1 1 1 1 1 1 1 4 , 2 , 2 , 2 , 2 , 2 , 2 , 3 , 4 , 2 , 2 ,} 23 27 30 31 37 43 50 65 70 76 92 e. πTK−022 = 1 1 1 1 1 1 1 1 1 1 1 1 2 3 4 4 2 2 4 2 3 4 2 2 1 , , , , , , , , , , , , 2 , 2 4 6 8 10 15 17 19 21 25 34 36 45 { 1 1 1 1 1 1 1 1 4 2 3 3 4 3 3 4 1 , , , , , , , , 2 49 54 56 67 75 84 85 89 93 } 9. Dari persamaan item-item di atas, kemudian dicari candidate rules dengan menghitung confidence dari tiap kombinasi k-item yang mencapai min_support ke-k (k ≥ 2) dari item fuzzy set yang sudah didapatkan dari langkah sebelumnya. Berikut rumus pencarian confidence dan contoh pengerjaan secara sederhana : R (X, Y) = confidence (Y ο X) = (μ (t)) ∑t ∈T i ∈ inf X ∪Y i (μ (t)) ∑t ∈T i inf ∈ Y i Tabel 4.19 Tabel Item yang Dicari Confidence-nya Kode {KP-011 ο TK-002} {TK-002 ο KP-011} {KP-011 ο TK-023} {TK-023 ο KP-011} {KP-011 ο TK-020} {TK-020 ο KP-011} {KP-011 ο TK-022} {TK-022 ο KP-011} (4.3) 72 a. Confidence (KP-011 ο TK-002) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + 2 4 3 3 4 3 2 4 3 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 + + + + + + + + …..(π‘ππ‘ππ ππππ πππππ KP−011) 3 2 2 3 3 4 2 4 4 = 79 12 447 12 = 79 12 × 12 447 = 948 5.364 = 0,18 = 18 % b. Confidence (TK-002ο KP-011) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + 2 4 3 3 4 3 2 4 3 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + 2 4 3 3 4 3 2 4 3 2 2 2 2 2 2 2 = 79 12 79 12 = 79 12 × 12 79 = 948 948 = 1 = 100 % c. Confidence (KP-011 ο TK-023) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + 4 4 3 2 2 3 2 3 3 4 4 3 2 2 1 1 1 1 1 1 1 1 1 + + + + + + + + …..(π‘ππ‘ππ ππππ πππππ KP−011) 3 2 2 3 3 4 2 4 4 = 62 12 447 12 = 62 12 × 12 447 = 744 5.364 = 0,14 = 14 % d. Confidence (TK-023ο KP-011) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + 4 4 3 2 2 3 2 3 3 4 4 3 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + 4 4 3 2 2 3 2 3 3 4 4 3 2 2 = 62 12 62 12 = 62 12 × 12 62 = 744 744 = 1 = 100 % 73 e. Confidence (KP-011 ο TK-020) = 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + 4 2 2 2 2 2 2 3 4 2 2 1 1 1 1 1 1 1 1 1 + + + + + + + + …..(π‘ππ‘ππ ππππ πππππ KP−011) 3 2 2 3 3 4 2 4 4 = 58 12 447 12 = 58 12 × 12 447 = 696 5.364 = 0,13 = 13 % f. Confidence (TK-020ο KP-011) = 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + 4 2 2 2 2 2 2 3 4 2 2 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + 4 2 2 2 2 2 2 3 4 2 2 = 58 12 58 12 = 58 12 × 12 58 = 696 696 = 1 = 100 % g. Confidence (KP-011 ο TK-022) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + 2 3 4 4 2 2 4 2 3 4 2 2 2 4 2 3 3 4 3 3 4 2 1 1 1 1 1 1 1 1 1 + + + + + + + + …..(π‘ππ‘ππ ππππ πππππ KP−011) 3 2 2 3 3 4 2 4 4 = 99 12 447 12 = 99 12 × 12 447 = 1.188 5.364 = 0,22 = 22 % h. Confidence (TK-022ο KP-011) = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + 2 3 4 4 2 2 4 2 3 4 2 2 2 4 2 3 3 4 3 3 4 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + 2 3 4 4 2 2 4 2 3 4 2 2 2 4 2 3 3 4 3 3 4 2 = 99 12 99 12 = 99 12 × 12 99 = 1.188 1.188 = 1 = 100 % 74 Nilai confidence digunakan dalam menentukan rule mana saja yang merupakan interesting rule. Misalkan dalam penelitian ini ditentukan minimal confidence adalah 10 %, maka semua data yang ter-support dari kombinasi k-2 memenuhi minimal confidence 10 %. Maka yang disebut sebagai interesting rule hanya rule yang nilai confidence-nya ≥ 10 %, yaitu seperti dalam tabel berikut : Tabel 4.20 Tabel Item yang Memenuhi Confidence Kode Nama Produk {KP-011 ο TK-002} {Gula Pasir Putih (1 kg) ο {TK-002 ο KP-011} {Kopi ABC STJM Bandit ο {KP-011 ο TK-023} { Gula Pasir Putih (1 kg) ο Kopi ABC STJM Bandit} Gula Pasir Putih (1 kg)} Teh Celup Cap Poci Kotak Isi 25} {TK-023 ο KP-011} {Teh Celup Cap Poci Kotak Isi 25 ο {KP-011 ο TK-020} { Gula Pasir Putih (1 kg) ο Gula Pasir Putih (1 kg)} Teh Celup Sariwangi Kotak Isi 25} {TK-020 ο KP-011} {Teh Celup Sariwangi Kotak Isi 25 ο {KP-011 ο TK-022} { Gula Pasir Putih (1 kg) ο {TK-022 ο KP-011} Gula Pasir Putih (1 kg)} Teh Celup Sosro Sachet Isi 5} Confidence = 10 % 18 % 100 % 14 % 100 % 13 % 100 % 22 % {Teh Celup Sosro Sachet Isi 5 ο Gula Pasir Putih (1 kg)} 100 % Dari tabel di atas terlihat kedua item yang saling berelasi, tidak hanya support dalam transaksi tapi juga mempunyai tingkat relasi tinggi jika diasosiasikan. Nilai confidence paling tinggi menandakan jika asosiasi kedua item tersebut paling banyak berada di keranjang belanja bersamaan. Misalnya item berkode TK-002 yaitu Kopi ABC STJM Bandit sangat berpengaruh terhadap pembelian KP-011 yaitu gula pasir putih (1 kg). Berikut dengan lainnya, yang intinya pembelian gula pasir putih (1 kg) dipengaruhi item di sebelum tanda panah. 75 4.2 Analisa Model dengan Aplikasi Pendukung 4.2.1 Perhitungan K-Means dengan Bantuan RapidMiner Versi 5.3.015 Selain perhitungan manual menggunakan bantuan Microsoft Excel, perhitungan kmeans pada penelitian ini juga menggunakan dukungan aplikasi RapidMiner yang salah satu tujuan penggunannya adalah untuk membandingkan data sampel. Jika dihitung manual dengan Microsoft Excel hasilnya akan seperti apa dan bagaimana hasilnya jika dengan RapidMiner. Untuk pengolahan excel, sudah dijelaskan pada poin sebelumnya. Sedangkan pengolahan RapidMiner, berikut penjelasannya : 1. Berikut merupakan tabel data stock, sama seperti yang digunakan dalam proses menggunakan excel. Atribut antara lain kode produk, jumlah transaksi, volume jual, dan rata-rata penjualan, yang diset sedemikian rupa. Gambar 4.13 Data Set Clustering pada RapidMiner 76 2. Setelah data diatur sedemikian sesuai kebutuhan modelling, kemudian dipilih algoritma pemodelannya yaitu clustering dengan algoritma k-means. Gambar 4.14 Pemodelan Algoritma K-Means 3. Berikut merupakan proses pemodelannya, data diinputkan ke dalam tabel Read Excel. Kemudian dikoneksikan dengan pemodelan clustering yang diset seperti jumlah cluster yang diinputkan ada 3 cluster, max runs 10 kali, dan dengan menggunakan rumus Squared Euclidean Distances. Gambar 4.15 Halaman Main Process Clustering 77 4. Tabel hasil dari proses clustering, di mana terlihat tanda cluster-nya terletak di sebelah kode. Dan dari yang terlihat juga, di data pertama yaitu AT-001 masuk ke dalam cluster 1 yang berbeda dengan letaknya ketika menggunakan excel yaitu pada cluster 0. Ini dikarenakan antara penelitian yang melakukan proses manual menggunakan nama cluster berbeda dengan aplikasi, meski berbeda penamaan tapi untuk kelas cluster dan titik pusatnya tetap sama. Gambar 4.16 Tabel Data Hasil Proses Clustering 5. Berikut cluster model yang telah dieksekusi menggunakan RapidMiner. Untuk hasil sama seperti hasil pada perhitungan Excel, hanya saja penamaan clusternya yang berbeda. Secara model, tingkat cluster, dan titik pusat sama. Gambar 4.17 Cluster Model pada RapidMiner 78 Gambar 4.18 Titik Pusat Cluster yang Terbentuk 6. Berikut gambaran dari plot view hasil clustering yang menunjukkan persebaran pusat cluster. Untuk warna biru merupakan himpunan cluster 1, warna hijau himpunan cluster 2, dan warna merah untuk himpunan cluster 0. Gambar 4.19 Plot View Hasil Clustering 79 4.2.2 Perhitungan Fuzzy C-Covering dengan Implementasi Algoritma ke dalam Aplikasi Microsoft Visual Basic 6.0 Untuk lebih mendukung modelling market basket analysis menggunkan algoritma fuzzy c-covering, berikut rancangan aplikasi sederhana 1. Merupakan halaman utama yang berisi menu-menu aplikasi, di antaranya menu File dan menu Proses. Menu File berfungsi dalam menginput data-data baik itu stock maupun transaksi, namun peng-input-an hanya baru bisa dilakukan secara manual karena aplikasi ini memang dirancang secara sederhana. Sedangkan untuk menu Proses, merupakan halaman pemodelan dilakukan. Dari tabel data transaksi, menggunakan algoritma fuzzy c-covering menghasilkan association rule antar item seperti yang telah dilakukan pada perhitungan secara manual di bagian sebelumnya tentang modelling fuzzy c-covering. Gambar 4.20 Halaman Utama / Menu Aplikasi Fuzzy C-Covering 2. Merupakan halaman sub menu yang terdapat dalam menu File, salah satunya adalah menginput data transaksi yang dilakukan pelanggan. Terdapat beberapa form input-an yang mana disesuaikan dengan atribut pada tabel data transaksi yang telah dibahas pada bagian sebelumnya, yaitu kode transaksi, kode produk, dan jumlah pembelian. Terdapat juga beberapa tombol seperti simpan, untuk menyimpan data yang telah di-input-kan. 80 Gambar 4.21 Halaman Input Data Transaksi Gambar 4.22 Data Transaksi yang Berhasil di-Input 3. Merupakan halaman untuk memasukkan data-data produk (master produk) yang dilakukan pihak pengadaan barang. Terdapat beberapa form input yang mana disesuaikan dengan atribut pada tabel data stock yang telah dibahas pada bagian sebelumnya, yaitu kode produk, nama produk, kategori, dan jumlah. 81 Gambar 4.23 Halaman Tabel Master Produk 4. Di halaman ini, proses utama dari algoritma fuzzy c-covering dilakukan. Ada beberapa form input yang harus diisi, karena berpengaruh pada jalannya proses yaitu max_item_threshold, minimal_support, dan minimal_ confidence. Gambar 4.24 Halaman Tabel Hasil Proses 82 4.3 Pembahasan Hasil Penelitian 4.3.1 Pembahasan Hasil Clustering Berbasis K-Means Hasil akhir pengolahan data stock berbasis k-means dengan rumus Euclidean Distances, 3 cluster memastikan data-data yang menjadi himpunannya. Kelompok data dari atribut jumlah transaksi, volume transaksi, dan rata-rata penjualan, yang mempunyai nilai terbesar masuk ke himpunan cluster 2. Kemudian yang nilainya sedang masuk cluster 1, dan nilai terkecil masuk cluster 0. Seperti yang dijelaskan pada tahap determine the data mining goal, di mana clustering ini bertujuan mengelompokkan data ke himpunan sangat laku, laku, dan kurang laku. Maka dari 3 cluster itu ditentukan mana cluster yang punya himpunan sangat laku, laku, dan kurang laku. Dengan mengacu pada nilai cluster terbesar, sedang dan paling kecil, maka nilai terbesar adalah sangat laku, sedang adalah laku, dan terkecil adalah kurang laku. Untuk lebih jelas, berikut tabel himpunan tiap cluster-nya. Tabel 4.21 Nilai Terbesar (Himpunan Sangat Laku) pada Cluster 2 Kode Nama Produk BM-001 BM-003 BM-005 BM-007 DR-005 KP-011 Telur Ayam Isi 4 / Pack So Nice Sosis Sapi / 1 Potong Champ Sosis Ayam / 1 Potong Okey Sosis Ayam / 1 Potong Aqua Gelas (240 ml) Gula Pasir Putih (1 kg) Indofood Saus Pedas Sachet Isi 6 (9 gr) SK-006 Jumlah Transaksi Volume Jual Rata-rata Penjualan 93 69 40 43 78 104 94 103 98 100 86 106 1,01 1,49 2,45 2,33 1,10 1,02 67 68 1,01 Tabel 4.22 Nilai Sedang (Himpunan Laku) pada Cluster 1 Kode Nama Produk AT-013 Staedler Pencil 2B BM-002 Telur Ayam Isi 10 / Pack DR-004 Teh Gelas Kotak (330 ml) KP-009 Beras Cap Raja Lele (5 kg) KP-010 Gulaku Premium Gula Tebu (1 kg) Jumlah Transaksi Volume Jual Rata-rata Penjualan 26 24 28 24 28 27 26 30 24 28 1,04 1,08 1,07 1,00 1,00 83 MI-003 MI-011 MI-014 MI-015 RB-017 RB-019 RB-020 RB-021 RB-022 SC-002 SB-019 SN-011 SN-012 SN-032 SN-034 SN-035 SS-001 SS-002 SS-004 TK-013 TK-022 TK-025 TP-014 Indomie Goreng Jumbo Ayam Panggang (127 gr) Indomie Instant Rasa Soto (75 gr) Mie Sukses Kuah Ayam Bawang (122 gr) Mie Sukses Kuah Kari Ayam (122 gr) Roti Tawar Pandan Roti Isi Abon Roti Isi coklat Roti Isi Keju Roti Isi Pisang Coklat Dangdut Sabun Cream Jeruk Roma Better Sachet Dua Kelinci Kacang Panggang Bawang Sukro Kacang Atom Original Qtela Tempe Rasa Cabai Rawit JetZ Stick Chocofiesta Taro Snack Net Potato Barbeque Bendera SKM Putih Gold Kaleng (385 gr) Bendera SKM Putih Sachet Isi 6 (45 gr) Indomilk SKM Coklat Kaleng (385 gr) Kopi Kapal Api Kopi Susu Renteng Isi 10 (31 gr) Teh Celup Sosro Sachet Isi 5 Teh Serbuk Cap Bandulan (40 gr) Selection Facial Cotton 12 38 3,17 27 79 2,93 10 31 3,10 20 48 2,40 35 16 15 11 13 24 29 35 49 45 36 39 31 32 1,00 3,06 3,00 3,27 3,00 1,29 1,10 46 46 1,00 33 21 31 18 33 35 32 26 1,00 1,67 1,03 1,44 31 31 1,00 33 33 1,00 51 51 1,00 42 42 1,00 37 21 34 47 28 34 1,27 1,33 1,00 Tabel 4.23 Nilai Paling Kecil (Himpunan Kurang Laku) pada Cluster 0 Kode AT-001 AT-014 Nama Produk Joyko Correction Tape CF-S201-PT Faber Castell Pencil 2B Jumlah Transaksi Volume Jual Rata-rata Penjualan 3 3 1,00 10 11 1,10 84 DR-006 ABC Juice Rasa Mangga (250 ml) Indomie Goreng Rasa Soto MI-004 (85 gr) Indomie Goreng Rasa Ayam MI-005 Bawang (85 gr) MI-007 Indomie Kriting Bulgogi (90 gr) Indomie Keriting Goreng Spesial MI-008 (90 gr) Indomie Instan Rasa Ayam MI-009 Spesial (69 gr) Indomie Instan Rasa Ayam MI-010 Bawang (69 gr) Indomie Instant Rasa Kari Ayam MI-012 (72 gr) Mie Sukses Goreng Ayam MI-013 Kremes (133 gr) RG-011 Kue Kering Kembang Goyang SN-033 Qtela Tempe Rasa Daun Jeruk SN-036 Taro Snack Net Seaweed Kopi Kapal Api Grande White TK-014 Coffe Isi 10 (20 gr) 14 23 1,64 10 25 2,50 6 14 2,33 6 15 2,50 3 10 3,33 4 8 2,00 6 14 2,33 1 2 2,00 3 5 1,67 4 4 11 4 7 21 1,00 1,75 1,91 10 10 1,00 Dari ketiga tabel di atas, dapat dilihat bagaimana data-data yang mulanya sulit dilakukan prediksi yang mana sangat laku atau kurang laku, dengan algoritma kmeans akhirnya dapat di-cluster menjadi pengetahuan yang berarti dengan hasil cluster sangat laku, laku, dan kurang laku. Kesulitan paling mencolok ada pada perbandingan antara cluster sangat laku dan laku. Pada jumlah transaksi kode item BM-005 dari himpunan sangat laku, jumlahnya justru lebih sedikit yaitu 40 kali dibanding dengan kode item SS-004 dari himpunan laku yang 51 kali transaksi. Namun karena ada atribut lain yaitu volume jual dan rata-rata penjualan, di mana volume jual BM-005 lebih tinggi yaitu 98 item dibanding SS-004 yang hanya 51 item. Maka dengan k-means, dipertimbangkan kembali kedua item tersebut untuk lebih berat ke titik pusat cluster yang mana. 85 4.3.2 Pembahasan Hasil Market Basket Analysis Berbasis Fuzzy C-Covering Nilai confidence digunakan dalam menentukan rule mana saja yang merupakan interesting rule. Misalkan dalam penelitian ini ditentukan minimal confidence adalah 10 %, maka semua data yang ter-support dari kombinasi k-2 memenuhi minimal confidence 10 %. Maka yang disebut sebagai interesting rule hanya rule yang nilai confidence-nya ≥ 10 %, yaitu seperti dalam tabel berikut : Tabel 4.24 Tabel Item yang Memenuhi Confidence Kode Nama Produk {KP-011 ο TK-002} {Gula Pasir Putih (1 kg) ο {TK-002 ο KP-011} {Kopi ABC STJM Bandit ο {KP-011 ο TK-023} { Gula Pasir Putih (1 kg) ο Kopi ABC STJM Bandit} Gula Pasir Putih (1 kg)} Teh Celup Cap Poci Kotak Isi 25} {TK-023 ο KP-011} {Teh Celup Cap Poci Kotak Isi 25 ο {KP-011 ο TK-020} { Gula Pasir Putih (1 kg) ο Gula Pasir Putih (1 kg)} Teh Celup Sariwangi Kotak Isi 25} {TK-020 ο KP-011} {Teh Celup Sariwangi Kotak Isi 25 ο {KP-011 ο TK-022} { Gula Pasir Putih (1 kg) ο {TK-022 ο KP-011} Gula Pasir Putih (1 kg)} Teh Celup Sosro Sachet Isi 5} Confidence = 10 % 18 % 100 % 14 % 100 % 13 % 100 % 22 % {Teh Celup Sosro Sachet Isi 5 ο Gula Pasir Putih (1 kg)} 100 % 86 Dari tabel di atas terlihat bagaimana kedua item yang saling berelasi, tidak hanya support dalam proses transaksi tapi juga mempunyai tingkat relasi tinggi jika diasosiasikan. Nilai confidence yang paling tinggi menandakan jika asosiasi kedua item tersebut paling banyak berada di dalam keranjang belanja secara bersamaan. Misalnya seperti item dengan kode TK-002, atau namanya produk tersebut adalah Kopi ABC STJM Bandit sangat berpengaruh terhadap pembelian KP-011 yaitu gula pasir putih (1 kg). Berikut dengan yang lainnya, yang intinya pembelian gula pasir putih (1 kg) dipengaruhi oleh item-item yang berada di sebelum tanda panah. Berikut untuk gambaran tatanan rak-rak barang pada InshofMart saat ini, yang masih mengacu pada kategori produk. Gambar 4.25 Denah Rak-rak Barang Sebelum Rekomendasi Dari gambar denah rak-rak barang tersebut, jika penataan hanya berdasar pada kategori akan kurang efektif karena kebanyakan kategori minuman bercampur dengan minuman, sabun dengan sabun, camilan dengan camilan, dan lainnya. Padahal setiap pelanggan yang sudah membeli minuman pasti jarang membeli minuman lagi, dan membutuhkan keperluan lain. Untuk itu, data-data transaksi dianalisa guna menemukan asosiasi terbaik antar produk yang dibeli bersama. Dan dari hasil analisa manual, gula pasir putih (1 kg) mempunyai relasi tinggi dengan beberapa produk dari kategori teh/kopi. Berikut denah rekomendasi : 87 Gambar 4.26 Rekomendasi Denah Rak-rak Barang Dari gambar rekomendasi denah rak-rak barang, terdapat beberapa panah yang menuju ke bagian rak kecil. Hal tersebut dimaksudkan agar rak kecil digunakan sebagai tempat produk yang mempunyai nilai asosiasi tertinggi, agar pelanggan lebih mudah dalam menemukan kebutuhan-kebutuhannya. Seperti gula pasir putih (1 kg) dari kategori kebutuhan pokok diletakkan pada rak kecil bersama kopi ABC STJM bandit, teh celup cap poci kotak isi 25, teh celup sariwangi kotak isi 25, dan teh celup sosro sachet isi 5 dari kategori teh / kopi. Sedangkan untuk tanda panah lain, dilakukan analisa menggunakan dukungan aplikasi dan didapat beberapa asosiasi terbaik lain seperti dangdut sabun cream jeruk dari kategori sabun cuci dengan busa cuci piring dari kategori alat kebersihan, dan dua kelinci kacang panggang bawang dari kategori aneka camilan dengan kapal api coffee candy dari kategori permen. 88 BAB 5 PENUTUP 5.1 Simpulan Berdasarkan hasil dari penelitian yang telah dilakukan, penulis dapat mengambil kesimpulan yang berkaitan dengan rumusan masalah dan tujuan penelitian : 1. Penggunaan metode data mining berbasis k-means dapat melakukan pengcluster-an data dari data-data yang sulit dilakukan penentuan antara nilai mana yang paling tinggi, sedang, dan kecil, menjadi sebuah pengetahuan yang dapat menentukan tingkatan nilai ke dalam 3 cluster. Dari 50 data sampel yang diambil yang mulanya tidak diketahui kelompok-kelompoknya menjadi dapat diketahui seperti 7 produk sangat laku, 28 produk laku, dan 15 kurang laku. 2. Penggunaan market basket analysis berbasis fuzzy c-covering yang dapat diketahui bagaimana min_support dan min_confidence yang merupakan penentuan tingkat keakuratan asosiasi antar barang. Yang mana dalam penelitian ini dari semua sampel data yang diambil adalah setiap transaksi yang mengandung gula pasir putih (1 kg), menghasilkan min_support dan min_confidence terbaik yaitu asosiasi antara {Gula Pasir Putih (1 kg) ο Kopi ABC STJM Bandit}, {Kopi ABC STJM Bandit ο Gula Pasir Putih (1 kg)}, {Gula Pasir Putih (1 kg) ο Teh Celup Cap Poci Kotak Isi 25}, {Teh Celup Cap Poci Kotak Isi 25 ο Gula Pasir Putih (1 kg)}, { Gula Pasir Putih (1 kg) ο Teh Celup Sariwangi Kotak Isi 25}, {Teh Celup Sariwangi Kotak Isi 25 ο Gula Pasir Putih (1 kg)}, { Gula Pasir Putih (1 kg) ο Teh Celup Sosro Sachet Isi 5}, {Teh Celup Sosro Sachet Isi 5 ο Gula Pasir Putih (1 kg)}. 89 5.2 Saran Berdasarkan dari analisa data dan pembahasannya dalam penelitian ini, penulis memberikan beberapa saran yang mungkin dapat dilakukan pengembangan pada penelitian berikutnya : 1. Ada banyak metode clustering lain yang tidak hanya k-means, dapat digunakan sebagai perbandingan performa antar algoritma dari metode clustering. 2. Untuk penelitian selanjutnya, akan lebih baik jika dalam clustering ditambah lagi atributnya seperti atribut harga agar variasinya lebih banyak. 3. Sedangkan untuk market basket analysis, dalam perancangan aplikasinya belum dapat di-generate dengan sistem informasi utama sehingga akan lebih baik jika pada penelitian berikutnya ada yang membuat aplikasi tersebut dapat diintegrasikan langsung dengan sistem utama milik toko. DAFTAR PUSTAKA [1] P. A. JULIANTO, “Aprindo: Industri Ritel Tumbuh Sekitar 10 Persen pada 2016,” 28 Desember, 2016. [Online]. Available: http://bisniskeuangan.kompas.com/read/2016/12/28/172204826/aprindo.ind ustri.ritel.tumbuh.sekitar.10.persen.pada.2016. [Accessed: 10-Apr-2017]. [2] N. Pratomo, “Minimarket Mendominasi Transaksi,” Kamis, 23 Februari, 2017. [Online]. Available: http://koran.bisnis.com/read/20170223/448/631108/minimarketmendominasi-transaksi. [Accessed: 10-Apr-2017]. [3] Rajarak.co.id, “5 Kunci Utama Sukses Bisnis Toko Minimarket,” 30 Agustus, 2016. [Online]. Available: http://www.rajarak.co.id/2015/07/5kunci-utama-sukses-bisnis-toko.html. [Accessed: 06-Apr-2017]. [4] Zahedi and C. Chandra, “Perancangan Program Aplikasi Market Basket Analysis Untuk Mendukung Persediaan Barang Dengan Metode Fuzzy CCovering,” vol. 03, no. 01, pp. 241–253, 2012. [5] N. Arianty, O. Soesanto, F. Indriani, and K. Selatan, “Penerapan Metode Fuzzy C-Covering Untuk Analisis Pola Pembelian Pada Minimarket,” Ilmu Komput., vol. 04, no. 01, pp. 92–102, 2016. [6] B. M. Metisen and H. L. Sari, “Analisis Clustering Menggunakan Metode K-Means Dalam Pengelompokkan Penjualan Produk Pada Swalayan Fadhila,” Media Infotama, vol. 11, no. 2, pp. 110–118, 2015. [7] W. Nengsih, “Descriptive Modelling Menggunakan K-Means untuk Pengclusteran Tingkat Kemiskinan di Propinsi Riau,” in Seminar Nasional Riset Ilmu Komputer, 2016, pp. 92–96. [8] E. Muningsih and S. Kiswati, “Penerapan Metode K-Means untuk Clustering Produk Online Shop dalam Penentuan Stok Barang,” Bianglala Inform., vol. 3, no. 1, pp. 10–17, 2015. [9] G. S. Linoff and M. J. A. Berry, “Data Mining Techniques For Marketing, 90 91 Sales, and Customer Relationship Management,” 3rd ed., Indianapolis: Wiley Publishing, Inc., 2011, p. 2. [10] C. C. Aggarwal, “Data Mining The Textbook,” New York: Springer International Publishing, 2015, p. 1. [11] I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, “Data Mining Practical Machine Learning Tools and Techniques,” 4th ed., T. Pitts, Ed. Cambridge: Todd Green, 2017, p. 6. [12] O. Maimon and L. Rokachi, “Data Mining And Knowledge Discovery Handbook,” Second Edi., O. Maimon, Ed. Israel: Springer International Publishing, 2010, p. 133. [13] D. T. Larose, “Discovering Knowledge In Data,” Canada, 2005, pp. 11–17. [14] E. Irwansyah and M. Faisal, “Advanced Clustering Teori Dan Aplikasi,” Deepublish, 2015, pp. 4–5, 31–33. [15] J. Han, M. Kamber, and J. Pei, “Data Mining Concepts And Techniques,” Third Edit., Waltham: Morgan Kaufmann Publishers, 2012, pp. 446–447. [16] D. Olson and Y. Shi, “Pengantar Ilmu Penggalian Data Bisnisβ―: Introduction To Business Data Mining,” Tim SPSS Indonesia, Ed. Jakarta: Salemba Empat, 2008, p. 254. [17] D. Atmajaya, “K-Means Clustering,” 22 Februari, 2016. [Online]. Available: http://lecturer.fikom.umi.ac.id/dedyatmajaya/k-means- algorithm/. [Accessed: 23-Jul-2017]. [18] K. Jensen, “Process Diagram Showing the Relationship Between the Different Phases of CRISP-DM,” 26 April, 2012. [Online]. Available: ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/1 8.0/en/ModelerCRISPDM.pdf. [Accessed: 22-Jul-2017]. [19] I. Budiman, “Data Clustering Menggunakan Metodologi CRISP-DM Untuk Pengenalan Pola Diponegoro, 2012. Proporsi Pelaksanaan Tridharma,” Universitas LAMPIRAN Lampiran 1. Surat Ijin Penelitian Survey 92 93 Lampiran 2. Surat Keterangan 94 Lampiran 3. Tabel Data Stock Kategori Alat-alat Tulis (AT) Alat-alat Kebersihan (AR) Alat Masak / Alumunium (AP) Baby Alat (BA) Baby Food (BF) Bahan Mentah (BM) Bahan Roti / Makanan (BR) Bedak / Cream Baby (BB) Buku / Kertas (BK) Bumbu Dapur (BD) Canned & Lauk Pauk (CN) Jml Trans. 3 Vol. Jual 3 Joyko Correction Tape JK-101 9 9 Snowman Ballpoint V5 Black 3 3 Snowman Spidol Board Marker Black 7 7 Kenko Isi Pensil (0,5 mm) 5 5 Kenko Rautan Pensil SP-95 8 8 Nagata Sikat Tangan 15 15 Nagata Pengki Tangkai 3 3 Alon Canebo Plas Chamois 4 4 Panci Susu Ukuran 18 cm 1 1 Parutan Alumunium 3 3 Pigeon Tempat Bedak 2 2 Sarung Tangan Bayi 1 1 Promina Baby Porridge 6+ Banana (120 gr) 3 3 Dancow Actigo Coklat Usia 6-12 Tahun (800 gr) 5 5 Telur Ayam Isi 4 / Pack 93 94 Telur Ayam Isi 10 / Pack 24 26 So Nice Sosis Sapi / 1 Potong 69 103 So Good Bakso Kuah Ayam 25 29 Champ Sosis Ayam / 1 Potong 40 98 Okey Sosis Ayam / 1 Potong 43 100 Tepung Terigu Cakra Kembar (500 gr) 11 14 Colatta Dark Chocolate (250 gr) 10 10 MR Cocoa Chocolate Powder (250 gr) 7 7 Caladine Lotion (95 ml) 2 2 Cussons Baby Powder Mild & Gentle (175 gr) 10 10 My Baby Minyak Telon (60 ml) 4 4 Sinar Dunia Buku Tulis 58s / 1 Pcs 21 64 Juz'amma Dan Terjemahan 5 5 Kertas Kado Kiky Motif Batik 17 18 Royco Penyedap Masakan Ayam Isi 6 Sachet (8 gr) 16 16 Royco Penyedap Masakan Sapi Isi 6 Sachet (8 gr) 20 20 Masako Ayam Isi 6 Sachet (9 gr) 9 10 Indofood Bumbu Sayur Asem (33 gr) 6 12 Pronas Chicken Sausage (325 gr) 9 9 ABC Sardines Sauce Chilli (155 gr) 12 12 Nama Produk Joyko Correction Tape CF-S201-PT 95 Coklat (CK) Drink Bahan (DB) Drink Botol (DT) Drink Kaleng (DK) Drink Kemasan / Kotak (DR) Silver Queen Almond Milk Chocolate (33 gr) 7 7 Silver Queen Cashew Milk Chocolate (33 gr) 5 8 Delfi Fruit & Nut (30 gr) 2 2 Choki-Choki Coklat Pasta 5 5 Milk Jus Rasa Coklat (5 Pcs) 2 2 Jasjus Rasa Jambu (5 Pcs) 4 5 ABC Syrup Special Grade Cocopandan (625 ml) 6 6 ABC Syrup Squash Orange (625 ml) 7 7 Aqua (600 ml) 35 35 Aqua (1500 ml) 50 50 You-C1000 Lemon Water (500 ml) 9 9 kratingdaeng (150 ml) 7 7 Sprite (330 ml) 13 14 Fanta Strawberry (330 ml) 10 10 Yeo's Minuman Leci (330 ml) 8 8 Cap Panda Liang Teh (310 ml) 4 4 Ale-ale Strawberry (200 ml) 9 11 Ale-ale Jeruk (200 ml) 21 25 Teh Rio Gula Batu (200 ml) 71 89 Indomilk Kids UHT Rasa Coklat (115 ml) 9 11 Milkuat Rasa Strawberry 39 52 Handuk & Sapu Tangan (HN) Handuk Aneka Warna Polos (23 x 23 cm) 2 2 Handuk Aneka Gambar (23 x 23 cm) 4 4 Ice Cream (IC) Wall's Sandwich Vanilla dan Coklat Pck 3 3 Wall's Dung Dung Kacang Hijau 6 8 Campina Heart 2 3 Okky Jelly Drink Rasa Apel 21 30 Nutrijell Jelly Powder Orange 4 7 Nutrijell Jelly Powder Lecy 4 7 Agarasa Jelly Powder Strawberry 4 7 Kaos Kaki Hitam 2 2 Kaos Kaki Putih 1 1 Kaos Kaki Muslimah Selutut 2 2 Minyak Goreng Cemara Pouch (1 liter) 10 13 Beras Cap Raja Lele Eceran (1 kg) 19 28 Beras Cap Raja Lele (5 kg) 24 24 Gulaku Premium Gula Tebu (1 kg) 28 28 Gula Pasir Putih (1 kg) 104 106 Korek Kayu 18 18 Korek Gas 13 13 Jely Drink (JL) Kaos Kaki / Tangan (KK) Kebutuhan Pokok (KP) Korek Api / Gas (KA) 96 Kosmetik Bibir (KB) Kosmetik Mata (KM) Kosmetik Rambut (KR) Kosmetik Tubuh (KT) Kosmetik Wajah (KW) Listrik / Elektrik (EL) Mainan (MN) Wardah Lipstick Exclusive 40 Diva 4 4 Purbasari Lipstick Color Matte 5 5 Maybelline Baby Lips Love Color 5 5 Maybelline Rocket Volume Express Mascara 3 3 Ponds Pensil Alis Warna Hitam 8 8 Davis Pensil Eyebrow Brown Warna Coklat 3 3 Gatsby Watergloss Hard (150 gr) 2 2 Gatsby Watergloss Hyper Solid (75 gr) 3 3 Ellips Hair Vitamin Hair Repair 6 pcs 6 6 Ellips Hair Vitamin Smooth and Silky 6 s 4 4 Viva Hand & Body Lotion Bengkoang (100 ml) 3 3 Soffell Geranium Sachet Isi 5 (10 ml) 13 13 Vaseline Healty White Perfect 10 (100 ml) Shinzu'I Body Scrub sakura (250 gr) 2 2 3 3 Citra Hazeline Pearly White UV (40 gr) 3 3 Viva Milk Cleanser Green tea (100 ml) 5 5 Pixy Cleansing Express Anti Acne (100 ml) 9 9 Saklar 1 Tombol 1 1 Philips Lampu LED Genie 5 - 11 Watt 3 5 Philips Lampu LED Essential 8 - 23 Watt 3 3 ABC Battery Biru R6 4'S 5 5 Gantungan Kunci Club Sepak Bola 2 2 Sticker Karakter Mini 14 15 Yoyo Kayu 4 4 Mantel / Payung (MT) Jas Hujan Baju Celana 1 1 Payung Lipat 4 4 Mie Instant (MI) Indomie Goreng Jumbo Spesial (129 gr) 5 15 Indomie Goreng Pedas (79 gr) 10 24 Indomie Goreng Jumbo Ayam Panggang (127 gr) 12 38 Mie Sukses Goreng Ayam Kremes (133 gr) 3 5 Pop Mie Mini Bakso Sapi (35 gr) 6 8 Obat Dalam (OB) Obat Luar (OL) Parfum (PF) Pop Mie Mini Soto (35 gr) 3 5 Adem Sari 13 21 Promag Tablet 4 4 Hansaplast Kain Elastis Isi 10s 6 6 Hansaplast Koyo Hangat Isi 10s 8 8 Betadine Solution (30 ml) 9 9 Balsem Lang (20 gr) 2 2 Kalpanax Cream (5 gr) 3 3 Body Spray Posh Blaze Pink 2 2 97 Pasta & Sikat Gigi (PG) Pembalut & Pampers (PB) Pembersih & Pengharum (PR) Pemutih / Pewangi (PP) Perlengkapan Kantor (AO) Permen (PC) Plastik Pembungkus (PL) Rokok (RK) Roti Basah (RB) Roti Kering / Garing (RG) Sabun Cuci / Detergent (SC) Sabun Mandi (SM) Body Spray Posh Love Song 2 2 Axe Gold Tempation Deo Body Spray (150 ml) 2 2 Ciptadent Toothpaste Fresh Tube (75 gr) 21 21 Ciptadent Sikat Gigi Classic Extra Soft 3s 5 5 Ciptadent Sikat Gigi Crystal Soft 6 7 Close Up Deep Action (160 gr) 5 5 Baby Happy Pants M 1 Pcs 7 21 Baby Happy Pants L 20 Pcs 7 7 Baby Happy Pants XL 1 Pcs 19 56 Laurier Relax Night (30 cm) 1 Pcs 2 2 Hit Insektisida Spray Orange (600 ml) 3 3 Harpic (200 ml) 3 3 Harpic (450 ml) 7 7 Bayclin Botol (100 ml) 13 13 So Klin Sachet Isi 4 19 19 Rapika Biang 3 ini 1 Violet Sachet 4 Pcs (25 ml) 6 6 Joyko Binder Clip 107 (19 mm) 1 1 Tom & Jerry Sticky Notes TJ 653 2 2 Alpenliebe Strawberry 4 4 Frozz Barley Mint 3 3 Plastik PP Bening ABC 1 kg 7 9 Plastik Joyo Boyo Tebal 2 Ons 2 4 Sampoerna A Mild 12 11 11 Djarum 76 35 35 Djarum MLD 20 9 9 Apache 12 7 7 Roti 3 Rasa Brilliant 6 7 Roti Tawar Pandan 35 35 Roti Isi Pisang Coklat 13 39 Roti Kacang Original 3 3 Kue Semprong Wijen 3 3 Kue Nnting-nting Kacang 6 6 Ekonomi Sabun Cream 2 2 Dangdut Sabun Cream Jeruk 24 31 Sunlight Sabun Krim Jeruk Nipis Sachet (350 gr) 6 6 Mama Lemon Power Stain Remover (500 gr) 3 3 Lifebuoy Body Wash Cool Fresh Refill (250 ml) 9 9 Lifebuoy Body Wash Lemon Fresh Botol (100 ml) 6 6 Lux Body Wash Soft Touch Botol (100 ml) 3 3 Asepso Bar Soap Fresh Orange (80 gr) 6 7 98 Sabun Wajah (SW) Shampoo / Conditioner (SP) Sandal (SD) Saos Sambal Kecap (SK) Sarung (SR) Snack Biskuit / Wafers (SB) Snack Ringan (SN) Snack Tradisional (ST) Susu (SS) Teh / Kopi (TK) Tisu / Kapas (TP) Biore Body Foam Whitening Scrub (100 ml) 3 3 Clean & Clear Foaming Facial wash (100 ml) 6 6 Nivea Facial Foam Sparkling White (100 gr) 3 3 Zinc Shampoo Refreshing Botol (80 ml) 2 3 Clear Man Shampoo Ice Cool (170 ml) 5 5 Kodomo Shampoo Pouch Strawberry (180 ml) 3 3 Swallow Sandal Jepit 4 4 Sandal Jepit Anak 7 7 ABC Saus Tomat Sachet Isi 6 (9 gr) 2 2 Indofood Sambal Terasi (190 gr) 8 8 Indofood Sambal Terasi Isi 6 Sachet (22 gr) 7 8 Bango Kecap Manis Pouch Refill (220 ml) 5 5 Bango Kecap Manis Botol (275 ml) 20 20 Sarung Gajah Duduk Junior 1 1 Peci Aceh Putih Boerdir 2 2 Goriorio Chocopiz Family Pack 3 3 Nissin Walens Choco Soes 25 29 Nissin Crispy Crackers 19 19 Lemonia Lemon Cookies 13 13 Khong Guan Chocolate Short Cream Biscuits 5 5 Twistko BBQ Corn 9 10 Chitato Rasa Keju Supreme 24 31 Chitato Rasa Sapi Panggang 10 15 Qtela Singkong Rasa Balado 14 26 Snack Ring Abon 15 19 Snack Ring Balado 8 8 Snack Kerupuk Rambak Plesungan Raya 15 15 Bendera SKM Putih Gold Kaleng (385 gr) 31 31 Bendera SKM Putih Sachet Isi 6 (45 gr) 33 33 Indomilk SKM Coklat Kaleng (385 gr) 51 51 Kopi ABC STJM Bandit 25 26 Teh Celup Sariwangi Kotak Isi 25 22 22 Teh Celup Sariwangi Sachet Isi 5 12 14 Teh Celup Sosro Sachet Isi 5 37 47 Teh Celup Cap Poci Kotak Isi 25 24 24 Tessa Soft Bathroom Tissue Roll TOT-04 9 9 Paseo Tissue Soft Pack 250s 8 8 Multi Tisu Gulung TOM-02/P 9 9 Selection Facial Cotton 34 34 99 Lampiran 4. Tabel Data Transaksi No. Tanggal 1 01/11/2016 2 01/11/2016 3 01/11/2016 4 01/11/2016 5 01/11/2016 6 01/11/2016 7 01/11/2016 8 01/11/2016 9 01/11/2016 10 01/11/2016 11 01/11/2016 12 01/11/2016 13 01/11/2016 14 01/11/2016 15 01/11/2016 Nama Produk Baby Happy Pants XL 1 Pcs Mitu Baby Wet Tissue Pink 10s My Baby Powder Soft & Gentle (150 gr) Aqua (1500 ml) Snack Kerupuk Tengiri Original Snack Ring Balado Aqua (1500 ml) Indofood Saus Pedas Sachet Isi 6 (9 gr) Okey Sosis Ayam / 1 Potong Sarimi isi 2 Koya jeruk Nipis (112 gr) So Good Bakso Kuah Ayam Busa Cuci Piring Dangdut Sabun Cream Jeruk Campina Concerto Sundae Blueberry Bayclin Botol (100 ml) Milkuat Rasa Strawberry Nuvo Bar Soap Family Biru (80 gr) So Klin Smart Color Deterjen (800 gr) Faber Castell Pencil 2B Faber Castell Penghapus Joyko Paper Clip C-3100 Sampul Buku OPP Kwarto + Lem Indomie Instan Rasa Ayam Bawang (69 gr) So Nice Sosis Sapi / 1 Potong Tessa Facial Tissue 260s Ponds Pensil Alis Warna Hitam ABC Battery Biru R6 4'S Payung Lipat Sandal Jepit Anak Fresh Care Aroma Therapy (10 ml) Larutan Penyegar Cap Badak Strawberry (320 ml) Indomie Instant Rasa Soto (75 gr) Indofood Saus Pedas Sachet Isi 6 (9 gr) So Nice Sosis Sapi / 1 Potong Bendera SKM Putih Gold Kaleng (385 gr) Indofood Saus Pedas Sachet Isi 6 (9 gr) Roti Tawar Pandan Sarimi isi 2 Koya jeruk Nipis (112 gr) Sukro Kacang Atom Original Milkuat Rasa Strawberry Mitu Baby Wet Tissue Pink 10s My Baby Powder Soft & Gentle (150 gr) Roma Sari Gandum Original 20 Roll Gudang Garam Signature Dua Kelinci Kacang Panggang Bawang Kapal Api Coffee Candy Jumlah 3 1 1 1 1 1 1 1 3 2 1 1 1 2 1 2 2 1 1 1 1 6 3 2 1 1 1 1 1 1 1 5 2 2 1 1 1 3 1 2 1 1 1 1 1 1 100 16 01/11/2016 17 01/11/2016 18 01/11/2016 19 20 01/11/2016 01/11/2016 21 01/11/2016 22 01/11/2016 23 01/11/2016 24 01/11/2016 25 02/11/2016 26 02/11/2016 27 02/11/2016 28 02/11/2016 29 02/11/2016 30 02/11/2016 31 02/11/2016 Aqua (1500 ml) Formula Toothpaste Action Protector (75 gr) Lay's Asin Klasik Pepsodent Sikat Gigi Travel Soft Qtela Singkong Rasa Balado Snack Kerupuk Bawang Plesungan Raya Indofood Saus Pedas Sachet Isi 6 (9 gr) Laurier Active Day Super Maxi Wing 8 Pcs Sarimi isi 2 Koya jeruk Nipis (112 gr) Tessa Facial Tissue Pack 50s Bendera SKM Putih Gold Kaleng (385 gr) Energen Coklat (5 Pcs) Milkita Lollipop Pro Chiz Keju Cheddar (180 gr) Roti Tawar Pandan Blue Band Margarine Tub (250 gr) Plastik Joyo Boyo Tebal 1 kg Wall's Dung Dung Kacang Hijau Clean & Clear Foaming Facial wash (100 ml) Lotte Sticks Chew Gum Blueberry Pocky Strawberry Teh Rio Gula Batu (200 ml) Aqua Gelas (240 ml) Nissin Walens Choco Soes So Nice Sosis Sapi / 1 Potong Lotte Sticks Chew Gum Blueberry Richeese Nabati Wafer Keju Slai O'lai Pineapple Jam Roll Teh Rio Gula Batu (200 ml) ABC Minuman Sari Kacang Hijau (250 ml) Faber Castell Watercolour Isi 12 Kenko Rautan Pensil SP-95 Sinar Dunia Buku Gambar A3 Intra Jahe Wangi (5 Pcs) Mama Suka Tepug Bakwan (100 gr) Priima Garam (250 gr) Djarum MLD 20 Aqua (600 ml) Kue Nnting-nting Kacang Roti Isi Keju Busa Cuci Piring Dangdut Sabun Cream Jeruk Lap Kain Kotak-Kotak Aqua (1500 ml) Qtela Singkong Rasa Original Roma Kelapa Family Pack Snack Jagung Gurih ColoMadu Sprite (390 ml) 1 1 2 1 2 1 1 1 3 1 1 2 2 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 3 2 2 1 1 1 4 1 1 1 1 2 1 1 2 101 32 02/11/2016 33 02/11/2016 34 02/11/2016 35 02/11/2016 36 02/11/2016 37 02/11/2016 38 02/11/2016 39 02/11/2016 40 02/11/2016 41 02/11/2016 42 02/11/2016 43 02/11/2016 44 02/11/2016 45 02/11/2016 46 02/11/2016 Tessa Facial Tissue Pack 50s Djarum 76 Kopi Top Kopi + Susu Renteng Isi 5 (31 gr) Roti Isi Pisang Coklat ABC Sardines Sauce Chilli (155 gr) Champ Nugget (250 gr) Energen Jagung (5 Pcs) Kopi Bubuk Cap Bintang (100 gr) Royco Penyedap Masakan Sapi Isi 6 Sachet (8 gr) Teh Serbuk Teh Gopek (40 gr) Dua Kelinci Kacang Panggang Bawang Kapal Api Coffee Candy Snack Kripik Pisang Gurih Snack Sus Kering Keju Axe Dark Tempation Deo Body Spray (150 ml) Sangobion Ellips Hair Vitamin Smooth and Silky 6 s Ponds Pensil Alis Warna Hitam Fermipan Sachet (11 gr) Indofood Bumbu Racik Tempe (20 gr) Koepoe-Koepoe Pelembut Kue VX (75 gr) Koepoe-Koepoe Pengembang Kue TBM (75 gr) Koepoe-Koepoe Pewarna Makanan Pandan (30 ml) Mama Suka Tepung Roti (100 gr) Masako Ayam Isi 6 Sachet (9 gr) Promina Baby Porridge 6+ Red Rice (120 gr) SGM Ananda 1 Usia 0-6 Bulan (400 gr) Kuramas Buku Ekspedisi Snowman Spidol Board Marker Black Standard Pen Tecno Hitam ABC Syrup Special Grade Cocopandan (625 ml) Marimas Jeruk Peras (5 Pcs) Nabati Richeese Keju Pasta Vitacimin C Bola Plastik Besar Gold Tape Isolasi Kertas Kado Kiky Motif Batik Loose Leaf A5 100s Tom & Jerry Sticky Notes TJ 653 Balsem Lang (20 gr) Baby Happy Pants XL 1 Pcs Mitu Baby Wet Tissue Pink 10s Hit Alat Anti Nyamuk Elektrik + 3 Mat Hit Mat Elektrik Anti Nyamuk Isi 18 Bango Kecap Manis Pouch Refill (220 ml) Biore Facial Foam Pure Oil Clear (100 gr) Giv Sabun Cair Pink Pouch (250 ml) Kopi Kapal Api (185 gr) 1 1 1 2 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 2 1 1 1 2 2 1 1 1 1 1 1 1 3 2 1 1 1 1 1 1 5 1 1 1 1 1 1 1 102 47 02/11/2016 48 02/11/2016 49 02/11/2016 50 02/11/2016 51 03/11/2016 52 03/11/2016 53 03/11/2016 54 03/11/2016 55 03/11/2016 56 03/11/2016 57 03/11/2016 58 03/11/2016 59 03/11/2016 60 03/11/2016 61 03/11/2016 Multi Tisu Gulung TOM-02/P Vanish Botol (180 ml) Djarum 76 Kopi Top Kopi + Susu Renteng Isi 5 (31 gr) Korek Kayu Beras Cap Raja Lele Eceran (1 kg) Minyak Goreng Bimoli Pouch (1 liter) Tepung Tapioka Rose Brand (500 gr) Saringan Teh Teh Serbuk Cap Bandulan (40 gr) Tessa Soft Bathroom Tissue Roll TOT-04 Roti 4 Rasa Mandiri Biore Facial Foam Pure Oil Clear (100 gr) Blue Band Margarine Tub (250 gr) Koepoe-Koepoe Pewarna Makanan Vanilli (30 ml) MR Cocoa Chocolate Powder (250 gr) My Baby Minyak Telon (60 ml) Zinc Shampoo Refreshing Botol (80 ml) Djarum 76 Kopi Top Kopi + Susu Renteng Isi 5 (31 gr) Djarum 76 Fermipan Sachet (11 gr) Mentega Batangan (250 gr) Tepung Terigu Segitiga Biru (1 kg) Puteri Body Splash Orchid (245 ml) Close Up Deep Action (160 gr) Formula Sikat Gigi Silver Ptotector3's Ripple Soft Good Time Cookies Brownies Roti Kacang Rasa Keju Garuda Kacang Kulit Gery Saluut Malkist Coklat Aqua (1500 ml) Frisian Flag Milky Rasa Coklat Mr. Hottest Stik Jagung Keju Oops Crispy Cracker Roasted Sweet Corn Paseo Trafel Pack Karakter 70s Snack Kerupuk Tempe Garuda Snack Kuping Gajah Sukro Kacang Telur Indofood Saus Pedas Sachet Isi 6 (9 gr) Sarimi Baso Sapi (77 gr) Vegeta Herbal Anggur Gatsby Splash Cologne Deep Ocean (175 ml) Pepsodent Sikat Gigi Travel Soft Pepsodent White (75 gr) So Klin Sachet Isi 4 Surf Bubuk Detergen Plus Softener (900 gr) Superpell White Lily Isi 6 / Renteng 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 1 3 3 3 1 1 1 1 1 1 1 1 1 1 1 1 1 103 62 03/11/2016 63 03/11/2016 64 03/11/2016 65 03/11/2016 66 03/11/2016 67 03/11/2016 68 03/11/2016 69 03/11/2016 70 03/11/2016 71 03/11/2016 72 03/11/2016 73 03/11/2016 74 75 03/11/2016 03/11/2016 76 03/11/2016 77 03/11/2016 78 04/11/2016 79 04/11/2016 Wipol Karbol Lemon Pine Botol (450 ml) Hit Alat Anti Nyamuk Elektrik + 3 Mat Hit Mat Elektrik Anti Nyamuk Isi 18 Vixal Botol Green (500 ml) Indomilk SKM Coklat Kaleng (385 gr) Kara Sun Coconut Cream (65 ml) Nutrijell Puding Coklat Roti Tawar Original Counterpain Patch Isi 4s Fox's Crystal Clear Fruits Kopi Extra Gingseng Madu 5 pcs Paseo Tissue Mini Trafel Pack 130s Roti 4 Rasa Mandiri Roti Almond Kayu Manis Teh Celup Sosro Sachet Isi 5 Body Spray Posh Blaze Pink Ellips Hair Vitamin Smooth and Silky 6 s Laurier Active Day Super Maxi 8 pcs Laurier Relax Night (30 cm) 8 Pcs Jhonson's Baby Soap Milk (100 gr) Roti Donat Keju Roti Donat Miesis Roti Almond Kayu Manis Pond's Men Face Wash Oil Control (100 ml) Delfi Fruit & Nut (30 gr) Hufagrip BF Kara Sun Coconut Cream (65 ml) Mama Suka Tepung Pisang Goreng (90 gr) Mama Suka Tepung Roti (100 gr) Aqua (1500 ml) Indofood Saus Pedas Sachet Isi 6 (9 gr) Mie sukses Kuah Kari Ayam (122 gr) Bendera SKM Putih Gold Kaleng (385 gr) Indofood Saus Pedas Sachet Isi 6 (9 gr) Okey Sosis Ayam / 1 Potong Roti Tawar Pandan Hot In Cream (60 gr) Emeron Shampoo Hair Fall Control (170 ml) Champ Sosis Ayam / 1 Potong Indofood Saus Pedas Botol Plastik (140 ml) Maestro Mustrad (245 gr) Roti Almond Kayu Manis Djarum 76 Korek Kayu Wismilak Slim Bendera SKM Putih Gold Kaleng (385 gr) Blue Band Margarine Tub (250 gr) Mama Suka Tepung Pisang Goreng (90 gr) 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 5 5 5 1 1 1 1 1 1 1 1 3 1 1 3 1 1 1 3 1 1 2 1 1 1 1 1 2 104 80 04/11/2016 81 04/11/2016 82 04/11/2016 83 04/11/2016 84 04/11/2016 85 04/11/2016 86 04/11/2016 87 04/11/2016 88 04/11/2016 89 04/11/2016 90 04/11/2016 91 04/11/2016 92 04/11/2016 93 04/11/2016 94 04/11/2016 95 04/11/2016 96 04/11/2016 97 04/11/2016 Mama Suka Tepung Roti (100 gr) Roti Tawar Pandan Frestea Honey (500 ml) Pop Mie Soto Ayam (60 gr) Roti 4 Rasa Mandiri Kaos Kaki Putih Beras Cap Raja Lele Eceran (1 kg) Indomie Instan Rasa Ayam Bawang (69 gr) Kopi Top White Coffee Renteng Isi 5 (21 gr) Marimas Jeruk Nipis (5 Pcs) Minyak Goreng Sania Pouch (1 liter) Aqua (600 ml) Snack Kedelai Garuda Snack Stick Bawang Plesungan Raya Roti 4 Rasa Mandiri Ades (600 ml) Roti Ayam Spesial Mandiri Roti Almond Kayu Manis Daia Violet Power Detergent Sachet (60 gr) Giv Beauty Soap Mulberry Silk (80 gr) Sampoena Kretek Ichi Ocha Green Tea (500 ml) Nissin Wafers Milk Family Pack Trenz Sandwich Crackers Rumput Laut Forvita Margarine Sachet (200 gr) Roti Tawar Pandan Nagata Pel Lantai Nagata Sikat Tangan Vixal Botol Green (500 ml) Snowman Spidol Board Marker Red Kodomo Shower Gel Botol Strawberry (200 ml) Bendera SKM Putih Sachet Isi 6 (45 gr) Indofood Sambal Terasi (190 gr) Snack Kerupuk Rambak Plesungan Raya Zinc Shampoo Soft Care Sachet Isi 5 (5 ml) Nivea Facial Foam Sparkling White (100 gr) Kopi Good Day 3in1 Mocacinno Isi 5 (20 gr) Wismilak Slim Snack Kerupuk Tengiri Original Snack Ring Balado Bango Kecap Manis Pouch Refill (220 ml) Emeron Shampoo Hair Fall Control (170 ml) Lifebuoy Bar Soap Naturepure (80 gr) Ekatape Lakban Bening Besar Joyko Cutter A-300A Tom & Jerry Label Biore Men's Facial Foam Double Scrub Black & White (100 gr) 2 1 2 2 1 1 1 2 2 2 1 1 1 1 1 1 3 3 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 105 98 04/11/2016 99 04/11/2016 100 05/11/2016 103 05/11/2016 109 05/11/2016 169 06/11/2016 215 07/11/2016 251 08/11/2016 254 08/11/2016 321 11/11/2016 347 12/11/2016 369 12/11/2016 371 12/11/2016 393 13/11/2016 395 13/11/2016 410 14/11/2016 Clear Man Shampoo Ice Cool (170 ml) Gulaku Premium Gula Tebu (1 kg) Roma Kelapa Family Pack Gery Coklat Mede Pasta Jasjus Rasa Jambu (5 Pcs) Sprite (1000 ml) Wall's Magnum Classic Minyak Goreng Cemara Pouch (1 liter) Gula Pasir Putih (1 kg) Kopi Kapal Api Kopi Susu Renteng Isi 10 (31 gr) Snack Marning Jagung Pedas Garuda Sukro Kacang Atom Original ABC Syrup Squash Orange (625 ml) Gula Pasir Putih (1 kg) Kopi Jahe 1001 Banded Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Roti Isi Abon Sedaap Mie Ayam Bawang (70 gr) Gula Pasir Putih (1 kg) Teh Celup Sariwangi Sachet Isi 5 Roti Donat Miesis Roti Isi Keju Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Gula Pasir Putih (1 kg) Teh Celup Sariwangi Sachet Isi 5 Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Sedaap Mie White Curry (81 gr) Indofood Saus Pedas Sachet Isi 6 (9 gr) Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Oreo Mini Chocolate Hatari Malkist Sugar Crackers Family Pack Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Djarum 76 Korek Kayu Kopi Good Day 3in1 Mocacinno Isi 5 (20 gr) Gula Pasir Putih (1 kg) Simba Choco Chips Sereal Bendera SKM Putih Sachet Isi 6 (45 gr) Forvita Margarine Sachet (200 gr) 1 1 1 3 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 5 3 1 1 3 3 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 106 424 14/11/2016 431 14/11/2016 466 15/11/2016 598 20/11/2016 617 20/11/2016 635 21/11/2016 704 23/11/2016 727 24/11/2016 772 26/11/2016 787 27/11/2016 853 29/11/2016 858 30/11/2016 911 01/12/2016 926 02/12/2016 Kopi Jahe 1001 Banded Gula Pasir Putih (1 kg) Telur Ayam Isi 4 / Pack Gula Pasir Putih (1 kg) Teh Celup Sariwangi Sachet Isi 5 ABC Kecap Pedas Botol (135 ml) Minyak Goreng Hemart Pouch (1 liter) Roti Tawar Original Indomilk SKM Coklat Kaleng (385 gr) Wismilak Hijau Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Kis Mint Cherry Gula Pasir Putih (1 kg) Kopi Indocafe Kasar (100 gr) Roti Kering Monas Kembang Gula Roti Bolu Iris Kering Gula Pasir Putih (1 kg) Minyak Goreng Bimoli Pouch (1 liter) Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Energen Coklat (5 Pcs) Teh Celup Sariwangi Sachet Isi 5 Gula Pasir Putih (1 kg) Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Snack Kedelai Garuda Snack Stick Bawang Plesungan Raya Gula Pasir Putih (1 kg) Teh Celup Sariwangi Sachet Isi 5 Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Intra Jahe Wangi (5 Pcs) Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Nutrijell Puding Santan Pandan Nutrijell Puding Lapis Coco Pandan Kara Sun Coconut Cream (65 ml) Koepoe-Koepoe Pewarna Makanan Pandan (30 ml) Gula Pasir Putih (1 kg) Minyak Goreng Kunci Mas Pouch (1 liter) Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Indomie Instant Rasa Soto (75 gr) Indofood Saus Pedas Sachet Isi 6 (9 gr) Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Minyak Goreng Sania Botol (1 liter) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 2 2 1 1 1 2 1 2 2 3 1 2 1 1 1 2 1 1 1 1 107 948 03/12/2016 965 04/12/2016 1022 06/12/2016 1048 07/12/2016 1080 09/12/2016 1110 10/12/2016 1191 11/12/2016 1214 13/12/2016 1221 13/12/2016 1264 15/12/2016 1288 16/12/2016 Gula Pasir Putih (1 kg) Roti Bolu Kering Original Roti Bolu Iris Kering Snack Stick Bawang Plesungan Raya Snack Kerupuk Bawang Plesungan Raya Tepung Terigu Segitiga Biru (1 kg) Koepoe-Koepoe Pelembut Kue VX (75 gr) Mentega Batangan (250 gr) Koepoe-Koepoe Pewarna Makanan Coffee (30 ml) MR Cocoa Chocolate Powder (250 gr) Gula Pasir Putih (1 kg) Roti Apem Keju Cahaya Roti Bolu Gulung Teh Celup Sariwangi Kotak Isi 25 Gula Pasir Putih (1 kg) Busa Cuci Piring Dangdut Sabun Cream Jeruk Gula Pasir Putih (1 kg) Minyak Goreng Bimoli Pouch (1 liter) Gula Pasir Putih (1 kg) Teh Celup Sosro Sachet Isi 5 Snack Kerupuk Bawang Plesungan Raya Pilus Garuda Original Intra Jahe Wangi (5 Pcs) Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) Teh Celup Sariwangi Kotak Isi 25 Gula Pasir Putih (1 kg) Sarimi Isi 2 ayam bawang (115 gr) ABC Saus Tomat Sachet Isi 6 (9 gr) Teh Celup Cap Poci Kotak Isi 25 Gula Pasir Putih (1 kg) Gula Pasir Putih (1 kg) Kopi Kapal Api Kopi Susu Renteng Isi 10 (31 gr) Teh Celup Sariwangi Kotak Isi 25 Gula Pasir Putih (1 kg) Teh Celup Sariwangi Kotak Isi 25 Gula Pasir Putih (1 kg) Kopi ABC STJM Bandit Gula Pasir Putih (1 kg) 1 1 1 1 1 1 1 1 1 1 1 5 5 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 108 Lampiran 5. Lampiran Total Data Kategori Produk Total Data Kategori Produk 109 Lampiran 6. Lampiran Total Data Nama Produk Total Data Nama Produk 110 Lampiran 7. Lampiran Total Data Tanggal (Jumlah) terjadi Transaksi Total Data Tanggal (Jumlah) terjadi Transaksi 111 Lampiran 8. Lampiran Total Data Nama Produk dari Semua Transaksi Total Data Nama Produk dari Semua Transaksi