IMPLEMENTASI ALGORITMA K-MEANS UNTUK PENGELOMPOKAN PENYAKIT PASIEN ( STUDI KASUS : PUSKESMAS KAJEN) K-MEANS ALGORITHM IMPLEMENTATION FOR CLASSIFICATION OF DISEASE PATIENT (CASE STUDY : HEALTH CENTERS KAJEN REGENCY PEKALONGAN) 1,2 Denada Ladyta Putri1,Heru Agus Santoso2 Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Jl.Nakula I No.5-11, Semarang, Jawa Tengah, 50131, Indonesia E-mail: [email protected], [email protected] Abstrak Kondisi kesehatan masyarakat di daerah Pekalongan yang tidak tetap dan salalu berubah – ubah ini sangat meyulitkan Tim Dinas Kesehatan dalam memonitoring dan memberi pembinaan pada masyarakat tersebut, banyak variabel yang mempengaruhi tingkat kesehatan disuatu masyarakat diantaranya adalah variabel ekonomi, epidemiologi dan pendidikan. Pada penelitian ini bertujuan untuk mengelompokkan penyakit pasien berdasarkan penyakit di suatu daerah tertentu pada Puskesmas Kajen Kabupaten Pekalongan sebanyak 1000 data pasien menggunakan metode K-Means dengan inputan variabel umur, kode penyakit dan lama mengidap penyakit dari data pasien. Penyakit ini merupakan penyakit yang sebagian besar mendiami atau menyerang suatu daerah tertentu dengan korban atau penderita terbanyak di daerah tersebut. hasil dari penelitian ini juga dapat dimanfaatkan sebagai dasar acuan untuk penyuluhan kesehatan didaerah setempat. Dari hasil pengujian sistem menggunakan data sebanyak 1000 data menghasilkan tiga kluster yaitu cluster C1 (Kecamatan Bojong) pada daerah ini penyakit yang banyak diderita oleh pasien adalah jenis penyakit Commond Cold, cluster C2 (Kecamatan Karanganyar) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Gangguan perkembangan dan erupsi gigi, dan pada cluster C3 (Kecamatan Kajen) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Pneumonia. Hasil dari uji sistem menggunakan 20% data yang di peroleh dari tempat penelitian menghasilkan akurasi sebesar 62%. Kata kunci : K-means, Data Mining, Clustering, Puskesmas Kajen Abstract The unstable and change able public health conditions in Pekalongan make it difficult for Team Health Department in monitoring and providing guidance to people. There are many variables that affect health level in the society such as economic, epidemiology and education variables. This study aims to classify disease of patients by disease in a particular region. For instance, it is registered in Health Center Kajen that there are 1000 patients use the K-Means with the input variables of age, disease code and patient length of suffering the diseases. This disease is a disease that mostly inhabit or invade and mostly in a particular area with most patients in the area. The results of this research can also be used as the reference for health education in the local area. From the results of testing the system using the data of 1000 patients implies three clusters which are cluster C1 (Subdistrict Bojong) with the disease suffered by people around this area is Common Cold, for cluster C2 (Subsdistrict Karanganyar) which is having developmental disorders disease and tooth eruption as the diseases disease suffered by people around this area, and cluster C3 (Subdistrict Kajen) with the disease suffered by people around this area is pneumonia. The results of the test system using 20% of the data derived from the research with accuracy at 62%. Keyword : K-means, Data Mining, Clustering, Health Center 1. PENDAHULUAN Kesehatan merupakan salah satu hak asasi manusia yang telah dicantumkan dalam Undang – Undang Dasar Republik Indonesia, kesehatan juga menjadi salah satu investasi dalam suatu negara untuk itu dibangun suatu organisasi Dinas Kesehatan pada setiap daerah di Indonesia. Kondisi kesehatan masyarakat di daerah pekalongan yang tidak tetap dan salalu berubah – ubah ini sangat meyulitkan Tim Dinas Kesehatan dalam memonitoring dan memberi pembinaan pada masyarakat tersebut, banyak variabel yang mempengaruhi tingkat kesehatan disuatu masyarakat diantaranya adalah variabel ekonomi, epidemiologi dan pendidikan[1]. Jaminan kesehatan merupakan salah satu indikator suatu negara dapat dikatan telah mencapai suatu keberhasilan pembangunan negara tersebut. Departemen Kesehatan di Indonesia melalui Dinas Kesehatan yang tersebar diseluruh wilayah telah mengumpulkan data kesehatan dari setiap daerah yang kemudian data tersebut diolah untuk menghasilkan rangking kota sehat di Indonesia. Perangkingan ini juga sebagai kegiatan acuan bagi Pemerintah Daerah untuk lebih meningkatkan rangking kesehatan pada daerahnya masing – masing yang dapat menjadikan negara Indonesia dikatakan berhasil dari segi pembangunan[2]. Dalam perangkingan kesehatan pada daerah Kajen Kabupaten Pekalongan masih menggunakan cara manual yaitu perhitungan yang masih menggunakan rata – rata seluruh hasil indikator atau didasarkan pada distribusi data pada setiap daerah, pengolahan data indikator data juga masih menggunakan teknik statistik dasar, ini menghasilkan output yang kurang maksimal dan memiliki permasalahan pada konsistensi data pada setiap Dinas Kesehatan[2]. Tumpukan data yang berada pada Puskesmas sekarang ini hanya sebatas memberikan grafik atau statistik jumlah pasien yang berobat dengan penyakit yang diderita beserta laporan penyakit yang diderita beserta informasi obat dari penyakit tersebut. Laporan data inilah yang dijadikan oleh dinas kesehatan untuk melakukan kebijakan – kebijakan apabila memonitoring dan memberikan penyuluhan. Untuk menentukan konsistensi data kesehatan dapat digunakan teknik data mining yang mampu menggali informasi tersembunyi dari kumpulan data multidimensi yang telah diperoleh, selain itu pengekstrakan data yang terhubung dengan data lain juga dapat dilakukan oleh teknik data mining ini. Salah satu teknik data mining yang cukup terkenal yaitu clustering dan metode yang cukup polpuler dalam teknik data mining ini dalah metode kmeans[3]. Oleh karena itu berdasarkan permasalah yang telah dipaparkan di atas maka penulis ingin menerapkan metode k-means untuk menghasilkan informasi mengenai pengelompokkan penyakit yang tersebar dibeberapa daerah yang ada di Kajen Kabupaten Pekalongan berdasarkan data yang didapat dari Puskesmas Kajen. Yang kemudian hasil tersebut dapat dijadikan bahan atau dasar penyuluhan kesehatan oleh Dinas Kesehatan setempat. 1. METODE Untuk menentukan konsistensi data kesehatan dapat digunakan teknik data mining yang mampu menggali informasi tersembunyi dari kumpulan data multidimensi yang telah diperoleh, selain itu pengekstrakan data yang terhubung dengan data lain juga dapat dilakukan oleh teknik data mining ini. Salah satu teknik data mining yang cukup terkenal yaitu clustering dan metode yang cukup polpuler dalam teknik data mining ini dalah metode kmeans[3]. 1.1 Data mining Data Mining juga dikenal dengan istilah pattern recognition merupakan suatu metode yang digunakan untuk pengolahan data guna menemukan pola yang tersembunyi dari data yang diolah. Data yang diolah dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru yang bersumber dari data lama, hasil dari pengolahan data tersebut dapat digunakan dalam menentukan keputusan di masa depan[4]. 1.2 Teknik Data Mining a. Klasifikasi Klasifikasi merupakan teknik data mining yang dalam prosesnya menentukan recorddari data yang baru ke dalam salah satu atau beberapa kelas (kategori) yang terlebih dahulu didefinisikan, teknik ini juga disebut juga supervised learning. b. Association Rule Discovery Association Rule Discovery merupakan teknik data mining dengan mendeteksi suatu kumpulan atribut atau variabel yang terdapat dalam frekuensi yang sering muncul dan membentuk sejumlah kaida dari kumpulan – kumpulan tersebut. c. Sequeential Pattern Discovery Sequeential Pattern Discoverymerupakan salah satu teknik data miningyang mencari sejumlah kejadian atau event yang berlangsung dan terjadi secara bersamaan. d. Regression Regresi merupakan teknik memprediksi dari suatu variabel kontinu yang telah diberikan berdasarkan nilai dari variabel yang lain, dengan mengansumsikan sebuah model ketergantungan linier atau nonlinier. 1.3 Tahap – Tahap Data Mining a. Data Cleaning (Pembersihan Data) Pada tahap ini data – data yang tidak relevan dan mengandung noise akan dihilangkan begitu juga data yang tidak konsisten, ini bertujuan untuk mempermudah pencarian pola. b. Data Integration (Integrasi Data) Pada tahap ini akan dilakukan proses pengggabungan data ke dalam database yang baru, karena pada data mining proses yang dilakukan tidak hanya menggunakan satu data namun beberapa data sekaligus, untuk itu perlu dilakukan data integrasi. c. Data Selection (Seleksi Data) Kebutuhan data yang dari data yang diperoleh tidak kesemuanya akan dipakai dalam kebutuhan, untuk itu pada data yang diperoleh akan dilakukan penyeleksian data, ini juga dilakukan untuk memebuang data – data yang tidak relevan dan tidak valid yang akan mempengaruhi informasi berikutnya. d. Data Transformation (Transformasi Data) Data yang telah dilakukan pemrosesan dengan tahap – tahap diatas kemudian dilakukan penggabungan dalam format tertentu yang sesuai dengan data mining, karena metode yang digunakan dalam proses mining membutuhkan format – format data tertentu agar supaya bisa diolah sedemikian rupa. e. Proses Mining Proses mining merupakan proses yang paling utama pada saat penerapan metode tertentu yang digunakan dalam data mining yang bertujuan untuk menemukan dan menggali informasi berharga yang terdapat dalam suatu data. f. Pattern Evaluation (Evaluasi Pola) Evaluasi pola dalam tahap data mining merupakan proses mengidentifikasi atau menganalisa pola – pola yang terdapat dalam data kemudian pola – pola tersebut dilakukan evaluasi untuk menilai apakah hipotesa yang didapatkan bisa tercapai atau tidak. g. Knowledge Presentation (Presentasi Pengetahuan) proses ini adalah bagaimana memformulasiakan keputusan atau aksi dari hasil analisis yang didapatkan. Hasil dari presentasi pengetahuan ini juga melibatkan orang – orang yang tidak memahami data mining, karena pengetahuan yang dihasilkan juga bersifat umum. 1.4 K-means K-means merupakan suatu algoritma yang digunakan dalam pengelompokkan secara pertisi yang memisahkan data ke dalam kelompok yang berbeda – beda. Algoritma ini mampu meminimalkan jarak antara data ke clusternya. Pada dasarnya penggunaan algoritma ini dalam proses clustering tergantung pada data yang didapatkan dan konklusi yang ingin dicapai di akhir proses[8]. 1.5 Clustering Clustering adalah metode yang digunakan dalam data mining yang cara kerjanya mencari dan mengelompokkan data yang mempunyai kemiripan karakteristik antara data satu dengan data lainnya yang telah diperoleh. Ciri khas dari teknik data mining ini adalah mempunyai sifat tanpa arahan (unsupervised), yang dimaksud adalah teknik ini diterapkankan tanpa perlunya data training dan tanpa ada teacher serta tidak memerlukan target output[4]. Metode clustering yang mempunyai sifat efesien dan cepat yang dapat digunakan salah satunya adalah metode k-means, metode ini bertujuan untuk membuat cluster objek berdasarkan atribut menjadi kpartisi. Cara kerja metode ini adalah mula – mula ditentukan cluster yang akan dibentuk, pada elemen pertama dalam tiap cluster dapat dipilih untuk dijadikan sebagai titik tengah (centroid), selanjutnya akan dilakukan pengulangan langkah – langkah hingga tidak ada objek yang dapat dipindahkan lagi[5]. Langkah langkah Algoritma K-Means Tahap 1: Pusat awal cluster Pusat awal cluster ini maka akan diansumsikan data yang memiliki nilai terendahlah yang akan digunakan sebagai pusat awal cluster, yaitu : Data ke- Umur Kode penyakit Lama mengidap 4 11 18 2 8 14 21 1 11 3 21 1 Tahap 2 : Perhitungan jarak pusat cluster Setalah pusat awal ditentukan yaitu dengan mengambil nilai yang paling rendah dari seluruh data, maka proses selanjutnya akan dihitung jarak antara data dengan pusat awal cluster menggunakan persamaan euclidean distace sebagai berikut : √∑ Dimana : Cik : pusat cluster Ckj : data Tahap 3 : Pengelompokkan data Jarak hasil perhitungan pada point ke-2 akan dilakukan perbandingan dan dipilih jarak yang paling dekat antara data dengan pusat cluster, jarak ini akan menunjukkan bahwa data yang memiliki jarak terdekat berada dalam satu kelompok dengan pusat cluster terdekat, pengelompokkan data tersebut dapat dilihat pada tabel 4.3 di bawah ini, nilai 1 berarti data tersebut berada dalam kelompok. Tahap 4 : Penetuan pusat cluster baru Setelah didapatkan anggota dari setiap cluster kemudian pusat cluster baru dihitung berdasarkan data anggota tiap – tiap cluster yang sudah didapatkan menggunakan rumus yang sesuai dengan pusat anggota cluster. Tahap 5 :Hitung jarak data ke pusat cluster baru Setelah pusat cluster baru didapatkan seperti pada point ke-4 selanjutnya proses perhitungan jarak data ke pusat cluster baru dilakukan seperti pada point ke-2 dengan menggunakan euclidean distance. √∑ Dimana : Cik Ckj : pusat cluster : data Tahap 6:Ulangi langkah dua sampai dengan lima sehingga sudah tidak ada lagi data yang berpindah ke cluster lain. Jarak hasil perhitungan data ke pusat cluster baru akan dilakukan perbandingan dan dipilih jarak yang paling dekat antara data dengan pusat cluster baru, jarak ini akan menunjukkan bahwa data yang memiliki jarak terdekat berada dalam satu kelompok dengan pusat cluster terdekat. METODOLOGI PENELITIAN 3.1 Metode Pengumpulan Data a. Studi Literatur Studi literatur yang digunakan disini meliputi pengolahan data penyakit pasien Puskesmas Kajen dan pemrograman. b. Sample Data Set Data pada penelitian yang sedang dilakukan merupakan data penyakit pasien Puskesmas Kajen sebanyak 1000 data yang akan dikelompokkan ke dalam penyakit berdasarkan tiap daerah c. Studi Pustaka Hal ini yang bertujuan untuk melakukan atau memperoleh data sebagai data pendukung maupun tambahan dengan memperoleh data dengan cara tidak langsung atau disebut dengan data sekunder yaitu yang bersumber berupa literatur, buku, jurnal, dan informasi dari internet yang berkaitan dengan penelitian ini yaitu mengetahui tingkat kepuasaan konsumen untuk meningkatkan kualitas pelayanan. d. Metode Analisa data Dalam penulisan penelitian ini menggunakan analisis data yang bersifat kualitatif, penelitian kualitatif adalah analisis yang dilakukan dengan mengelompokkan data untuk mencari suatu pola dari hal yang dipelajari dan membandingkan konsep – konsep yang ada dalam sumber. 3.2 Variabel Penelitian Pada sebuah penelitian data mining pastinya terdapat data yang akan diolah dengan metode yang telah ditentukan sebelumnya, pada penelitian ini data yang digunakan adalah data pasien dari Puskesmas Kajen Kabupaten Pekalongan yang akan diolah menggunakan metode k-means untuk mengelompokkan data penyakit pasien tersebut kedalam kelompok penyakit berdasarkan beberapa variabel inputan. Variabel inputan yang digunakan dalam pengelompokkan penyakit pasien tersebut adalah nama, nomor ID, jenis kelamin, umur, kode penyakit, dan lama mengidap penyakit tersebut dalam hitungan bulan. Kemudian variabel tersebut akan diolah menggunakan metode kmeans yang kemudian menghasilkan output kelompok penyakit berdasarkan hitungan dari metode k-means. 3.3 Diagram Alur Penelitian Diagram Alur penelitian dapat dilihat pada gambar1 : Studi Literatur Metode Pengumpulan Data Implementasi Perancangan Analisa Kebutuhan Pengujian Pengambilan Kesimpulan dan Saran Start End Gambar 1: Prosedur Penelitian Uji Akurasi Perhitungan akurasi dari kinerja sistem merupakan langkah yang dilakukan untuk mengatahui seberapa besar dan seberapa tepat kinerja dari sistem yang telah dibuat untuk pemrosesan clustering data sebanyak 1000 data pasien Puskesmas Kajen. Pada pengujian akurasi ini hanya menggunakan data sebanyak 20% dari data training yang jumlah totalnya ada 1000 data. Dalam pengujian akurasi sistem ini hasil dari data yang sudah dikluster akan dicocokkan dengan data asli yang didapatkan dari tempat penelitian, maka untuk menghitung presentase akurasinya dapat dimasukkan dalam persamaan berikut ini : Dari hasil pengujian sistem dan perhitungan akurasi sistem di atas, didapatkan akurasi sistem sebesar 62% dengan menggunakan data 20% dari 1000 data training. 4. HASIL PEMBAHASAN DAN IMPLEMENTASI PROGRAM Tahapan awal yang dilakukan pada penelitian ini adalah persiapan data, yang diperoleh dari data Puskesmas Kajen Kabupaten Pekalongan. Data yang diperoleh adalah data pasien yang berobat di Puskesmas Kajen dari 1000 data pasien yang sudah dikelompokkan menjadi 3 cluster. 4.1 4.1.1 Implementasi Program Tampilan Menu Home Halaman home yang terdapat pada sistem akan tampil sebagai halaman utama, halaman ini berisi data tabel dari data pasien Puskesmas Kajen yang telah diinputkan oleh user, tabel data tersebut terdiri dari beberapa atribut yaitu nama pasien, jenis kelamin, umur, jenis penyakit, lama mengidap dan alamat pasien. Dari setiap record data pasien mempunyai aksi delete untuk menghapus data yang bilamana tidak diperlukan dalam proses. 4.1.2 Tampilan Menu Input Data Pasien Halaman input data pasien ini berupa halaman yang akan muncul apabila user memilih menu input data yang berada dihalaman sistem, halaman ini digunakan untuk menginputkan data pasien yang akan diclustering menggunakan metode k-means. 4.1.3 Tampilan Menu Data Penyakit Halaman data penyakit ini merupakan halaman yang digunakan dalam menginputkan jenis penyakit dan kode penyakit sebagai inisialisasinya, jenis dan kode penyakit tersebut kemudian akan disimpan dalam database sistem. Jenis penyakit yang telah diinisialisasi akan otomatis keluar dalam pilihan inputan pada saat menginputkan data pasien di halaman menu input pasien. 4.1.4 Tampilan Menu Clustering Halaman ini merupakan halaman hasil pemrosesan data pasien yang sebelumnya telah diinputkan dan disimpan dalam database. Proses yang dilakukan dalam pengklusteran data menggunakan metode k-means yang cara perhitungannya sudah dilakukan pada point diatas. Pada halaman ini terdapat dua konten yaitu konten jumlah cluster dan konten tabel hasil clustering. gambar di atas merupakan halaman yang tampil pertama kali ketika user memilih menu proses clustering maka user akan diminta untuk memasukkan jumlah centroid untuk memproses data nantinya, jumlah centroid juga merupakan jumlah cluster yang akan dibuat dalam proses pengklusteran nantinya. Pada penilitian kali ini menggunakan tiga cluster yang sesuai dengan daerah yang sudah dipilih terlebih dahulu, yaitu C1 adalah daerah Kajen, C2 adalah daerah Karanganyar dan C3 adalah daerah Bojong. 4.1.5 Tampilan Menu Kode Penyakit Kode penyakit ini merupakan inisialisasi dari nama penyakit yang termasuk dalam atribut yang diolah pada proses clustering sistem. Berikut ini tampilan menu kode penyakit dan tabel kode penyakit yang diderita oleh pasien. 4.1.6 Tampilan Menu Kode Cluster Pada gambar di atas dapat dilihat tabel inisialasasi kluster daerah, kecamatan Bojong di inisialisasikan dengan C1, kecamatan Karanganyar di inisialisasikan dengan C2, kecamatan Kajen di inisialisasikan dengan C3. 4.1.7 Hasil Clustering Data Gambar diatas merupakan tabel sampel data hasil proses pengklusteran menggunakan metode k-means dengan data sebanyak 1000 data pasien Puskesmas Kajen. Namun pada tabel hasil clustering ini mempunyai kelemahan yaitu tidak bisa menampilkan atribut lain selain atribut yang diproses oleh algoritma clustering. Dari hasil pengujian sistem menggunakan data sebanyak 1000 data menghasilkan tiga cluster yaitu cluster C1 (Kecamatan Bojong) pada daerah ini penyakit yang banyak diderita oleh pasien adalah jenis penyakit Commond Cold, cluster C2 (Kecamatan Karanganyar) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Gangguan perkembangan dan erupsi gigi, dan pada cluster C3 (Kecamatan Kajen) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Pneumonia. 5. Kesimpulan Dan Saran 5.1 Kesimpulan 1.1 Kesimpulan Berdasarkan hasil analisis implementasi dan pengujian pada sistem clustering, maka dapat disimpulkan bahwa metode k-means berhasil dan dapat diterapkan untuk mengelompokkan penyakit yang berada pada daerah tertentu di Kajen Kabupaten Pekalongan. Dari hasil pengujian sistem menggunakan data sebanyak 1000 data menghasilkan tiga cluster yaitu cluster C1 (Kecamatan Bojong) pada daerah ini penyakit yang banyak diderita oleh pasien adalah jenis penyakit Commond Cold, cluster C2 (Kecamatan Karanganyar) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Gangguan perkembangan dan erupsi gigi, dan pada cluster C3 (Kecamatan Kajen) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Pneumonia. Dan Hasil pengujian pada sistem pengelompokkan penyakit tersebut mempunyai akurasi 62% dengan menggunakan data sebanyak 20% dari data training, hal ini menunjukkan bahwa metode k-means dapat diterapkan dalam proses pengelompokkan data penyakit berdasarkan data dari Puskesmas Kajen Kabupaten Pekalongan. 5.2 Saran Berdasarkan hasil analisis implementasi dan pengujian pada sistem clustering, maka dapat disimpulkan bahwa metode k-means berhasil dan dapat diterapkan untuk mengelompokkan penyakit yang berada pada daerah tertentu di Kajen Kabupaten Pekalongan. Dari hasil pengujian sistem menggunakan data sebanyak 1000 data menghasilkan tiga cluster yaitu cluster C1 (Kecamatan Bojong) pada daerah ini penyakit yang banyak diderita oleh pasien adalah jenis penyakit Commond Cold, cluster C2 (Kecamatan Karanganyar) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Gangguan perkembangan dan erupsi gigi, dan pada cluster C3 (Kecamatan Kajen) pada daerah ini penyakit yang banyak diderita oleh pasien adalah penyakit Pneumonia. Dan Hasil pengujian pada sistem pengelompokkan penyakit tersebut mempunyai akurasi 62% dengan menggunakan data sebanyak 20% dari data training, hal ini menunjukkan bahwa metode k-means dapat diterapkan dalam proses pengelompokkan data penyakit berdasarkan data dari Puskesmas Kajen Kabupaten Pekalongan. 6. DAFTAR PUSTAKA [1] M. M. Putri dan K. Fithriasari, “Pengelompokan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kesehatan Masyarakat Menggunakan Metode Kohonen SOM dan K-Means,” Jurnal Sains dan Seni ITS, vol. 4, no. 1, pp. D13 - D18, 2015. [2] N. Atthina dan L. Iswari, “Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat kesehatan Daerah denganMetode K-Means,” Seminar Nasional Aplikasi Teknologi Informasi (SNATI), Vol. %1 dari %2ISSN 1907 - 5022, pp. B52 - B59, 2014. [3] V. Handayani, A. dan A. P. kurniati, “Analisa Clustering Menggunakan Algoritma K-Modes,” Telkom University, pp. 1-8, 2010. [4] J. O. Ong, “Implementasi Algoritma K-Means Clustering Untuk Menentukan Strategi Marketing President University,” Jurnal Ilmiah Teknik Industri, vol. 12, no. 1, pp. 10 - 20, 2013. [5] Y. Ardilla, H. Tjandrasa dan I. Arieshanti, “Deteksi Penyakit Epilepsi dengan Menggunakan Entropi Permutasi, K-Means Clustering, dan Multilayer Perceptron,” Jurnal Teknik POMITS , vol. 3, no. 1, pp. A70 - A74, 2014. [6] M. E. Putra, “Implementasi Algoritma K-Means Pada Pendeteksian Warna Untuk Membantu Penderita Buta Warna,” Jurnal Ilmiah komputer dan Informatika (KOMPUTA), Vol. %1 dari %2ISSN 2089 - 9033, pp. 1-8, 2012. [7] S. P. Tulus dan Hendry, “Supprot Vektor Machines Yang Didukung K-Means Clustering Dalam Klasifikasi Dokumen,” Jurnal Teknologi Informasi-Aiti, vol. 11, no. 2, pp. 101-202, 2014. [8] S. Agustina, D. Yhudo, H. Santoso, N. Marnasusanto, A. Tirtana dan F. Khusnu, “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan Metode K-Means,” Universitas Brawijaya Malang, Malang, 2012. [9] F. E. Agustin, A. Fitria dan A. H. S, “Implementasi Algoritma K-Means Untuk Menentukan Kelompok Pengayaan Materi Mata Pelajaran Ujian Nasional (Studi Kasus : SMP Negeri 101 Jakarta),” Jurnal Teknik Informatika, vol. 8, no. 1, pp. 73 - 78, 2015. [10] K. R. Prilianti dan H. Wijaya, “Aplikasi Text Mining Untuk Automasi Penentuan Tren Topik Skripsi Dengan Metode K-Means Clustering,” Jurnal Cybermatika, vol. 2, no. 1, pp. 1-6, 2014. [11] A. Yusuf dan T. Priambadha, “Supprot Vektor Machines Yang Didukung K-Means Clustering Dalam Klasifikasi Dokumen,” JUTI, vol. 11, no. 1, pp. 13-16, 2013. [12] N. A, S. B dan P. U, “Implementasi Naive Bayes Classifier Pada Program Bantu Penentuan Buku Referensi Mata Kuliah,” Jurnal Informatika, vol. 3, no. 2, pp. 32-36, 2007. [13] D. Septiari, “Implementasi Metode Naive Bayes Classifier Dalam Klasifikasi Kelayakan Calon Pendonor Darah (Studi Kasus : PMI Kabupaten Demak),” Universitas Dian Nuswantoro, Semarang, 2016. [14] Budiono, a. Fahmi dan Pujiono, “Penerapan Metode Association Rule Discovery Menggunakan Algoritma Apriori Untuk Mengidentifikasi Pola Penyakit Radang Sendi,” Techno.COM, vol. 13, no. 2, pp. 115-124, 2014. [15] Supardi, D. E. Ratnawati dan W. F. Mahmudy, “Pengenalan Pola Transaksi Sirkulasi Buku Pada Database Perpustakaan Menggunakan Algoritma Generalized Sequential Pattern,” Jurnal Mahasiswa PTIIK Universitas Brawijaya, vol. 4, no. 11, pp. 1-8, 2014. [16] R. F. Jannah, “Rancang Bangun Sistem Hasil Produksi Dengan Memanfaatkan Metode Least Square Regression Line (Studi Kasus : Toko Keeava Salad & Puding)”,” Universitas Jember, Jember, 2015. [17] N. P. E. Merliana, Ernawati dan J. Santoso, “Analisis Penentuan Jumlah Cluster Terbaik Pada Metode K-Means Clustering,” dalam Prosiding Seminar Nasional Multi Disiplin Ilmu dan Call For Papers Unisbank (SENDI_U), Yogyakarta, 2014. [18] Y. L. Prihartanto, “Sistem Informasi Manajemen Agenda Pada Badan Pelayanan Perijinan Terpadu Kabupaten Karanganyar,” Indonesian Jurnal on Computer Science Speed(IJCSS), vol. 9, no. 3, pp. 1-6, 2102.