PENERAPAN METODE CLUSTERING DATA DENGAN C-MEANS UNTUK REKOMENDASI PENERIMA BEASISWA PADA UNIVERSITAS SUMATERA UTARA SKRIPSI DESI FITRIANI 091402003 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013 Universitas Sumatera Utara PENERAPAN METODE CLUSTERING DATA DENGAN C-MEANS UNTUK REKOMENDASI PENERIMA BEASISWA PADA UNIVERSITAS SUMATERA UTARA SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi DESI FITRIANI 091402003 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013 Universitas Sumatera Utara ii PERSETUJUAN Judul : PENERAPAN METODE CLUSTERING DATA DENGAN C-MEANS UNTUK REKOMENDASI PENERIMA BEASISWA PADA UNIVERSITAS SUMATERA UTARA Kategori : SKRIPSI Nama : DESI FITRIANI Nomor Induk Mahasiswa : 091402003 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Departemen : TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI (FASILKOMTI) UNIVERSITAS SUMATERA UTARA Diluluskan di Medan, Agustus 2013 Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Dedy Arisandi, ST, M.Kom NIP : 19790831 200912 1 002 Syahril Efendi, S.Si, M.IT NIP : 19671110 199602 1 001 Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua, Prof. Dr. Opim Salim Sitompul, M.Sc. NIP 19610817 198701 1 001 Universitas Sumatera Utara iii PERNYATAAN PENERAPAN METODE CLUSTERING DATA DENGAN C-MEANS UNTUK REKOMENDASI PENERIMA BEASISWA PADA UNIVERSITAS SUMATERA UTARA SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya. Medan, Agustus 2013 Desi Fitriani 091402003 Universitas Sumatera Utara iv PENGHARGAAN Alhamdulillah segala puji dan syukur penulis sampaikan kehadirat Allah SWT beserta Nabi Besar Muhammad SAW yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi S1 Teknologi Informasi Universitas Sumatera Utara. Ucapan terimakasih penulis sampaikan kepada: 1. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara. 2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Prof. Dr. Opim Salim Sitompul, M.sc. dan Drs. Sawaluddin, M.IT. 3. Bapak Syahril Efendi, S.Si., M.IT selaku pembimbing satu dan Bapak Dedy Arisandi, ST., M.Kom selaku pembimbing dua yang telah banyak meluangkan waktu dan fikirannya, memotivasi, memberikan kritik dan saran kepada penulis. 4. Ibu Sarah Purnamawati, ST., M.Sc dan Bapak Baihaqi Siregar, S.Si., MT yang telah bersedia menjadi dosen penguji dan telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini. 5. Ayahanda Akhmad Bangun Nasution dan Ibunda Idawati Hasibuan yang telah memberikan dukungan, motivasi, dan pembelajaran bagi penulis dari kecil dan selalu sabar dalam mendidik penulis. Untuk adik penulis Saiful Anwar Nasution, Aisah Safitri, Akhmad Faisal Nasution dan Rahmat Halomoan Nasution yang selalu memberikan dukungan kepada penulis, terimakasih kepada Bapak Syamsul Bahri S.Pd yang telah memberikan dukungan dan motivasi kepada penulis. 6. Teman-teman penulis Fitrianti Pohan, Erni Fauziah Nasution, Riris Poppy Lestari, Nurul Azmi dan teman-teman Asrama Putri USU dan abangda Guntur Saputra S Hasibuan yang selalu mendukung penulis dengan sabar, selalu ada untuk penulis dalam keadaan apapun dan menjadi penyemangat penulis setelah kedua orang tua penulis. 7. Teman-teman seperjuangan yang selalu memberikan dukungan dan membantu penulis selama belajar di Program Studi Teknologi Informasi yaitu Yuli Primadani, Aang Adyatma, Rian Haris Nasution, Adnan Buyung Nasution, Irwan Syahputra, Muhammad Rozy Lubis, Fuji Frilla Kurnia, Yayuk Anggraini dan teman-teman TA serta seluruh angkatan 09. Sekali lagi penulis mengucapkan terimakasih kepada semua pihak yang membantu dalam menyelesaikan tugas akhir ini yang tidak dapat disebutkan satu persatu, terimakasih atas masukan, saran dan motivasi yang diberikan. Universitas Sumatera Utara v ABSTRAK Universitas Sumatera Utara menawarkan beberapa jenis program beasiswa kepada mahasiswa berprestasi dan memerlukan bantuan ekonomi dalam menyelesaikan kuliahnya, oleh sebab itu diperlukan suatu informasi dalam bentuk rekomendasi program beasiswa. Manfaat sistem pendukung keputusan dapat diimplementasikan pada rekomendasi penerima beasiswa, teknik yang digunakan dalam aplikasi sistem pendukung keputusan ini adalah clustering data dengan c-means, dimana objek dari data yang tersedia akan dikelompokkan sedemikian rupa sehingga objek dalam satu cluster sangat mirip dan objek di berbagai cluster yang lain cukup berbeda. Clustering dengan c-means memiliki kemampuan untuk mengelompokan data mahasiswa, dan dapat meminimalisir data sesuai dengan kebutuhan program beasiswa yang ditawarkan. Setelah data mahasiswa diminimalisir, kemudian data dikelompokkan berdasarkan jarak kedekatan terhadap program beasiswa yang ditawarkan, sehingga diperoleh persamaan dan perbedaan dari beberapa cluster data dengan jarak minimal yang dimasukkan kedalam aplikasi. Aplikasi rekomendasi beasiswa memberikan informasi jenis beasiswa yang dapat diikuti oleh mahasiswa sesuai dengan syarat yang dibutuhkan oleh program beasiswa yang ditawarkan. Kata kunci : sistem pendukung keputusan, clustering data, c-means, rekomendasi Universitas Sumatera Utara vi APPLICATION OF METHODS CLUSTERING DATA WITH C-MEANS FOR RECOMMENDATIONS SCHOLARSHIP RECIPIENT IN UNIVERSITAS SUMATERA UTARA ABSTRACT Universitas Sumatera Utara offers a few types of scholarship programe for achievement student and economic assistance required in completing college, therefore the required information in the form of a scholarship program recommendations. Benefits of decision support systems can be implemented on the recommendation of the scholarship recipients, the techniques used in the application of decision support system is a clustering of data with the c-means clustering, where the object of the available data will be grouped such that objects within a cluster are very similar and objects in different clusters others are quite different. C-means clustering with the ability to classify the student data, and can minimize the data according to the needs of scholarship programs offered. Once the student data is minimized, the data is grouped by distance proximity to the scholarship program offered, in order to obtain some of the similarities and differences of the data cluster with the minimum distance is entered into the application. Provide information on scholarship applications scholarship types that can be followed by students in accordance with the terms required by the scholarship program offered. Keywords: decision support systems, clustering data, c-means, recommendations Universitas Sumatera Utara vii DAFTAR ISI Hal. ii iii iv v vi vii viii x Persetujuan Pernyataan Penghargaan Abstrak Abstract Daftar Isi Daftar Tabel Daftar Gambar BAB 1 PENDAHULUAN 1 1.1 Latar Belakang 1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian 1.5 Manfaat Penelitian 1.6 Metodologi Penelitian 1.7 Sistematika Penulisan 1 3 3 4 4 4 5 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan (SPK) 2.1.1 Nilai Guna dan Karakteristik Sistem Pendukung Keputusan 2.1.2 Komponen-komponen Sistem Pendukung Keputusan 2.1.3 Subsistem Manajemen Database 2.1.4 Subsistem Manajemen Basis Model 2.1.5 Subsistem Perangkat Lunak Penyelenggara Dialog 2.2 Beasiswa Universitas Sumatera Utara 2.2.1 Persyaratan Beasiswa Universitas Sumatera Utara 2.2.2 Syarat Khusus 2.2.3 Prosedur Untuk Mendapatkan Beasiswa Universitas Sumatera Utara 2.3 Data Mining 2.3.1 Teknik Data Mining 2.4 Metode Clustering 2.4.1 Analisa Cluster 2.4.2 Clustering dengan C-Means 2.4.3 Sifat Pengelompokan Clustering C-Means 2.4.4 Kelebihan dan Kekurangan C-Means Clustering 2.5 Pemrograman PHP dan MySQL 2.6 Data Flow Diagram (DFD) 2.7 Flowchart 7 7 7 9 10 10 11 12 13 13 20 20 22 23 23 24 26 27 27 29 29 Universitas Sumatera Utara viii BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem 3.2 Analisis Data Sistem 3.3 Perancangan Sistem 3.3.1 Pengelompokan Data (Clustering Data) 3.3.2 Data Cleaning 3.3.3 Pembentukan Centroid Cluster 3.3.4 Clustering Dengan C-Means 3.4 Analisis Komponen Sistem 3.4.1 Data Flow Diagram (DFD) Level 0 3.4.2 Data Flow Diagram (DFD) Level 1 3.4.3 Data Flow Diagram (DFD) Level 2 3.5 Rancangan Antarmuka Pengguna (user interface) 3.5.1 Rancangan Form Utama 3.5.2 Rancangan Form Beasiswa 3.5.3 Rancangan Form Staff 3.5.4 Rancangan Form Peserta 3.5.5 Rancangan Form Pengumuman 30 30 30 33 35 35 37 40 43 43 43 44 46 46 47 47 49 49 BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Implementasi Sistem 4.1.1 Lingkungan Implementasi 4.1.2 Implementasi Perancangan Antarmuka 4.1.3 Tampilan Implementasi Program 4.2 Pengujian Sistem 4.2.1 Rencana Pengujian Sistem 4.2.2 Hasil Pengujian Sistem 4.2.3 Hasil Pengujian Kinerja Sistem 50 50 50 50 51 58 58 59 64 BAB 5 KESIMPULAN DAN SARAN 5.1 Kesimpulan 5.2 Saran 65 65 65 DAFTAR PUSTAKA LAMPIRAN A : Listing Program LAMPIRAN B : FLOWCHART BEASISWA 67 69 78 Universitas Sumatera Utara ix DAFTAR TABEL Tabel 2.1 Jenis dan Syarat Beasiswa Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 2.1 Jenis dan Syarat Beaiswa (Lanjutan) Tabel 3.1 Data Mahasiswa yang Mendaftar Beasiswa Tabel 3.2 Data Jenis Program Beasiswa di Universitas Sumatera Utara Tabel 3.3 Nilai Numerik Tiap Fakultas Tabel 3.4 Hasil Filterisasi Karakteristik Data Mahasiswa Tabel 3.4 Hasil Filterisasi Karakteristik Data Mahasiswa (Lanjutan) Tabel 3.5 Perbandingan Antara Tiap-tiap Centroid Tabel 3.6 Jarak Data Umur ke Pusat Cluster Tabel 4.1 Rencana Pengujian Tabel 4.2 Hasil Pengujian Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) 13 14 15 16 17 18 19 32 34 36 36 37 39 41 59 60 61 62 63 Universitas Sumatera Utara x DAFTAR GAMBAR Gambar 2.1 Proses Knowledge Discovery In Database Gambar 2.2 Flowchart Algoritma C-Means Gambar 3.1 Flowchart Clustering Gambar 3.2 Tahapan Pengelompokan Data Gambar 3.3 Flowchart Clustering C-Means Gambar 3.4 Diagram Konteks (DFD Level 0) Gambar 3.5 Data Flow Diagram Level 1 Gambar 3.6 Data Flow Diagram Level 2 Mengelola Data Peserta Gambar 3.7 Data Flow Diagram Level 2 SPK Rekomendasi Beasiswa Gambar 3.8 Rancangan Form Utama Gambar 3.9 Rancangan Form Beasiswa Gambar 3.10 Rancangan Form Login Staff Gambar 3.11 Rancangan Form Staff Gambar 3.12 Rancangan Form Peserta Gambar 3.13 Rancangan Form Pengumuman Gambar 4.1 Menu Utama Program Gambar 4.2 Menu Pendaftaran Beasiswa Gambar 4.3 Tampilan Data Mahasiswa Gambar 4.4 Menu Beasiswa Gambar 4.5 Menu Login Staff Gambar 4.6 Menu Staff Admin Gambar 4.7 Menu Peserta Gambar 4.8 Print Screen Hasil Laporan Dalam Bentuk Excel Gambar 4.9 Menu Pengumuman Rekomendasi Beasiswa 21 25 31 35 40 43 43 44 45 46 47 48 48 49 49 51 52 52 53 54 55 56 56 57 Universitas Sumatera Utara