IMPLEMENTASI DATA MINING MENGGUNAKAN METODE DECISION TREE BERDASARKAN DATA PEMINJAMAN BUKU PERPUSTAKAAN UNSYIAH BERDASARKAN FAKULTAS Haris Dwi Wijaya (1208107010075) Program Studi Informatika Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Syiah Kuala Email : [email protected] Abstrak -- Seiring berkembangnya teknologi, memaksa kemampuan kita dalam mengumpulkan dan mengolah data. Penggunaan sistem komputerisasi dalam berbagai bidang akan menghasilkan data berukuran yang sangat besar dan data-data yang telah terkumpul merupakan suatu aset yang digunakan sebagai informasi terhadap pihak-pihak yang mengumpulkannya. Oleh karena itu perlu adanya sistem yang bisa mengklasifikasikan data tersebut. Teks mining merupakan metode klasifikasi yang merupakan variasi data mining yang digunakan untuk menemukan pola yang menarik dari sekumpulan data tekstual yang sangat besar. Sedangkan algoritma decision tree classifier merupakan algoritma yang mendukung untuk melakukan klasifikasi dalam data mining. Dalam pembahasan penelitian ini menggunakan data peminjaman buku perpustakaan Unsyiah dengan total data sebanyak 2299 banyak peminjam dari berbagai fakultas yang ada di Unsyiah. Klasifikasi yang digunakan menggunakan aplikasi WEKA yang merupakan salah satu aplikasi atau perangkat lunak data mining yang memiliki sekumpulan algoritma standar data mining berbasis interface yang bisa dipakai oleh user secara langsung. Aplikasi weka ini menggunakan metode kalsifikasi data yang telah disebutkan diatas. Hasil dari penelitian ini menghasilkan sebuah data dengan kategori fakultas yang meminjam buku perpustakaan paling banyak. Kata kunci : Klasifikasi, Teks Mining, Decision Tree Clasifier, Weka. I. PENDAHULUAN I. Teks Mining adalah salah satu teknik yang dapat digunakan untuk klasifikasi[1]. Klasifikasi dengan banyak data dapat juga disebut dengan data mining. Data Mining merupakan metode pencarian informasi (pengetahuan) baru yang terkandung dalam data yang sangat besar. Ada banyak metode yang ada dalam data mining, yaitu prediksi, klasifikasi, cluster, dan asosiasi[2]. Dalam data mining terdapat banyak metode yang digunakan di dalamnya, salah satunya adalah Decision Tree. Decision Tree merupakan salah satu metode klasifikasi yang II. digunakan dan memiliki prediksi yang sangat kuat dan terkenal dalam penerapannya di datamining. Pada dasarnya Decision tree mengubah data menjadi pohon keputusan dan aturan-aturan keputusan (rule) [3]. Keuntungan dalam metode ini adalah efektif dalam menganalisa sejumlah besar atribut dari data sehingga data tersebut dapat mudah dipahami oleh pengguna akhir[4]. Aplikasi yang digunakan untuk mendukung implementasi data mining dengan metode decision tree ini adalah WEKA.WEKA kependekan dari Wakaito Environment for Knowledge Analysis merupakan perangkat lunak data mining yang memiliki sekumpulan algoritma standart data mining. Weka dikembangkan di University of Waikato, New Zealand dan dikembangkan menggunakan Java yang berbasis Interface. Data yang disimpan dalam Weka ini akan dibuat dalam format ARFF yangmerupakan standar bawaan dalam weka dari data. III. Adapun maksud dari penyusunan laporan ini berdasarkan judul besar di atas adalah untuk membangun dan mengetahui data hasil berdasarkan data yang telah di dapat dan telah di klasifikasi menjadi sebuah data yang penting berupa informasi. Data yang digunakan adalah data Peminjaman Buku perpustakaan Unsyiah. Hasil yang diharapakan dalam data ini dengan klasifikasi yang digunakan adalah dapat mengetahui fakultas dari mahasiswa yang meminjam buku terbanyak untuk kampus Unsyiah sendiri. II. MODEL ANALISA DAN IMPLEMENTASI IV. Penelitian ini menggunakan metode decision tree yang bertujuan untuk mendapatkan hasil dari data yang diinginkan berdasarkan data yang diperoleh melalui tahapan berikut: a. Pengumpulan Data, berupa data set yang terdiri dari nim, nama, mahasiswa, tipe anggota, judul buku yang di pinjam, tanggal peminjam, tanggal pengembalian, Fakultas, Jurusan dan Tahun Peminjaman sebanyak total data 2299 banyaknya nama mahasiswa yang terdaftar di bagian sub pengelola perpustakaan dalam hal peminjaman. Data ini di acak dari 80ribu data total peminjam yang terdata dan hanya diambil sebanyak 2299 data. b. Pengklasifikasian menggunakan perangkat lunak, seperti yang telah dibahas, perangkat lunak yang digunakan adalah WEKA, dengan menggunakan class Fakultas dan classify menggunakan trees, dengan sub J48 serta menggunakan Crossvalidation dengan nilai Folds 10. V. III. HASIL DAN PEMBAHASAN VI. Berikut gambar dataset yang telah di dapat: VII. VIII. Selanjutnya di data tersebut kita masukkan ke dalam weka. Berikut hasil IX. yang didapat : XVI. X. XI. Bagian yang dicentang merupakan bagian untuk klasifikasi yang akan kita, tentunya menggunakan data nominal. Selanjutnya adalah melakukan klasifikasi dengan classifier tree. Dengan nilai awal Folds 10. XVII. XVIII. XII. XIX. XX. XIII. XIV. XV. Hasil yang di dapat untuk nilai folds 10 : XXI. IV. KESIMPULAN XXII. Berdasarkan hasil data yang telah di klasifikasi, didapat bahwa peminjam buku terbanyak berada di Fakultas dengan kategori KIP sebanyak 893 dengan nilai akurasi atau F-Measure sebanyak 0.99. hasil ini dikatakan sangat bagus karena mendekati 1, selain itu data yang di dapat merupakan data yang benar-benar bagus, dan tidak acak. XXIII. XXIV. XXV. DAFTAR PUSTAKA XXVI. [1]. Feldman, R & Sanger, J. 2007. The Text Mining Handbook : Advanced Approaches in Analyzing Data. Cambridge University Press : New York. XXVII. XXVIII. [2]. Kusrini, Emha Taufiq Luthfi, (2009),Algoritma Data Mining,Yogyakarta : ANDI. XXIX. XXX. [3]. Tala, Fadillah Z. 2003. A Study of Stemming Efects on Information Retrieval in Bahasa Indonesia.Institute for Logic, Language and ComputationUniversiteit van Amsterdam. XXXI. XXXII. [4] Hermawan, Julius, 2005. Membangun Decision Support System. Penerbit Andi, Yogyakarta XXXIII.