implementasi data mining menggunakan metode decision

advertisement
IMPLEMENTASI DATA MINING MENGGUNAKAN METODE DECISION TREE
BERDASARKAN DATA PEMINJAMAN BUKU PERPUSTAKAAN UNSYIAH
BERDASARKAN FAKULTAS
Haris Dwi Wijaya (1208107010075)
Program Studi Informatika
Fakultas Matematika Dan Ilmu Pengetahuan Alam
Universitas Syiah Kuala
Email : [email protected]
Abstrak -- Seiring berkembangnya teknologi, memaksa kemampuan kita dalam mengumpulkan dan
mengolah data. Penggunaan sistem komputerisasi dalam berbagai bidang akan menghasilkan data berukuran
yang sangat besar dan data-data yang telah terkumpul merupakan suatu aset yang digunakan sebagai informasi
terhadap pihak-pihak yang mengumpulkannya. Oleh karena itu
perlu adanya sistem yang bisa
mengklasifikasikan data tersebut. Teks mining merupakan metode klasifikasi yang merupakan variasi data
mining yang digunakan untuk menemukan pola yang menarik dari sekumpulan data tekstual yang sangat besar.
Sedangkan algoritma decision tree classifier merupakan algoritma yang mendukung untuk melakukan
klasifikasi dalam data mining. Dalam pembahasan penelitian ini menggunakan data peminjaman buku
perpustakaan Unsyiah dengan total data sebanyak 2299 banyak peminjam dari berbagai fakultas yang ada di
Unsyiah. Klasifikasi yang digunakan menggunakan aplikasi WEKA yang merupakan salah satu aplikasi atau
perangkat lunak data mining yang memiliki sekumpulan algoritma standar data mining berbasis interface yang
bisa dipakai oleh user secara langsung. Aplikasi weka ini menggunakan metode kalsifikasi data yang telah
disebutkan diatas. Hasil dari penelitian ini menghasilkan sebuah data dengan kategori fakultas yang meminjam
buku perpustakaan paling banyak.
Kata kunci : Klasifikasi, Teks Mining, Decision Tree Clasifier, Weka.
I. PENDAHULUAN
I.
Teks Mining adalah salah satu
teknik yang dapat digunakan
untuk klasifikasi[1]. Klasifikasi
dengan banyak data dapat juga
disebut dengan data mining.
Data
Mining
merupakan
metode pencarian informasi
(pengetahuan)
baru
yang
terkandung dalam data yang
sangat besar.
Ada banyak
metode yang ada dalam data
mining,
yaitu
prediksi,
klasifikasi,
cluster,
dan
asosiasi[2]. Dalam data mining
terdapat banyak metode yang
digunakan di dalamnya, salah
satunya adalah Decision Tree.
Decision Tree merupakan salah
satu metode klasifikasi yang
II.
digunakan
dan
memiliki
prediksi yang sangat kuat dan
terkenal dalam penerapannya di
datamining. Pada dasarnya
Decision tree mengubah data
menjadi pohon keputusan dan
aturan-aturan keputusan (rule)
[3]. Keuntungan dalam metode
ini adalah efektif dalam
menganalisa sejumlah besar
atribut dari data sehingga data
tersebut dapat mudah dipahami
oleh pengguna akhir[4].
Aplikasi yang digunakan untuk
mendukung implementasi data
mining dengan metode decision
tree ini adalah WEKA.WEKA
kependekan
dari
Wakaito
Environment for Knowledge
Analysis merupakan perangkat
lunak data mining yang
memiliki sekumpulan algoritma
standart data mining. Weka
dikembangkan di University of
Waikato, New Zealand dan
dikembangkan menggunakan
Java yang berbasis Interface.
Data yang disimpan dalam
Weka ini akan dibuat dalam
format ARFF yangmerupakan
standar bawaan dalam weka
dari data.
III.
Adapun
maksud
dari
penyusunan
laporan
ini
berdasarkan judul besar di atas
adalah untuk membangun dan
mengetahui
data
hasil
berdasarkan data yang telah di
dapat dan telah di klasifikasi
menjadi sebuah data yang
penting berupa informasi. Data
yang digunakan adalah data
Peminjaman
Buku
perpustakaan Unsyiah. Hasil
yang diharapakan dalam data
ini dengan klasifikasi yang
digunakan
adalah
dapat
mengetahui
fakultas
dari
mahasiswa yang meminjam
buku terbanyak untuk kampus
Unsyiah sendiri.
II. MODEL ANALISA DAN
IMPLEMENTASI
IV.
Penelitian ini menggunakan
metode decision tree yang
bertujuan untuk mendapatkan
hasil dari data yang diinginkan
berdasarkan
data
yang
diperoleh melalui tahapan
berikut:
a. Pengumpulan Data, berupa data set
yang terdiri dari nim, nama, mahasiswa,
tipe anggota, judul buku yang di
pinjam, tanggal peminjam, tanggal
pengembalian, Fakultas, Jurusan dan
Tahun Peminjaman sebanyak total data
2299 banyaknya nama mahasiswa yang
terdaftar di bagian sub pengelola
perpustakaan dalam hal peminjaman.
Data ini di acak dari 80ribu data total
peminjam yang terdata dan hanya
diambil sebanyak 2299 data.
b. Pengklasifikasian
menggunakan
perangkat lunak, seperti yang telah
dibahas, perangkat lunak
yang
digunakan adalah WEKA, dengan
menggunakan class Fakultas dan
classify menggunakan trees, dengan sub
J48
serta
menggunakan
Crossvalidation dengan nilai Folds 10.
V.
III.
HASIL DAN PEMBAHASAN
VI.
Berikut gambar dataset yang
telah di dapat:
VII.
VIII.
Selanjutnya di data tersebut kita
masukkan ke dalam weka. Berikut hasil
IX.
yang
didapat
:
XVI.
X.
XI.
Bagian
yang
dicentang
merupakan
bagian
untuk
klasifikasi yang akan kita,
tentunya menggunakan data
nominal. Selanjutnya adalah
melakukan klasifikasi dengan
classifier tree. Dengan nilai
awal Folds 10.
XVII.
XVIII.
XII.
XIX.
XX.
XIII.
XIV.
XV.
Hasil yang di dapat untuk nilai
folds 10 :
XXI.
IV. KESIMPULAN
XXII. Berdasarkan hasil data yang
telah di klasifikasi, didapat
bahwa
peminjam
buku
terbanyak berada di Fakultas
dengan kategori KIP sebanyak
893 dengan nilai akurasi atau
F-Measure
sebanyak 0.99.
hasil ini dikatakan sangat bagus
karena mendekati 1, selain itu
data yang di dapat merupakan
data yang benar-benar bagus,
dan tidak acak.
XXIII.
XXIV.
XXV. DAFTAR PUSTAKA
XXVI. [1].
Feldman, R & Sanger,
J. 2007. The Text Mining
Handbook : Advanced Approaches
in Analyzing Data. Cambridge
University Press : New York.
XXVII.
XXVIII.
[2].
Kusrini, Emha Taufiq
Luthfi, (2009),Algoritma Data
Mining,Yogyakarta : ANDI.
XXIX.
XXX. [3]. Tala, Fadillah Z. 2003. A
Study of Stemming Efects on
Information Retrieval in Bahasa
Indonesia.Institute for Logic,
Language
and
ComputationUniversiteit
van
Amsterdam.
XXXI.
XXXII. [4] Hermawan, Julius, 2005.
Membangun Decision Support
System.
Penerbit
Andi,
Yogyakarta
XXXIII.
Download