Praktikum Data Mining - Informatika Unsyiah

advertisement
Materi II
Praktikum Data Mining
Program Studi Informatika / Matematika
FMIPA Universitas Syiah Kuala
Dosen Pengasuh
Dr. Taufik Fuadi Abidin, M.Tech
Dr. Muhammad Subianto, M.Si
{tfa,subianto}@informatika.unsyiah.ac.id
PENDAHULUAN
Praktikum ini berkaitan dengan penggunaan software data mining, Weka
(http://www.cs.waikato.ac.nz/ml/weka/), penulisan data dalam format arff, dan
pengklasifikasian menggunakan KNN. Tujuan dari praktikum ini adalah:
a. Meningkatkan pemahaman mahasiswa terhadap software Weka.
b. Mengetahui cara dan aturan pembentukan data dalam format arff.
c. Melatih mahasiswa menyelesaikan
menggunakan metode KNN.
masalah-masalah
klasifikasi
sederhana
PRAKTIKUM
1. Pelajari training set dari data segmentation yang disimpan dalam file segmentchallenge.arff dalam direktori data dimana software Weka diinstal, sebagai contoh:
/home/tfa/weka-3-6-8/data
Buka file tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan pelajari
bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas file
tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut:
@relation segment
@attribute region-centroid-col numeric
@attribute region-centroid-row numeric
@attribute region-pixel-count numeric
@attribute short-line-density-5 numeric
@attribute short-line-density-2 numeric
:
:
@attribute hue-mean numeric
@attribute class
{brickface,sky,foliage,cement,window,path,grass}
@data
Praktikum Data Mining
© Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si
1
Perhatikan pula bagian @data dan bagaimana data disusun dibawahnya. Diskusi dengan
teman dan pahami maksudnya.
2. Setelah anda memahami bagaimana data dalam format arff disusun, pelajari testing set
data segmentation yang disimpan dalam file segment-test.arff dalam direktori yang
sama. Lakukan proses klasifikasi menggunakan metode KNN untuk k=3, k=5, k=7, k=9
dan k=11. Lakukan analisa, untuk nilai k berapa metode KNN memberikan akurasi yang
paling tinggi?
Sebagai acuan, berikut snapshot dari Weka setelah file segment-test.arff dibuka.
Lakukan observasi dan lanjutkan proses klasifikasi (classify) menggunakan metode KNN
(dalam software Weka disebut sebagai metode lazy). Diskusi dengan asisten bila anda
mengalami kesulitan dalam memahami praktikum tentang klasifikasi menggunakan KNN
(lazy classifier) ini.
- - - Happy Mining - - -
Praktikum Data Mining
© Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si
2
Download