Uploaded by User52088

week 1 decision tree experiments

advertisement
Minggu #2 :
Supervised Learning menggunakan Decision Tree Classifier
Tujuan : Mempelajari bagaimana algoritma decision tree bekerja untuk melakukan
proses klasifikasi data
Percobaan (Experiments)
1. Jalankan Weka, lalu buka dataset : weather.nominal.arff , amati dataset yang
ada, dan jawablah pertanyaan-pertanyaan berikut ini :
a. Berapa jumlah fitur (features/attributes) dan jumlah sampel data
(instances) ?
b. Tulislah daftar fitur / atribut dataset tersebut beserta pilihan isinya.
c. Buatlah tabel dari weather.nominal.arff data
2. Jalankan algoritma ID3 menggunakan 10-fold cross validation, dan amati
hasilnya. Gambarkan pohon keputusan (decision tree) yang terbentuk
3. Amati confusion matrix yang dihasilkan. Informasi apa sajakah yang tersedia ?
Jelaskan apa yang dimaksud dengan :
a. TP rate, FP rate
b. Precision, Recall, F-measure
c. Amati hasil dari proses klasifikasi menggunakan ID3, dari semua sampel
data, berapakah data yang termasuk missclassified (salah prediksi) ? Dari
tabel yang anda buat nomer 1c, tandailah data yang missclassified
4. Bukalah dataset ‘weather.arff’ , jalankan sekali lagi algortima ID3.
a. Apakah perbedaan data weather.nominal.arff dan weather.arff ?
b. Pada saat anda menjalankan algoritma ID3, masalah apakah yang anda
hadapi ?
c. Menurut anda, apakah penyebab masalah tersebut ? Bagaimanakah anda
mengatasi masalah tersebut ?
d. Sekarang, cobalah algoritma J48 pada dataset weather.arff dan analisa
hasilnya. Berapakah data yang missclassified ? Gambarkan decision tree
yang dihasilkan.
5. Jalan algoritma J48 menggunakan dataset iris_training sebagai data training dan
iris_testing sebagai data testing, lalu amati hasilnya.
a. Percobaan pertama, jalankan J48 pada data training menggunakan 10fold cross validation dan catat hasilnya
b. Percobaan kedua, jalankan J48 menggunakan data training dan data
testing yang telah disediakan. Bandingkan hasilnya dengan percobaan 5a.
6. Ulangi percobaan nomer 2 dan nomer 5 menggunakan Weka Knowledge Flow
a. Buatlah Weka Knowledge seperti berikut ini :
b. Amati dan analisa hasilnya
7. Ulangi percobaan nomer 2 dan nomer 5 menggunakan Rapidminer
Tugas :
1.
2.
3.
4.
Apakah fungsi dari entropi pada algoritma decision tree ?
Tulislah rumus penghitungan entropi
Hitunglah nilai entropi dari semua atribut pada dataset weather.nominal.arff
Apakah hubungan antara nilai entropi suatu atribut dengan posisi node pada
decision tree yang dihasilkan ?
Laporan praktikum dikumpulkan via email paling lambat 6 hari setelah praktikum.
References :
• Data Mining Lab Manual, http://gyan.fragnel.ac.in/labmanual/
• Weka website, http://www.cs.waikato.ac.nz/ml/weka/
• Rapidminer website, https://rapidminer.com/
Download