Minggu #2 : Supervised Learning menggunakan Decision Tree Classifier Tujuan : Mempelajari bagaimana algoritma decision tree bekerja untuk melakukan proses klasifikasi data Percobaan (Experiments) 1. Jalankan Weka, lalu buka dataset : weather.nominal.arff , amati dataset yang ada, dan jawablah pertanyaan-pertanyaan berikut ini : a. Berapa jumlah fitur (features/attributes) dan jumlah sampel data (instances) ? b. Tulislah daftar fitur / atribut dataset tersebut beserta pilihan isinya. c. Buatlah tabel dari weather.nominal.arff data 2. Jalankan algoritma ID3 menggunakan 10-fold cross validation, dan amati hasilnya. Gambarkan pohon keputusan (decision tree) yang terbentuk 3. Amati confusion matrix yang dihasilkan. Informasi apa sajakah yang tersedia ? Jelaskan apa yang dimaksud dengan : a. TP rate, FP rate b. Precision, Recall, F-measure c. Amati hasil dari proses klasifikasi menggunakan ID3, dari semua sampel data, berapakah data yang termasuk missclassified (salah prediksi) ? Dari tabel yang anda buat nomer 1c, tandailah data yang missclassified 4. Bukalah dataset ‘weather.arff’ , jalankan sekali lagi algortima ID3. a. Apakah perbedaan data weather.nominal.arff dan weather.arff ? b. Pada saat anda menjalankan algoritma ID3, masalah apakah yang anda hadapi ? c. Menurut anda, apakah penyebab masalah tersebut ? Bagaimanakah anda mengatasi masalah tersebut ? d. Sekarang, cobalah algoritma J48 pada dataset weather.arff dan analisa hasilnya. Berapakah data yang missclassified ? Gambarkan decision tree yang dihasilkan. 5. Jalan algoritma J48 menggunakan dataset iris_training sebagai data training dan iris_testing sebagai data testing, lalu amati hasilnya. a. Percobaan pertama, jalankan J48 pada data training menggunakan 10fold cross validation dan catat hasilnya b. Percobaan kedua, jalankan J48 menggunakan data training dan data testing yang telah disediakan. Bandingkan hasilnya dengan percobaan 5a. 6. Ulangi percobaan nomer 2 dan nomer 5 menggunakan Weka Knowledge Flow a. Buatlah Weka Knowledge seperti berikut ini : b. Amati dan analisa hasilnya 7. Ulangi percobaan nomer 2 dan nomer 5 menggunakan Rapidminer Tugas : 1. 2. 3. 4. Apakah fungsi dari entropi pada algoritma decision tree ? Tulislah rumus penghitungan entropi Hitunglah nilai entropi dari semua atribut pada dataset weather.nominal.arff Apakah hubungan antara nilai entropi suatu atribut dengan posisi node pada decision tree yang dihasilkan ? Laporan praktikum dikumpulkan via email paling lambat 6 hari setelah praktikum. References : • Data Mining Lab Manual, http://gyan.fragnel.ac.in/labmanual/ • Weka website, http://www.cs.waikato.ac.nz/ml/weka/ • Rapidminer website, https://rapidminer.com/