Kerangka Materi UTS Bisnis Cerdas Kelas A & B Semester Gasal 2012 - 2013 Rabu, 14 November 2012 Data 1. Types of data 2. Similarity measures Principles of Classification 1. Proses pembentukan model/classifier untuk klasifikasi secara otomatis berdasarkan data 2. Contoh-contoh algoritma yang bisa dipakai untuk membentuk classifier Decision Tree 1. Prinsip kerja pembentukan decision tree 2. Hubungan greedy strategy dengan impurity measure 3. Impurity measures o Classification error o Gini Index o Entropy Information gain 4. Penghitungan impurity pada suatu kumpulan objek data 5. Pre-pruning, post-pruning 6. Underfitting, overfitting 7. Penyebab overfitting 8. Advantages of DT 9. Jenis-jenis error (Hint: ada 2) 10. Bagaimana mengestimasi generalization error? (Hint: ada 3) 11. Occam’s Razor 12. Minimum Description Length Evaluating Classifiers 13. Mengapa model yang dihasilkan perlu dievaluasi? 14. Metrik yang dipergunakan untuk mengukur performa model o Akurasi o Precision o Recall 15. Kapan kita memakai akurasi dan kapan kita memakai precision dan recall? 16. Metoda yang dipergunakan untuk mengukur performa model Rule-Based Classifier 1. Prinsip kerja rule-based classifier 2. Pengertian: Coverage dari suatu rule Accuracy dari suatu rule 3. Pengertian karakteristik dari rule-based classifier Mutually exclusive Exhaustive 4. Sifat rule-based classifier yang diturunkan dari Decision Tree dan efek dari penyederhanaan rule 5. Metode pembangunan rule-based classifier: Langsung (direct) sequential covering Contoh: RIPPER Tidak langsung (indirect) melalui decision tree Contoh: C4.5 rules k-Nearest Neighbor 1. 2. 3. 4. 5. Cara kerja instance-based classifier Perbedaan prinsip kerja antara rote learner dengan k-Nearest Neighbor Komponen-komponen yang dibutuhkan pada Nearest-Neighbor Classifier Prinsip kerja Nearest Neighbor Classifier Mengapa dilakukan pembobotan pada voting (pemungutan suara pada kelas terdekat) untuk kNearest Neighbor Bagaimana pembobotan itu dilakukan (Hint: contohnya, berdasarkan jarak instance tetangga pada objek yang ingin diklasifikasikan, bila dihitung dengan Euclidean Distance) 6. Pemilihan nilai k 7. Isu-isu pada nearest-neighbor classifier mengapa terkadang perlu dilakukan penskalaan pada nilai-nilai atribut data yang diperhitungkan Naïve Bayes Classifier 1. Teorema Bayes Hubungan antara teorema bayes dengan kasus klasifikasi Apa yg dimaksud dengan hMAP 2. Prinsip kerja Naïve Bayes Classifier Apa yang dimaksud dengan independence assumption dan dampaknya pada perhitungan probabilitas kondisional atribut-atribut pada data 3. Penghitungan hMAP pada contoh record / objek data dengan nilai-nilai atribut nominal