Kerangka Materi UTS Bisnis Cerdas File

advertisement
Kerangka Materi UTS Bisnis Cerdas
Kelas A & B
Semester Gasal 2012 - 2013
Rabu, 14 November 2012
Data
1. Types of data
2. Similarity measures
Principles of Classification
1. Proses pembentukan model/classifier untuk klasifikasi secara otomatis berdasarkan data
2. Contoh-contoh algoritma yang bisa dipakai untuk membentuk classifier
Decision Tree
1. Prinsip kerja pembentukan decision tree
2. Hubungan greedy strategy dengan impurity measure
3. Impurity measures
o Classification error
o Gini Index
o Entropy
 Information gain
4. Penghitungan impurity pada suatu kumpulan objek data
5. Pre-pruning, post-pruning
6. Underfitting, overfitting
7. Penyebab overfitting
8. Advantages of DT
9. Jenis-jenis error (Hint: ada 2)
10. Bagaimana mengestimasi generalization error? (Hint: ada 3)
11. Occam’s Razor
12. Minimum Description Length
Evaluating Classifiers
13. Mengapa model yang dihasilkan perlu dievaluasi?
14. Metrik yang dipergunakan untuk mengukur performa model
o Akurasi
o Precision
o Recall
15. Kapan kita memakai akurasi dan kapan kita memakai precision dan recall?
16. Metoda yang dipergunakan untuk mengukur performa model
Rule-Based Classifier
1. Prinsip kerja rule-based classifier
2. Pengertian:
 Coverage dari suatu rule
 Accuracy dari suatu rule
3. Pengertian karakteristik dari rule-based classifier
 Mutually exclusive
 Exhaustive
4. Sifat rule-based classifier yang diturunkan dari Decision Tree dan efek dari penyederhanaan rule
5. Metode pembangunan rule-based classifier:
 Langsung (direct)  sequential covering
Contoh: RIPPER
 Tidak langsung (indirect)  melalui decision tree
Contoh: C4.5 rules
k-Nearest Neighbor
1.
2.
3.
4.
5.
Cara kerja instance-based classifier
Perbedaan prinsip kerja antara rote learner dengan k-Nearest Neighbor
Komponen-komponen yang dibutuhkan pada Nearest-Neighbor Classifier
Prinsip kerja Nearest Neighbor Classifier
Mengapa dilakukan pembobotan pada voting (pemungutan suara pada kelas terdekat) untuk kNearest Neighbor
 Bagaimana pembobotan itu dilakukan  (Hint: contohnya, berdasarkan jarak instance
tetangga pada objek yang ingin diklasifikasikan, bila dihitung dengan Euclidean Distance)
6. Pemilihan nilai k
7. Isu-isu pada nearest-neighbor classifier  mengapa terkadang perlu dilakukan penskalaan pada
nilai-nilai atribut data yang diperhitungkan
Naïve Bayes Classifier
1. Teorema Bayes
 Hubungan antara teorema bayes dengan kasus klasifikasi
 Apa yg dimaksud dengan hMAP
2. Prinsip kerja Naïve Bayes Classifier
 Apa yang dimaksud dengan independence assumption dan dampaknya pada
perhitungan probabilitas kondisional atribut-atribut pada data
3. Penghitungan hMAP pada contoh record / objek data dengan nilai-nilai atribut nominal
Download