bab vii penutup

advertisement
BAB VII
PENUTUP
7.1
Kesimpulan
Berikut adalah beberapa kesimpulan yang diperoleh dari penelitian yang
dilakukan.
1.
Seluruh algoritma Naive Bayes dan metode incremental learning
menghasilkan peningkatan akurasi terhadap 250 data pengujian ketika
ditambahkan 15.000 data. Hal tersebut menunjukkan bahwa penambahan
corpus dapat meningkatkan akurasi.
2.
Algoritma BMNB selalu memberikan memberikan akurasi terbaik
terhadap 250 data pengujian dalam pengolahan 15.000 data stream pada
setiap metode incremental learning dan setiap nilai n.
3.
MBNB selalu menghasilkan waktu pemrosesan paling lama pada
percobaan yang dilakukan. Waktu pemrosesan algoritma MNB dan
BMNB tidak terlalu berbeda.
4.
Percobaan yang dilakukan menunjukkan bahwa penggunaan data stream
Twitter untuk memperbesar corpus pada proses opinion mining tweet
dapat meningkatkan akurasi.
5.
Metode
incremental
learning
terbaik
berdasarkan
percobaan
menggunakan 15.000 data stream dan pengujian dengan 250 data
pengujian adalah algoritma BMNB dengan full concept memory dengan
perbandingan akurasi dan n = 25.
6.
Pengujian incremental learning pada real-time data stream dari Twitter
selama satu jam menunjukkan peningkatan akurasi sebesar 10,4% yaitu
dari 64,4% menjadi 74,8%.
63
64
7.2
Saran
Berikut adalah beberapa saran untuk penelitian selanjutnya.
1.
Penelitian berikutnya dapat berfokus pada membandingkan proses
incremental learning untuk opinion mining pada tweet dalam proses
klasifikasi tweet ke kelas-kelas lain seperti emosi atau subjektivitas dari
tweet.
2.
Penelitian berikutnya dapat mencoba menggunakan algoritma lain untuk
proses klasifikasi dalam memproses data stream, dan juga menggunaka n
pustaka pengolah data stream lainnya untuk menghasilkan akurasi yang
lebih baik serta memproses dengan waktu lebih cepat.
3.
Penelitian berikutnya dapat berfokus pada metode pengolahan data
stream lainnya seperti melakukan metode incremental learning lainnya
(partial concept memory, no concept memory, atau menggunaka n
pendekatan instance) atau menambahkan pendeteksi concept drift dalam
pengolahan data stream.
4.
Penelitian berikutnya dapat berfokus dengan menggunakan pembanding
lain seperti menggunakan persentase tingkat kesalahan deteksi tiap kelas,
F1 score, ROC atau metode evaluasi lainnya. Pembuatan pembanding
lain juga dapat dilakukan dengan memahami bagaimana membuat data
pengujian yang baik.
5.
Penelitian berikut dapat berfokus pengolahan awal pada data serta atribut
data yang diterima seperti menggunakan fitur yang lebih banyak (ngram) atau menggunakan metode tertentu untuk menyaring data stream
yang akan digunakan (data yang kemungkinan dapat meningkat akurasi
atau tidak serta memilih data yang dapat menggantikan data-data yang
diperkirakan mengurangi akurasi).
Download