BAB VII PENUTUP 7.1 Kesimpulan Berikut adalah beberapa kesimpulan yang diperoleh dari penelitian yang dilakukan. 1. Seluruh algoritma Naive Bayes dan metode incremental learning menghasilkan peningkatan akurasi terhadap 250 data pengujian ketika ditambahkan 15.000 data. Hal tersebut menunjukkan bahwa penambahan corpus dapat meningkatkan akurasi. 2. Algoritma BMNB selalu memberikan memberikan akurasi terbaik terhadap 250 data pengujian dalam pengolahan 15.000 data stream pada setiap metode incremental learning dan setiap nilai n. 3. MBNB selalu menghasilkan waktu pemrosesan paling lama pada percobaan yang dilakukan. Waktu pemrosesan algoritma MNB dan BMNB tidak terlalu berbeda. 4. Percobaan yang dilakukan menunjukkan bahwa penggunaan data stream Twitter untuk memperbesar corpus pada proses opinion mining tweet dapat meningkatkan akurasi. 5. Metode incremental learning terbaik berdasarkan percobaan menggunakan 15.000 data stream dan pengujian dengan 250 data pengujian adalah algoritma BMNB dengan full concept memory dengan perbandingan akurasi dan n = 25. 6. Pengujian incremental learning pada real-time data stream dari Twitter selama satu jam menunjukkan peningkatan akurasi sebesar 10,4% yaitu dari 64,4% menjadi 74,8%. 63 64 7.2 Saran Berikut adalah beberapa saran untuk penelitian selanjutnya. 1. Penelitian berikutnya dapat berfokus pada membandingkan proses incremental learning untuk opinion mining pada tweet dalam proses klasifikasi tweet ke kelas-kelas lain seperti emosi atau subjektivitas dari tweet. 2. Penelitian berikutnya dapat mencoba menggunakan algoritma lain untuk proses klasifikasi dalam memproses data stream, dan juga menggunaka n pustaka pengolah data stream lainnya untuk menghasilkan akurasi yang lebih baik serta memproses dengan waktu lebih cepat. 3. Penelitian berikutnya dapat berfokus pada metode pengolahan data stream lainnya seperti melakukan metode incremental learning lainnya (partial concept memory, no concept memory, atau menggunaka n pendekatan instance) atau menambahkan pendeteksi concept drift dalam pengolahan data stream. 4. Penelitian berikutnya dapat berfokus dengan menggunakan pembanding lain seperti menggunakan persentase tingkat kesalahan deteksi tiap kelas, F1 score, ROC atau metode evaluasi lainnya. Pembuatan pembanding lain juga dapat dilakukan dengan memahami bagaimana membuat data pengujian yang baik. 5. Penelitian berikut dapat berfokus pengolahan awal pada data serta atribut data yang diterima seperti menggunakan fitur yang lebih banyak (ngram) atau menggunakan metode tertentu untuk menyaring data stream yang akan digunakan (data yang kemungkinan dapat meningkat akurasi atau tidak serta memilih data yang dapat menggantikan data-data yang diperkirakan mengurangi akurasi).