iii ABSTRAK Sebagian besar konten yang terdapat pada web

advertisement
ABSTRAK
Sebagian besar konten yang terdapat pada web bersifat subjektif atau
merefleksikan opini dari orang yang menulis. Dengan pesatnya perkembangan
web. Semakin banyak orang menuliskan opini mereka tentang produk atau jasa.
Hal ini dimanfaatkan sebagai acuan customers untuk mengetahui pendapat orang
lain tentang produk atau jasa yang akan digunakan. Sebaliknya bagi produsen
dapat digunakan sebagai media pelacak tentang kepuasan pelanggan. Salah satu
hal yang penting dalam sebuah review adalah opini yang terkandung didalamnya.
Opini yang terkandung dalam review bisa berupa opini positif atau opini negatif.
Riset ini bertujuan untuk melakukan pengklasifikasian terhadap sentiment postif
dan negatif dari review film berbahasa Inggris serta mencari akurasi dari metode
yang digunakan yaitu K-Nearest Neighbor yang akan dibandingkan dengan
Metode Naive Bayes. Penelitian ini dibatasi oleh nilai k pada k-nearest neighbor
yang digunakan adalah 1, 3, 5, 7, 9, 11, 13, 15, serta data yang digunakan adalah
large movie review dataset v 1.0 dengan jumlah data 700 dokumen. Hasil dari
penelitian ini adalah metode naive bayes lebih baik dari pada metode k-nearest
neighbor dimana nilai akurasi tertinggi yang dihasilkan oleh metode naive bayes
adalah 81% sedangkan akurasi tertinggi yang didapat k-nearest neighbor adalah
71%.
Kata Kunci : sentiment, naive bayes, k-nearest neighbor, akurasi, review
iii
ABSTRACT
Most of the content on the web are subjective or reflect the opinion of the person
who wrote. With the rapid development of the web more people write their opinion about
a product or service, it is used as a reference for the customer to know what others think
about a product or service that will be used. Othewise, to the producers can be used as
tracers on customer satisfaction. One of the things that are important in a review is the
opinion, opinions contained in the review can be positive opinion or a negative opinion.
This research aims at classifying the positive and negative sentiment of the movie reviews
and look for the accuracy of K-Nearest Neighbor which will be compared with the Naive
Bayes . This study is limited by the value of k in the k-nearest neighbor used were 1, 3, 5,
7, 9, 11, 13, 15, and the data used is large movie review dataset v 1.0 with the amount of
data is 700 documents. The results of this study are naive bayes method is better than the
k-nearest neighbor method where the value of the highest accuracy produced by Naive
Bayes method is 81% while the highest accuracy obtained k-nearest neighbor is 71%.
Keyword : sentiment, naive bayes, k-nearest neighbor, accuracy, review
iv
Download