bab i pendahuluan

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang dan Permasalahan
Perkembangan volume dan keragaman informasi yang tersedia di internet
saat ini sangat pesat sehingga mendorong tumbuhnya media pemberitaan online.
Media pemberitaan online (situs berita) sudah menjadi media utama untuk
menyampaikan informasi atau berita dari kebanyakan instansi. Berita online sudah
menjadi kebutuhan bagi user internet untuk mengetahui kabar terkini dan teraktual.
Di Indonesia terdapat berbagai situs berita yang berisi beragam berita yang
diterbitkan setiap waktu. Hal ini berdampak pada ketersedian berita yang jumlahnya
melimpah.
Banyaknya berita yang tersedia membuat pembaca sulit untuk mendapatkan
informasi yang cepat dan relevan dengan kebutuhan user. User membutuhkan
waktu yang lama apabila menemukan artikel berita yang terkait dengan membaca
satu per satu judul setiap berita. Kemiripan berita juga tidak bisa hanya dinilai dari
judulnya saja. Tantangan penyedia media online saat ini adalah memberikan
layanan yang terbaik, salah satunya membantu user untuk menemukan berita yang
mereka sukai. Suatu sistem rekomendasi dengan penyaringan otomatis diperlukan
untuk menanggulangi masalah tersebut.
Sistem rekomendasi merupakan sistem yang bertujuan untuk menghasilkan
rekomendasi untuk user terkait pemilihan suatu item yang mungkin menarik bagi
mereka. Sistem rekomendasi memiliki cara yang berbeda dalam menganalisis
sumber data untuk menemukan prediksi berdasarkan hubungan antara user dan item
yang digunakan untuk mengidentifikasi kecocokan antara keduanya (Melville, P.
dan Sindhwani, V., 2012). Menurut Ricci et all (2011), terdapat enam pendekatan
berbeda untuk teknik dalam sistem rekomendasi, yaitu content-based, collaborative
filtering,
demographic,
knowledge-based,
community-based,
dan
hybrid
recommender systems. Sistem rekomendasi memiliki tiga strategi yang umum
digunakan dalam menghasilkan rekomendasi yaitu Content-Based Filtering (CBF)
berdasarkan kemiripan konten, Collaborative Filtering (CF) berdasarkan transaksi
2
user lainnya yang memiliki kemiripan catatan transaksi dengan user, dan Hybrid
Filtering (HF) yang merupakan gabungan dari kedua strategi sebelumnya.
Penelitian tentang sistem rekomendasi sebelumnya dilakukan dengan cara
sistem akan memberikan rekomendasi kepada user dengan mengakses riwayat
penjelajahan dan profil user lalu menggunakan information filtering serta
information
collaboration
untuk
diimplementasikan
pada
google
news.
Rekomendasi berita secara personal hanya bisa diberikan kepada member user dan
memiliki riwayat penjelajahan yang (lebih dari 1 bulan) di google news. Pembaca
baru yang selanjutnya disebut user anonim tidak bisa diberikan rekomendasi secara
personal sesuai dengan berita yang diminatinya. Rekomendasi diberikan
berdasarkan information collaboration yang artinya rekomendasi berita diberikan
berdasarkan berita–berita yang disukai oleh user lain (Liu, et al. 2010).
Sistem rekomendasi berbasis konten merupakan penggabungan dari
beberapa topik ilmu komputer, terutama Sistem Temu Balik Informasi (Information
Retrieval) dan Kecerdasan Buatan (Artificial Intellegince). Berdasarkan perspektif
Sistem Temu Balik Informasi meneliti tentang teknologi rekomendasi yang
melibatkan proses pencarian informasi. Berdasarkan perspektif kecerdasan buatan
meneliti tentang model inferensi yang akan digunakan dalam pengambilan
keputusan untuk item yang direkomendasikan (Lops dkk, 2011).
Keuntungan utama dari sistem rekomendasi berbasis konten adalah
memungkinkan membangun sistem rekomendasi yang sesuai dengan materi yang
diinginkan user atau setiap konten yang sesuai, baik dari bahasa, topik atau apapun
itu. Sebaliknya, sistem rekomendasi kolaboratif membutuhkan komunitas user
yang besar, karena rekomendasinya berdasar pada bagaimana user yang sama telah
menilai suatu item. Masalah lain untuk rekomendasi berita dengan penyaringan
kolaboratif selain memerlukan banyak user, item harus telah dinilai oleh setidaknya
beberapa user, dan dalam kasus situs berita, item baru yang mungkin paling sesuai
belum tentu sudah dinilai, dan item lama menjadi yang paling memungkinkan untuk
direkomendasikan karena telah dinilai sebelumnya.
Pada penelitian ini akan dikembangkan sistem rekomendasi berita berbasis
konten, dimana item yang direkomendasikan kepada user berdasarkan konten berita
3
yang sedang dibaca user. Penelitian ini dilakukan pada user anonim, yaitu user
yang tidak memiliki profil user dan riwayat akses berita sehingga dalam penentuan
rekomendasi berita berdasarkan kesamaan setiap artikel berita dengan berita yang
sedang dibaca oleh user dapat dijadikan solusi untuk memberikan rekomendasi
secara personal.
Kecerdasan buatan memiliki beragam cara yang dapat digunakan untuk
pengambilan keputusan, salah satunya adalah dengan menggunakan sistem
inferensi fuzzy. Penelitian ini menggunakan aturan fuzzy dalam menentukan item
mana yang cocok direkomendasikan kepada user. Teori himpunan fuzzy merupakan
kerangka matematis yang digunakan untuk merepresentasikan ketidakpastian,
ketidakjelasan, ketidaktepatan, kekurangan informasi, dan kebenaran parsial.
Pengambilan keputusan merupakan bagian penting dalam seluruh sistem. Sistem
inferensi fuzzy merumuskan aturan yang sesuai dan berdasarkan aturan keputusan
logika fuzzy yang telah dibuat (Sivanandam dkk, 2007).
Sistem inferensi fuzzy ini akan diimplementasikan untuk menemukan berita
yang relevan dengan berita yang sedang dibaca user. Penggunaan logika fuzzy ini
digunakan untuk memudahkan pengambilan keputusan apakah suatu artikel layak
direkomendasikan atau tidak, hal ini disebabkan dokumen yang berupa teks tidak
mudah diterjemahkan ke dalam nilai absolut 0 atau 1. Keterkaitan antar dokumen
berita tidak bisa dinilai secara mutlak. Oleh karen itu, logika fuzzy akan diterapkan
pada sistem ini dengan menggunakan beberapa atribut dari dokumen berita
sehingga dapat digunakan untuk menjelaskan apakah dokumen ini layak
direkomendasikan atau tidak.
Penerapan sistem inferensi fuzzy pada sistem rekomendasi diharapkan dapat
membantu user dalam melakukan penyaringan otomatis untuk mendapatkan berita
yang relevan berdasarkan konten berita yang sedang dibaca user. Sistem akan
memeriksa keterkaitan antar dokumen berita dengan memeriksa atribut setiap berita
untuk mengetahui berita mana yang relevan dan akan direkomendasikan. Sistem ini
nantinya diharapkan dapat dimanfaatkan dengan baik oleh pengembang situs berita
online.
4
1.2
Perumusan Masalah
Berdasarkan permasalahan yang telah dipaparkan pada latar belakang,
penelitian akan dititik beratkan pada bagaimana mengimplementasikan sistem
rekomendasi berita berbasis konten dengan menggunakan sistem inferensi fuzzy
untuk mendapatkan output berita yang relevan berdasarkan konten berita yang
sedang dibaca oleh user.
1.3
Batasan Masalah
Adapun batasan masalah dalam penelitian ini agar lebih mudah dipahami
dan tidak terlalu luas dalam penulisannya sebagai berikut:
a. Sistem rekomendasi yang dikembangkan hanya
menggunakan
pendekatan berbasis konten (content-based) dan tidak menggunakan
pendekatan berbasis collaborative-filtering.
b. Sistem tidak memperhatikan history dari url yang dikunjungi user
sebelumnya atau banyaknya user yang mengunjungi url berita tersebut.
c. Sistem rekomendasi yang dikembangkan berfokus pada konten berita.
d. Data berita yang digunakan adalah data berita dari 6 situs berita yang
paling
sering
diakses
di
Indonesia
berdasarkan
data
dari
www.similarweb.com pada bulan Maret 2016, yaitu

detik.com (peringkat Indonesia 9)

Liputan6.com (peringkat Indonesia 21)

kompas.com (peringkat Indonesia 23)

Viva.co.id (peringkat Indonesia 29)

merdeka.com (peringkat Indonesia 30)

Tribunnews.com (peringkat Indonesia 34)
e. Sistem rekomendasi menggunakan bahasa pemrograman php dengan
framework laravel dan database yang digunakan dalam sistem adalah
PostgreSQL.
f. Sistem yang dikembangkan hanya pada tahap purwarupa atau prototype.
g. Sistem menggunakan pembobotan kata TF-IDF (Term FrequencyInverse Document Frequency).
5
h. Algoritma similarity yang digunakan adalah algoritma cosine similarity.
Sistem menghitung similaritas dari judul berita, lead (teras berita) dan
konten setiap berita.
i. Sistem rekomendasi berita menggunakan aturan sistem inferensi fuzzy
mamdani.
j. Penelitian menggunakan data berita yang sudah ada dan tidak berfokus
pada pengambilan atau crawling data berita.
k. Penelitian tidak berfokus pada sinonim kata, polisemi kata dan konteks
kalimat (context-free).
l. Tingkat relevansi hasil rekomendasi dari sistem akan diuji dengan
pengujian kepada user.
1.4
Tujuan Penelitian
Tujuan dari penelitian ini adalah mengimplementasikan sistem rekomendasi
berita berbasis konten dengan menggunakan sistem inferensi fuzzy untuk
menentukan output berita yang sesuai berdasarkan kesesuaian konten berita yang
relevan dengan berita yang sedang dibaca oleh user.
Setiap artikel berita akan melalui proses preprocessing data, kemudian akan
dilakukan proses pembobotan kata TF-IDF. Hasil bobot kata akan digunakan untuk
menentukan nilai similaritas antar berita menggunakan algoritma cosine similarity,
yang akan menghitung nilai kesamaan antara judul, lead dan konten setiap berita.
Sistem ini menggunakan aturan sistem inferensi fuzzy mamdani untuk
menghasilkan berita yang akan direkomendasi agar dapat menghasilkan output
yang sesuai dengan keinginan user. Penelitian ini akan menguji seberapa akurat dan
relevan output berita yang diberikan sistem kepada user.
1.5
Manfaat Penelitian
Manfaat dari penelitian ini sebagai berikut
a. Membuka wawasan topik penelitian baru yaitu sistem rekomendasi
berbasis konten untuk berita berbahasa Indonesia
6
b. Mengimplementasikan
sistem
rekomendasi
berbasis
konten
menggunakan sistem inferensi fuzzy dan berbasis php
c. Memberikan referensi bagi pengembang situs berita dalam menentukan
kelebihan dan kekurangan dalam menggunakan sistem rekomendasi
berbasis konten menggunakan sistem inferensi fuzzy tersebut.
1.6
Sistematika Penulisan
Sistematika dalam penulisan tugas akhir ini terdiri dari tujuh bab, yaitu:
BAB I PENDAHULUAN
Berisi mengenai latar belakang penelitian, rumusan masalah,
batasan masalah, tujuan penelitian, manfaat penelitian, metode
penelitian dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Bab ini memuat pembahasan mengenai penelitian terdahulu yang
digunakan sebagai bahan referensi dalam penulisan penelitian ini
dan penjelasan yang membedakan penelitian ini dengan penelitian
sejenis yang pernah ada sebelumnya.
BAB III LANDASAN TEORI
Bab ini berisi teori-teori yang menjadi landasan dalam penulisan
penelitian ini yaitu mengenai sistem temu balik informasi, sistem
rekomendasi, sistem rekomendasi berbasis konten, struktur berita,
preprocessing teks, pembobotan kata TF-IDF, algoritma cosine
similarity, logika fuzzy, sistem inferensi fuzzy mamdani, dan
evaluasi sistem rekomendasi
BAB IV ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi analisis terhadap sistem yang akan dikembangkan,
serta penjelasan mengenai perancangan sistem berdasarkan hasil
analisis yang telah dilakukan.
7
BAB V IMPLEMENTASI SISTEM
Bab ini akan menjelaskan hasil implementasi dari sistem yang telah
dibangun
berdasarkan
perancangan
yang
telah
dilakukan
sebelumnya.
BAB VI HASIL PENGUJIAN DAN PEMBAHASAN
Bab ini akan menjelaskan hasil yang diperoleh setelah sistem selesai
diimplementasikan dan pembahasan hasil pengujian dan analisis
sistem tersebut.
BAB VII KESIMPULAN DAN SARAN
Bab ini berisi mengenai kesimpulan dari penelitian yang telah
dilakukan dan saran untuk pengembangan penelitian selanjutnya.
8
Download