1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Sejak awal

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang Masalah
Sejak awal mula adanya peradaban, manusia sudah mulai berkomunikasi secara
tertulis. Mulai dari gambar-gambar di goa hingga tulisan tercetak. Perkembangan
teknologi memungkinkan suatu informasi ataupun dokumen tidak lagi berupa kumpulan
tulisan yang tercetak (hard print) tetapi berupa data atau dokumen digital yang disimpan
dalam media penyimpanan komputer (soft print). Komunikasi tertulis ini membuktikan
keberadaan umat manusia.
Penyimpanan suatu dokumen pasti mempunyai alasan tertentu. Dengan semakin
banyaknya dokumen yang disimpan akan menimbulkan beberapa masalah, salah satunya
adalah bagaimana cara mendapatkan dokumen dari sekian banyak dokumen yang
memenuhi kebutuhan user akan informasi. Permasalahan ini tidak begitu merepotkan
apabila jumlah dokumen yang ada hanya sedikit, tetapi apabila jumlah dokumennya
puluhan atau mungkin ratusan tentu akan membutuhkan waktu yang tidak sedikit untuk
mencarinya.
Information Retrieval (IR) pada dasarnya adalah keadaan untuk menentukan
dokumen mana dalam kumpulan dokumen yang harus diambil untuk memenuhi
kebutuhan user akan informasi. Kebutuhan informasi user ditampilkan melalui query
atau profile, dan mengandung satu atau lebih kata pencarian, ditambah mungkin beberapa
informasi tambahan seperti bobot dokumen. Karena itu, keputusan pencarian dilakukan
melalui membandingkan kata dari query dengan index kata (kata penting atau ungkapan)
yang tampil dalam dokumen itu sendiri.
Program yang nantinya akan dibuat adalah suatu program information retrieval
yang mengimplementasikan metode Extended Boolean Retrieval p-norm Model dengan
query inputan berupa query logic yang dihubungkan dengan operator boolean. Alasan
untuk menerapkan extended boolean p-norm model ini adalah untuk mengatasi beberapa
kelemahan yang terdapat pada boolean model dan juga karena model ini merupakan
model statistikal atau probabilistic yang dianggap bisa memberikan kinerja yang baik
1
dalam proses penelusuran karena menerapkan sistem yang menggunakan operator AND
dan OR.
Daiharapkan bahwa Extended Boolean Retrieval p-Norm Model mampu
mengatasi kekurangan dari metode boolean retrieval yang dianggap belum mencukupi
kebutuhan user serta memberikan kinerja yang lebih baik pada sistem retrieval.
1.2
Perumusan Masalah
Permasalahan yang menjadi titik berat di dalam melakukan penelitian ini adalah :
1. Bagaimana program melakukan proses indexing dokumen-dokumen teks yang
diinputkan oleh user.
2. Bagaimana sistem dapat mengimplementasikan metode Extended Boolean
Retrieval p-Norm model untuk memberikan rangking pada suatu dokumen
teks berdasarkan tingkat kemiripan dokumen dengan query yang diinputkan
oleh user.
3. Seberapa tinggi tingkat recal precision sistem terhadap pencarian dokumen
teks yang sesuai dengan query atau kata kunci yang diinputkan.
1.3
Batasan Masalah
Permasalahan yang akan dibahas di dalam penulisan tugas akhir ini dibatasi
sebagai berikut :
1. Sistem yang nantinya akan dibuat oleh penulis berupa aplikasi desktop yang
dijalankan pada lingkungan windows dan tidak dirancang untuk jaringan.
2. Disesuaikan dengan studi kasus yang ada. Dokumen yang diproses adalah
dokumen teks yang sudah bersih atau plain text.
3. Pencarian dokumen berdasarkan keywords yang context-free, sehingga tidak
tergantung konteks tertentu dalam bahasa tertentu.
4. Operator boolean yang digunakan dalam sistem ini untuk menghubungkan
query adalah operator OR dan AND.
2
1.4
Tujuan Penelitian
Penelitian tugas akhir ini bertujuan untuk mengaplikasikan metode Extended
Boolean Retrieval p-Norm pada proses information retrieval terhadap pencarian
dokumen teks berdasarkan keyword atau query tertentu.
1.5
Spesifikasi Kebutuhan Sistem
•
Kebutuhan Perangkat Lunak
Sistem operasi dan software yang digunakan untuk pembuatan sistem adalah:
9 Microsoft Windows XP Professional Service Pack 2
9 Microsoft Office XP 2007
9 Microsoft Visual Studio 2008 Profesional Edition, dengan bahasa
pemrograman Visual Basic .Net
•
Kebutuhan Perangkat Keras
Sedangkan perangkat keras yang digunakan untuk pembuatan sistem ini
adalah:
9 Processor Intel Pentium 2.66 GHz
9 RAM 512 MB
9 Hardisk 80 GB
9 Monitor, Keyboard, mouse, printer
1.6
Sistematika Penulisan
Untuk memudahkan pembahasan masalah, skripsi ini menggunakan sistematika
penulisan sebagai berikut:
BAB 1 : Pendahuluan
Pada bab ini, berisi tentang latar belakang masalah, perumusan masalah, batasan
masalah, tujuan penulisan, spesifikasi sistem, metodologi penulisan, dan
sistematika penulisan.
BAB 2 : Tujuan Pustaka
Pada bab ini, berisi tentang tinjauan pustaka dan dasar teori yang berupa teoriteori pendukung yang digunakan dalam penulisan tugas akhir ini.
BAB 3 : Analisis dan Perancangan Sistem
3
Pada bab ini berisi tentang mengenai perancangan sistem yang akan dibuat baik
perancangan input, proses, output, dan algoritma program penyelesaian
masalah.
BAB 4 : Implementasi Sistem
Pada bab ini berisi tentang implementasi sistem yang meliputi implementasi
tampilan, implementasi proses. Pada bab ini juga akan berisi kendala-kendala
yang mungkin ada pada saat implementasi dan solusinya serta laporan-laporan
yang dihasilkan.
BAB 5 : Kesimpulan dan Saran
Pada bab ini berisi tentang kesimpulan dari sistem yang dibuat serta saran-saran
untuk pengembangan sistem lebih lanjut.
4
Download