BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Sejak awal mula adanya peradaban, manusia sudah mulai berkomunikasi secara tertulis. Mulai dari gambar-gambar di goa hingga tulisan tercetak. Perkembangan teknologi memungkinkan suatu informasi ataupun dokumen tidak lagi berupa kumpulan tulisan yang tercetak (hard print) tetapi berupa data atau dokumen digital yang disimpan dalam media penyimpanan komputer (soft print). Komunikasi tertulis ini membuktikan keberadaan umat manusia. Penyimpanan suatu dokumen pasti mempunyai alasan tertentu. Dengan semakin banyaknya dokumen yang disimpan akan menimbulkan beberapa masalah, salah satunya adalah bagaimana cara mendapatkan dokumen dari sekian banyak dokumen yang memenuhi kebutuhan user akan informasi. Permasalahan ini tidak begitu merepotkan apabila jumlah dokumen yang ada hanya sedikit, tetapi apabila jumlah dokumennya puluhan atau mungkin ratusan tentu akan membutuhkan waktu yang tidak sedikit untuk mencarinya. Information Retrieval (IR) pada dasarnya adalah keadaan untuk menentukan dokumen mana dalam kumpulan dokumen yang harus diambil untuk memenuhi kebutuhan user akan informasi. Kebutuhan informasi user ditampilkan melalui query atau profile, dan mengandung satu atau lebih kata pencarian, ditambah mungkin beberapa informasi tambahan seperti bobot dokumen. Karena itu, keputusan pencarian dilakukan melalui membandingkan kata dari query dengan index kata (kata penting atau ungkapan) yang tampil dalam dokumen itu sendiri. Program yang nantinya akan dibuat adalah suatu program information retrieval yang mengimplementasikan metode Extended Boolean Retrieval p-norm Model dengan query inputan berupa query logic yang dihubungkan dengan operator boolean. Alasan untuk menerapkan extended boolean p-norm model ini adalah untuk mengatasi beberapa kelemahan yang terdapat pada boolean model dan juga karena model ini merupakan model statistikal atau probabilistic yang dianggap bisa memberikan kinerja yang baik 1 dalam proses penelusuran karena menerapkan sistem yang menggunakan operator AND dan OR. Daiharapkan bahwa Extended Boolean Retrieval p-Norm Model mampu mengatasi kekurangan dari metode boolean retrieval yang dianggap belum mencukupi kebutuhan user serta memberikan kinerja yang lebih baik pada sistem retrieval. 1.2 Perumusan Masalah Permasalahan yang menjadi titik berat di dalam melakukan penelitian ini adalah : 1. Bagaimana program melakukan proses indexing dokumen-dokumen teks yang diinputkan oleh user. 2. Bagaimana sistem dapat mengimplementasikan metode Extended Boolean Retrieval p-Norm model untuk memberikan rangking pada suatu dokumen teks berdasarkan tingkat kemiripan dokumen dengan query yang diinputkan oleh user. 3. Seberapa tinggi tingkat recal precision sistem terhadap pencarian dokumen teks yang sesuai dengan query atau kata kunci yang diinputkan. 1.3 Batasan Masalah Permasalahan yang akan dibahas di dalam penulisan tugas akhir ini dibatasi sebagai berikut : 1. Sistem yang nantinya akan dibuat oleh penulis berupa aplikasi desktop yang dijalankan pada lingkungan windows dan tidak dirancang untuk jaringan. 2. Disesuaikan dengan studi kasus yang ada. Dokumen yang diproses adalah dokumen teks yang sudah bersih atau plain text. 3. Pencarian dokumen berdasarkan keywords yang context-free, sehingga tidak tergantung konteks tertentu dalam bahasa tertentu. 4. Operator boolean yang digunakan dalam sistem ini untuk menghubungkan query adalah operator OR dan AND. 2 1.4 Tujuan Penelitian Penelitian tugas akhir ini bertujuan untuk mengaplikasikan metode Extended Boolean Retrieval p-Norm pada proses information retrieval terhadap pencarian dokumen teks berdasarkan keyword atau query tertentu. 1.5 Spesifikasi Kebutuhan Sistem • Kebutuhan Perangkat Lunak Sistem operasi dan software yang digunakan untuk pembuatan sistem adalah: 9 Microsoft Windows XP Professional Service Pack 2 9 Microsoft Office XP 2007 9 Microsoft Visual Studio 2008 Profesional Edition, dengan bahasa pemrograman Visual Basic .Net • Kebutuhan Perangkat Keras Sedangkan perangkat keras yang digunakan untuk pembuatan sistem ini adalah: 9 Processor Intel Pentium 2.66 GHz 9 RAM 512 MB 9 Hardisk 80 GB 9 Monitor, Keyboard, mouse, printer 1.6 Sistematika Penulisan Untuk memudahkan pembahasan masalah, skripsi ini menggunakan sistematika penulisan sebagai berikut: BAB 1 : Pendahuluan Pada bab ini, berisi tentang latar belakang masalah, perumusan masalah, batasan masalah, tujuan penulisan, spesifikasi sistem, metodologi penulisan, dan sistematika penulisan. BAB 2 : Tujuan Pustaka Pada bab ini, berisi tentang tinjauan pustaka dan dasar teori yang berupa teoriteori pendukung yang digunakan dalam penulisan tugas akhir ini. BAB 3 : Analisis dan Perancangan Sistem 3 Pada bab ini berisi tentang mengenai perancangan sistem yang akan dibuat baik perancangan input, proses, output, dan algoritma program penyelesaian masalah. BAB 4 : Implementasi Sistem Pada bab ini berisi tentang implementasi sistem yang meliputi implementasi tampilan, implementasi proses. Pada bab ini juga akan berisi kendala-kendala yang mungkin ada pada saat implementasi dan solusinya serta laporan-laporan yang dihasilkan. BAB 5 : Kesimpulan dan Saran Pada bab ini berisi tentang kesimpulan dari sistem yang dibuat serta saran-saran untuk pengembangan sistem lebih lanjut. 4