RELEVANSI HASIL PENCARIAN PADA MESIN PENCARI MENGGUNAKAN SEMANTIK WEB TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Akademik Studi Strata Satu (S1) Teknik Informatika Universitas Muhammadyah Malang Oleh: Alif Nur Cahyana 08560008 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013 LEMBAR PENGESAHAN RELEVANSI HASIL PENCARIAN PADA MESIN PENCARI MENGGUNAKAN SEMANTIK WEB TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata Satu Teknik Informatika Universitas Muhammadiyah Malang Disusun Oleh : ALIF NUR CAHYANA 08560008 Tugas Akhir ini telah diuji dan dinyatakan lulus oleh tim penguji pada tanggal 30 Januari 2013 Mengetahui/Menyetujui Penguji I Penguji II (Eko Budi Cahyono, S.Kom, MT) NIP. 108.9504.0330 (Aminudin, S.Kom) Mengetahui Ketua Jurusan Teknik Informatika (Eko Budi Cahyono, S.Kom, MT) NIP. 108.9504.0330 KATA PENGANTAR Alhamdulillahirabbilalamin, puji syukur kehadirat Allah SWT atas limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan dengan baik tugas akhir yang berjudul: “RELEVANSI HASIL PENCARIAN PADA MESIN PENCARI MENGGUNAKAN SEMANTIK WEB” Pada tugas akhir ini, dibahas mengenai pokok-pokok bahasan dalam perancangan mesin pencari yang menggunakan semantik web untuk pencarian istilah-istilah dalam mata kuliah di Teknik Informatika. Penggunaan teknologi semantik web dapat memahami makna dari sebuah kata dan konsep serta hubungan logis keduanya. Sehingga diharapkan hasil pencarian dari mesin pencari tersebut menjadi lebih relevan. Penulis menyadari bahwa tugas akhir ini masih jauh dari kesempurnaan. Oleh sebab itu penulis mengharapkan masukan berupa saran maupun kritik yang membangun untuk pengembangan dari tugas akhir ini kedepannya. Akhir kata penulis berharap semoga tugas akhir ini dapat bermanfaat dan menjadi tambahan ilmu pengetahuan. Tak lupa penulis mengucapkan terima kasih kepada semua pihak yang telah membantu hingga tugas akhir ini terselesaikan. Malang, 22 Januari 2013 Penulis DAFTAR ISI LEMBAR PERSETUJUAN .............................................................................. i LEMBAR PENGESAHAN ............................................................................... ii LEMBAR PERNYATAAN .............................................................................. iii ABSTRAKSI .................................................................................................... iv ABSTRACT ..................................................................................................... v LEMBAR PERSEMBAHAN ............................................................................ vi KATA PENGANTAR ................................................................................... vii DAFTAR ISI ................................................................................................. viii DAFTAR GAMBAR ..................................................................................... xi DAFTAR TABEL ......................................................................................... xiii BAB I PENDAHULUAN ................................................................................. 1 1.1 Latar Belakang .................................................................................... 1 1.2 Rumusan Masalah ............................................................................... 2 1.3 Tujuan Penelitian ................................................................................ 2 1.4 Batasan Masalah ................................................................................. 2 1.5 Metodologi .......................................................................................... 3 1.6 Sistematika Penulisan .......................................................................... 4 BAB II LANDASAN TEORI ........................................................................... 6 2.1 Relevansi ............................................................................................ 6 2.2 Mesin Pencari ..................................................................................... 6 2.2.1 Definisi Mesin Pencari ............................................................... 6 2.2.2 Arsitektur Mesin Pencari ............................................................ 7 2.3 Web Semantik ..................................................................................... 9 2.3.1 Definisi Web Semantik .............................................................. 9 2.3.2 Komponen Web Semantik .......................................................... 10 2.4 Ontologi .............................................................................................. 11 2.4.1 Definisi Ontologi ....................................................................... 11 2.4.2 Komponen Ontologi ................................................................... 12 2.5 Bahasa Ontologi .................................................................................. 13 2.5.1 XML dan XML Shema .............................................................. 14 2.5.1.1 Definisi XML ...................................................................... 14 2.5.1.2 Fungsi dan Tujuan XML ..................................................... 14 2.5.2 RDF ........................................................................................... 15 2.5.2.1 Definisi RDF ....................................................................... 15 2.5.2.2 Sintaksis XML dan RDF ..................................................... 17 2.5.3 OWL .......................................................................................... 18 2.5.3.1 Definisi OWL ...................................................................... 18 2.5.3.2 Rancangan OWL ................................................................. 20 2.5.3.3 Sintaksis OWL .................................................................... 21 2.6 SPARQL ............................................................................................. 22 2.7 Jena ..................................................................................................... 23 2.7.1 Definisi Jena .............................................................................. 23 2.7.2 Arsitektur Jena ........................................................................... 24 BAB III ANALISA DAN PERANCANGAN SISTEM ..................................... 27 3.1 Perancangan Alur Sistem ..................................................................... 27 3.2 Perancangan Kebutuhan Sistem ........................................................... 28 3.2.1 Use Case dan Skenario ............................................................... 28 3.2.2 Activity Diagram ....................................................................... 30 3.3 Perancangan Tahap Analisa ................................................................. 31 3.3.1 Class Diagram Level Analisis .................................................... 31 3.3.2 Sequence Diagram Level Analisis .............................................. 31 3.4 Perancangan Tahap Desain .................................................................. 32 3.4.1 Sequence Diagram Level Desain ................................................ 32 3.4.2 Deployment Diagram ................................................................. 33 3.4.3 Component Diagram .................................................................. 33 3.5 Perancangan Web Semantik ................................................................ 34 3.5.1 Perancangan Ontologi ................................................................ 34 3.5.2 Perancangan Class ...................................................................... 35 3.5.3 Pembuatan Dokumen RDF ......................................................... 36 3.6 Perancangan Ekseskusi Query ............................................................. 40 3.7 Perancangan Google Custom Search Engine ....................................... 42 3.8 Perancangan Antarmuka ...................................................................... 44 3.8.1 Perancangan Form Pencarian ..................................................... 44 3.8.2 Perancangan Hasil Pencarian ...................................................... 45 BAB IV IMPLEMENTASI DAN PENGUJIAN ............................................... 46 4.1 Implementasi Sistem ........................................................................... 46 4.1.1 Implementasi Mesin Pencari ...................................................... 46 4.1.2 Konfigurasi Google Custom Search Engine ................................ 48 4.1.3 Implementasi Library Jena ......................................................... 49 4.1.4 Implementasi Ontologi ............................................................... 51 4.2 Pengujian Sistem dan Analisa .............................................................. 57 4.2.1 Rancangan Pengujian ................................................................. 57 4.2.2 Pengujian Sistem ........................................................................ 58 4.2.2.1 Pengujian Nilai Precision .................................................... 58 4.2.2.2 Pengujian Jumlah Hasil Pencarian ....................................... 61 4.2.3 Analisa Pengujian ...................................................................... 65 4.2.3.1 Analisa Nilai Precision ........................................................ 65 4.2.3.2 Analisa Jumlah Hasil Pencarian ........................................... 66 4.2.4 Tampilan Antarmuka ................................................................. 67 BAB V KESIMPULAN DAN SARAN ............................................................. 68 5.1 Kesimpulan ......................................................................................... 69 5.2 Saran ................................................................................................... 70 DAFTAR PUSTAKA ....................................................................................... 71 LAMPIRAN DAFTAR GAMBAR Gambar 2.1 Semantic Web Layer, bersumber dari [7] ................................... 10 Gambar 2.2 Contoh dari Skema RDF, bersumber dari [15] ............................ 15 Gambar 2.3 Contoh RDF/XML ..................................................................... 17 Gambar 2.4 Arsitektur Jena, bersumber dari [18] ........................................... 25 Gambar 3.1 Diagram Alir Mesin Pencari ....................................................... 27 Gambar 3.2 Use Case Pengguna Mesin Pencari ............................................. 29 Gambar 3.3 Activity Diagram Pencarian ....................................................... 30 Gambar 3.4 Class Diagram Level Analisis Pencarian .................................... 31 Gambar 3.5 Sequence Diagram Level Analisis Pencarian ..............................32 Gambar 3.6 Sequence Diagram Level Desain Pencarian ................................ 32 Gambar 3.7 Deployment Diagram ................................................................. 33 Gambar 3.8 Component Diagram .................................................................. 34 Gambar 3.9 Ontologi Matakuliah Teknik Informatika ................................... 35 Gambar 3.10 Pembuatan Class dan Subclass pada Protégé .............................. 37 Gambar 3.11 Pembuatan Object Property pada Protégé ................................... 38 Gambar 3.12 Pembuatan Data Property pada Protégé ...................................... 39 Gambar 3.13 Penyimpanan Dokumen RDF pada Protégé ................................ 39 Gambar 3.14 Isi Dokumen RDF yang Dibuat Menggunakan Protégé ............... 40 Gambar 3.15 Pemotongan Kalimat Menjadi Perkata (Satu Kata) ..................... 41 Gambar 3.16 Pemotongan Kalimat Menjadi Perkata (Dua Kata) ..................... 41 Gambar 3.17 Konfigurasi Google Custom Search Engine ................................ 43 Gambar 3.18 Nomor Unik Mesin Pencari ........................................................ 43 Gambar 3.19 Function Onload ......................................................................... 44 Gambar 3.20 Perancangan Antarmuka Form Pencarian ................................... 44 Gambar 3.21 Perancangan Antarmuka Hasil Pencarian ................................... 45 Gambar 4.1 Halaman Index Mesin Pencari .................................................... 47 Gambar 4.2 Potongan Kode Google Custom Search Engine .......................... 48 Gambar 4.3 Tampilan Web Google Custom Search Engine ........................... 49 Gambar 4.4 Add JAR/Folder ......................................................................... 50 Gambar 4.5 Memilih Seluruh Library Jena .................................................... 50 Gambar 4.6 Library Jena Berhasil Ditambahkan ............................................ 51 Gambar 4.7 Potongan Kode Import Library Jena ........................................... 52 Gambar 4.8 Potongan Kode Membuka File RDF/OWL ................................. 52 Gambar 4.9 Potongan Kode Membaca File RDF/OWL ................................. 52 Gambar 4.10 Model Ontologi dalam Format RDF ........................................... 53 Gambar 4.11 Kode untuk Memotong Kalimat Menjadi Beberapa Kata ............ 53 Gambar 4.12 Implementasi Query SPARQL ................................................... 54 Gambar 4.13 Potongan Kode Penspesifikasian Kata Kunci ............................. 55 Gambar 4.14 Penspesifikasian Kata Kunci pada Mesin Pencari ....................... 56 Gambar 4.15 Query Expansion Kata Kunci pada Mesin Pencari ...................... 57 Gambar 4.16 Grafik Persentase Hasil Pengujian Mesin Pencari ....................... 66 Gambar 4.17 Tampilan Form Pencarian .......................................................... 67 Gambar 4.18 Tampilan Hasil Pencarian Biasa ................................................. 67 Gambar 4.19 Tampilan Hasil Pencarian Semantik dan Query Expansion ......... 68 DAFTAR TABEL Tabel 2.1 Property .......................................................................................... 16 Tabel 2.2 Classes ............................................................................................ 17 Tabel 3.1 Skenario Pencarian ......................................................................... 35 Tabel 3.2 Deskripsi Property dari Class Informatika ....................................... 36 Tabel 3.3 Deskripsi Property dari Class RPL .................................................. 36 Tabel 3.4 Deskripsi Property dari Class Jaringan ............................................ 36 Tabel 3.5 Deskripsi Property dari Class Desain .............................................. 36 Tabel 4.1 Hasil Pengujian Nilai Precision ....................................................... 59 Tabel 4.2 Hasil Pengujian Konsentrasi RPL ................................................... 61 Tabel 4.3 Hasil Pengujian Konsentrasi Jaringan Komputer ............................. 62 Tabel 4.4 Hasil Pengujian Konsentrasi Desain Grafis ..................................... 64 Tabel 4.5 Persentase Hasil Pencarian .............................................................. 66 DAFTAR PUSTAKA [1] Toba, Hapnes. 2005. Pencarian Cerdas dengan Penggunaan Semantic Web. Universitas Kristen Maranatha Bandung. Indonesia. [2] Dewi Agushinta R., Hanum Putri Permatasari, Soepono Soeparlan. 2005. Aplikasi Pencarian Karya Ilmiah Berbasis Web Semantik. Universitas Gunadarma. Indonesia. [3] Green, Rebecca. 1995. Topical relevance relationships I : Why topic matching fails. Journal of the American Society for Information Science, 46(9), 646-653. [4] Hadi, Umar. http://kuncimarketing.com/cara-kerja-search-engine-dan- komponen-komponen-yang-ada-padanya. Diakses pada tanggal 5 Agustus 2012. [5] Daniel O. Siahaan. 2006. Graphical Notations For Semantic Web Language. Institut Teknik Sepuluh November (ITS). Indonesia. [6] Amiril Muslimin, Waskitho Wibisono, Daniel O. Siahaan. 2006. Image Search Engine Using Semantic Web. Institut Teknik Sepuluh November (ITS). Indonesia. [7] W3C. http://www.w3.org/2007/03/layerCake.png. Diakses pada tanggal 5 Agustus 2012 [8] I Wayan Simri Wicaksana. 2006. Ontology: Bahasa dan Tools Protégé. Universitas Gunadarma. Indonesia. [9] V. Richard Benjamins and Assunción Gómez-Pérez. 2004. Knowledge System Technology: Ontologies and Problem-Solving Methods. University of Amsterdam. Netherlands. [10] T. Finin T. R. Gruber T. Senator R. Neches, R. E. Fikes and W. R. Swartout. Enabling Technology for Knowledge Sharing. 1991. AI Magazine. [11] T. Gruber. Towards Principles for the Design of Ontologies Used for Knowledge Sharing. Int. Journal of Human-Computer Studies, 43:907-928, 1995. [12] Willem Nico Borst. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. PhD thesis, University of Twente, Netherland, 5 September 1997. SIKS The Dutch Graduate School. [13] V. R. Benjamins R. Studer and D. Fensel. Knowledge Engineering, Principles and Methods., chapter Data and Knowledge Engineering, pages 25(1-2):161-197. 1998. [14] I Wayan Simri Wicaksana. Survei dan Evaluasi Metode Pengembangan Ontologi (Survey and Evaluation of Methodology of Ontology Development). In Proc. of KOMMIT 2004, Jakarta&Depok, 24 2004. University Gunadarma. [15] W3C. http://www.w3.org/TR/2002/WD-rdf-schema-20021112/. Diakses pada tanggal 5 Agustus 2012. [16] Karsanti, H. T., 2006, Penerapan Teknologi Semantic Web pada Sistem Menejemen Perpustakaan Digital. Universitas Gajah Mada. Yogyakarta. [17] Apache Jena. http://jena.apache.org/index.html. Diakses pada tanggal 28 Juli 2012. [18] Jeremy J. Carroll, Ian Dickinson, Chris Dollin, Dave Reynolds, Andy Seaborne, Kevin Wilkinson. 2003. Jena: Implementing the Semantic Web Recommendations. HP Laboratories Bristol. Inggris. [19] Qiu, Yonggang and Frei, HP. 1997. Concept Based Query Expansion. Swiss Federal Institute of Technology Zurich. Switzerland.