TEMU BALIK INFORMASI Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus Beserta Algoritmanya TI 14 A STMIK AMIKOM PURWOKERTO 2017 1. WISNU WIDHU (14.11.0050) 2. WILDAN ANUGERAH(14.11.0037) 3. YUSUF SUYANTO (14.11.0051) 4. RADIN RIO (14.11.0043) 5. FRENANDA FERDY (14.11.0067) 6. WILDAN ERWIN (14.11.0069) 7. NUR AFIATILLAH (14.11.0072) PEMBAHASAN Konsep dan Macam-Macam Thesaurus di TBI Beserta Algoritmanya KONSEP THESAURUS Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus katakata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya. 1. Menurut fungsinya. Thesaurus dalam daftar istilah untuk mengawasi kosa kata yang dipakai untuk menterjemahkan bahasa sehari-hari (bahasa alami) dari dokumen, pengindeks atau pemakai ke dalam bahasa sistem (bahasa dokumentasi, bahasa informasi). 2. Menurut strukturnya. Thesaurus adalah daftar kata-kata yang dinamis dan terkendali yang berhubungan satu sama lain secara semantik, dan secara umum mencakup bidang ilmu pengetahuan tertentu. CONTOH : World : earth, planet, globe, humankind, humanity, the human race, Call : name, describe, identify, entitle, label, term, dub, christen. Pembangunan thesaurus secara otomatis Menurut frakes dan yates (frakes, 1992) secara garis besar menentukan fase dalam pembangunan tesaurus secara otomatis yaitu : 1. Penyususan daftar kata • Normalisasi dan pemilihan term • Pembangunan frase sesuai level kordinasi yang diinginkan 2. Penghitungan tingkat kemiripan (similarity) • Mengidentifikasi hubungan antara term secara statistik 3. Pengoranisasian daftar kata • Mengorganisasikan kosa kata secara umum mnjadi susunan hiraki berdasarkan hubungan yang telah terkomputasi Proses thesaurus Proses tesaurus menurut schubert foo dapat dibagi menjadi dua yaitu sub fase pembentukan kamus dan fase pembangunan tesaurus. Fase pembentukan kamus kata Tujuan pembentukan kamus adalah membantu dalam mengektrak term yang spesifik. Langkah langkah yang dilakukan : • Term selection (pemilihan term) • Term filtering • Term specification/generalisation Fase pembentukan tesaurus • Menghitung frekuensi term dan frekuensi dokumen • Menghitung bobot term • Analissa asymmetric co-occurrence Bagian Thesaurus Thesaurus paling tidak terdiri atas dua bagian yaitu bagain hierarkis dan alpabetis. Kadangkala ada bagian berkelas. A. Menurut buku “Guidekine for the establishment and development monolingual thesauri (1981)” dikutip Lalu Anwar (2000) kedudukan suatu istilah dalam Hierarkhis ditentukan berdasarkan aturan sebagai berikut : 1. Hubungan generik (genus-species) merupakan hubungan antar istilah dimana makna istilah yang satu merupakan species atau jenis dari makna istilah yang lain. Contoh : istilah “Banjir” ditempatkan satu tingkat lebih spesifik daripada istilah “Bencana alam”, karena istilah “Banjir” adalah jenis dari “Bencana alam”. 2. Hubungan partitif (Whole-part relationship) merupakan hubungan antar istilah dimana istilah yang satu mewakili istilah yang lain dalam makna. Contoh : hubungan antara “rumah” dan “jendela”. B. Bagian alfabetis Bagian ini merupakan perubahan bentuk bagian hirarkhis tadi disusun kembali secara alpabetis serta diperlihatkan hubungannya dengan istilah lain berdasarkan tingakat kesepesifikkan makna, misalnya : 1. Hubungan suatu istilah dengan istilah lain yang satu tingkat lebih luas maknanya dinyatakan dengan BT (Broader Term), 2. Hubungan suatu istilah dengan yang satu tingkat lebih sempit maknanya dinyatakan dengan NT (Narrower Term). Algoritma Thesaurus Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming. Sumber : andy rofiek 2011 Algoritma Stemming Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan: 1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi : Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1 Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut : enum awalan_t {AwalanError=0,x, me, pe, be, di, se, ke, te, mem=100, men, per, pem, ber, ter, pen, ber_luluh, ter_luluh, per_luluh, mem_luluh, pem_luluh, men_luluh, pen_luluh, meny=200, peny, meng, meng_luluh, peng_luluh, peng }; enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun, nya, kah, xx}; struct arrkata_t { enum awalan_t p1,p2; char kd[30]; enum akhiran_t s3,s2,s1; }; 2. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut : a. Awalan I, hasilnya disimpan pada p1 b. Awalan II, hasilnya disimpan pada p2 c. Akhiran I, hasilnya disimpan pada s1 d. Akhiran II, hasilnya disimpan pada s2 e. Akhiran III, hasilnya disimpan pada s3 Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya. 3. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut : a. Kata Dasar b. Kata Dasar + Akhiran III c. Kata Dasar + Akhiran III + Akhiran II d. Kata Dasar + Akhiran III + Akhiran II + Akhiran I e. Awalan I + Awalan II + Kata Dasar f. Awalan I + Awalan II + Kata Dasar + Akhiran III g. Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II h. Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI i. Awalan II + Kata Dasar j. Awalan II + Kata Dasar + Akhiran III k. Awalan II + Kata Dasar + Akhiran III + Akhiran II 3 l. Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I referensi https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-saranatemu-kembali-informasi-untuk-meningkatkan-pelayanan-kepadapengguna-di-perpustakaan/