temu balik informasi

advertisement
TEMU BALIK INFORMASI
Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus
Beserta Algoritmanya
TI 14 A
STMIK AMIKOM PURWOKERTO 2017
1.
WISNU WIDHU
(14.11.0050)
2.
WILDAN ANUGERAH(14.11.0037)
3.
YUSUF SUYANTO
(14.11.0051)
4.
RADIN RIO
(14.11.0043)
5.
FRENANDA FERDY
(14.11.0067)
6.
WILDAN ERWIN
(14.11.0069)
7.
NUR AFIATILLAH
(14.11.0072)
PEMBAHASAN
Konsep dan Macam-Macam Thesaurus di
TBI Beserta Algoritmanya
KONSEP THESAURUS
 Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus katakata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan
sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus
dapat diartikan menurut fungsi dan strukturnya.
1. Menurut fungsinya.
Thesaurus dalam daftar istilah untuk mengawasi kosa kata yang dipakai untuk
menterjemahkan bahasa sehari-hari (bahasa alami) dari dokumen, pengindeks
atau pemakai ke dalam bahasa sistem (bahasa dokumentasi, bahasa
informasi).
2. Menurut strukturnya.
Thesaurus adalah daftar kata-kata yang dinamis dan terkendali yang
berhubungan satu sama lain secara semantik, dan secara umum mencakup
bidang ilmu pengetahuan tertentu.
 CONTOH :
World
: earth, planet, globe, humankind, humanity, the human race,
Call
: name, describe, identify, entitle, label, term, dub, christen.
Pembangunan thesaurus secara
otomatis
 Menurut frakes dan yates (frakes, 1992) secara garis besar menentukan
fase dalam pembangunan tesaurus secara otomatis yaitu :
1. Penyususan daftar kata
•
Normalisasi dan pemilihan term
•
Pembangunan frase sesuai level kordinasi yang diinginkan
2. Penghitungan tingkat kemiripan (similarity)
•
Mengidentifikasi hubungan antara term secara statistik
3. Pengoranisasian daftar kata
•
Mengorganisasikan kosa kata secara umum mnjadi susunan hiraki
berdasarkan hubungan yang telah terkomputasi
Proses thesaurus
Proses tesaurus menurut schubert foo dapat dibagi menjadi dua yaitu sub fase
pembentukan kamus dan fase pembangunan tesaurus.
 Fase pembentukan kamus kata
Tujuan pembentukan kamus adalah membantu dalam mengektrak term yang
spesifik. Langkah langkah yang dilakukan :
•
Term selection (pemilihan term)
•
Term filtering
•
Term specification/generalisation
 Fase pembentukan tesaurus
•
Menghitung frekuensi term dan frekuensi dokumen
•
Menghitung bobot term
•
Analissa asymmetric co-occurrence
Bagian Thesaurus
 Thesaurus paling tidak terdiri atas dua bagian yaitu bagain hierarkis dan
alpabetis. Kadangkala ada bagian berkelas.
A. Menurut buku “Guidekine for the establishment and development
monolingual thesauri (1981)” dikutip Lalu Anwar (2000) kedudukan suatu istilah
dalam Hierarkhis ditentukan berdasarkan aturan sebagai berikut :
1. Hubungan generik (genus-species) merupakan hubungan antar istilah
dimana makna istilah yang satu merupakan species atau jenis dari makna
istilah yang lain. Contoh : istilah “Banjir” ditempatkan satu tingkat lebih spesifik
daripada istilah “Bencana alam”, karena istilah “Banjir” adalah jenis dari
“Bencana
alam”.
2. Hubungan partitif (Whole-part relationship) merupakan hubungan antar
istilah dimana istilah yang satu mewakili istilah yang lain dalam makna.
Contoh : hubungan antara “rumah” dan “jendela”.
B. Bagian alfabetis
Bagian ini merupakan perubahan bentuk bagian hirarkhis tadi disusun kembali
secara alpabetis serta diperlihatkan hubungannya dengan istilah lain
berdasarkan tingakat kesepesifikkan makna, misalnya :
 1. Hubungan suatu istilah dengan istilah lain yang satu tingkat lebih luas
maknanya dinyatakan dengan BT (Broader Term),
 2. Hubungan suatu istilah dengan yang satu tingkat lebih sempit maknanya
dinyatakan dengan NT (Narrower Term).
 Algoritma Thesaurus
Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini
menggunakan algoritma tertentu dan algoritma yang digunakann adalah
algoritma stemming.
Sumber : andy rofiek 2011
Algoritma Stemming
Algoritma ini didahului dengan pembacaan tiap kata dari file sampel.
Sehingga input dari algoritma ini adalah sebuah kata yang kemudian
dilakukan:
1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata
diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga
bentuknya menjadi :
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan
yangkosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya
maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut :
enum awalan_t {AwalanError=0,x,
me, pe, be, di, se, ke, te,
mem=100, men, per, pem, ber, ter,
pen,
ber_luluh, ter_luluh, per_luluh,
mem_luluh, pem_luluh, men_luluh,
pen_luluh, meny=200, peny, meng,
meng_luluh, peng_luluh, peng
};
enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun, nya, kah, xx};
struct arrkata_t {
enum awalan_t p1,p2;
char kd[30];
enum akhiran_t s3,s2,s1;
};
2. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana
saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
a. Awalan I, hasilnya disimpan pada p1
b. Awalan II, hasilnya disimpan pada p2
c. Akhiran I, hasilnya disimpan pada s1
d. Akhiran II, hasilnya disimpan pada s2
e. Akhiran III, hasilnya disimpan pada s3
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus
apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau
pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu
melanjutkan proses pemotongan imbuhan lainnya.
3. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di
kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan
dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut :
a. Kata Dasar
b. Kata Dasar + Akhiran III
c. Kata Dasar + Akhiran III + Akhiran II
d. Kata Dasar + Akhiran III + Akhiran II + Akhiran I
e. Awalan I + Awalan II + Kata Dasar
f. Awalan I + Awalan II + Kata Dasar + Akhiran III
g. Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
h. Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
i. Awalan II + Kata Dasar
j. Awalan II + Kata Dasar + Akhiran III
k. Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
l. Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
referensi
 https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-saranatemu-kembali-informasi-untuk-meningkatkan-pelayanan-kepadapengguna-di-perpustakaan/
Download