thesaurus - Hirup Motekar

advertisement
Pertemuan 8 : Thesaurus
Anggota Kelompok :
1.
Kurniawan Novi Pambudi
14.11.0161
2.
Hijriah Fajar Muhammad Insan
14.11.0162
3.
Raditya Tri Wibowo
14.11.0164
4.
Mei Susanto
14.11.0165
5.
Anggrean Yudistira
14.11.0167
6.
Fanny Tri Pamungkas
7.
Agus Harianto
14.11.0168
14.11.0169
Pengertian Thesaurus
 Istilah TESAURUS berasal dari bahasa Inggris THESAURUS yang bermula dari bahasa
Yunani THESAUROS, artinya harta benda, kekayaan atau gudang. Istilah tesaurus pertama
kali digunakan oleh Brunetto Latini (tahun 1220-1294). Pada abad 16 istilah tesaurus
muncul dalam kamus bahasa Latin dan Yunani, yang diterbitkan oleh ahli bahasa,
Estiennes, dari Perancis.
 Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus
sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu
atau suatu kelompok konsep, seperti kamus sinonim.
Pengertian Thesaurus
 Dalam buku “Guidelines for the Establisment and Develoment of Multilingualual Thesauri”
dikutip Lalu Anwar (2000) pengertian thesaurus adalah sekelompok istilah yang dipilih dari
bahasa sehari-hari, dan merupakan kosa kata dari bahasa indeks yang terkendali.
Disusun sedemikian rupa sehingga hubungan formal antara istilah yang lebih luas
(broader terms) dengan istilah yag khusus (narrower terms) dibuat dengan jelas.
 Berdasarkan pengertian diatas, thesaurus merupakan himpunan kata-kata terkendali
yang berhubungan satu sama lain secara semantik dan hierarkis, yang dapat
dipergunakan untuk menterjemahkan bahasa sehari-hari ke dalam bahasa indeks dalam
bidang ilmu pengetahuan tertentu.Thesaurus dipergunakan secara luas untuk
mengendalikan kosa kata (vocabulary control) dalam sistem terkoordinasi, kemudian
menggunakan sistem komputerisasi dan sistem “Pre –coordinate”.
Fungsi Thesaurus
Seperti kegunaan atau fungsi sebuah kamus atau daftar kata-kata adalah
memberikan definisi atau penjelasan arti tentang kata dan istilah tersebut,
menurut Sri Rohyanti Z. (2002) maka thesaurus berguna untuk :
 Membantu menentukan dan menemukan istilah yang diberi definisi
tersebut.
 Sangat berguna bagi orang yang bertanggungjawab terhadap indexing
dan retrieving dalam bidang tertentu.
 Mencapai standardisasi dan konsistensi dalam pengindeksan dokumen.
Perbedaan Thesaurus dengan Daftar
Tajuk :
Secara lebih rinci perbedaan thesaurus dengan daftar tajuk subyek adalah
sebagai berikut:
 Istilah-istilah pada thesaurus yang berbentuk kata majemuk ditulis seperti apa
adanya, sedangkan dalam tajuk subyek bisa dibalik.
 Daftar tajuk subyek dalam penyajiannya terdiri atas satu bagian utama saja,
yaitu susunan alpabetis. Sedangkan thesaurus paling tidak terdiri atas dua
bagian yaitu bagain hierarkis dan alpabetis.Kadangkala ada bagian berkelas.
 Daftar tajuk subyek kebanyakan dipergunakan pada katalogisasi konvensional,
sedangkan thesaurus lebih tepat untuk sistem terotomasi. Karena itu istilah-istilah
dalam thesaurus cenderung bersifat pasca–laras.Dikoordinasikan pada saat
pencarian informasi. Hal ini sangat erat kaitannya dengan pengoperasian
BOOLEAN LOGIC (salah satu strategi sistem temu kembali informasi yang
berbasis komputer).

Dalam proses temu kembali informasi berbasis komputer, pemakai
harus menyediakan pertanyaan (query) yang diperlukan dengan
menggunakan kata kunci (keyword). Thesaurus menyediakan daftar katakata kunci yang disusun secra alpabetis dengan sinonim yang berdekatan
dan sering dikembangkan untuk mencakup beberapa indikasi dari istilah
yang luas (broader term) dan istilah khusus (narrower term). Dengan kata
lain bahwa thesaurus dalam fungsinya sebagai sarana temu kembali
informasi, bahwa kosa kata yang terdapat dalam thesaurus dapat
dipergunakan sebagai kata kunci (key word) untuk membuat pertanyaan
(query) dalam proses temu kembali informasi seperti dilakukan dalam
pengoperasiaan Boolean Logic.
Struktur Thesaurus
Thesaurus terdiri dari 2 bagian utama, yakni:
1.
Daftar descriptor menurut abjad Merupakan Pengelompokkan secara
alfabetis yang terdiri dari kategori yang mempunyai hubungan satu sama
lain.
2.
Daftar istilah yang merupakan panduan suatu descriptor Merupakan
pintu masuk kosa kata yang dipakai sebagai descriptor dan menunjukkan
hubungan hierarkis dari masing-masing descriptor.
Bagian Alfabetis
Bagian ini merupakan perubahan bentuk bagian hirarkhis tadi disusun kembali
secara alpabetis serta diperlihatkan hubungannya dengan istilah lain
berdasarkan tingakat kesepesifikkan makna, misalnya :
1.
Hubungan suatu istilah dengan istilah lain yang satu tingkat lebih luas
maknanya dinyatakan dengan BT (Broader Term),
2.
Hubungan suatu istilah dengan yang satu tingkat lebih sempit maknanya
dinyatakan dengan NT (Narrower Term).
Pencantuman BT dan NT pada bagian alpabetis dilengkapi dengan
pencantuman istilah lain yang mempunyai hubungan secara asosiatif dan
dinyatakan dengan RT (Related Term).
 Istilah-istilah yang dipergunakan untuk menyatakan hubungan hierarkhis dari masingmasing deskriptor serta penggunaannya, adalah sebagai berikut :
 DALAM BAHASA INGGRIS
U = Use
UF = Use For
SN = Scope Note
BT = Broader Term
NT = Narrowar Term
RT = Related Term
 DALAM BAHASA INDONESIA
G = Gunakan
GU = Gunakan Untuk
RL = Ruang Lingkup
IL = Istilah Luas
IK = Istilah Khusus
IB = Istlah Berhubungan
 Istilah “Use/Gunakan (U/G)” digunakan dibelakang deskriptor yang tidak boleh dipakai
dan menunjukkan harus menggunakan deskriptor lain.
Contoh : ADMINISTRASI PERSONALIA
G : PENGELOLAAN KEPEGAWAIAN.
 Istilah “Scope Note/Ruang Lingkup (SN/RL)” menandakan diberikannya keterangan
singkat untuk menggambarkan luasnya arti penerapan deskriptor itu.
Contoh : ADMINUSTRASI PENDIDIKAN.
RL : Berhubungan dengan sebagian atau seluruh sistem pendidikan.
 Istilah “Broader Term / Islilah Luas (BT/IL)” menunjukkan bahwa istilah yang mengikutinya
mempunyai arti lebih luas.
Contoh : ADMINISTRASI SEKOLAH
IL : ADMINISTRASI PENDIDIKAN
 Istilah “Narrower Term / Istilah Khusus (NT/IK)” menunjukkan bahwa istilah
yang mengikutinya mempunyai arti lebih sempit.
Contoh : PERPUSTAKAAN.
IK : PERPUSTAKAAN PERGURUAN TINGGI.
 Istilah “Related Term / Istilah Berhubungan (RT/IB)” menunjukkan pada satu
istilah-istilah yang mempunyai arti serupa seperti penunjukan ”lihat juga”
yang biasa terdapat dalam indeks. Istilah tersebut memperluas bidang
penelusuran dan menunjukkan arah-arah baru.
Algoritma Thesaurus
Algoritma yang digunakan dalam thesaurus adalah algoritma stemming. Algoritma ini
didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini
adalah sebuah kata yang kemudian dilakukan :
1.
Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2
awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka
imbuhan yang kosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk
mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang
bentuknya sebagai berikut :
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas,
maka imbuhan yang kosong diberi tanda x untuk prefiks dan diberi tanda xx
untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk
menampung setiap kata yang bentuknya sebagai berikut :
enum awalan_t {AwalanError=0,x,
me, pe, be, di, se, ke, te,
mem=100, men, per, pem, ber, ter, pen,
ber_luluh, ter_luluh, per_luluh,
mem_luluh, pem_luluh, men_luluh,
pen_luluh, meny=200, peny, meng,
meng_luluh, peng_luluh, peng
};
enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun, nya, kah, xx};
struct arrkata_t {
enum awalan_t p1,p2;
char kd[30];
enum akhiran_t s3,s2,s1;
};
2. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana
saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
a.
Awalan I, hasilnya disimpan pada p1
b.
Awalan II, hasilnya disimpan pada p2
c.
Akhiran I, hasilnya disimpan pada s1
d.
Akhiran II, hasilnya disimpan pada s2
e.
Akhiran III, hasilnya disimpan pada s3
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus
apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau
pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu
melanjutkan proses pemotongan imbuhan lainnya.
3. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata
dasar yang dihasilkan dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut :

Kata Dasar

Kata Dasar + Akhiran III

Kata Dasar + Akhiran III + Akhiran II

Kata Dasar + Akhiran III + Akhiran II + Akhiran I

Awalan I + Awalan II + Kata Dasar

Awalan I + Awalan II + Kata Dasar + Akhiran III

Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II

Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI

Awalan II + Kata Dasar

Awalan II + Kata Dasar + Akhiran III

Awalan II + Kata Dasar + Akhiran III + Akhiran II 3

Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
Referensi
 http://asriliaodri.note.fisip.uns.ac.id/tag/materi-thesaurus/
 http://ladangbelajar.blogspot.com/2013/09/sistem-temu-kembali-informasithesaurus.html
 https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-saranatemu-kembali-informasi-untuk-meningkatkan-pelayanan-kepadapengguna-di-perpustakaan/
Download