temu balik informasi

advertisement
TEMU BALIK INFORMASI
ANGGOTA KELOMPOK

BAYU ANDRIANTO
21

SYAIFUL HIDAYAT
25

M. FAIZ NOERIS
27

RIFDHOTUL ALFIANSYAH
33

MASKUR ALASAD
35

YOGI HENDRA GUNAWAN 32

YOUSUA SANDI GARSA
34
Konsep thesaurus dalam
information retrieval dan
mengenal macam-macam
thesaurus beserta algoritmanya.
A. PENGERTIAN THESAURUS

Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan,
harta ataupun gudang tempat menyimpan harta benda atau
kekayaan”. (Sri Rohyanti Z.: 2002: 1)

Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah
kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan
artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan
informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya.

Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan
thesaurus sebagai suatu ‘buku yang berisi kata atau informasi
mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti
kamus sinonim.

Tesaurus adalah alat untuk pengawasan kosa kata (vocabulary
control). (E. John Leide: 2002: 1)

Paul Kleinbart dalam artikel “Prolegomenon to Intelegent Thesaurus
Software” mengutip pengertian thesaurus dari (ISO 2788 [4]) dikutip Lalu
Anwar (2000) : thesaurus dapat didefinisikan dalam dua pengertian
yaitu menurut fungsi dan strukturnya.
Menurut fungsinya

Thesaurus dalam daftar istilah untuk mengawasi kosa kata yang
dipakai untuk menterjemahkan bahasa sehari-hari (bahasa alami)
dari dokumen, pengindeks atau pemakai ke dalam bahasa sistem
(bahasa dokumentasi, bahasa informasi).
Menurut Strukturnya

Thesaurus adalah daftar kata-kata yang dinamis dan terkendali
yang berhubungan satu sama lain secara semantik, dan secara
umum mencakup bidang ilmu pengetahuan tertentu.

Dalam buku “Guidelines for the Establisment and Develoment of
Multilingualual Thesauri” dikutip Lalu Anwar (2000) pengertian
thesaurus adalah sekelompok istilah yang dipilih dari bahasa seharihari, dan merupakan kosa kata dari bahasa indeks yang terkendali.
Disusun sedemikian rupa sehingga hubungan formal antara istilah
yang lebih luas (broader terms) dengan istilah yag khusus (narrower
terms) dibuat dengan jelas.

Berdasarkan pengertian diatas, thesaurus merupakan himpunan
kata-kata terkendali yang berhubungan satu sama lain secara
semantik dan hierarkis, yang dapat dipergunakan untuk
menterjemahkan bahasa sehari-hari ke dalam bahasa indeks
dalam bidang ilmu pengetahuan tertentu. Thesaurus dipergunakan
secara luas untuk mengendalikan kosa kata (vocabulary control)
dalam sistem terkoordinasi, kemudian menggunakan sistem
komputerisasi dan sistem “Pre –coordinate”.

Thesaurus berbeda dengan daftar tajuk suyek, kamus istilah dan
klasifikasi hierarkhis. Perbedaannya dengan daftar tajuk subyek
bahwa daftar tajuk subyek tidak secara implisit menyebutkan
hubungan hierarkhis dari masing-masing subyek melainkan disusun
hanya berdasarkan abjad. Dalam tajuk subyek untuk menunjukkan
hubungan hierarkhis digunakan acuan “lihat juga”, yang dapat
menunjukkan hubungan subyek yang lebih luas dengan subyek
yang lebih khusus.
Contoh : ADMINISTRASI PENDIDIKAN
Lihat juga : ADMINISTRASI SEKOLAH.

Pada thesaurus, acuan yang digunakan lebih eksplisit lagi. Istilahistilah yang terdaftar dinyatakan dengan jelas hubungan
hierarkhisnya dengan menggunakan istilah lain.
Contoh : ADMINISTRASI PENDIDIKAN
BT : ADMINISTRASI.
NT : ADMINISTRASI EKOLAH.

Secara lebih rinci perbedaan thesaurus dengan daftar tajuk subyek
adalah sebagai berikut :………………………..

1. Istilah-istilah pada thesaurus yang berbentuk kata majemuk ditulis
seperti apa adanya, sedangkan dalam tajuk subyek bisa dibalik.

2. Daftar tajuk subyek dalam penyajiannya terdiri atas satu bagian
utama saja, yaitu susunan alpabetis. Sedangkan thesaurus paling
tidak terdiri atas dua bagian yaitu bagain hierarkis dan alpabetis.
Kadangkala ada bagian berkelas.

3. Daftar tajuk subyek kebanyakan dipergunakan pada katalogisasi
konvensional, sedangkan thesaurus lebih tepat untuk sistem
terotomasi. Karena itu istilah-istilah dalam thesaurus cenderung
bersifat pasca–laras. Dikoordinasikan pada saat pencarian
informasi. Hal ini sangat erat kaitannya dengan pengoperasian
BOOLEAN LOGIC (salah satu strategi sistem temu kembali informasi
yang berbasis komputer).

Perbedaan thesaurus dengan kamus istilah, bahwa kamus istilah
hanya memberikan definisi suatu istilah, sedangkan thesaurus
memberikan difinisi dalam rangka menunjukkan hubungan suatu
istilah dengan istilah yang lain.
Contoh : ADMISITRASI PERSONALIA
Gunakan : PENGELOLAAN KEPEGAWAIAN.

Perbedaan thesaurus dengan klasifikasi hierarkhis seperti DDC atau
UDC yaitu sistem klasifikasi hierarkhis berusaha menggambarkan
keseluruhan hubungan hierarkhis antara istilah yang terdapat
dalam klasifikasi tersebut, sebaliknya thesaurus hanya
menggambarkan istilah yang perlu-perlu saja.
B. Struktur Thesaurus.

Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian
utama yaitu :
(1) Daftar deskriptor (rumusan) menurut abjad; dan
(2) Daftar istilah yang merupakan panduan suatu deskriptor.

 Istilah yang dipergunakan sebagai deskriptor untuk mengindeks
dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks
yang dikelompokkan secara alpabetis yang terdiri dari faset
(kategori) yang mempunyai erat antara satu sama lain.
Contoh : PERPUSTAKAAN
: PERPUSTAKAAN NASIONAL.
: PERPUSTAKAAN PERGURUAN TINGGI.
: PERPUSTAKAAN SEKOLAH.

 Istilah-istilah yang merupakan panduan suatu deskriptor (lead in
term) yang merupakan pintu masuk kosa kata yang dipakai
sebagai deskriptor dan menunjuk hubungan hierarkhis dari masingmasing deskriptor.
C. Bagian Hierarkis

Suatu thesaurus memuat sejumlah istilah mulai dari yang spesifik
hingga istilah yang umum. Istilah yang satu merupakan bagian dari
istilah lainnya yang mengandung makna yang lebih luas dan paling
luas, namun masih termasuk dalam cakupan subyek thesaurus
dimaksud. Menurut Simanjuntak (1986) dikutip Lalu Anwar (2000)
hubungan yang berdasarkan kriteria “sempit – lebih luas – paling
luas” ini disebut hubungan hierarkhis.
Menurut buku “Guidekine for the establishment and development
monolingual thesauri (1981)” dikutip Lalu Anwar (2000) kedudukan suatu
istilah dalam hierarkhis ditentukan berdasarkan aturan sebagai berikut :

1. Hubungan generik (genus-species) merupakan hubungan antar
istilah dimana makna istilah yang satu merupakan species atau jenis
dari makna istilah yang lain. Contoh : istilah “Banjir” ditempatkan
satu tingkat lebih spesifik daripada istilah “Bencana alam”, karena
istilah “Banjir” adalah jenis dari “Bencana alam”.

2. Hubungan partitif (Whole-part relationship) merupakan hubungan
antar istilah dimana istilah yang satu mewakili istilah yang lain dalam
makna.
Contoh : hubungan antara “rumah” dan “jendela”.
D. Bagian alfabetis.

Bagian ini merupakan perubahan bentuk bagian hirarkhis tadi
disusun kembali secara alpabetis serta diperlihatkan hubungannya
dengan istilah lain berdasarkan tingakat kesepesifikkan makna,
misalnya :
1. Hubungan suatu istilah dengan istilah lain yang satu tingkat lebih
luas maknanya dinyatakan dengan BT (Broader Term),
2. Hubungan suatu istilah dengan yang satu tingkat lebih sempit
maknanya dinyatakan dengan NT (Narrower Term).

Pencantuman BT dan NT pada bagian alpabetis dilengkapi dengan
pencantuman istilah lain yang mempunyai hubungan secara
asosiatif dan dinyatakan dengan RT (Related Term).
Istilah-istilah yang dipergunakan untuk menyatakan
hubungan hierarkhis dari masing-masing deskriptor serta
penggunaannya, adalah sebagai berikut :

DALAM BAHASA INGGRIS
DALAM BAHASA INDONESIA

U = Use
UF = Use For
SN = Scope Note
BT = Broader Term
NT = Narrowar Term
RT = Related Term

G = Gunakan
GU = Gunakan Untuk
RL = Ruang Lingkup
IL = Istilah Luas
IK = Istilah Khusus
IB = Istlah Berhubungan
E. Fungsi Thesaurus.
Thesaurus dapat berfungsi sebagai sistem untuk mengolah informasi dan
sarana temu kembali informasi yang berbasis komputer. Sebagai sistem
pengelolaan informasi, thesaurus dapat berfungsi sebagai pedoman
dalam mengolah dokumen seperti pembuatan indeks dan penentuan
tajuk. Sebagai sarana temu kembali informasi, thesaurus terdiri dari
komponen-komponen pokok yang dapat digunakan dalam sistem temu
kembali informasi seperti struktur kosa kata kendali dan sistem acuan (misal
; Gunakan : ….., Gunakan Untuk : …… dsb.).
 Dalam proses temu kembali informasi berbasis komputer, pemakai harus
menyediakan pertanyaan (query) yang diperlukan dengan
menggunakan kata kunci (keyword). Thesaurus menyediakan daftar katakata kunci yang disusun secra alpabetis dengan sinonim yang berdekatan
dan sering dikembangkan untuk mencakup beberapa indikasi dari istilah
yang luas (broader term) dan istilah khusus (narrower term). Dengan kata
lain bahwa thesaurus dalam fungsinya sebagai sarana temu kembali
informasi, bahwa kosa kata yang terdapat dalam thesaurus dapat
dipergunakan sebagai kata kunci (key word) untuk membuat pertanyaan
(query) dalam proses temu kembali informasi seperti dilakukan dalam
pengoperasiaan Boolean Logic.


Seperti kegunaan atau fungsi sebuah kamus atau daftar kata-kata
adalah memberikan definisi atau penjelasan arti tentang kata dan
istilah tersebut, menurut Sri Rohyanti Z. (2002) maka thesaurus
berguna untuk :
a. Membantu menentukan dan menemukan istilah yang diberi
definisi tersebut.
b. Sangat berguna bagi orang yang bertanggungjawab terhadap
indexing dan retrieving dalam bidang tertentu.
c. Mencapai standardisasi dan konsistensi dalam pengindeksan
dokumen.
F. Tujuan Thesaurus

Dalam Encyclopedia of Library and Information Science Vol. 30 (1970) dikutip
Lalu Anwar (2000) diuraikan bahwa yang menjadi tujuan utama disusunnya
thesaurus, antar lain adalah sebagi berikut :

1. Untuk memberikan gambaran tentang bidang ilmu pengetahuan tertentu,
menunjukkan pengertian atau ide tentang konsep yang saling berhubungan,
untuk membantu pengindeks atau peneliti dalam memahami struktur bidang
ilmu pengetahuan tersebut.
2. Untuk menyediakan kosa kata yang standar untuk bidang subyek tertentu
yang dipergunakan oleh para pengindeks sacara konsisten pada saat
menyusun entri indeks dalam rangka penyimpanan dan atau dalam proses
temu kembali informasi.
3. Untuk menyediakan sebuah sistem referensi antara istilah yang telah
dipastikan hanya mempunyai satu bentuk sinonim yang digunakan untuk
mengindeks sebuah dokumen.
4. Untuk menyediakan panduan bagi para pemakai sistem, sehingga mereka
dapat memilih istilah yang benar untuk menelusur subyek tertentu.
5. Untuk menyediakan pengklasifikasian yang hierarkhis sehingga penelusur
dapat memperluas atau mempersempit secara sistematis, jika pilihan
pertama dalam penelusuran terlalu sedikit atau terlalu banyak petunjuk
terhadap bahan yang tersedia.
Algoritma Thesaurus

Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan
algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.

Algoritma Stemming

Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari
algoritma ini adalah sebuah kata yang kemudian dilakukan:

1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan /
prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :

Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1

Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan
yangkosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya
maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut
http://viplab.if.its.ac.id/
Download