Tesaurus - Hirup Motekar

advertisement
Tesaurus
TI14D
Kelompok
Tesaurus

Kata tesaurus berasal dari kata thesauros, bahasa Yunani, yang bermakna
‘khazanah’.Lambat laun, kata tersebut mengalami perkembangan makna, yakni ‘buku
yang dijadikan sumber informasi’. Tesaurus berisi seperangkat kata yang saling bertalian
maknanya. Pada dasarnya, tesaurus merupakan sarana untuk mengalihkan gagasan ke
dalam sebuah kata, atau sebaliknya. Oleh karena itu, lazimnya tesaurus disusun
berdasarkan gagasan atau tema. Namun, untuk memudahkan pengguna dalam
pencarian kata, penyusunan tesaurus pun berkembang, kini banyak tesaurus yang
dikemas berdasarkan abjad.

Tesaurus dibedakan dari kamus. Di dalam kamus dapat dicari informasi tentang makna
kata, sedangkan di dalam tesaurus dapat dicari kata yang akan digunakan untuk
mengungkapkan gagasan pengguna. Dengan demikian, tesaurus dapat membantu
penggunanya dalam mengungkapkan atau mengekspresikan gagasan sesuai dengan
apa yang dimaksud. Misalnya, pencarian kata lain untuk kata hewan, pengguna
tesaurus dapat mencarinya pada lema hewan.
Tesaurus
hewan n binatang, dabat, fauna, sato, satwa
Sederet kata yang terdapat pada lema hewan tersebut menunjukkan bahwa kata tersebut
bersinonim sehingga dapat saling menggantikan sesuai dengan konteksnya. Tesaurus ini berguna
dalam pengajaran bahasa sehingga dapat dimanfaatkan oleh pengajar dan pelajar. Di dalam
tesaurus ini, pada sebagian lema dicantumkan pula antonimnya, dengan label ant.
haram a 1 gelap (ki), ilegal, liar, pantang, sumbang, tabu, terlarang; 2 mulia, suci;
ant 1 halal
mengharamkan v melarang, memantang, mencegah, menegah, menolak;
ant menghalalkan
pengharaman n pencegahan, pelarangan, penegahan;
ant penghalalan
jaka n bujang, cowok (cak), jejaka, lajang, laki-laki, pemuda, perjaka, teruna ant dara
Tesaurus
Kesinoniman dalam lema-lema disusun berdasarkan abjad. Lema-lema itu merupakan lema yang memiliki kesamaan makna
yang berjalinan di antara kata dasar, kata turunan, dan kelompok kata atau frasa. Lema yang bersinonim digunakan tanda
koma (,). Lema yang bersinonim mencakup kata-kata dari ragam baku, ragam percakapan sehari-hari, kontemporer, ataupun
arkais. Di dalam tesaurus ini hanya label ragam percakapan dan kiasan yang dicantumkan, sedangkan label ragam yang lain
tidak. Hal itu dilakukan agar kata-kata dapat dimanfaatkan kembali dalam percakapan sehari-hari.
Dalam tesaurus ini, hiponim dicantumkan pula karena di dalam tesaurus lazimnya memuat makna yang saling bertalian.
Dengan demikian, pengguna dapat dengan mudah memperoleh kata yang tepat sesuai dengan yang dikehendaki sehingga
pengguna dapat memanfaatkan kata itu untuk keperluan pragmatis.
jahit v bordir, jelujur, kelim, obras, tisik, setik, sulam, suji, tekat
Satuan leksikal bordir, jelujur, kelim, dan seterusnya merupakan hiponim dari lema jahit.

Akronim yang sudah lazim disertakan pula sebagai lema dalam tesaurus ini karena akronim tersebut sudah menjadi hal
biasa dan sering digunakan dalam komunikasi seharihari.

radar n pencari, pengesan, peninjau
Tesaurus
Singkatan
A
adv
ant
cak
dsb
Ki
n
num
p
pron
v
adjektiva
adverbia
antonim
cakapan
dan
sebagainya
kiasan
nomina
numeralia
partikel
pronomina
verba
Tesaurus
Pemakaian modern dimulai tahun 1852, di edisi pertama sebuah buku berjudul amat panjang: Thesaurus of English Words and Phrases :
classified and arranged so as to facilitate the expression of ideas an to assist in literacy composition diterbitkan oleh Peter Mark Roget. Inilah
thesaurus yang dianggap paling konsisten dan selalu diperbarui sampai sekarang. Mudah dilihat, thesaurus sangat berkaitan dengan
linguistik dan perhatian masyarakat terhadap bahasa mereka. Tidaklah sebuah kebetulan bahwa thesaurus moderen lahir di Inggris,
negara yang bahasanya kini menjadi bahasa internasional.
Kehadiran thesaurus pada sebuah bangsa berkaitan dengan keseriusan bangsa itu menggunakan kata dan memberlakukan
bahasa mereka. Keseriusan tersebut terwujud dalam bentuk upaya memastikan bahwa setiap kata dipakai dengan benar dan setiap kata
yang benar berhubungan dengan kata lain dengan benar pula.
Menurut Fungsi dan kegunaan thesaurus terletak pada struktur yang mengaitkan satu konsep dengan konsep lainnya melalui
berbagai hirarki dan maknanya. Di dalam definisi yang dibuat oleh World Science Information System of Unesco (UNISIST) sebagaimana
dikutip oleh Foskett (1997) terungkap bahwa: Sebuah thesaurus dapat didefinisikan baik dari segi fungsi maupun strukturnya.
Dari segi fungsi, sebuah thesaurus adalah alat pengendali terminologi yang digunakan dalam penerjemahan dari bahasa alamiah di
dalam dokumen, indeks, atau pengguna menjadi sebuah “bahasa sistem” (bahasa dokumentasi, bahasa informasi) yang lebih terbatas.
Dari segi struktur, sebuah thesaurus adalah kosa kata yang terkendali tetapi dinamis, berisi istilah-istilah yang secara semantik dan generik
saling terkait dalam lingkup sebuah bidang pengetahuan tertentu.
Dari penyataan diatas dapat di simpulkan bahwa Thesaurus adalah himpunan kata-kata terkendali yang berhubungan satu sama
lain secara semantik dan hierarkis, yang dapat dipergunakan untuk menterjemahkan bahasa sehari-hari ke dalam bahasa indeks dalam
bidang ilmu pengetahuan tertentu. Thesaurus dipergunakan secara luas untuk mengendalikan kosa kata (vocabulary control) dalam sistem
terkoordinasi, kemudian menggunakan sistem komputerisasi dan sistem “Pre –coordinate”.
Manfaat Thesaurus
Ada beberapa manfaat dari Thesaurus diantaranya adalah:
1.
Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu,
sehingga para pengindeks (manusia) dapat secara konsisten
menetapkan istilah yang akan dipakai sebagai indeks.
2.
Menjadi sebuah panduan bagi pengguna sistem informasi ketika
memilih istilah untuk digunakan dalam pencarian berdasarkan subjek.
3.
Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang
pengetahuan tertentu.
4.
Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat
diperluas atau dipersempit.
Peran Thesaurus dalam Pengelolaan
Informasi
Dalam kaitanya dengan pengelolaan informasi, Thesaurus berperan penting
di dalamnya diantaranya:
1.
Sebagai sarana temu kembali informasi yang berbasis komputer.
2.
Sebagai pedoman dalam mengolah dokumen seperti pembuatan
indeks dan penentuan tajuk.
3.
Mempermudah dalam mengelola data yang telah ada.
4.
Mempercepat diketemukannya informasi yang di cari.
Algoritma Thesaurus
Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini
menggunakan algoritma tertentu dan algoritma yang digunakan adalah
algoritma stemming.
Algoritma Thesaurus
Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga
input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:
1.
Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan
memiliki 2 awalan/prefiks dan 3 akhiran/sufiks. Sehingga bentuknya menjadi :
a)
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2 + Sufiks 1
b)
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan
di atas, maka imbuhan yang kosong diberi tanda x untuk prefiks dan
diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah
struktur data untuk menampung setiap kata yang bentuknya sebagai
berikut:
Algoritma Thesaurus
Algoritma Thesaurus
2.
Dengan struktur data di atas, maka langkah awal pemotongan bisa dari
mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai
berikut:
a)
Awalan I, hasilnya disimpan pada p1
b)
Awalan II, hasilnya disimpan pada p2
c)
Akhiran I, hasilnya disimpan pada s1
d)
Akhiran II, hasilnya disimpan pada s2
e)
Akhiran III, hasilnya disimpan pada s3
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di
kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar.
Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak
perlu melanjutkan proses pemotongan imbuhan lainnya.
Algoritma Thesaurus
3.
Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar
yang dihasilkan dikombinasikan dengan imbuhan-imbuhannya dalam 12 konfigurasi berikut:
a)
Kata Dasar
b)
Kata Dasar + Akhiran III
c)
Kata Dasar + Akhiran III + Akhiran II
d)
Kata Dasar + Akhiran III + Akhiran II + Akhiran I
e)
Awalan I + Awalan II + Kata Dasar
f)
Awalan I + Awalan II + Kata Dasar + Akhiran III
g)
Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
h)
Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
i)
Awalan II + Kata Dasar
j)
Awalan II + Kata Dasar + Akhiran III
k)
Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
l)
Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
Contoh Penerapan Tesaurus
disini
Download