Uploaded by laodegaming.21

Artificial Intelegent

advertisement
MAKALAH
LOGIKA ORDER PERTAMA DALAM KECERDASAN
BUATAN
LA ODE YUDISTIRA DWISURYA NDAU
1162001035
PROGRAM STUDI INFORMATIKA
FAKULTAS TEKNIK DAN ILMU
KOMPUTER UNIVERSITAS BAKRIE
JAKARTA 2021
1.
Pendahuluan
Kecerdasan Buatan sebenarnya sudah dimulai sejak musim panas tahun1956. pada waktu itu
sekelompok pakar komputer, pakar dan peneliti dari disiplinilmu lain dari berbagai akademi,
industri serta berbagai kalangan berkumpul di Dartmouth College untuk membahas potensi
komputer dalam rangka menirukanatau mensimulasi kepandaian manusia. Beberapa ilmuwan
yang terlibat adalah Allen Newel, Herbert Simon, Marvin Miskey, Oliver Selfridge, dan
JohnMcCarthy. Sejak saat itu, para ahli mulai bekerja keras untuk membuat, mendiskusikan,
merubah dan mengembangkan sampai mencapai titik kemajuan yang penuh. Mulai dari
laboratorium sampai kepada pelaksanaan kerja nyata. Pada mulanya Kecerdasan Buatan hanya
ada di universitas-universitas dan laboratorium-laboratorium penelitian, dan hanya sedikit sekali
– jika ada – produkpraktis yang sudah dikembangkan. Menjelang akhir tahun 1970-an dan awal
tahun 1980-an, mulai dikembangkansecara penuh dan hasilnya secara berangsur-angsur mulai
dipasarkan. Saat ini, sudah banyak hasil penelitian yang sedang dan sudah dikonversikan
menjadiproduk nyata yang membawa keuntungan bagi pemakainya.
Sistem tanya jawab (STJ) adalah sebuah sistem yang berupaya untuk mencari jawaban spesifik
terhadap sebuah pertanyaan yang diajukan dalam bahasa natural. Dibandingkan dengan mesin
pencarian yang memberikan himpunan dokumen hasil penelusuran, sebuah STJ harus dapat
menghadirkan jawaban akhir kepada pengguna. Secara nilai kecerdasan, STJ harus memiliki
intelijensia yang lebih dibandingkan dengan mesin pencarian biasa. Permasalahan utama yang
harus diatasi dalam STJ adalah sejauh mana pertanyaan yang diajukan dalam bahasa alami
(bahasa Inggris, Indonesia, dll) dapat diinterpretasikan, dan kemudian dicari jawabannya dari
sekumpulan fakta yang telah ada di dalam sistem. Fakta dapat berupa sekumpulan kalimat yang
diinputkan melalui dialog dengan sistem ataupun sekumpulan dokumen tekstual dalam jumlah
yang sangat besar (korpus), misalnya dokumen-dokumen yang dapat diakses melalui Internet.
Pencarian jawaban dalam STJ dapat menggunakan beberapa teknik dengan menerapkan teknikteknik penelusuran informasi (information retrieval / IR, misalnya dengan teori probabililitas,
model bahasa, dan model similaritas kata), kecerdasan buatan (artificial intelligence, misalnya
dengan ontologi, data-driven, anotasi pengetahuan, dan logika deskripsi / description logic), dan
pendekatan penalaran (reasoning, misalnya dengan teknik resolusi dan inferensi pada logika
tingkat pertama = First Order Logic / FOL). Pada umumnya teknik IR dipakai untuk menyaring
2
kandidat dokumen yang berisi jawaban dari korpus yang besar, dan dipakai dalam STJ domain
terbuka (open-domain), misalnya STJ yang beroperasi pada Internet, seperti AskMSR [Lin &
Katz 2003], AskJeeves, OpenEphyra [Schlaefer, et.al. 2006, 2007], dan JIRS [Buscaldi, et. al
2009]. Pemanfaatan ontologi dalam STJ, biasanya dilakukan untuk STJ dalam domain tertutup
(closed-domain). Penerapan ontologi dapat dilakukan jika model data dalam sebuah domain
direpresentasikan sebagai sebuah keterkaitan konsep, yang pada akhirnya digunakan sebagai alat
interpretasi bahasa alami. Contoh STJ yang menerapkan ontologi dan data-driven antara lain
AquaLog [Lopez, et. al. 2009a,b], Senso [Saias & Quaresma, 2007], dan HITIQA [Strzalkowski,
et. al. 2005].
Pemanfaatan FOL untuk merepresentasikan fakta adalah salah satu teknik dasar yang sudah sejak
lama dipakai untuk dapat mengkodekan bahasa alami ke dalam bentuk formal. Dengan
menggunakan FOL, diharapkan fakta (dan juga pertanyaan) dapat direpresentasikan secara tepat
ke dalam konteksnya masing-masing, sehingga jawaban akhir yang dikembalikan kepada
pengguna adalah jawaban yang tingkat kesasihannya (validity, di dalamnya mencakup
consistency dan informativeness) sangat tinggi. STJ yang memanfaatkan teknik penalaran antara
lain QED dan LaSapienza [Bos, J. 2006], LogAnswer [Furbach, U., et. al. 2009].
STJ yang dibahas dalam laporan ini akan menggunakan dialog sebagai alat untuk menginputkan
fakta dan pertanyaan. Sistem akan memberikan sebuah jawaban tunggal yang didapatkan dari
hasil inferensi. Contoh dialog yang diharapkan, misalnya:
Pengguna: Ayah makan sepiring nasi
Sistem: Ok
Pengguna: Anto naik sepedaSistem: Ok
Pengguna: Siapa makan sepiring nasi?
Sistem: Ayah
Untuk dapat melakukan dialog seperti di atas, ada dua permasalahan yang harus dapat ditangani
di dalam sistem:
1. Bagaimana kalimat dalam bahasa alami dapat secara otomatis direpresentasikan ke dalam
bentuk semantik yang sesuai?
2. Bagaimana representasi bahasa alami yang telah dihasilkan dapat dipakai untuk
3
melakukan penalaran jawaban?
Bagian laporan selanjutnya akan memuat pembahasan mengenai FOL yang sebagai perangkat
representasi untuk analisis semantik fakta dan pertanyaan, serta mekanisme penalaran yang
digunakan dalam menentukan jawaban akhir. Pendekatan analisis semantik yang digunakan
dalam laporan ini memakai model yang ditulis dalam buku “Representation and Inference for
Natural Language” karangan Patrick Blacburn dan Johan Bos [Blackburn, P. & Bos, J. 2005],
selanjutnya disebut sebagai BB1.
Susunan laporan selanjutnya adalah sebagai berikut: bagian dua akan memuat pembahasan
mengenai peranan FOL dalam representasi semantik. Bagian tiga akan membahas mengenai
arsitektur yang dipakai untuk analisis dan inferensi semantik. Bagian empat akan memuat
mengenai permasalahan representasi FOL, yang diteruskan pada bagian lima
dengan
pembahasan mengenai pembentukan semesta pembicaraan yang dipakai sebagai perangkat untuk
membentuk domain penalaran untuk STJ. Bagian enam akan membahas mekanisme STJ yang
dihasilkan. Laporan akan ditutup dengan beberapa kesimpulan dan arah penelitian selanjutnya.
2.
Representasi Semantik
Representasi sebuah fakta dalam bentuk FOL memiliki beberapa keuntungan dibandingkan
dengan logika proposisi. Dalam logika proposisi sebuah kalimat direpresentasikan ke dalam
sebuah lambang yang menggantikan keseluruhan kalimat secara utuh. Misalnya: ‘ayah makan
sepiring nasi’, akan dilambangkan dengan proposisi utuh ‘A’. Keterbatasan dari representasi ini
adalah jika hanya sebagian dari fakta yang berperan sebagai jawaban atas sebuah pertanyaan.
Misalnya jika sistem hanya ingin mengambil jawaban ‘ayah’ sebagai respons atas pertanyaan
‘Siapa makan sepiring nasi?’.
Dengan FOL, representasi dapat dilakukan dengan memberikan predikat yang menjelaskan
adanya relasi antara fakta atomik (variabel) dalam kalimat. FOL juga memberikan kesempatan
untuk melengkapi representasi dengan adanya kuantifikator, yang menjelaskan lingkup predikat
dalam kalimat bahasa alami. Sebagai contoh kalimat ‘ayah makan sepiring nasi’, sebenarnya
ingin menjelaskan bahwa ‘ada seorang ayah yang memakan nasi dengan menggunakan sejumlah
4
piring sebagai tempat nasi tersebut’, atau dengan kata lain ada fakta atomik ‘ayah’ yang
melakukan fakta tindakan ‘makan’ sesuatu, yaitu ‘nasi’ yang diletakkan di dalam ‘piring’. Jika
direpresentasikan ke dalam FOL, kalimat ‘ayah makan sepiring nasi’, dapat menjadi
sejumlah nasi tertentu diberikan lingkup ke dalam konteks ‘makan’ yang dilakukan ‘ayah’.
Kuantifikator ini dapat digunakan untuk menjelaskan generalisasi terhadap sebuah fakta. Sebagai
contoh jika ada kalimat ‘semua ayah makan sepiring nasi’, maka dapat direpresentasikan ke
,y))’. Perhatikan bahwa FOL, ambiguitas (underspecification) dalam
mengartikan sebuah kalimat tetap dapat direpresentasikan. Contoh di atas menghasilkan dua
interpretasi, yang pertama menjelaskan bahwa ‘semua ayah memakan nasi dari piring yang
berbeda-beda’, sedangkan yang kedua menjelaskan bahwa ‘semua ayah memakan nasi dari
sebuah piring yang sama’. Permasalahan ambiguitas ini bergantung pada lingkup kuantifikator
dalam formula FOL. Untuk menjelaskan lingkup kuantifikator diperlukan adanya pemahaman
terhadap model, domain, formula, dan keterikatan variabel (variable binding) dalam sebuah
representasi FOL.
2.1.
Model, Domain dan Formula
Sebuah model adalah sebuah situasi yang menjelaskan hal-hal yang menjadi konteks
pembicaraan. Untuk membentuk sebuah model, diperlukan adanya kosa-kata (vocabularies),
yaitu daftar istilah yang membentuk model tersebut. Sebuah kosa-kata berisikan topik
pembicaraan dan bahasa (simbol) yang digunakan dalam pembicaraan. Dalam contoh kalimat
‘ayah dan anto makan sepiring nasi’, akan terdapat kosa-kata sebagai berikut: {(ayah,1), (anto,0),
(makan,2), (nasi,1)}. Dalam kosa-kata ini akan terlihat bagaimana relasi antara fakta atau
variabel yang satu dengan lainnya di dalam representasi. Perlu dibedakan antara fakta (sebuah
konstanta / non-binding variable), dengan variabel yang dapat menampung sebuah fakta (binding
variable). Dalam contoh, relasi ‘makan’ menjelaskan bahwa aktivitas tersebut dapat terjadi jika
melibatkan dua konstanta (relasi biner yang memiliki arity 2). Angka 1 menjelaskan bahwa
terjadi relasi tunggal (arity 1), yang dapat diisikan (binding) dengan sebuah konstanta. Angka 0
menjelaskan sebuah konstanta, dan bukan merupakan relasi.
5
Sebuah domain memberikan himpunan entitas / fakta yang menjadi fokus pembicaraan. Setiap
simbol dalam kosa-kata akan menyampaikan nilai semantik yang sesuai dengan interpretasinya
di dalam domain yang berlaku. Interpretasi terhadap simbol diberikan dengan menggunakan
sebuah fungsi. Dengan demikian sebuah model M, adalah pasangan domain dengan fungsi yang
memberikan nilai semantik tertentu (D,F). Misalkan untuk contoh ‘ayah makan sepiring nasi’,
terdapat domain D = {d1, d2}, dengan fungsi interpretasi F1, sebagai berikut: F1(ayah) = d1,
F1(nasi) = d2, F1(makan) = {d1, d2}, akan menghasilkan sebuah model M, yang berisikan
pasangan antara domain dengan fungsi.
6
2.2.
Kalkulus Lambda
Sebuah kalimat bahasa alami tidak dapat secara langsung direpresentasikan ke dalam bentuk
FOL tanpa melalui proses pengenalan semantik dari setiap simbol (kata) di dalamnya. Hal ini
terutama terkait dengan proses pengikatan variabel-konstanta dan kuantifikator untuk setiap
simbol dalam kosa-kata yang merepresentasikan nilai semantik tertentu. Bahasa alami memiliki
tata bahasa (gramatika / struktur sintaksis), yang bersifat hierarkis. Sebuah kalimat lengkap akan
dapat diuraikan ke dalam bentuk yang lebih sederhana secara bertingkat, dengan setiap
simbolnya menempati peranan (fungsi interpretasi / semantik) tertentu di dalam domainnya.
Untuk contoh ‘ayah makan sepiring nasi’, setiap simbolnya dapat memiliki nilai semantik
berdasarkan struktur sintaksis, sebagai berikut:
Salah satu pendekatan yang digunakan untuk melakukan analisis sintaksis adalah dengan
menerapkan Definite Clause Grammar (DCG). Sebelum representasi FOL dapat dilakukan,
aturan DCG harus diterapkan ke dalam sistem, yaitu dengan:
1. Memberikan spesifikasi sintaksis (gramatika) untuk bahasa alami yang digunakan.
2. Memberikan spesifikasi representasi semantik untuk setiap simbol (leksikon).
3. Memberikan spesifikasi hierarkis / komposisional yang memberikan nilai semantik
untuk setiap (sub-) bagian dalam sintaks.
7
Setelah adanya aturan DCG, representasi FOL dapat dilakukan dengan melakukan terlebih
dahulu pengikatan variabel dan kuantifikator untuk setiap simbol yang akan dianalisis nilai
semantiknya. Hal ini dilakukan dengan menerapkan kalkulus lambda (KL). KL memberikan
jaminan bahwa setiap simbol akan mendapatkan pengikatan variabel yang berbeda sesuai dengan
untuk menampung informasi yang ‘hilang’ dalam sebuah relasi / predikat di dalam domain.
Informasi akan diikatkan ke dalam variabel dengan proses substitusi, dengan simbol @ (dapat
diartikan sebagai “sesuatu diaplikasikan (applied) ke dalam variabel pada fungsi domain”).
-conversion, akan menjamin bahwa substitusi dilakukan
untuk ‘lubang’ dengan variabel yang tepat.
Sebagai contoh untuk kalimat ‘anto makan sepiring nasi’, maka dapat digunakan aturan DCG,
dengan penerapan KL, sebagai berikut:
8
2.3.
Implementasi Kalkulus Lambda
Guna mengimplementasikan analisis semantik dengan pendekatan DCG, diperlukan seperangkat
komponen. Komponen-komponen tersebut harus mewakili aturan-aturan sintaktik dan semantik.
Setiap aturan sintaktik dan semantik akan dipakai untuk menginterpretasikan kalimat yang
diinputkan ke dalam sistem, kata-per-kata. Interpretasi akhir dari sebuah kalimat akan
bergantung pada model representasi semantik yang dipakai, misalnya jika pada sistem diterapkan
KL, maka binding (pengisian variabel dan kuantifikator) akan mengikuti mekanisme
-
conversion. Arsitektur dalam BB1 diimplementasikan dengan bahasa pemrograman Prolog yang
sangat fleksibel untuk implementasi aturan dan dapat diandalkan untuk melakukan inferensi.
lambda disiapkan untuk mengisi ‘lubang’ pada sebuah variabel X. Sebenarnya dalam mekanisme
KL ada dua proses yang terjadi. Yang pertama adalah untuk memberikan label (penamaan
variabel) yang unik untuk setiap variabel yang terdapat dalam kalimat, dan kedua memberikan
nilai pada label, sesuai dengan urutan (dengan data struktur tumpukan / stack). Proses yang
-reduction
-reduction. Kedua
proses ini harus dilakukan untuk menghindari adanya ‘kekurangcermatan’ pemberian label pada
variabel saat analisis kalimat dilakukan. Setelah kedua proses dalam KL dilakukan, barulah
proses binding dilakukan sesuai dengan domain dan fungsi yang berlaku pada kalimat yang
9
dianalisis. Dalam Prolog, aplikasi fungsional seperti ini dilakukan oleh sebuah predikat
app(Functor,Argument).
Ide implementasi dengan data struktur tumpukan terhadap kalkulus lambda, dapat dilihat pada
contoh berikut ini. Seandainya terdapat kalimat “ayah tidur”, maka sebenarnya secara kalkulus
lambda akan direpresentasikan dengan app(lam(X,tidur(X),ayah). Dalam proses selengkapnya,
representasi tersebut terjadi dengan tahapan sebagai berikut:
Ekspresi
Stack
app(lam(X, tidur(X), ayah)
[]
lam(X, tidur(X))
[ayah]
tidur(ayah)
[]
Proses dimulai dengan tumpukan kosong, pada saat aplikasi fungsi akan dilakukan, maka
argumen dalam ekspresi, yaitu ‘ayah’, dilempar (push) ke dalam tumpukan (baris pertama). Jika
ekspresi yang ditemukan adalah sebuah abstraksi lambda (baris kedua), maka simbol lambda
akan dibuang, dan selanjutnya variabel pertama yang ditemukan dalam argumen, akan diisikan
dengan nilai yang ada pada tumpukan (pop). Jika ekspresi bukan merupakan ‘aplikasi’ ataupun
‘abstraksi lambda’, maka proses keseluruhan selesai. Dengan cara yang demikian, KL
memberikan proses yang transparan dan notasi yang utuh untuk analisis semantik, dan sekaligus
dapat digunakan untuk “menyatukan” semantik dengan aturan sintaktiknya.
3.
Arsitektur Analisis Semantik
Arsitektur yang ditawarkan dalam BB1 diupayakan untuk memenuhi tiga persyaratan dalam
implementasi tata-bahasa, yaitu: modular (setiap komponen memiliki peran spesifik dengan
antarmuka yang jelas dengan komponen lainnya), ekstensibilitas (aturan tata-bahasa harus dapat
dengan mudah diperluas jika ada kebutuhan baru), dan penggunaan kembali (reusabilitas, yang
artinya komponen tata-bahasa harus sedemikian rupa dapat dipertahankan, meskipun ada
perubahan model representasi semantik).
Untuk menjawab ketiga syarat tersebut, maka arsitektur yang disiapkan terbagi ke dalam dua
dimensi, yaitu: aturan sintaktik (Grammar.pl) yang berkorespondensi dengan aturan semantik
untuk kombinasi konstruksi bagian kalimat (SemRules.pl), dan leksikon (Lexicon.pl, yang berisi
10
kosa-kata) yang berkorespondensi dengan aturan semantik leksikal (SemLex.pl). Jika
digambarkan, maka dimensi arsitektur tersebut dapat dilihat sebagai berikut:
Model
Representasi
Semantik
syntax
Lexicon.pl
SemLex.pl
Grammar.p
SemRules.pl
lexicon
grammar
semantic
l
11
3.1.
Aturan Tata Bahasa
Aturan tata bahasa memberikan susunan kalimat bahasa natural dalam sebuah DCG. Dalam
perangkat aturan tata bahasa ini, konstuksi semantik yang penting untuk sebuah bahasa natural
didefinisikan, misalnya aturan untuk pronomina, kata kerja, determinator, kata benda, dsb.
Dalam arsitektur BB1, kombinasi antar setiap konstruksi semantik diberikan dengan predikat
sebagai berikut:
s([coord:no,sem:Sem])-->
np([coord:_,num:Num,gap:[],sem:NP]),
vp([coord:_,inf:fin,num:Num,gap:[],sem:VP]),
{combine(s:Sem,[np:NP,vp:VP])}.
Dalam aturan ini, terlihat juga bahwasanya sebuah kalimat S bukan kalimat berkoordinasi
(berdiri tunggal), bagian NP dan VP memiliki konteks numerikal yang sama (misalnya tunggal).
Konstruksi VP dalam aturan ini harus dalam kondisi yang terbatas (finite), dan secara lengkap
kalimat S merupakan kombinasi antara NP dan VP.
Jika detil dari sebuah konstruksi bahasa alami diambil, misalnya bagian NP, dengan aturan
sebagai berikut:
np([coord:no,num:sg,gap:[],sem:NP])-->pn([sem:PN]),
{combine(np:NP,[pn:PN])}.
Dan dengan aturan PN, sebagai berikut:
pn([sem:Sem])-->
{lexEntry(pn,[symbol:Sym,syntax:Word])},Word,
{semLex(pn,[symbol:Sym,sem:Sem])}.
12
Akan terlihat sekarang, bahwa sebuah tata-bahasa, selain memerlukan kombinasi konstruksi
semantik, juga memerlukan kosa-kata (lewat predikat lexEntry), dan juga aturan semantik dari
leksikon tersebut (semLex).
3.2.
Kombinasi Konstruksi
Kombinasi konstruksi memberikan aturan untuk pengaplikasian fungsional antara bagian
kalimat, atau dengan kata lain melakukan “aplikasi fungsional untuk setiap argumen dalam
ekspresi lambda” yang dikenali dari kalimat. Dalam implementasi BB1, kombinasi konstruksi
dilakukan den
NP
VP, akan menggunakan aturan sebagai berikut:
combine(s:app(A,B),[np:A,vp:B]).
Definisi untuk combine/2, adalah sebagai berikut:
combine(t:Converted,[s:Sem]):betaConvert(Sem,Converted).
Terlihat bahwa dengan cara yang demikian, interpretasi semantik yang dilakukan dapat
dilakukan secara modular, atau dengan kata lain, jika model yang digunakan untuk model
representasi semantik bukan KL, maka definisi combine/2 harus dirubah pada perangkat ini,
dan juga pada perangkat semantik leksikon.
3.3.
Leksikon
Leksikon berisi daftar kata yang akan dikenali di dalam sistem. Dalam daftar kata ini akan
diberikan juga kategori dan fitur dari setiap kata. Sebagai contoh untuk kata dengan kategori PN:
lexEntry(pn,[symbol:ayah,syntax:[ayah]]).
Secara
generik
setiap
entry
dalam
lexicon
dapat
diberikan
dengan
predikat:
lexEntry(Category,Features). Category memberikan jenis konstruksi yang diwakili oleh kata
dalam semantik, sedangkan Features memberikan pasangan atribut-nilai, yang berperan dalam
analisis semantik. Sebagai contoh, symbol ‘ayah’, akan diolah sebagai konstruksi PN, dengan
syntax (tampilan) yang harus muncul dalam kalimat (teks) yang akan dikenali adalah ‘ayah’.
13
Sesuai dengan konstruksi yang diwakili oleh setiap leksikon, maka bisa saja ada fitur yang
membedakan untuk setiap jenis leksikon. Misalnya untuk determinator, memerlukan fitur
kuantifikator untuk kata benda yang ditunjuknya, atau verba transitif, memerlukan fitur untuk
menentukan nilai ‘numerik’ dari kata kerja, sebagai tunggal atau majemuk.
3.4.
Semantik Leksikon
Perangkat semantik leksikon memberikan definisi semantik yang sesungguhnya (seperti sebuah
‘macro’) untuk setiap kata dalam leksikon. Misalnya jika sebuah kata adalah dalam kategori PN,
maka proses KL yang harus dilakukan adalah sebagai berikut:
semLex(pn,M):M = [symbol:Sym, sem:lam(P,app(P,Sym))].
Terlihat dari definisi SemLex untuk PN, bahwa misalnya ‘ayah’ akan diasosiasikan dengan fitur
symbol dalam leksikon, dan representasi semantik lam(X,app(X,ayah)). Contoh lain misalnya
untuk kata benda:
semLex(noun,M):M = [symbol:Sym, sem:lam(X,Formula)], compose(Formula,Sym,[X]).
Terlihat bahwa untuk definisi kata benda, diperlukan mekanisme untuk ‘mengaitkan’ sebuah variabel
sebagai tanda bahwa kata benda harus ‘diisikan’ nantinya dengan sebuah fakta. Proses pemberian variabel
tersebut dilakukan melalui predikat compose/3, sebagai berikut:
compose(Term,Symbol,ArgList):- Term =.. [Symbol|ArgList].
Dengan komposisi arsitektur yang demikian, maka jika ada perubahan yang perlu diubah hanya
pada bagian semantik-nya, sedangkan sintaktiknya dapat dipertahankan.
4.
Permasalahan Lingkup Kuantifikator
Secara khusus dalam buku BB1, diberikan beberapa pendekatan yang dipakai untuk mengatasi
ambiguitas lingkup kuantifikator (scope ambiguities atau underspecified scoping). Permasalahan
14
lingkup kuantifikator muncul sebagai akibat perbedaan interpretasi yang dimunculkan oleh
kehadiran kuanfikator dalam FOL. Misalkan sebuah kalimat: ‘setiap pria mencintai seorang
wanita’. Untuk kalimat ini akan muncul dua interpretasi dalam FOL, yaitu:
1. Ada wanita yang berbeda-beda yang dicintai oleh pria yang berbeda:
^ cinta(x,y))).
2. Ada hanya satu wanita yang dicintai oleh semua pria:
^
cinta(x,y))).
Perbedaan interpretasi ini disebabkan perubahan lingkup kuantifikator eksistensial dalam
kalimat. Pada interpretasi pertama, lingkup kuantifikator ‘seorang wanita’, berada di dalam
lingkup kuantifikator universal untuk ‘semua pria’. Sedangkan pada interpretasi kedua, urutan
munculnya kuantifikator dibalik. Atau dengan kata lain, kuantifikator universal (‘semua pria’)
pada interpretasi pertama memiliki konteks luas, dan kuantifikator eksistensial (‘seorang
wanita’), berkonteks sempit. Peran ini terbalik pada interpretasi kedua.
Peran kuantifikator sebagaimana dijelaskan di atas, tidak muncul pada aturan-aturan sintaktik.
Setiap kata pada kalimat memiliki kategori yang sudah pasti, dan dengan demikian tidak akan
membedakan ‘interpretasi’ yang seharusnya muncul karena perbedaan peran kuantifikator.
Permasalahan yang sebenarnya akan muncul jika dari interpretasi yang diberikan, tidak ada
satupun yang benar-benar merupakan sesuatu yang ‘utuh’ sebagai hasil representasi. Dari contoh
di atas, interpretasi pertama adalah representasi utuh dari analisis sintaktik dan semantik, atau
dengan kata lain langsung mengikuti hasil parsing dari aturan sintaktik, sehingga bisa dianggap
sebagai representasi yang ‘seharusnya’ (weakest representation). Atau dengan kata lain, jika
hasil penguraian ternyata membentuk interpretasi yang berbeda-beda dari analisis sintaksis, dan
jika ada perbedaan implikasi logis dari setiap interpretasi, maka tanpa adanya mekanisme untuk
menentukan lingkup kuantifikator, hanya akan terbentuk satu interpretasi yang belum tentu tepat.
Sistem harus dapat memberikan alternatif kepada pengguna untuk memilih interpretasi yang
‘lebih tepat’, menurut pendapat manusia.
15
4.1.
Pendekatan Montague
Pendekatan Montague, disebut juga dengan istilah pembangkitan kuantifikator (quantifier
rising). Jika ada kuantifikator yang ingin ‘ditonjolkan’, atau ingin diunggulkan terhadap lainnya,
maka kuantifikator tersebut harus dikaitkan dengan sebuah variabel ‘bayangan’, yang disebut
sebagai sebuah ‘placeholder’, yang dapat diberikan index. Variabel bayangan ini akan diisi
sesuai dengan aturan sintaktik pada tingkatan penguraian kalimat yang sesuai. Kuncinya adalah
dengan “merekam” posisi placeholder, dan “memutar”-nya kembali saat muncul pada
kesempatan lain, yaitu saat ingin dicari representasi semantiknya, dengan menerapkan KL.
Pada contoh di atas, pembangkitan kuantifikator, terjadi untuk variabel bayangan z3, yang
melalui KL diaplikasikan untuk ‘seorang wanita’. Kelemahan utama pendekatan Montague,
adalah perlu menambahkan aturan-aturan pada tata-bahasa (grammar), misalnya aturan untuk
memperkenalkan variabel baru, dan juga aturan untuk eliminasi placeholder yang diisikan
dengan pronomina dari fakta (domain) tertentu. Dengan cara seperti ini, arsitektur tidak akan
sefleksibel semula, yaitu jika aturan hanya perlu diubah untuk analisis semantik.
4.2.
Cooper Storage
Dalam representasi dengan menggunakan storage, representasi semantik dibangun secara
langsung tanpa melalui analisis sintaktik. Ide utamanya adalah dengan mengasosiasikan setiap
simpul dalam pohon sintaktik dengan sebuah store, yang berisi sebuah inti dari representasi
semantik bersama dengan kuantifikator dari simpul di bawahnya. Setelah sebuah kalimat
diuraikan, store digunakan untuk membangkitkan representasi lingkup kuantifikator. Store
16
adalah sebuah abstraksi dari representasi semantik berupa list dari n-keterurutan. List bisa berisi
keterurutan tunggal (1-place store
ada) yang dihasilkan oleh analisis semantik (n-place store
Dengan demikian melalui
abstraksi tersebut akan dihasilkan daftar dari urutan KL yang perlu untuk di-binding dengan
fakta di dalam domain. Daftar urutan berisi index dan daftar operator lambda yang perlu untuk
di-binding, yaitu
index binding operators.
Konstruksi semantik dalam storage dapat dengan baik berperan pada frase kata benda (NP) yang
dilengkapi dengan determinator (quantified noun phrase). Ada dua langkah dalam memanipulasi
storage, yaitu membentuk store dan melakukan retrieval.
Aturan untuk membentuk store adalah sebagai berikut (COOPER):
“Jika store
representasi semantik untuk sebuah frase
i
dengan i adalah index yang unik, adalah juga sebuah representasi untuk NP tersebut”.
Strategi besar dalam penentuan store adalah dengan ‘memilih’ sebuah variabel baru secara acak,
yang akan digunakan sebagai placeholder, untuk setiap bagian kalimat yang memiliki frase NP.
Sama sebagaimana yang dilakukan dalam pendekatan Montague, bagian tersebut akan ‘direkam’,
dan diingat bahwa variabel bebasnya perlu untuk diisikan sesuatu. Pada tahap pembentukan store
ini, semua variabel baru masih belum ‘diikat’ dengan lingkupnya, namun pada saat retrieval
nantilah urutannya akan menjadi jelas.
Aturan untuk melakukan retrieval store (COOPER):
“Jika ada
store
dan
berisi urutan untuk binding (kemungkinan bisa kosong), dan jika
diasosiasikan dengan sebuah ekspresi pada kalimat, maka store
i
juga dapat diasosiasikan dengan ekspresi tersebut”.
Contoh Cooper Storage untuk kalimat ‘setiap pria mencintai seorang wanita’, dapat dilihat
sebagai berikut:
17
Pada gambar di atas, untuk setiap simpul yang berisi kuantifikator NP, terbentuk sebuah store.
Store tersebut berisi 2-place. Slot yang pertama adalah untuk identifikasi variabel yang harus dibinding, sedangkan yang kedua untuk identifikasi nomor index variabel yang telah ditentukan
untuk dibuat saat pembentukan store. Slot pertama berisi ‘inti aktif’, yang dipakai untuk
representasi semantiknya, diistilahkan juga sebagai functional-application-in-the-first-method.
Guna menentukan lingkup dari kuantifikator yang akan di-binding, langkah retrieval storage
perlu dilakukan. Retrieval akan membuang index variabel, dan kemudian dikombinasikan
dengan representasi ‘inti aktif’ untuk membentuk representasi inti yang baru. Jika index dan
binding sudah dilebur pada tingkat komponen NP, maka pada saat analisis semantik berada pada
tingkat kalimat (S), yang tersisa adalah 1-place sequence, yang merupakan ekspresi akhir untuk
representasi kalimat. Untuk contoh di atas, adalah z6 dan z7 pada tingkat S. Representasi inti
yang terakhir inilah yang akan menentukan lingkup kuantifikator.
Proses selengkapnya dapat dijelaskan sebagai berikut:
dengan aplikasi
-conversion dihasilkan:
dengan retrieval storage Cooperdidapatkan:
conversion, dihasilkan kuantifikator ‘seorang wanita’ yang memiliki lingkup lebih luas
dibandingkan dengan kuantifikator ‘semua pria’:
^
cinta(x,y))).
18
Metode store memberikan kebebasan dalam memilih variabel yang akan dijadikan sebagai
kuantifikator, dan juga memberikan keleluasaan dalam melakukan retrieval, sehingga perubahan
lingkup kuantifikator dalam kalimat dapat tetap ditelusuri.
Dalam arsitektur BB1, store diimplementasikan sebagai sebuah list, dengan menyiapkan index
untuk binding operator dalam bentuk bo(Quantificator,Index). Quant berisi ekspresi lambda yang
perlu ditelusuri selama retrieval, dan Index merupakan variabel yang akan diisikan saat binding
terjadi.
Perubahan dalam macro semantik, terjadi dalam komponen SemLex, misalnya untuk konstruksi
TV:
semLex(tv,M):M = [symbol:Sym, sem:[lam(K,lam(Y,app(K,lam(X,Formula))))]],compose(Formula,Sym,[Y,X]).
Selain itu, perlu juga untuk mengubah aturan kombinasi dalam komponen SemRules, misalnya
untuk transitif VP:
combine(vp:[app(A,B)|S],[tv:[A],np:[B|S]]).
Aturan untuk combine/2memberikan mekanisme retrieval sebagai berikut:
combine(s:S,[np:[A|S1],vp:[B|S2]]):appendLists(S1,S2,S3),
sRetrieval([app(A,B)|S3],Retrieved),
betaConvert(Retrieved,S).
Dengan mekanisme retrieval yang sesungguhnya sebagai
berikut:
sRetrieval([S],S).
sRetrieval([Sem|Store],S):selectFromList(bo(Q,X),Store,NewStore),
sRetrieval([app(Q,lam(X,Sem))|NewStore],S).
Melalui sifat rekursif yang dimiliki dalam sRetrieval/2, ini menjamin bahwa store akan dapat
‘direduksi’ menjadi elemen yang hanya terdiri atas satu item, yang merupakan representasi
19
lingkup akhir dalam kalimat.
4.3.
Keller Storage
Mekanisme Cooper Storage (CS) telah memberikan kebebasan untuk melakukan retrieval
kuantifikator dalam urutan yang bebas. Namun CS hanya cocok untuk ambiguitas dalam frase
NP dengan determinator, yaitu dengan menggunakan variabel yang dilengkapi co-index dan KL
sebagaimana dalam pendekatan Montague. Perlu diperluas juga mekanisme untuk ambiguitas
yang hadir dalam berbagai bentuk kalimat, seperti misalnya untuk klausa relatif (contoh kalimat
‘setiap perbuatan yang melawan sebuah hukum bertentangan dengan norma sosial’) atau untuk
kalimat dengan frase preposisi dalam NP kompleks (contoh kalimat ‘anto mengenal setiap orang
yang memiliki sebuah sepeda’). Dalam contoh kedua, interpretasi yang mungkin muncul adalah
bahwa anto mengenal pemilik sepeda yang ‘berbeda’, dan interpretasi bahwa hanya ada ‘satu’
sepeda yang dimiliki semua orang. Kedua contoh kalimat di atas juga memberikan adanya
konstruksi NP bersarang, yaitu: ‘setiap perbuatan yang melawan sebuah hukum’, dan ‘setiap
orang yang memiliki sebuah sepeda’. Karena CP memberikan kebebasan dalam memilih
retrieval kuantifikator, mekanisme tersebut tidak memperhitungkan struktur hirarki.
Salah satu cara untuk menyertakan struktur hirarki adalah dengan melakukan kontrol terhadap
variabel bebas pada saat proses retrieval kuantifikator. Keller Storage (KS) memberikan
alternatif solusi terhadap masalah ini, yaitu dengan mengijinkan adanya persarangan storage
(nested storage). Dalam proses pembentukan storage, aturan yang digunakan adalah (KELLER):
“Jika sebuah storage
adalah sebuah interpretasi untuk sebuah NP,
maka
i
sebuah interpretasi untuk NP tersebut.”
Sedangkan untuk aturan retrieval storage adalah sebagai berikut (KELLER):
binding, dan
jika store
ekspresi dalam kalimat lengkap S, maka
interpretasiekspresi tersebut.”
20
i
juga merupakan
Sebagai contoh dalam sub-kalimat NP ‘setiap pemilik sebuah sepeda’, pembentukan KS terjadi
sebagai berikut:
Persarangan storage yang terjadi dalam kalimat lengkap ‘anto mengenal setiap pemilik sebuah
sepeda’ adalah (‘sepeda yang sama untuk semua pemilik’):
<kenal(anto,z2),
Dengan persarangan tersebut, hanya ada satu kemungkinan untuk melakukan retrieval, pertama
mengambil kuantifikator universal, dan diikuti dengan kuantifikator eksistensialnya.
Interpretasi kedua dari kalimat contoh adalah dengan ‘tidak’ melakukan store untuk sub-NP
‘sebuah sepeda’, sehingga dihasilkan penguraian sebagai berikut (‘sepeda yang berbeda’):
21
Persarangan yang terbentuk untuk interpretasi kedua ini adalah:
retrieval storage
yang
dapat
dilakukan
untuk
interpretasi
ini
adalah:
Implementasi Prolog untuk KS, mirip dengan CS, hanya saja pada saat retrieval dilakukan
dengan persarangan, yaitu dengan melakukan binding operator secara bertahap mulai dari
persarangan terdalam pada sRetrieval/2:
sRetrieval([S],S).
sRetrieval([Sem|Store],S):selectFromList(bo([Q|NestedStore],X),Store,TempStore),
appendLists(NestedStore,TempStore,NewStore), sRetrieval([app(Q,lam(X,Sem))|NewStore],S).
4.4.
Hole Semantics
Kelemahan kedua metode storage CS dan KS, adalah keterbatasannya dalam menangani
constraints, yang hanya sebatas pada kuantifikator saja. Dalam kalimat bahasa alami ada lebih
banyak persyaratan yang bisa menghasilkan ambiguitas, seperti: negasi, dan relasi sub-kalimat
(koordinasi). Mengingat bahwa representasi yang digunakan adalah FOL, tentu diperlukan
mekanisme untuk juga menangani ambiguitas pada saat kalimat sudah diubah ke dalam bentuk
formula FOL. Untuk inilah metode Hole Semantics (HS) dikembangkan. HS memberikan
kemungkinan untuk melakukan analisis semantik secara hirarki dalam pohon penguraian kalimat
dengan memperhitungkan urutan kemunculan formula dalam pohon tersebut. Konsep yang
ditawarkan dalam HS adalah dengan memperhitungkan keterurutan (sorted) formula FOL.
Dalam HS dianalogikan bahwa sebuah simpul (sebagai lubang / ‘hole’), dalam pohon penguraian
perlu diisikan oleh subformula yang memenuhi persyaratan. Dengan kata lain, beberapa simpul
22
dalam pohon memiliki dominansi (pada hirarki yang lebih tinggi, disebut dominance constraints)
dibandingkan simpul lainnya, sehingga subformula yang menyusun dominasi tersebut akan dapat
dipakai untuk membentuk representasi semantik yang diinginkan. Formula FOL dapat
mengambil semua bentuk dasar sebagai bagian dari kosa-kata dalam HS, yaitu: NOT, IMP,
h) menyatakan bahwa sebuah posisi h dalam simpul sintaktik l perlu untuk ‘diangkat’ lebih
tinggi, atau dengan kata lain lubang h harus mendominansi simpul yang diberi label l. Metode
HS akan dapat dipakai untuk merepresentasikan sebuah ambiguitas secara utuh, bukan hanya
sebatas pada (sub)formula tertentu saja. Oleh karena itu HS juga sering diistilahkan sebagai
Underspecified Representations (USR).
Bentuk USR untuk contoh kalimat ‘setiap pria mencintai seorang wanita’, dengan interpretasi
^ cinta(x,y))), dapat dinyatakan dalam USR sebagai:
1
2
1(l1:ALL(v1,l2)
^
3
1(l2:IMP(l3,h1)
4
5
2(l4:SOME(v2,l5)
^
6
2(l5:AND(l6,h2)
7(l7:cinta(v1,v2)
^ l7
h1 ^ l7
h2 ^
0(l1
h0 ^ l4
^
^
l3:pria(v1)
^
l6:wanita(v2)
^
h0)))))).
Jika digambarkan bentuk USR yang dihasilkan, sebenarnya menggambarkan keterurutan formula
FOL yang perlu ditelusuri pada saat binding variabel dilakukan, misalnya untuk USR di atas:
23
Dari contoh USR di atas, dapat dilihat bahwa dengan representasi seperti ini terlihat bagaimana
formula l7, ‘dipaksa’ untuk memiliki lingkup yang lebih luas dibandingkan dengan implikasi
dari kuantifikator universal dan konjungsi dari kuantifikator eksistensial. Terlihat juga
bagaimana posisi dari l1 dan l4, berada setingkat dan tidak dapat ‘saling’ mengalahkan. Dengan
demikian penggunaan konsep hole dan dominansi dalam HS, telah memungkinkan adanya
kesetaraan dalam kuantifikator, yang memampukan keleluasaan dalam analisis representasi
untuk keseluruhan kalimat.
Jika USR telah dihasilkan, maka dalam HS, langkah berikutnya adalah melakukan plugging,
yaitu proses “pengisian” lubang dengan representasi yang diinginkan. Plugging adalah proses
yang bersifat pemetaan satu-ke-satu untuk semua h dan l dalam USR. Plugging yang diinginkan
adalah yang bersifat admissable, yaitu jika tidak terbentuk siklus (cycle) saat h dipetakan pada l.
Untuk contoh di atas, terdapat dua cara plugging, P1 (yaitu P1(h0)=l1, P1(h1)=l4, P1(h2)=l7)
dan P2 (yaitu P2(h0)=l4, P2(h1)=l7, P2(h2)=l1). Dengan P1, gambar USR di atas,akan menjadi:
24
Dengan menggunakan P2, maka USR akan menjadi:
Implementasi HS dalam arsitektur dilakukan dengan cara mengubah komponen SemLex dan
SemRules, sehingga dapat mengakomodasikan konsep hole, label dan dominansi. Misalnya
untuk komponen SemLex untuk konstruksi TV:
semLex(tv,M):M=[symbol:Sym
,
sem:lam(Z,lam(X,app(Z,lam(Y,lam(H,lam(L,and(pred2(L,Sym,X,Y),leq(L,H))))))))].
Untuk melakukan kombinasi terhadap konstruksi-konstruksi dalam bagian kalimat, predikat
combine/2 dalam HS, didefinisikan sebagai:
combine(t:U,[s:S]):- betaConvert(some(T,and(hole(T),some(L,and(label(L),app(app(S,T),L))))),U).
Tahapan yang dilakukan pembentukan representasi semantik secara utuh dengan HS, setelah
kalimat diuraikan sebagai USR, adalah sebagai berikut:
1. Lakukan proses skolemisasi untuk setiap variabel dalam USR.
2. Pecahkan USR ke dalam komponen yang lebih kecil, dan masukkan (assert) ke dalam
basis data Prolog.
3. Bentuk plugging yang mungkin dilakukan (admissable plugging).
4. Aplikasikan plugging untuk membentuk formula semantik akhir.
25
Secara garis besar, tahapan di atas dapat diimplementasikan dalam Prolog sebagai berikut:
plugUSR(USR,Sem):numbervars(USR,0,_),
% 1 Skolemise USR
initUSR,
assertUSR(USR),
% 2 Break down and assert USR
top(Top), findall(H,hole(H),Holes),
findall(L,(label(L),\+ parent(_,L)), Labels), plugHoles(Holes,Labels,[]),
% 3 Calculate a
plugging
url2srl(Top,Sem).
4.5.
% 4 Construct SRL formula
Inferensi dalam Perangkat Komputasi Semantik
Representasi semantik dalam bentuk FOL yang dihasilkan melalui KL, pendekatan Montague,
storage ataupun HS adalah usaha untuk merepresentasikan bahasa natural ke dalam bentuk
formal yang dapat dimengerti oleh komputer. Hasil representasi tidak akan memiliki makna bagi
pengguna (manusia) jika hanya dibiarkan sebagai model. Model yang telah tersedia harus dapat
diakses kembali untuk melakukan pelacakan informasi, misalnya melalui sebuah interaksi atau
dialog.
Representasi dalam FOL selain berfungsi sebagai pembentuk model, juga berperan sebagai
perangkat dasar untuk melakukan penalaran atau inferensi. Dalam ranah komputasi semantik,
sebuah inferensi sebenarnya terdiri atas tiga bentuk tugas, yaitu: operasi kueri, analisis
konsistensi, dan analisis informatif. Yang dimaksud dengan operasi kueri adalah usaha untuk
menilai apakah sebuah formula FOL
satisfied) dalam sebuah
model M.
M, dengan kata lain mencoba untuk menilai satisfiabilitas (masuk akal atau tidak) sebuah
dalam model M, dengan kata lain, ingin menilai sejauh mana sebuah formula berperan dalam
pembentukan nilai informasi baru di dalam sebuah model.
Ketiga tugas ini sebenarnya saling terkait satu dengan lainnya. Operasi kueri memungkinkan
proses bahwa sistem dapat menerima informasi dan mengakses model, yang pada akhirnya akan
26
dapat ditentukan apakah informasi tersebut konsisten atau tidak di dalam model, juga untuk
menilai apakah informasi tersebut membentuk sebuah fakta baru atau tidak. Sebagai contoh, jika
misalkan di dalam model tersedia informasi ‘anto seorang pria’. Kemudian melalui operasi kueri,
dimasukkan informasi tambahan bahwa ‘anto bukan seorang pria’, maka sebenarnya informasi
yang dimasukkan tersebut bukan informasi yang konsisten dengan model, karena saling
bertentangan. Atau jika dimasukkan informasi ‘anto makan bakso’, maka dapat dinilai bahwa
informasi tersebut informatif (valid) di dalam model, karena merupakan informasi baru. Secara
abstraksi, tugas untuk analisis konsistensi dan analisis informatif merupakan sesuatu yang
bersifat tidak mutlak (undecidable), karena jumlah model yang dapat ditampung dalam mesin
inferensi tidak terbatas jumlahnya, dan tidak mungkin untuk menilai konsistensi dan
informativitas untuk semua model yang tidak terbatas tersebut. Oleh karena inilah perlu dibentuk
solusi parsial yang hanya melihat konsistensi dan validitas tersebut dari domain yang terbatas,
yaitu sebatas kalimat-kalimat yang dimasukkan ke dalam sistem dan dicari representasi
semantiknya.
Cara yang paling sederhana untuk melakukan evaluasi konsistensi adalah dengan sebuah model
checker (MC). Untuk membuat sebuah MC, diperlukan tiga tahap, yaitu: pertama, menentukan
bagaimana
model
direpresentasikan.
Kedua,
menentukan
bagaimana
formula
FOL
direpresentasikan. Dan ketiga, bagaimana representasi model dan formula yang telah terbentuk
dalam dua tahap sebelumnya dapat ditelusuri alokasi variabelnya, yaitu untuk menilai apakah
penggunaan ‘semantik’ variabel dalam formula telah memenuhi batasan domain
yang
ditentukan. Salah satu implementasi yang ditawarkan dalam BB1, adalah dengan menggunakan
predikat satisfy/4, yang memiliki 4 argumen sebagai berikut: satisfy(Formula,Model,
Assignment,Result).
Definisi predikat satisfy/4 sangat bergantung pada komposisi formula dalam kalimat yang
hendak dibentuk representasi semantiknya. Formula dapat berisi sub-formula yang merupakan
semua kemungkinan komposisi formula dalam FOL, yaitu: kuantifikator eksistensial dan
universal, disjungsi, konjungsi, implikasi, negasi, persamaan (ekualitas), predikat relasi tunggal
(one-place predicates) dan predikat relasi ganda (two-place predicates). Misalkan terdapat
sebuah representasi model:
example(3,model([d1,d2],[f(0,anto,d1),f(0,tuti,d2),f(1,pria,d1),f(1,wanita,d2),f(2,cinta,[d1,d2])])).
27
Dalam model ini terdapat dua domain, d1 dan d2. Anto adalah konstanta (one-place predicates)
yang mengisi domain d1, dan tuti mengisi domain d2. Di dalam model ini terdapat juga relasi
(two-place predicates) ‘cinta’, yang menghubungkan isi domain d1 dan d2. Dengan
menggunakan predikat satisfy/4, akan dapat dinilai misalnya sebuah formula FOL,
‘cinta(anto,mia)^wanita(tuti)’, memenuhi model dengan nomor 3 atau tidak. Yang menjadi kunci
adalah trik untuk membentuk komposisi formula ke dalam bentuk yang lebih sederhana (subformula), kemudian melihat apakah ada interpretasi variabel dan term (konstanta), sepanjang
perjalanan evaluasi formula di dalam domain yang menggunakan data struktur list. Untuk contoh
di atas, pertama-tama sistem akan menghasilkan dua sub-formula dengan melepas konjungsi,
melalui predikat satisfy/4 untuk konjungsi sebagai berikut:
satisfy(Formula,Model,G,pos):nonvar(Formula),
Formula = and(Formula1,Formula2),
satisfy(Formula1,Model,G,pos),
satisfy(Formula2,Model,G,pos).
Sub-formula pertama akan dievaluasi sebagai two-place predicates, dan yang kedua sebagai oneplace predicates. Pada saat evaluasi sub-formula inilah akan diketahui interpretasi formula yang
sebenarnya di dalam domain, dengan menggunakan predikat i/4 sebagai berikut:
i(X,model(D,F),G,Value):-(
var(X), memberList(g(Y,Value),G),
X==Y, !, memberList(Value,D)
;
atom(X), memberList(f(0,X,Value),F)).
28
Untuk contoh di atas, formula dalam bentuk konjungsi tidak memenuhi model, karena di dalam
model, tidak ada domain (baik sebagai variabel ataupun atom), untuk relasi ‘cinta(anto,mia)’,
sehingga bernilai salah, meskipun relasi ‘wanita(tuti)’bernilai benar.
Penggunaan model checker dalam interpretasi semantik hanya dapat digunakan jika variabel
telah diisikan dengan konstanta, dan tidak dapat dipakai untuk menginterpretasikan kalimat
(formula) yang mengandung kuantifikator. Untuk melakukan inferensi dalam FOL, kuantifikator
(eksistensial) harus diolah terlebih dahulu sehingga interpretasi semantik dengan metode yang
ada, seperti: CS, KS ataupun HS, dapat dilakukan. Pengolahan kuantifikator memerlukan strategi
unifikasi. Unifikasi dalam FOL dapat dijamin jika formula direprentasikan sebagai klausa normal
konjungsi (conjunctive normal form / CNF), yaitu jika semua komposisi semua klausa dalam
(sub)-formula dilakukan melalui simbol konjungsi (^), misalnya: (pvq)^(rv~qvs)^(gv~s).
Langkah-langkah yang diperlukan untuk membentuk CNF dari sebuah formula FOL adalah:
1. Mereduksi semua (sub)-formula ke dalam bentuk normal negasi (negation normal form /
NNF).
2. Membuang semua kuantifikator eksistensial dengan skolemisasi.
3. Membuang semua kuantifikator universal.
4. Menempatkan formula yang sudah tidak memiliki kuantifikator ke dalam bentuk CNF.
Implementasi tingkat tinggi dalam Prolog untuk proses CNF, misalnya:
cnf(Formula,SetCNF):- nnf(Formula,NNF),
skolemise(NNF,Skolemised,[]),
cnf([[Skolemised]],[],CNF),
setCnf(CNF,SetCNF).
Jika CNF telah dihasilkan maka formula akhir tersebut akan dapat diunifikasikan ke dalam
model. Unifikasi dapat diartikan sebagai usaha untuk melakukan substitusi dua term dari formula
ke dalam domain sehingga menjadi identik. Sebelum unifikasi dilakukan, perlu dilakukan juga
‘penyederhanaan’ variabel terhadap klausa-klausa yang redundant, sehingga
memiliki
interpretasi yang unik. Misalnya terdapat klausa [A(m), A(y), B(n,x), B(y,z), ~C(w),
~C(f(z)], maka bisa disederhanakan menjadi [A(m), B(n,x), B(m,z), ~c(f(z)] atau menjadi [A(m),
A(n), B(n,x), ~C(f(x)]. Klausa yang sudah sederhana ini disebut sebagai non-redundant factors.
29
Hasil akhir sebuah proses unifikasi adalah proses resolusi, yaitu usaha untuk menghilangkan
fakta-fakta yang saling bertentangan untuk menjamin konsistensi dalam model. Jika resolusi
berhasil dilakukan maka unifikasi yang dihasilkan adalah konsisten.
Klausa utama dalam melakukan resolusi, misalnya:
rprove(Formula):cnf(not(Formula),CNF), nonRedundantFactors(CNF,NRF), refute(NRF). Dalam proses pembentukan
non-redundant factors, dilakukan pula occurs-check, terhadap dua variabel. Dengan cara ini sebuah
variabel hanya akan berunifikasi dengan term jika term tersebuttidak berisi variabel dengan nama yang
sama, atau dengan kata lain terbentuk “sound- unification”.
Arsitektur dalam BB1, selain menggunakan model checker, untuk menjamin optimasi pada saat
analisis konsistensi dan analisis informatif, digunakan perangkat terpisah, yaitu: theorem prover
(TP) dan model builder (MB). Perbedaan antara keduanya terletak pada proses unifikasi. Dalam
sebuah TP, unifikasi formula dilakukan dengan mencoba melakukan resolusi pada model yang
‘dimasukkan’ ke dalam sistem (negative check). Sedangkan dalam MB, mencoba untuk
‘membentuk’ model dari formula yang dimasukkan, atau dengan kata lain dari sebuah deskripsi
(kalimat) akan dibuat sebuah gambaran keadaan yang membuat deskripsi tersebut benar (positive
check). Contoh TP yang dapat digunakan dalam arsitektur BB1, antara lain: Bliksem, Otter,
Gandalf. Contoh MB untuk arsitektur BB1, antara lain: Mace, Paradox, Satchmo.
4.6.
Permasalahan Representasi Semantik
Representasi FOL dan usaha untuk analisis konsistensi / analisis informatif formula di dalam
model sering dilakukan keadaan parsial, yang tentu saja bertolak belakang dengan kenyataan
bahwa sebenarnya model dari dunia riil sifatnya tidak berhingga. Dengan kata lain konsistensi
dan informativitas adalah sesuatu yang sifatnya undecidable.
Permasalahan lain juga muncul dalam bentuk yang lebih fundamental, yaitu bahwa bentuk
representasi semantik dapat dilakukan dengan berbagai macam pendekatan. Telah diuraikan
dalam bagian terdahulu bahwa dengan representasi formula FOL, berbagai bentuk representasi
semantik dapat dibuat, seperti: Montague, CS, KS, dan HS. Semua pendekatan tersebut
sebenarnya dilakukan untuk menjamin fleksibilitas dalam menangani ambiguitas semantik. Dari
30
berbagai pendekatan yang telah dibahas, semua masih berkutat pada ranah ambiguitas
kuantifikator (secara khusus yang bersifat eksistensial), dan belum pada ranah pembentukan
semesta pembicaraan (discourse). Pembentukan semesta ini penting untuk menjamin pilihan
model yang akan dipakai untuk memenuhi analisis konsistensi dan pembentukan informasi baru.
Untuk melakukan tanya jawab dengan sistem, pengguna harus dapat memasukkan informasi
(berupa bahasa natural) ke dalam sistem, yang harus diinterpretasikan bukan hanya secara
representasi sintaktik ke representasi semantik berdasarkan leksikon, tapi juga harus sesuai
dengan ‘maksud’ yang lazim dalam pembicaraan manusia. Salah satu cara untuk membentuk
nilai semantik untuk semesta pembicaraan, adalah dengan memberikan keterkaitan konsep secara
intrinsik (intrinsic literal) yang terkandung dalam setiap predikat dan variabel. Dengan cara
seperti ini akan terlihat ‘peran’ dari setiap relasi antara predikat dengan variabel. Sebagai contoh
untuk kalimat ‘ayah makan sepiring nasi’, selain representasi kuantifikator, dapat diberikan
tambahan konsep yang memperjelas peran dari setiap relasi / predikat, misalnya:
pred(event,z) ^
rel(agent,z,x) ^ rel(patient,z,y)) Dengan interpretasi intrinsik bahwa ada seorang ‘agent’ ayah
sedang melakukan ‘event’ makan dengan obyek / ‘patient’ nasi. Interpretasi intrinsik ini
berkaitan dengan interpretasi ekstrinsik yang dalam hal ini terjadi secara sintaktik sesuai bentuk
tata bahasa yang digunakan, sehingga dalam contoh ini misalnya dapat ditentukan bahwa ‘event’
makan adalah sebuah komponen TV dengan determinator yang sifatnya nonreflexive. Contoh
representasi intrinsik seperti ini, dikenal sebagai pendekatan ‘neo-davidsonian’ [Larasati, Dian
Septina. 2007], yang membentuk konteks intrinsik sebagai predikat terhadap obyek dan event,
yang juga turut melibatkan analisis variabel (argumen) melalui interpretasi ekstrinsik dengan
aturan sintaktik, sehingga secara keseluruhan membentuk keutuhan analisis semantik.
Jika interpretasi intrinsik, seperti dicontohkan di atas, dapat dihasilkan, maka proses tanya-jawab
dengan sistem dapat dengan lebih tepat dilakukan sesuai dengan tipe pertanyaan. Misalnya jika
pengguna bertanya ke dalam sistem ‘siapa makan sepiring nasi?’, maka kata ‘siapa’ dapat
dijadikan sebagai acuan untuk mencari jawaban (‘ayah), yaitu suatu predikat di dalam model
yang berupa ‘agent’ dan mengandung komponen ‘PN’.
Pendekatan-pendekatan yang telah dibicarakan sebelumnya dalam laporan ini, tidak
31
memungkinkan analisis intrinsik internal, sehingga perlu adanya pendekatan lain yang juga dapat
dipakai sebagai pembentuk semesta pembicaraan, yaitu Discourse Representation Theory
(DRT).
5.
Discourse Representation Theory
Pembahasan mengenai DRT dalam laporan ini dilandasi dengan arsitektur dalam BB1, yang
diperluas dengan pembentukan DRT sebagaimana dituliskan dalam buku “Representation and
Inference for Natural Language, Vol. II Working with Discourse Representation Structures”,
oleh Patrick Blackburn dan Johan Bos [Blackburn, P. & Bos, J. 1999], selanjutnya disebut
sebagai BB2.
5.1.
Discourse Representation Structures
Sebuah Discourse Representation Structures (DRS) adalah yang mengimplementasi konsep
DRT yang pada awalnya diusulkan oleh [Kamp, H. 1984] dan [Heim, I. 1982]. DRS dapat
diasumsikan sebagai sebuah model pemikiran yang dibentuk selama proses pemasukan fakta ke
dalam sistem. DRS dapat digambarkan sebagai kotak yang secara dinamis dapat berisi berbagai
fakta dalam semesta.
DRS memiliki kosa-kata yang beririsan dengan FOL. DRS memiliki simbol-simbol logika
DRS dapat dimasukkan simbol-simbol x, y, z, dsb yang merepresentasikan variabel atau
referents. Dalam DRS tidak terdapat kuantifikator, karena konsep lingkup kuantifikator sudah
diambil alih dalam bentuk semesta pembicaraan, yang direpresentasikan dengan ‘kotak’.
32
Representasi DRS terdiri atas sebuah himpunan variabel dan sebuah himpunan kondisi. Dalam
Prolog representasi ini dapat dituliskan sebagai drs(Ref, Cond). Misalkan untuk contoh kalimat
‘ayah makan sepiring nasi’, DRS yang terbentuk dapat digambarkan sebagai berikut:
| x3 x2 x1
|
|------------------|
| ayah(x3)
|
| nasi(x2)
|
| makan(x1)
|
| agent(x1,x3)
|
| patient(x1,x2)
|
| nonreflexive(x1) |
| event(x1)
|
|
|
Representasi sintaksis dan analisis semantik terhadap DRS yang terbentuk tersebut dapat
digambarkan sebagai berikut:
33
Dengan adanya kemiripan kosa-kata antara DRS dengan FOL, representasi DRS di atas juga
dapat dituliskan dalam bentuk formula FOL sebagai berikut:
drs([A, B, C], [pred(ayah,A), pred(nasi, B), pred(makan, C), rel(agent, C, A), rel(patient, C,B),
pred(nonreflexive, C), pred(event, C)])
Dari gambar DRS di atas, x1, x2 dan x3 adalah variabel yang mengikat kosa-kata yang dikenali
dengan aturan semantik pada komponen SemRules dan SemLex, sebagaimana dalam BB1, tapi
yang diperluas untuk DRS. Daftar kata-kata (komponen Lexicon) dan aturan tata bahasa
(komponen Grammar) dari BB1 dapat dipertahankan.
Aturan dalam SemLex untuk DRS harus disesuaikan sehingga di dalam DRS terjadi pengikatan
variabel dan kondisi, dengan tetap menggunakan konsep KL. Misalnya untuk aturan struktur PN,
aturan SemLex DRS-nya adalah:
semLex(pn,M):M = [symbol:Sym, sem:lam(P,alfa(nam,drs([X],[pred(Sym,X)]),app(P,X)))].
Aturan ini menyiratkan bahwa variabel x adalah sebuah DRS yang diikat (melalui proses KL), dengan
sebuah kata yang berpredikat dan dalam tipe PN.
Jika dibandingkan dengan arsitektur BB1, pembuatan DRS melalui analisis sintaktik DCG
memiliki proses yang sama. Perbedaan yang ada terletak pada saat kombinasi antara struktur
kalimat dilakukan. Dalam DRS, kombinasi dilakukan dengan melakukan penggabungan DRS
(merge DRS). Perubahan yang terjadi dalam SemRules (combine/2) untuk DRS, misalnya untuk
menggabungkan antara TV dan NP, seperti contoh di atas, adalah:
combine(t:Drs,[s:S,t:T]):- betaConvert(mergeDrs(app(S,lam(E,drs([],[pred(event,E)]))),T),Drs).
combine(vp:app(A,B),[tv:A,np:B]).
Dengan aturan untuk mergeDrs/2, adalah sebagai berikut:
34
mergeDrs(merge(G1,G2),drs(Disc3,Cond3)):mergeDrs(G1,drs(Disc1,Cond1)),
mergeDrs(G2,drs(Disc2,Cond2)),
appendLists(Disc1,Disc2,Disc3),
appendLists(Cond1,Cond2,Cond3).
Proses penggabungan terjadi secara rekursif dengan menggunakan data struktur list, sehingga
dapat membentuk DRS yang kompleks.
5.2.
Resolusi Referensi dan Presupposisi
Konsep DRS sebagaimana dijelaskan dalam bagian sebelumnya memungkinkan terbentuknya
sub-ordinasi (kotak di dalam kotak). Dengan cara seperti ini referensi pronomina (anafora) dan
juga presupposisi dapat dideteksi, dan dibatasi dengan membentuk DRS di dalam DRS.
Mekanisme untuk menyelesaikan referensi anafora dan presupposisi di dalam DRS
memanfaatkan kondisi ekualitas (‘=’). Dalam DRS dimungkinkan untuk memberikan kondisi
x=y, yang berlaku dalam DRS tertentu, sehingga y dapat diakses dari DRS lain yang memiliki x.
Dengan kata lain, sebuah variabel dapat memiliki referensi yang sama dalam sebuah DRS jika
berada dalam DRS yang sama atau dalam sub-ordinasi yang dapat diakses.
Sebagai contoh, jika seandainya dimasukkan dua kalimat ke dalam sistem: ‘ayah memakan
sepiring nasi’, dan ‘ dia tidak makan sepiring nasi’.
Untuk kalimat contoh di atas, bisa terbentuk interpretasi DRS sebagai berikut:
35
Interpretation 1: consistent, informative, 0 local violations.
| x3 x5 x4
|
|--------------------------|
| neuter(x3)
|
| ayah(x3)
|
| nasi(x5)
|
| makan(x4)
|
| agent(x4,x3)
|
| patient(x4,x5)
|
| nonreflexive(x4)
|
| event(x4)
|
|
|
|
| x2 x1
|
|
||
|------------------| |
| | nasi(x2)
||
|
| makan(x1)
||
|
| agent(x1,x3)
||
|
| patient(x1,x2)
||
|
| nonreflexive(x1) | |
|
| event(x1)
||
|
|
||
|
|
Dalam interpretasi DRS di atas, terlihat bahwa ‘ayah(x3)’, dan ‘dia’ (= neuter (x3)), mengacu
pada semantik yang sama, yaitu ‘ayah’.
Hal yang menarik juga terjadi untuk bentuk negasi pada kalimat kedua ‘dia tidak makan nasi’.
DRS bisa mengahasilkan interpretasi yang menyatakan bahwa sebuah event yang sama, yaitu
‘makan nasi’ tidak dapat terjadi secara bersamaan (event (x1) dan event (x4)). Jika keduanya
36
terjadi bersamaan, maka akan terjadi inkonsistensi dalam model, seperti terlihat dalam DRS
berikut ini:
Interpretation 2: inconsistent.
| x3 x5 x4
|
|--------------------------|
| neuter(x3)
|
| ayah(x3)
|
| nasi(x5)
|
| makan(x4)
|
| agent(x4,x3)
|
| patient(x4,x5)
|
| nonreflexive(x4)
|
| event(x4)
|
|
|
|
| x2 x1
|
|
||
|------------------| |
| | nasi(x2)
||
|
| makan(x1)
||
|
| agent(x1,x3)
||
|
| patient(x1,x2)
||
|
| nonreflexive(x1) | |
|
| event(x1)
||
|
|
||
|
|
37
DRS juga dapat menginterpretasikan inkonsistensi yang akan terjadi jika dua event makan (x1
dan x4) dengan dua agent (x3 dan x5) berada dalam event yang sama. Atau dengan kata lain,
kedua event tersebut harus terjadi dalam model yang berbeda. Gambar interpretasi DRS untuk
keadaan ini dapat dilihat sebagai berikut:
Interpretation 3: inconsistent.
| x5 x3 x4
|
|--------------------------|
| neuter(x3)
|
| ayah(x5)
|
| nasi(x3)
|
| makan(x4)
|
| agent(x4,x5)
|
| patient(x4,x3)
|
| nonreflexive(x4)
|
| event(x4)
|
|
|
|
| x2 x1
|
|
||
|------------------| |
| | nasi(x2)
||
|
| makan(x1)
||
|
| agent(x1,x3)
||
|
| patient(x1,x2)
||
|
| nonreflexive(x1) | |
|
| event(x1)
||
|
|
||
|
|
Algoritma yang digunakan dalam pendeteksian anafora dan presupposisi secara ringkas dapat
38
dijelaskan sebagai berikut:
1. Bentuk sebuah DRS dari kalimat yang dimasukkan untuk semua bentuk anafora dan
presupposisi sebagai reduksi beta dan alfa.
2. Gabungkan DRS yang terbentuk dengan DRS yang sudah ada sebelumnya.
3. Lakukan traversal di dalam DRS yang telah digabungkan secara lokal untuk
mendeteksi konsistensi pada sub-ordinasi. Jika terjadi reduksi alfa, lakukan
a. Hubungkan informasi anafora untuk sub-ordinasi DRS yang dapat diakses,
dengan melakukan mekanisme free-variable-check.
b. Jika gagal, sampaikan informasi anafora untuk super-ordinasi
4. Buang interpretasi DRS yang tidak memiliki variabel bebas, karena tidak memiliki
resolusi anafora di dalamnya.
Sesuai mekanisme di atas, bisa saja terbentuk lebih dari satu interpretasi DRS pada saat traversal
dilakukan pada sub- dan super-ordinasi. Untuk menyesuaikan dengan kebutuhan, pengguna
dapat memilih salah satu interpretasi DRS yang terbentuk sebagai sebuah semesta pembicaraan.
Jika semesta pembicaraan sudah dipilih, maka mekanisme tanya jawab antara pengguna dengan
sistem akan mengikuti model dan formula FOL dari DRS yang dipilih tersebut.
39
6.
Mekanisme Tanya Jawab dengan Analisis Semantik
Terkait dengan studi mandiri ini, sebuah solusi parsial telah dikembangkan untuk melakukan
tanya jawab dari sebuah model DRS. Solusi ini mengandalkan pada konsep unifikasi antara
formula FOL dari pertanyaan dan DRS yang dipilih untuk mewakili semesta pembicaraan.
Jika ada sebuah pertanyaan dari pengguna ke dalam sistem, maka sistem akan terlebih dahulu
melakukan analisis semantik dengan menguraikan pertanyaan sesuai aturan tata-bahasa sebagai
berikut:
q([sem:Sem])-->
whnp([num:Num,sem:NP]), vp([coord:_,inf:fin,num:Num,gap:[],sem:VP]),
{combine(q:Sem,[whnp:NP,vp:VP])}.
Aturan ini menyatakan bahwa sebuah pertanyaan akan diinterpretasikan sebagai gabungan antara
kata tanya dalam struktur NP dan sisa kalimat dalam struktur VP.
Diperlukan lebih banyak aturan untuk mengidentifikasi kata tanya yang memberikan tipe
pertanyaan. Namun dalam laporan ini hanya dibahas mengenai tipe pertanyaan yang dapat
dijawab dengan pronomina (PN), misalnya untuk kata tanya ‘siapa’, dengan aturan ‘whnp’
sebagai berikut:
whnp([num:sg,sem:NP])-->
qnp([mood:int,sem:QNP]),
{combine(whnp:NP,[qnp:QNP])}.
Lewat aturan ini, sistem akan mengetahui bahwa kalimat yang dimasukkan adalah kalimat tanya,
dengan aturan ‘qnp’ sebagai berikut:
qnp([mood:M,sem:Sem])-->
{lexEntry(qnp,[symbol:Symbol,syntax:Word,mood:M,type:Type])},Word,
{semLex(qnp,[type:Type,symbol:Symbol,sem: Sem])}.
40
Dalam komponen lexicon, diperlukan penyesuaian pada simbol kata ‘siapa’ sebagai Person,
sehingga diinterpretasikan sebagai variabel pada saat pembentukan DRS. Hal ini dilakukan
dengan aturan LexEntry sebagai berikut:
lexEntry(qnp,[symbol:Person,syntax:[who],mood:int,type:wh]).
Aturan dalam komponen SemLex untuk variabel Person perlu dibuat, sehingga DRS kalimat
pertanyaan dapat disesuaikan bentuknya dengan DRS yang telah terbentuk sebelumnya, sebagai
berikut:
semLex(qnp,M):M=[type:wh,symbol:Sym,
sem:lam(P,alfa(nam,drs([X],[pred(Sym,X)]),app(P,X)))].
Untuk aturan kombinasi kalimat tanya, diperlukan aturan sebagai berikut di dalam perangkat
SemLex:
combine(q:app(A,B),[whnp:A,vp:B]).
combine(whnp:A,[qnp:A]).
Setelah interpretasi DRS terhadap kalimat tanya terbentuk, maka langkah berikutnya adalah
mencoba melakukan unifikasi antara formula FOL dari kalimat tanya dan formula FOL untuk
DRS yang dipilih. Proses unifikasi ini dilakukan dengan memanfaatkan predikat unifiable/3 dari
Prolog, seperti berikut ini:
prosesQ(QFOL,SelFol,X):unifiable(QFOL,SelFol,X).
Hasil unifikasi adalah himpunan nilai variabel, maka untuk mendapatkan jawaban akhir adalah
dengan membuang dari himpunan tersebut, nilai yang bukan merupakan PN.
Contoh jalannya mekanisme sesi tanya jawab, dapat dilihat sebagai berikut:
41
ready> ayah makan sepiring nasi.ready>
interpretations.
Interpretation 1: consistent, informative, 0 local violations.
drs([_G8812, _G8815, _G8818], [pred(ayah, _G8812), pred(nasi, _G8815),pred(makan,
_G8818), rel(agent, _G8818, _G8812), rel(patient, _G8818,
_G8815), pred(nonreflexive, _G8818), pred(event, _G8818)])
model([d1], [f(1, event, []), f(1, thing, []), f(1, neuter, []), f(1,
male, []), f(1, female, []), f(1, ayah, []), f(1, makan, []), f(2, agent,
[]), f(1, nonreflexive, []), f(1, nasi, []), f(2, patient, [])])ready> select 1.
ready> query.
ready> siapa makan sepiring nasi? FOL
of the selected discourse:
some(_G6487,some(_G6490,some(_G6493,and(pred(ayah,_G6487),and(pred(nasi,_G
6490),and(pred(makan,_G6493),and(rel(agent,_G6493,_G6487),and(rel(patie
nt,_G6493,_G6490),and(pred(nonreflexive,_G6493),pred(event,
_G6493))))))))))
FOL of the query:
some(_G6241,some(_G6244,some(_G6247,and(pred(_G6253,_G6241),and(pred(nasi,
_G6244),and(pred(makan,_G6247),and(rel(agent,_G6247,_G6241),and(rel(pat
ient,_G6247,_G6244),and(pred(nonreflexive,_G6247),pred(event,
_G6247))))))))))
42
Hasil unifikasi formula DRS pertanyaan dengan semesta pembicaraan adalah:
[_G6562=ayah,_G6568=_G6569, _G6574=_G6575, _G6580=_G6581]
Jawaban akhir dari sistem adalah:
ready> answer: ayah
7.
Kesimpulan dan Penelitian Lanjutan
Dalam laporan telah dituliskan peranan formula FOL dalam upaya untuk melakukan tanya jawab
dari sebuah semesta pembicaraan. FOL dapat digunakan untuk melakukan representasi semantik
yang dapat diperluas guna mengatasi berbagai permasalahan ambiguitas, misalnya untuk
ambiguitas kuantifikator dapat digunakan pendekatan Montague, Cooper Storage, Keller Storage
dan Hole Semantics. Untuk mengatasi ambiguitas dalam konteks yang lebih luas, FOL harus
dilengkapi dengan konsep Discourse Representation Structure, yang dapat dipakai untuk
memilih semesta pembicaraan. Melalui pemilihan semesta pembicaraan inilah, sebuah
mekanisme tanya-jawab dapat dibangun, yang merepresentasikan kebutuhan dari pengguna.
Keterbatasan mekanisme tanya jawab yang telah dikembangkan saat ini adalah keterbatasan
dalam melakukan inferensi yang sangat tergantung pada struktur kalimat hasil analisis semantik
dan sintaktik. Hal ini terjadi karena sistem masih belum dapat melakukan inferensi dari model,
dan hanya sebatas pada unifikasi formula FOL antara kalimat tanya dengan semesta
pembicaraan.
Penelitian lanjutan yang dapat dilakukan adalah dengan mencoba memanfaatkan aksioma
ataupun background knowledge, sehingga inferensi dapat dilakukan berdasarkan model semesta
pembicaraan yang dipilih. Selain itu akan menarik pula, jika sistem dapat memiliki interpretasi
konteks pembicaraan yang diambil dari sekumpulan dokumen (korpus), dan bukan hanya yang
berasal dari dialog singkat dengan pengguna. Jika sistem memiliki interpretasi yang sudah built43
in (misalnya dengan adanya background knowledge atau world knowledge), maka materi yang
dipakai dalam penalaran akan menjadi lebih luas, dan bisa memiliki variasi jawaban.
44
Referensi
Blackburn, P. & Bos, J. 2005. Representation and Inference for Natural Language: A First
Course in Computational Semantics. Center for the Study of Language and Information
(CLSI) Publications.
Blackburn, P. & Bos, J. 2003. Computational Semantics. Theoria 18(1), pp. 27-45.
Blackburn, P. & Bos, J. 1999. Representation and Inference for Natural Language: A First
Course in Computational Semantics. Volume II Working with Discourse Representation
Structures. Book Draft. Available at: http://www.blackburnbos.org.
Bos, Johan. 2006. The “La Sapienza” Question Answering System at TREC 2006.
Buscaldi, D., Rosso, P., Gómez-Soriano, J.M., Sanchis, E. 2009. Answering questions with
an n-gram based passage retrieval engine. Journal of Intelligent Information System (82),
Springer.
Furbach, Ulrich; Glockner, Ingo; Helbig, Hermann and Bjorn Pelzer. 2009. LogAnswer - A
Deduction-Based Question Answering System. Proceedings CLEF 2009.
Heim, I. 1982. The Semantics of Definite and Indefinite Noun Phrases. Ph.D. thesis,
University of Massachusetts.
Kamp, H. 1984. A Theory of Truth and Semantic Representation. In J. Groenendijk, T.M.
Janssen, and M. Stokhof (Eds.), Truth, Interpretation and Information: Selected Papers
from the Third Amsterdam Colloquium, pp. 1-41. Dordrecht – Holland/Cinnaminson –
U.S.A.: Foris
Larasati, Dian Septina. 2007. Pengembangan Awal Analisis Semantik Bahasa Indonesia
dengan Metode Syntax-Driven Semantic Analysis dan Penerapannya dalam Sistem Tanya
Jawab. Bachelor Thesis Faculty of Computer Science University of Indonesia.
Lin, Jimmy & Katz, Boris. 2003. Question Answering Techniques for the World Wide Web.
Tutorial presentation at The 11th Conference of the European Chapter of the Association
of Computational Linguistics (EACL-2003).
Lopez, Vanessa; Sabou, Marta; Uren, Victoria; & Motta, Enrico. 2009a. Cross-Ontology
Question Answering on the Semantic Web –an initial evaluation. In Proc. of Knowledge
Capture Conference.
Lopez, Vanessa; Sabou, Marta; Uren, Victoria; & Motta, Enrico. 2009b. Merging and
Ranking answers in the Semantic Web: The Wisdom of Crowds. Lecture Notes in
Computer Science (LNCS) Volume 5926/2009. Springer Berlin, Heidelberg.
Saias, Jose & Quaresma, Paulo. 2007. The Senso Question Answering approach to
Portuguese [email protected]
Schlaefer, Nico; Gieselmann, Petra; Schaaf, Thomas & Waibel, Alex. 2006. A Pattern
Learning Approach to Question Answering Within the Ephyra Framework. Lecture Notes
in Computer Science (LNCS) Volume 4188/2006.
Schlaefer, Nico & Ko, Jeongwoo. 2007. Semantic Extensions of the Ephyra QA System for
TREC 2007. In Proceedings of the 16th Text REtrieval Conference (TREC 2007).
Strzalkowski, Tomek; Small, Sharon; Hardy, Hilda; Yamrom, Boris; Liu, Ting; Kantor, Paul;
Ng, K.B.; Wacholder, Nina. 2005. HITIQA: A Question Answering Analytical Tool.
32
View publication stats
Download