Modul Word Graph Frasa Kata Pada Bogordelftconsrtuct

advertisement
6
dibatasi. Frasa ini dapat dipecahkan
dengan menyisipkan kata oleh dan yang
dilakukan oleh. Misalnya: dihadapi petani
dan ditampung pihak swasta.
3
Relasi objektif adalah relasi yang kata
keduanya sebenarnya menjadi objek dari
kata pertama. Frasa ini sebenarnya hasil
substantivasi frasa objektif direktif. Frasa
ini dapat dipecahkan dengan menggunakan
kata akan, kepada, dan tentang. Misalnya:
menghasilkan tekstur dan memenuhi
kebutuhan pangan.
4
Relasi tujuan adalah relasi yang
pembatasnya merupakan tujuan dari kata
yang dibatasi. Frasa ini dapat dipecahkan
dengan kata bagi, buat, guna, dan untuk.
Misalnya: makanan rakyat dan untuk
membeli solar.
5
Relasi keahlian adalah relasi yang
pembatasnya merupakan keahlian dari kata
yang dibatasi. Dapat digunakan kata dalam
bidang untuk memisahkan frasa itu.
Misalnya: petani kelapa dan dokter ahli
saraf.
6
7
8
9
10
Relasi asal adalah relasi yang pembatasnya
merupakan asal dari kata yang dibatasi.
Frasa ini dapat dipecahkan dengan
menyisipkan kata dari dan yang berasal
dari. Misalnya: tenaga mesin dan dari
pangkal daun.
Relasi partitif adalah relasi yang
pembatasnya merupakan keseluruhan dari
kata yang dibatasi atau kata yang dibatasi
merupakan bagian dari pembatasnya.
Parafrasa bentuk ini dapat dilakukan
dengan menyisipkan kata dari. Misalnya:
biji jagung.
Relasi material adalah relasi yang
pembatasnya menyatakan materi yang
dipakai untuk kata yang dibatasi. Dalam
hal ini dapat digunakan kata dari dan
dibuat dari untuk menyatakan hubungan
itu secara eksplisit. Misalnya: tepung
jagung dan minyak kelapa.
Relasi perbandingan adalah relasi yang
pembatasnya merupakan perbandingan
bagi kata yang dibatasi. Frasa ini
dipisahkan dengan kata seperti dan
bagaikan. Misalnya: berakar serabut dan
putih susu.
Relasi instrumental adalah relasi yang
pembatasnya merupakan alat bagi kata
yang dibatasi. Relasi ini dapat dinyatakan
dengan menggunakan kata dengan.
Misalnya: tumbuh baik
kehidupan masyarakat.
11
dan
dengan
Relasi lokatif adalah relasi yang
pembatasnya merupakan tempat atau
tempat bekerja dari kata yang dibatasi.
Kata yang dapat disisipkan untuk
menyatakan hubungan ini secara eksplisit
adalah di, pada, dan dalam. Misalnya:
masyarakat Papua dan di kebun petani.
METODE PENELITIAN
Pada bab ini dibahas tahapan penelitian
dalam proses pembentukan modul word graph
frasa kata. Diagram proses penambahan modul
word graph frasa kata dapat dilihat pada
Gambar 13.
Mulai
Studi Literatur
Penambahan Modul
Frasa Kata
Penentuan Pola Hasil
(Pengujian)
Analisis Hasil
Dokumentasi &
Laporan
Selesai
Gambar 13 Diagram proses penambahan
modul frasa kata.
7
Studi Literatur
Penelitian
ini
diawali
dengan
mengumpulkan bahan-bahan pustaka yang
relevan dengan topik kajian penelitian.
Penelitian ini mengkaji pembentukan modul
word graph frasa kata sebagai bagian dari
sistem aplikasi BogorDelftConstruct. Penelitian
ini didasarkan pada penelitian sebelumnya, di
antaranya skripsi Deni Romadoni (2009) yang
berjudul “Pengembangan Sistem Pembentukan
Word Graph untuk Teks Berbahasa Indonesia”
dan Tesis Mahmuda (2010) yang berjudul
“Konstruksi Pola Word Graph Frasa Kata
Menggunakan Metode Knowledge Graph”.
Hasil kajian dua penelitian sebelumnya
digunakan untuk mengembangkan modul word
graph frasa kata.
Penambahan Modul Frasa Kata
Terdapat beberapa tahapan pada proses
penambahan modul frasa kata yaitu:
a
Praproses
Tahapan praproses dilakukan untuk
membatasi nilai input. Pertama akan dilakukan
proses tokenisasi pada frasa kata yang berguna
untuk memecah frasa kata. Setelah itu, frasa
kata yang telah dipecah akan disimpan dalam
array sementara
yang
akan dihitung
panjangnya. Setelah frasa kata melalui tahap
tokenisasi, frasa kata tersebut akan diperiksa
panjang array-nya apakah panjang array sama
dengan satu atau tidak. Jika panjang array frasa
kata sama dengan satu, berarti input bukan
merupakan frasa kata dan akan muncul pesan
peringatan yang menyatakan bahwa input tidak
akan diproses ke tahap selanjutnya. Jika panjang
array lebih dari satu, frasa kata yang telah
ditokenisasi akan diperiksa satu per satu apakah
kata-kata tersebut mengandung nilai masukan
selain karakter. Jika kata-kata tersebut
mengandung nilai masukan selain karakter,
akan muncul pesan peringatan dan frasa kata
tidak akan diproses ke tahap selanjutnya.
b
Ekstraksi Data Frasa Kata
Frasa kata yang telah melewati tahap
praproses akan diekstraksi datanya yang
berguna untuk pencarian pola frasa kata.
Ekstraksi data frasa kata adalah proses
pengambilan data frasa kata yang telah
ditokenisasi berupa jenis kata, kata dasar, jenis
kata dasar, dan imbuhan.
Pertama, array kata dari hasil tokenisasi
akan diperiksa satu per satu ke dalam database
kamus. Data yang dapat diambil dari database
kamus adalah jenis kata dan kata dasar. Setiap
kata yang berhasil diekstraksi datanya akan
disimpan dalam array StorageType{n} untuk
jenis kata dan StorageBase{n} untuk kata dasar
dengan indeks n sebagai penunjuk kata ke-n.
Jika kata ke-n adalah kata dasar, kata tersebut
langsung dikembalikan sebagai output-nya. Jika
kata ke-n adalah kata berimbuhan, kata tersebut
harus melalui proses stemming terlebih dahulu.
Proses stemming yang digunakan pada
penelitian ini mengadopsi proses stemming yang
telah dilakukan oleh Iqbal (2010). Proses
stemming yang dilakukan Iqbal (2010)
menggunakan KBBI yang telah disesuaikan.
KBBI digunakan untuk memeriksa kata dasar
hasil stemming. Pada penelitian ini KBBI selain
digunakan untuk memeriksa kata dasar hasil
stemming, juga digunakan untuk mengenali
label dari kata dasar yang didapat dari hasil
stemming.
Pada KBBI yang digunakan dalam
penelitian ini dilakukan beberapa perubahan.
Pada awalnya di dalam KBBI asli terdapat tiga
field, yaitu: ‘Kata’, ‘Sifat’, dan ’Subkata’. Field
‘Kata’ berisi kata dasar sedangkan field
‘Subkata’ berisi kata turunan, yang terdiri dari
kata berimbuhan dan kata berulang. Satu kata
dasar dapat memiliki lebih dari satu subkata.
Kata-kata tersebut disusun berdasarkan susunan
alfabetis. Tiap-tiap kata ditulis dengan
pemenggalan kata berdasarkan Pedoman Umum
Ejaan Bahasa Indonesia yang Disempurnakan.
Misalnya kata ‘mengandalkan’, dipenggal
menjadi ‘meng.an.dal.kan’. Field ‘Sifat’ berisi
label dari kata yang sesuai dengan konteks dan
keperluannya. Label ragam bahasa, label kelas
kata,
label
penggunaan
bahasa
yang
menunjukkan dalam dialek mana kata yang
bersangkutan digunakan, serta label bidang
kehidupan dan bidang ilmu yang menunjukkan
dalam bidang apa kata tersebut digunakan.
Misalnya, label ‘n komp’ merupakan nomina
(kata benda) yang digunakan pada bidang
kehidupan dan bidang ilmu komputer.
Seluruh kata yang dimuat dalam KBBI
beserta labelnya (seperti kelas kata, ragam
bahasa dan sebagainya) disusun dalam tabel
Entry (Iqbal 2010). Tabel Entry terdiri dari
empat field, yaitu ‘EntryID’, ‘Word’,
‘Category’, dan ‘Stem’. Field ‘EntryID’ berisi
nomor identifikasi kata. Field ‘Word’ berisi
kata dasar dan kata turunan sedangkan field
‘Stem’ berisi kata dasar. Field ‘Category’ berisi
label dari kata yang diambil kelas kata secara
umumnya saja. Misalnya, label ‘n komp’ diubah
menjadi ‘n’ (nomina) saja.
Download