susunan dewan redaksi jurnal ilmu komputer

advertisement
Jurnal
ILMU KOMPUTER
Volume 5 Nomor 2 September 2012
Daftar Isi :
PERANCANGAN DAN IMPLEMENTASI AUTOMATED DOCUMENT INTEGRATION
DENGAN MENGGUNAKAN ALGORITMA COMPLETE LINKAGE AGGLOMERATIVE
HIERARCHICAL CLUSTERING ............................................................................................... 1
Gede Aditra Pradnyana, Ngurah Agus Sanjaya ER
SISTEM PENDUKUNG KEPUTUSAN DALAM PEMILIHAN TEMPAT KOST DENGAN
METODE PEMBOBOTAN ( STUDI KASUS : SLEMAN YOGYAKARTA)........................ 11
I Wayan Supriana
SISTEM TUTORIAL MATEMATIKA DISKRET DALAM MENUNJANG PROSES
BELAJAR BERBASIS KOMPETENSI ..................................................................................... 17
I Gede Santi Astawa
PENENTUAN KOMPOSISI BAHAN PAKAN IKAN LELE YANG OPTIMAL DENGAN
MENGGUNAKAN METODE IWO-SUBTRACTIVE CLUSTERING .................................... 22
Agus Muliantara
SISTEM PENGAMANAN DATA SIDIK JARI MENGGUNAKAN ALGORITMA AES
PADA SISTEM KEPENDUDUKAN BERBASIS RADIO FREQUENCY IDENTIFICATION
(RFID) ......................................................................................................................................... 29
I Gede Andika Putra,I Made Widhi Wirawan
PENINGKATAN RELEVANSI HASIL PENCARIAN KATA KUNCI DENGAN
PENERAPAN MODEL RUANG VEKTOR PADA SISTEM INFORMASI RUANG BACA DI
JURUSAN ILMU KOMPUTER UNIVERSITAS UDAYANA ................................................ 36
Ngurah Agus Sanjaya, Agus Muliantara, I Made Widiartha
A CASE STUDY OF IT IMPLEMENTATION IN PUBLIC UNIVERSITY : IT’S BARRIERS
AND CHALLANGES ................................................................................................................ 43
I Made Agus Setiawan
JURUSAN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS UDAYANA
DENPASAR
SUSUNAN DEWAN REDAKSI JURNAL ILMU KOMPUTER
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Ketua
Agus Muliantara, S.Kom, M.Kom
Penyunting
Drs. Wayan Santiyasa, M.Si
Ngurah Agus Sanjaya, S.Kom, M.Kom
Cokorda Rai Adi Paramarta, S.T, M.M
Ida Bagus Gede Dwidasmara, S.Kom.M.Cs
Penyunting Tamu
Imas Sitanggang, S.Si, M.Kom (IPB)
Ir. A.A. Gede Raka Dalem, M.Sc (Hons)
Prof. Pieter Hartel (Twente University)
Pelaksana
I Made Widiartha, S.Si, M.Kom
Dra. Luh Gede Astuti, M.Kom
Gede Santi Astawa, ST, M.Cs
Ida Bagus Mahendra, S.Kom, M.Kom
Alamat Redaksi
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Kampus Bukit Jimbaran – Badung
Telpon. 0361 – 701805
Email : [email protected]
Website : www.cs.unud.ac.id
ISSN : 1979-5661
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
PERANCANGAN DAN IMPLEMENTASI AUTOMATED DOCUMENT INTEGRATION
DENGAN MENGGUNAKAN ALGORITMA COMPLETE LINKAGE AGGLOMERATIVE
HIERARCHICAL CLUSTERING
Gede Aditra Pradnyana1, Ngurah Agus Sanjaya ER2
Program Studi Teknik Informatika, Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Email : [email protected], [email protected]
ABSTRAK
Salah satu cara yang umum digunakan untuk memperoleh informasi adalah dengan membaca
beberapa dokumen yang membahas topik yang sama. Walaupun cara ini merupakan yang paling
mudah namun pada pelaksanaannya banyak menghabiskan waktu. Penggunaan suatu sistem
automated document integration yang membantu menemukan kalimat penting dari masing-masing
dokumen akan menghemat waktu serta tenaga yang diperlukan. Keluaran dari sistem yang
dikembangkan dalam penelitian ini adalah suatu dokumen yang dibentuk dari integrasi (cluster)
kalimat-kalimat dari dokumen asli.
Kesamaan dokumen yang akan diintegrasikan ditentukan oleh cosine similarity. Sistem
kemudian menghitung TF-IDF (term frequency-inverse document frequency) masing-masing kalimat
pada dokumen. TF-IDF merupakan bobot dari suatu kalimat yang mencerminkan tingkat kepentingan
dari kalimat pada suatu dokumen serta terhadap kalimat-kalimat lain pada dokumen yang berbeda.
Kalimat-kalimat yang memiliki kesamaan yang tinggi kemudian digabungkan secara agglomerative
hierarchical menggunakan metode complete linkage. Hasil uji coba memperlihatkan 75% responden
menyatakan keluaran sistem adalah benar.
Kata kunci: automated document integration, complete linkage agglomerative hierarchical clustering,
cosine similarity
ABSTRACT
A common way of gaining knowledge or information is by reading through documents which
discuss the same topic. Despite being the easiest method to implement, it requires a lot of time and
effort. Thus, the use of an automated text integration system which serves in finding important
sentences from each original document, greatly reduces the time and effort needed. The research
output which implements this system is a new document constructed from clustered sentences in the
original documents.
The similarities of documents to be clustered is determined by using the cosine similarity. The
system further calculates the TF-IDF (Term Frequency-Inverse Document Frequency) of each
sentence in the documents. The TF-IDF serves as a weight of the sentence in a document to describe
how important it is in comparison with other sentences in different documents. Sentences with high
similarities are then clustered in an agglomerative hierarchical way using a complete linkage method.
Experimental results show that 75% of respondents confirm that the output is correct.
Keywords: automated document integration, complete linkage agglomerative hierarchical clustering,
cosine similarity
pengguna teknologi menuntut agar semua
informasi dapat diperoleh dengan cepat,
mudah, dan tidak membuang banyak waktu.
Selain itu tingginya penggunaan internet telah
memacu pesatnya pertumbuhan dan pertukaran
1. PENDAHULUAN
Perkembangan teknologi informasi
yang semakin pesat dewasa ini membuat para
ISSN : 1979-5661
-1-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
informasi sehingga informasi yang beredar
pun semakin banyak. Salah satu cara untuk
memperoleh
informasi
adalah
dengan
membaca beberapa dokumen yang pada
kenyataannya banyak membahas topik yang
sama. Namun hal ini akan sangat menyulitkan
pembaca untuk menangkap topik bahasan
utama dari dokumen-dokumen tersebut karena
harus mengingat isi dokumen yang telah
dibaca
sebelumnya.
Pembaca
harus
mengintegrasikan dahulu dokumen-dokumen
yang dia baca di dalam pikirannya sebelum
dapat merangkum maksud dan topik utama
dokumen-dokumen
tersebut
secara
keseluruhan. Selain itu, seringkali ada
pembaca yang tidak ingin membaca seluruh
dokumen tersebut karena faktor waktu yang
dibutuhkan terlalu lama atau adanya
keterbatasan waktu.
Seiring berkembangnya teknologi
informasi, maka saat ini telah diperoleh suatu
solusi yang memungkinkan pembaca dapat
membuat integrasi dari beberapa dokumen
tersebut menjadi suatu kesatuan dokumen
dengan mudah. Maksud dari integrasi
dokumen disini adalah sebuah proses untuk
menghasilkan suatu dokumen baru dari
beberapa dokumen dengan menggunakan
bantuan komputer, tanpa menghilangkan arti
dan bagian-bagian penting dari tiap dokumen
tersebut. Tujuan dari integrasi dokumen ini
adalah untuk mengambil sumber informasi
dengan memperhatikan sebagian besar bagianbagian berupa kalimat-kalimat yang penting
dari setiap dokumen yang berbeda dan
menampilkan kepada pembaca dalam bentuk
suatu dokumen baru yang sesuai dengan
kebutuhan pembaca. Setelah melalui proses
ini, diharapkan pembaca dapat terbantu dalam
menyerap informasi penting yang ada dalam
kumpulan dokumen yang berbeda dengan
topik bahasan yang sama, karena pembaca
tidak perlu lagi membaca kumpulan dokumen
satu per satu. Proses integrasi dokumen ini
akan menghasilkan suatu produk teks yang
memiliki atau mengandung semua bagian
penting dari dokumen-dokumen awal, namun
memiliki susunan antar kalimat atau antar
paragraf yang berbeda.
Adapun algoritma yang digunakan
dalam proses integrasi dokumen ini adalah
agglomerative hierarchical clustering dengan
metode complete linkage. Agglomerative
hierarchical clustering adalah suatu metode
ISSN : 1979-5661
hierarchical clustering yang bersifat bottomup yaitu menggabungkan n buah cluster
(beberapa dokumen) menjadi satu cluster
tunggal (sebuah dokumen hasil integrasi).
Agglomerative
hieararchical
clustering
merupakan metode yang umum digunakan
dalam clustering dokumen dan memiliki
beberapa kelebihan, antara lain : tidak
memperhitungkan initial centroid sehingga
tepat digunakan dalam proses pengelompokan
dokumen dan kinerja information retrieval
berbasis hierarchical clustering memiliki hasil
yang lebih baik jika dibandingkan dengan
metode partitional clustering (Hamzah, 2009).
Algoritma
agglomerative
hierarchical
clustering dengan metode complete linkage
memiliki hasil clustering yang lebih baik
dibandingkan dengan metode linkage yang
lainnya (Soebroto, 2005).
Dalam proses clustering, kesamaan
antara satu dokumen dengan dokumen yang
lain diukur dengan fungsi kesamaan
(similarity) tertentu. Dalam sistem automated
document integration ini digunakan algoritma
cosine similarity dalam pengukuran kesamaan
antar dokumen. Sebelum proses clustering
dilakukan, suatu dokumen akan melalui proses
parsing, stemming, dan pembobotan kalimat
(TF – IDF) serta pembobotan relasi antar
kalimat. Proses stemming dilakukan dengan
menggunakan algoritma porter stemmer for
Bahasa Indonesia.
2. TINJAUAN PUSTAKA
2.1 Complete Linkage Agglomerative
Hierarchical Clustering
Salah satu kategori algoritma clustering yang
banyak dikenal adalah hierarchical clustering.
Hierarchical clustering merupakan salah satu
algoritma clustering yang fungsinya dapat
digunakan untuk pengelompokkan dokumen
(document
clustering).
Dari
teknik
hierarchical clustering, dapat dihasilkan suatu
kumpulan partisi yang berurutan, dimana
dalam kumpulan tersebut terdapat :
 Cluster-cluster yang mempunyai poinpoin individu. Cluster-cluster ini
berada di level yang paling bawah.
 Sebuah cluster yang didalamnya
terdapat poin-poin yang dipunyai
semua cluster didalamnya. Single
cluster ini berada di level yang paling
atas.
-2-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Dalam algoritma hierarchical clustering,
cluster yang berada di level yang lebih atas
(intermediate level) dari cluster yang lain
dapat
diperoleh
dengan
cara
mengkombinasikan dua buah cluster yang
berada pada level dibawahnya. Hasil
keseluruhan dari algoritma hierarchical
clustering secara grafik dapat digambarkan
sebagai tree, yang disebut dengan dendogram
(Tan, 2006).
Pada
algoritma
agglomerative
hierarchical clustering ini, proses hierarchical
clustering dimulai dari cluster-cluster yang
memiliki poin-poin individu yang berada di
level paling bawah. Pada setiap langkahnya,
dilakukan penggabungan sebuah cluster
dengan cluster lainnya, dimana cluster-cluster
yang digabungkan berada saling berdekatan
atau mempunyai tingkat kesamaan yang paling
tinggi (Tan, 2006).
Salah satu metode yang digunakan
dalam Agglomerative Hierarchical Clustering
adalah Complete linkage (furthest neighbor
methods). Complete Linkage adalah suatu
metode yang menggunakan prinsip jarak
minimum yang diawali dengan mencari jarak
terjauh antar dua buah cluster dan keduanya
membentuk cluster baru. Pada awalnya,
dilakukan perhitungan jarak terpendek dalam
D = {dik} dan menggabungkan objek-objek
yang bersesuaian misalnya, U dan V , untuk
mendapatkan cluster (UV). Kemudian jarakjarak antara (UV) dan cluster W yang lain
dihitung dengan cara :
d(UV)W = max{duw , dvw}
diperlukan karena dokumen yang panjang
cenderung mendapatkan nilai yang besar
dibandingkan dengan dokumen yang lebih
pendek.
Perhitungan cosine similarity yang
memperhitungkan perhitungan pembobotan
kata pada suatu dokumen dapat dinyatakan
dengan perumusan :
t
q d
CosSim(d i , qi )  i i 
qi d i
ij
j 1
ij
)
 q  . d 
t
j 1
2
ij
t
j 1
2
ij
Keterangan :
qij = bobot istilah j pada dokumen i = tfij * idfj
dij = bobot istilah j pada dokumen i = tfij * idfj
2.3 Proses Parsing dan Stemming
Parsing adalah sebuah proses untuk
membuat sebuah kalimat menjadi lebih
bermakna. Hal ini dilakukan dengan cara
memecah kalimat tersebut menjadi kata-kata
atau frase-frase (Budhi, 2005). Proses parsing
merupakan proses penguraian dokumen yang
semula berupa kalimat-kalimat berisi kata-kata
dan tanda pemisah antar kata seperti titik (.),
koma (,), spasi dan tanda pemisah lain menjadi
kata-kata saja.
Stemming merupakan suatu proses
yang terdapat dalam sistem IR (Information
Retrieval) yang mentransformasi kata-kata
yang terdapat dalam suatu dokumen ke katakata
akarnya
(root
word)
dengan
menggunakan aturan-aturan tertentu untuk
meningkatkan kualitas informasi yang
didapatkan (Agusta, 2009). Proses tersebut
akan
menghilangkan
imbuhan
yang
terkandung dalam suatu kata yang diproses.
Sebagai contoh, kata bersama, kebersamaan,
menyamai, setelah melaui proses stemming
akan menjadi kata “sama”. Proses ini akan
mendukung
tingkat
ketelitian
dalam
perhitungan daftar keyword pada proses
berikutnya. Algoritma stemming untuk Bahasa
Indonesia yang dikenal antara lain Algoritma
Porter Stemmer dan Algoritma Nazief &
Adriani. Porter Stemmer for Bahasa Indonesia
dikembangkan oleh Fadillah Z. Tala pada
tahun 2003. Implementasi Porter Stemmer for
Bahasa Indonesia berdasarkan English Porter
Stemmer yang dikembangkan oleh W.B.
Frakes pada tahun 1992.
2.2 Algoritma Cosine Similarity
Metode Cosine Similarity merupakan
metode yang digunakan untuk menghitung
similarity (tingkat kesamaan) antar dua buah
objek. Secara umum penghitungan metode ini
didasarkan pada vector space similarity
measure. Metode cosine similarity ini
menghitung similarity antara dua buah objek
(misalkan D1 dan D2) yang dinyatakan dalam
dua buah vektor dengan menggunakan
keywords (kata kunci) dari sebuah dokumen
sebagai ukuran.
Metode pengukuran kesesuaian ini
memiliki beberapa keuntungan, yaitu adanya
normalisasi terhadap panjang dokumen. Hal
ini memperkecil pengaruh panjang dokumen.
Jarak euclidean (panjang) kedua vektor
digunakan sebagai faktor normalisasi. Hal ini
ISSN : 1979-5661
 (q .d
-3-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
induktif sesuai kaidah Bahasa
Indonesia, ide pokok suatu
paragraf terdapat pada kalimat
yang berada di awal dan atau akhir
dari paragraf tersebut.
4. Bagian keempat ini sangat
berhubungan
dengan
hasil
pemetaan dokumen. Pada bagian
keempat ini akan dihitung jumlah
relasi (yang disimbolkan dengan
edge) suatu kalimat di dalam
dokumen. Idenya adalah semakin
banyak relasi yang dimiliki suatu
kalimat dengan kalimat lainnya di
dalam suatu dokumen maka
kalimat tersebut kemungkinan
mendiskusikan topik utama suatu
dokumen.
5. Bobot
kelima
ini
merepresentasikan
seberapa
penting
sebuah
kalimat
dibandingkan dengan kalimatkalimat lain yang terdapat pada
semua dokumen yang akan
diintegrasikan.
2.4 Proses Stopword Removal
Kebanyakan bahasa resmi di berbagai
negara memiliki kata fungsi dan kata sambung
seperti preposisi dan kata hubung yang hampir
selalu muncul pada dokumen-dokumen teks.
Kata-kata ini umumnya tidak memiliki arti
yang lebih untuk memenuhi kebutuhan
seorang searcher dalam mencari informasi.
Kata-kata tersebut (misalnya a, an, the, on
pada bahasa Inggris) yang disebut sebagai kata
tidak penting misalnya “di”, “oleh”, “pada”,
“sebuah”, “karena”, dan kata sambung lainnya.
Sebelum proses stopword removal dilakukan,
terlebih dulu dibuat daftar stopword (stoplist).
Preposisi, kata hubung dan partikel biasanya
merupakan kandidat stoplist. Stopword
removal merupakan proses penghilangan kata
tidak penting pada suatu dokumen, melalui
pengecekan kata-kata hasil stemmer dokumen
tersebut apakah termasuk kata di dalam daftar
kata tidak penting (stoplist) atau tidak
2.5 Perhitungan Bobot Kalimat dan Bobot
Relasi Antar Kalimat
2.5.1 TF-IDF (Terms Frequency-Inverse
Document Frequency )
Metode ini merupakan metode untuk
menghitung nilai/bobot suatu kata (term) pada
dokumen. Metode ini akan mengabaikan setiap
kata-kata yang tergolong tidak penting. Oleh
sebab itu, sebelum melalukan metode ini,
proses stemming dan stopword removal harus
dilakukan terlebih dahulu oleh sistem. Karena
melakukan pembobotan suatu kalimat bukan
kata, pada metode ini terdapat 5 proses yang
berbeda untuk perhitungan nilai suatu kalimat,
yaitu (Budhi, 2008):
1. Kecocokan kata-kata pada kalimat
dengan daftar kata kunci/keyword.
Idenya adalah semakin tinggi nilai
suatu kalimat, maka kalimat
tersebut
semakin
penting
keberadaannya di dalam suatu
dokumen.
2. Menghitung frekuensi kata-kata
suatu
kalimat
terhadap
keseluruhan
dokumen
dan
hasilnya akan dibagi dengan
jumlah kata pada dokumen
tersebut.
3. Bagian ketiga ini sangat sederhana
yaitu hanya melihat posisi kalimat
di
dalam
suatu
paragraf.
Berdasarkan metode deduktif
ISSN : 1979-5661
Setelah mendapatkan hasil dari kelima
bobo diatas, selanjutnya nilai tf akan dihitung
dengan persamaan berikut:
tf = bobot1 + bobot2 + bobot3 + bobot4 + bobot5
Faktor lain yang diperhatikan dalam
pemberian bobot adalah kejarangmunculan
kalimat (sentence scarcity) dalam koleksi.
Kalimat yang muncul pada sedikit dokumen
harus dipandang sebagai kata yang lebih
penting (uncommon sentences) daripada
kalimat yang muncul pada banyak dokumen.
Pembobotan akan memperhitungkan faktor
kebalikan
frekuensi
dokumen
yang
mengandung suatu kalimat (inverse document
frequency).
Nilai dari tf akan dikalikan dengan
nilai idf seperti pada persamaan dibawah ini
(Intan, 2005):
Keterangan :
W= bobot kalimat terhadap dokumen
-4-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Proses – proses yang ada pada
subsistem ini adalah :
a. Proses upload dokumen ke dalam
sistem.
b. Proses konversi dokumen dengan
format file PDF menjadi file txt.
c. Proses devide to word atau
parsing
yaitu proses yang
memecah kalimat-kalimat dalam
file txt menjadi kata-kata.
d. Proses stopword removal atau
menghilangkan kata-kata tidak
penting.
e. Proses
stemming
dengan
algoritma Porter Stemmer for
Bahasa Indonesia.
f. Proses perhitungan kesamaan
dokumen
dengan
algoritma
Cosine Similarity.
2. Subsistem Integration Process
Proses – proses yang ada pada
subsistem ini adalah :
a. Proses perhitungan bobot kalimat
dengan metode TF-IDF.
b. Proses perhitugan bobot relasi
antar kalimat.
c. Proses
clustering
dengan
algoritma Complete Linkage
Agglomerative
Hierarchical
Clustering
tf = jumlah kemunculan kata/term dalam
dokumen
N= jumlah semua dokumen yang ada dalam
database
n= jumlah dokumen yang mengandung
kata/term
idf = inverse document frequency
2.5.3 Perhitungan Bobot Edge
Untuk perhitungan bobot edge akan
digunakan persamaan berikut (Sjobergh, 2005)
:
Nilai overlap i,j diperoleh dengan
menghitung jumlah kata yang sama antara
kalimat ke-i dan kalimat ke-j dengan
mengabaikan stopword yang ada di dalam
kalimat-kalimat tersebut. Kemudian hasil dari
persamaan diatas akan digunakan untuk
menentukan nilai relasi dari setiap kalimat
berdasarkan hasil pemetaan dari dokumen.
3. DESAIN AUTOMATED DOCUMENT
INTEGRATION SYSTEM
Tahap awal yang dilakukan dalam
pengembangan sistem adalah penentuan input,
proses, dan output dari sistem yang akan
dibuat. Input – input yang masuk dan akan
diproses dalam sistem dapat dibagi menjadi 2
bagian yaitu :
1. Penentuan input sistem yang berupa
kumpulan dokumen yang akan
diintegrasikan.
Dokumen
disini
berperan sebagai suatu kumpulan
data-data mentah yang akan dijadikan
objek pada penelitian ini. Dokumen
berupa
artikel-artikel
mengenai
teknologi informasi dalam Bahasa
Indonesia dengan format file PDF.
2. Penentuan input yang kedua adalah
input dari user yang berupa nilai
toleransi kesamaan antar dokumen
yang akan diintegrasikan ( similarity
tolerance value ) ke sistem.
Setelah melakukan teknik kajian
pustaka pada tahap sebelumnya, secara garis
besar proses-proses yang ada pada sistem
dapat dibagi ke dalam dua subsistem yaitu :
1. Subsistem Pre-Integration
ISSN : 1979-5661
Pada
proses
integrasi
dengan
algoritma
agglomerative
hierarchical
clustering, awalnya semua kalimat yang
terdapat dalam tabel kalimat dianggap sebagai
atomic cluster – atomic cluster. Langkah
pertama yang dilakukan adalah mencari
cluster-cluster dengan jarak terdekat, atau
pasangan kalimat yang memiliki bobot relasi
antar kalimat yang paling kecil. Pencarian
dilakukan dengan menggunakan perintah
query select yang mengurutkan data-data pada
tabel
kalimat_relasi
secara
ascending
berdasarkan bobot relasinya. Langkah
selanjutnya adalah melakukan update jarak
cluster yang baru terbentuk dengan clustercluster lainnya dengan metode maximum
distance. Setelah semua kalimat telah
tergabung menjadi sebuah cluster, dilakukan
proses untuk memecah cluster tersebut
menjadi paragraf – paragraf. Caranya adalah,
kalimat – kalimat yang bergabung terlebih
dahulu menjadi cluster – cluster besar
dianggap sebagai sebuah paragraf tersendiri.
-5-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Asumsinya, bila secara natural kalimat –
kalimat tersebut bergabung, dapat dianggap
kalimat – kalimat tersebut memiliki similarity
yang cukup tinggi dan membahas topik
bahasan yang sama. Sementara untuk
memproses kalimat – kalimat tersisa yang
tidak mau bergabung kedalam cluster – cluster
besar, dipakai aturan sebagai berikut:
 Bila
hanya
1
kalimat
akan
digabungkan pada paragraf terakhir.
 Bila lebih dari satu kalimat, kalimat –
kalimat yang tersisa tersebut akan
dipaksakan bergabung menjadi satu
paragraf tersendiri.
Sementara,
Output-output
yang
dihasilkan sistem melalui pemrosesan input
dari user adalah :
a. Report tingkat kesamaan antar
dokumen yang akan diintegrasikan.
b. Dokumen hasil proses integrasi yang
dapat disimpan dalam format file .doc.
Berikut ini adalah gambar rancangan
alur pada subsistem Integration secara garis
besar :
dijalankan. Pengujian basis path pada
penelitian ini difokuskan pada proses
perhitungan bobot relasi antar kalimat dan
proses integrasi dengan algoritma complete
linkage agglomerative hierarchical clustering.
Alur logika dari sistem diujicoba dengan
menyediakan kasus ujicoba yang melakukan
semua kondisi atau perulangan yang ada pada
sistem. Dimana setelah melakukan pengujian,
setiap path yang ada dalam tiap proses dapat
dijalan dengan baik.
4.2 Pengujian Proses Integrasi
Pengujian terhadap proses integrasi
dilakukan dengan membandingkan proses
integrasi dengan perhitungan manual dan
dengan sistem. Dokumen yang dipergunakan
adalah dokumen dengan judul Data Mining 1
dan Data Mining 2. Pada akhir pengujian
didapatkan hasil bahwa hasil integrasi secara
manual menghasilkan dokumen yang sama
dengan dokumen yang diintegrasikan oleh
sistem. Berikut ini adalah contoh dokumen
yang akan diintegrasikan dengan automated
document integration system.
start
Urut dokumen
berdasarkan
similarity
Hitung bobot
kalimat
Proses pengelompokkan
kalimat dengan clustering
Parsing paragraf
menjadi kalimat
Hitung bobot kalimat
dengan TF-IDF
Print hasil
Clustering
Parsing kalimat
menjadi kata
Hitung bobot relasi antar
kalimat
“Data Mining 1”
Data Mining memang salah satu
cabang ilmu komputer yang relatif baru. Dan
sampai
sekarang
orang
masih
memperdebatkan untuk menempatkan data
mining di bidang ilmu mana, karena data
mining menyangkut database, kecerdasan
buatan (artificial intelligence), statistik, dsb.
Ada pihak yang berpendapat bahwa data
mining tidak lebih dari machine learning atau
analisa statistik yang berjalan di atas database.
Namun pihak lain berpendapat bahwa database
berperanan penting di data mining karena data
mining mengakses data yang ukurannya besar
(bisa sampai terabyte) dan disini terlihat peran
penting database terutama dalam optimisasi
query-nya.
Kehadiran data mining dilatar
belakangi dengan problema data explosion
yang dialami akhir-akhir ini dimana banyak
organisasi telah mengumpulkan data sekian
tahun lamanya (data pembelian, data
penjualan, data nasabah, data transaksi dsb.).
Hampir semua data tersebut dimasukkan
dengan menggunakan aplikasi komputer yang
digunakan untuk menangani transaksi seharihari yang kebanyakan adalah OLTP (On Line
Transaction Processing). Bayangkan berapa
tidak
Save ?
ya
end
Save menjadi file
.doc
Gambar 1. Perancangan Alur pada Subsistem
Integration
4. PENGUJIAN SISTEM
4.1 Pengujian Sistem dengan White Box
Pengujian white box yang digunakan
dalam pembuatan automated document
integration system ini adalah pengujian basis
path. Pengujian tersebut ditujukan untuk
mencari path-path yang dilalui saat program
ISSN : 1979-5661
-6-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
transaksi yang dimasukkan oleh hypermarket
semacam Carrefour atau transaksi kartu kredit
dari sebuah bank dalam seharinya dan
bayangkan betapa besarnya ukuran data
mereka jika nanti telah berjalan beberapa
tahun. Pertanyaannya sekarang, apakah data
tersebut akan dibiarkan menggunung, tidak
berguna lalu dibuang, ataukah kita dapat
menambangnya untuk mencari emas, berlian
yaitu informasi yang berguna untuk organisasi
kita. Banyak diantara kita yang kebanjiran data
tapi miskin informasi.
organisasi telah mengumpulkan data sekian
tahun lamanya (data pembelian, data
penjualan, data nasabah, data transaksi dsb).
Hampir semua data tersebut dimasukkan
dengan menggunakan aplikasi komputer yang
digunakan untuk menangani transaksi seharihari yang kebanyakan adalah OLTP (On Line
Transaction Processing). Bayangkan berapa
transaksi yang dimasukkan oleh hypermarket
semacam Carrefour atau transaksi kartu kredit
dari sebuah bank dalam seharinya dan
bayangkan betapa besarnya ukuran data
mereka jika nanti telah berjalan beberapa
tahun.
Pertanyaannya sekarang, apakah data
tersebut akan dibiarkan menggunung, tidak
berguna lalu dibuang, ataukah kita dapat
menambangnya untuk mencari emas, berlian
yaitu informasi yang berguna untuk organisasi
kita. Banyak diantara kita yang kebanjiran data
tapi miskin informasi.
Dan sampai sekarang orang masih
memperdebatkan untuk menempatkan data
mining di bidang ilmu mana, karena data
mining menyangkut database, kecerdasan
buatan (artificial intelligence), statistik, dsb.
Ada pihak yang berpendapat bahwa data
mining tidak lebih dari machine learning atau
analisa statistik yang berjalan di atas database.
Namun pihak lain berpendapat bahwa database
berperanan penting di data mining karena data
mining mengakses data yang ukurannya besar
(bisa sampai terabyte) dan disini terlihat peran
penting database terutama dalam optimisasi
query-nya. Data Mining memang salah satu
cabang ilmu komputer yang relatif baru.
Tetapi pertumbuhan yang pesat dari
akumulasi data itu telah menciptakan kondisi
yang sering disebut sebagai “rich of data but
poor of information” karena data yang
terkumpul itu tidak dapat digunakan untuk
aplikasi yang berguna. Tidak jarang kumpulan
data itu dibiarkan begitu saja seakan-akan
“kuburan data” (data tombs). Perkembangan
internet juga punya andil cukup besar dalam
akumulasi data.
Data Mining (DM) adalah salah satu
bidang yang berkembang pesat karena
besarnya kebutuhan akan nilai tambah dari
database skala besar yang makin banyak
terakumulasi sejalan dengan pertumbuhan
teknologi informasi. Definisi umum dari DM
itu sendiri adalah serangkaian proses untuk
menggali nilai tambah berupa pengetahuan
“Data Mining 2”
Data Mining (DM) adalah salah satu
bidang yang berkembang pesat karena
besarnya kebutuhan akan nilai tambah dari
database skala besar yang makin banyak
terakumulasi sejalan dengan pertumbuhan
teknologi informasi. Definisi umum dari DM
itu sendiri adalah serangkaian proses untuk
menggali nilai tambah berupa pengetahuan
yang selama ini tidak diketahui secara manual
dari suatu kumpulan data. Dalam review ini,
penulis mencoba merangkum perkembangan
terakhir dari teknik-teknik DM beserta
implikasinya di dunia bisnis.
Perkembangan data mining(DM) yang
pesat tidak dapat lepas dari perkembangan
teknologi informasi yang memungkinkan data
dalam jumlah besar terakumulasi. Sebagai
contoh, toko swalayan merekam setiap
penjualan barang dengan memakai alat
POS(point of sales). Database data penjualan
tsb. bisa mencapai beberapa GB setiap harinya
untuk sebuah jaringan toko swalayan berskala
nasional. Perkembangan internet juga punya
andil cukup besar dalam akumulasi data.
Tetapi pertumbuhan yang pesat dari
akumulasi data itu telah menciptakan kondisi
yang sering disebut sebagai “rich of data but
poor of information” karena data yang
terkumpul itu tidak dapat digunakan untuk
aplikasi yang berguna. Tidak jarang kumpulan
data itu dibiarkan begitu saja seakan-akan
“kuburan data” (data tombs).
Hasil dari proses integrasi kedua dokumen
diatas adalah sebagai berikut :
Kehadiran data mining dilatar
belakangi dengan problema data explosion
yang dialami akhir-akhir ini dimana banyak
ISSN : 1979-5661
-7-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
yang selama ini tidak diketahui secara manual
dari suatu kumpulan data. Dalam review ini,
penulis mencoba merangkum perkembangan
terakhir dari teknik-teknik DM beserta
implikasinya di dunia bisnis. Perkembangan
data mining(DM) yang pesat tidak dapat lepas
dari perkembangan teknologi informasi yang
memungkinkan data dalam jumlah besar
terakumulasi. Sebagai contoh, toko swalayan
merekam setiap penjualan barang dengan
memakai alat POS(point of sales). Database
data penjualan bisa mencapai beberapa GB
setiap harinya untuk sebuah jaringan toko
swalayan berskala nasional.
4.4 Evaluasi Relevansi Sistem
Pengujian ini dilakukan dengan cara
meminta bantuan 100 orang responden yang
merupakan mahasiswa Jurusan Ilmu Komputer
Universitas
Udayana
untuk
membaca
dokumen – dokumen asal yang berjenis
eksposisi dan narasi serta membaca dokumen
hasil integrasi, kemudian menjawab 3
pertanyaan berikut:
1) Menurut anda, apakah kata-kata pada
dokumen hasil integrasi tersebut telah
terorganisir dengan baik (tiap paragraf
memberikan arti yang jelas dan dapat
dipahami) ? A. Ya B. Tidak
4.3 Pengujian Terhadap Waktu Proses
Integrasi
2) Menurut anda, apakah dokumen hasil
integrasi tersebut telah memberikan
gambaran secara umum dari keseluruhan
dokumen yang ada sebelumnya ? A. Ya
B. Tidak
3) Menurut anda, apakah dokumen hasil
integrasi dapat memberikan informasi informasi penting yang terdapat pada
dokumen sebelumnya secara jelas? A. Ya
B. Tidak
Berdasarkan hasil survei relevansi
didapatkan kesimpulan bahwa sistem akan
bekerja lebih baik pada dokumen yang bertipe
eksposisi dibandingkan dengan dokumen yang
bertipe narasi. Dimana lebih dari 75 persen
mengatakan bahwa hasil integrasi dokumen
yang bertipe eksposisi dapat mewakili
dokumen asli, memiliki susunan antar paragraf
yang jelas, dan tetap mengandung informasi
penting dari dokumen awal.
Tabel 1. Hasil Pengujian Waktu
Untuk mendapatkan hasil uji coba
yang terbaik mengenai lama proses clustering
dan proses integrasi keseluruhan yang
dilakukan sistem maka perlu dilakukan uji
coba terhadap berbagai dokumen yang
berbeda-beda. Dari dokumen yang berbedabeda tersebut yang perlu diperhatikan adalah
dari segi jumlah dokumen yang diintegrasi,
jumlah paragraf dari setiap dokumen asli, dan
jumlah kalimat dari setiap dokumen asli.
Pengujian waktu proses ini diujikan dengan
keadaan hardware dan software sebagai
berikut : Processor Intel Pentium Dual Core
T2390 1,86 Ghz, RAM 1 GB. Hasil pengujian
sistem terhadap waktu dapat dilihat pada tabel
1.
ISSN : 1979-5661
5. KESIMPULAN DAN SARAN
5.1 Kesimpulan
 Secara umum sistem automated
document integration dapat dibagi
menjadi dua subsistem yaitu subsistem
pre-integration
dan
subsistem
integration. Adapun proses yang
termasuk dalam subsistem preintegration adalah proses devide to
word, proses stopword removal,
proses
stemming,
dan
proses
perhitungan
kesamaan.
Proses
integrasi dokumen berada dalam
subsistem integration menggunakan
algoritma
complete
linkage
agglomerative hierarchical clustering
-8-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
yang sebelumnya didahului dengan
proses pembobotan kalimat dengan
metode
TF-IDF(term
frequencyinverse document frequency) dan
pembobotan relasi antar kalimat.
 Hasil dari pengujian terhadap waktu
dari proses integrasi dan proses
hierarchical clustering, menunjukkan
bahwa semakin banyak dokumen
paragraf dan kalimat yang yang
diproses maka akan membutuhkan
running time yang semakin besar pula.
 Berdasarkan hasil survei relevansi
sistem kepada 100 orang responden,
didapatkan kesimpulan bahwa sistem
akan bekerja lebih baik pada dokumen
yang bertipe eksposisi dibandingkan
dengan dokumen yang bertipe narasi.
Dimana lebih dari 75 persen
mengatakan bahwa hasil integrasi
dokumen yang bertipe eksposisi dapat
mewakili dokumen asli, memiliki
susunan antar paragraf yang jelas, dan
tetap mengandung informasi penting
dari dokumen awal.
jenis dokumen selain dokumen
berjenis eksposisi dan narasi.
6. DAFTAR PUSTAKA
Agusta, Ledy. 2009. Perbandingan Algoritma
Stemming Porter Dengan Algoritma
Nazief & Adriani Untuk Stemming
Dokumen Teks Bahasa Indonesia.
Bali : Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana.
Budhi, Gregorius S, Arlinah I. Rahardjo, dan
Hendrawan
Taufik.
2008.
Hierarchical
Clustering
Untuk
Aplikasi Automated Text Integration.
Surabaya : UK Petra Jurusan Teknik
Informatika.
Budhi, Gregorius S, Ibnu Gunawan dan Ferry
Yuwono. 2005. Algoritma Porter
Stemmer For Bahasa Indonesia
Untuk Pre-Processing Text Mining
Berbasis Metode Market Basket
Analysis. Surabaya : UK Petra
Jurusan Teknik Informatika.
Hamzah, Amir. 2009. Temu Kembali
Informasi Berbasis Kluster Untuk
Sistem Temu Kembali Informasi Teks
Bahasa Indonesia. Yogyakarta :
Jurusan Teknik Informatika, Fakultas
Teknologi Industri Institut Sains &
Teknologi AKPRIND.
Hartini, Entin. 2004. Metode Clustering
Hirarki.
Pusat
Pengembangan
Teknologi dan Komputasi Batan.
Intan, Rolly dan Andrew Defeng. 2005.
HARD: Subject-based Search Engine
menggunakan TF-IDF dan Jaccard’s
Coefficient. Surabaya : UK Petra
Jurusan Teknik Informatika.
Kendall, Kenneth E dan Julie E. Kendall.
2006. Analisis dan Perancangan
Sistem.Edisi kelima. Indeks. Jakarta.
Mandala, Rila dan Hendra Setiawan. 2002.
Peningkatan Performansi Sistem
Temu-Kembali Informasi dengan
Perluasan Query Secara Otomatis.
Bandung : Departemen Teknik
Informatika
Institut
Teknologi
Bandung.
Pramudiono, Iko. 2003. Pengantar Data
Mining:
Menambang
Permata
Pengetahuan di Gunung Data.
Tokyo : The University of Tokyo.
5.2 Saran
 Sistem
automated
document
integration memiliki kelemahan dalam
menentukan urutan dokumen yang
diintegrasi. Dalam sistem automated
document integration ini urutan
dokumen ditentukan berdasarkan
tingkat kesamaannya dengan metode
cosine similarity. Padahal cosine
similarity merupakan metode yang
bersifat simetris, sehingga tidak dapat
menentukan suatu urutan. Untuk
pengembangan selanjutnya disarankan
agar
menggunakan
metode
pengukuran kesamaan yang asimetris.
 Pada pengembangan selanjutnya,
sistem dapat dikembangkan untuk
melakukan
integrasi
dokumendokumen dengan bahasa lain, tidak
terbatas
pada
dokumen
yang
berbahasa Indonesia saja.
 Pada pengembangan selanjutnya,
sistem dapat dikembangkan dengan
menggunakan algoritma lain sehingga
dapat mengintegrasi dokumen narasi
dengan baik, disamping itu juga dapat
diteliti hasilnya dalam mengintegrasi
ISSN : 1979-5661
-9-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Pressman, Roger S. 2005. Software
Engineering
A
practitioner’s
Approach Sixth Edition. New York :
Mc-Graw-Hill.
Sjobergh, Jonas dan Kenji Araki. 2005.
Extraction Based Summarization
Using Shortest Path Algorithm.
Sweden : KTH Nada.
Soebroto dan Arief Andy. 2005. Hybrid
Average
Complete
Clustering
sebagai Algoritma Kompromi antara
Kualitas dan Waktu Komputasi
Proses Clustering. Surabaya : Institut
Teknologi Sepuluh November.
Steinbach, Michael, George Karypis dan Vipin
Kumar. 2005. A Comparisont of
Document Clustering Techniques.
Minnesota : University of Minnesota,
Department of Computer Science
and Engineering.
Tan, P. N., M. Steinbach dan V. Kumar.
2005. Introduction to Data Mining.
New York : Addison Wesley.
ISSN : 1979-5661
-10-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
SISTEM PENDUKUNG KEPUTUSAN DALAM PEMILIHAN TEMPAT KOST DENGAN
METODE PEMBOBOTAN
( STUDI KASUS : SLEMAN YOGYAKARTA)
I Wayan Supriana
Program Pascasarjana Ilmu Komputer Fakultas MIPA Universitas Gadjah Mada
Skip Utara, Yogyakarta, 55281
Email: [email protected]
ABSTRAK
Penentuan tempat tinggal di daerah yang baru dikenal dipengaruhi oleh banyak factor, diantaranya
lokasi, fasilitas, sistem kontrak dan harga. Makalah ini menentukan kriteria-kriteria yang digunakan
didalam pemilihan tempat tinggal. kriteria-kriteria tersebut dianalisis menggunakan metode
pembobotan. Hasil analisis yang didapat berupa kriteria lokasi untuk menentukan tempat kost yang
paling sesuai.
Kata kunci: Pembobotan, kriteria, analisis
ABSTRACT
Determination of residence in the newly recognized influenced by many factors, such as location,
facilities, contracts and pricing. This paper determines the criteria used in the selection of a place to
stay. criteria were analyzed using the methods of weighting. The results of the analysis are obtained
in the form of criteria to determine the location of the most appropriate place of boarding.
Keywords: Weighting, criteria, analysis
Demikian juga halnya dengan pemilihan
kost bagi mahasiswa yang menuntut ilmu di
jogjakarta. Terkadang mahasiswa yang tidak
mengetahui daerah jogjakarta tentunya akan
menemui banyak kesulitan ataupun banyak
kendala dalam memilih tempat kost.
Penentuan tempat kost mana yang harus
dipilih oleh mahasiswa dipengaruhi oleh
banyak faktor, diantaranya lokasi, fasilitas,
sistem kontrak dan harga. Makalah ini
bertujuan untuk mencari kriteria-kriteria yang
digunakan didalam memilih kost oleh
mahasiswa yang kuliah dijogjakarta. Kriteriakriteria tersebut dianalisis menggunakan
sistem pembobotan. Hasil analisis yang
didapat dengan menjumlahkan hasil seluruh
kriteria dan membagi dengan banyaknya
kriteria .
1. PENDAHULUAN
Persoalan pengambilan keputusan pada
dasarnya adalah bentuk pemilihan dari
berbagai altrenatif tindakan yang mungkin
dipilih yang prosesnya melalui mekanisme
tertentu, dengan harapan akan menghasilkan
sebuah keputusan yang terbaik. Penyusunan
model keputusan adalah suatu cara untuk
mengembangkan hubungan-hubungan yang
logis yang mendasari persoalan keputusan ke
dalam suatu model matematis, yang
mencerminkan hubungan yang terjadi di antara
faktor-faktor yang terlibat, sehingga proses
keputusan harus diambil melalui proses yang
bertahap, sistematik, konsisten dan diusahakan
dalam setiap langkah melalui dari awal telah
mengikutsertakan dan mempertimbangkan
berbagai faktor.
ISSN : 1979-5661
-11-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
2. METODE PENELITIAN
3. PERANCANGAN SISTEM
3.1. Model dan Bobot Penilaian Sistem
Pendukung Keputusan
Model (kriteria) sistem pendukung
keputusan pemilihan tempat tinggal/kost
dibuat dalam 4 jenis kriteria yaitu : model
lokasi, model fasilitas, model sistem kontrak
rumah dan model harga. Dimana masingmasing model tersebut memiliki beberapa
elemen yang akan menentukan hasil akhir
sistem pendukung keputusan yang akan
digunakan oleh para pengguna dalam
menentukan suatu keputusan. Setiap elemen
bobot penilaian yang berbeda-beda tergantung
dari hasil jenis model.
Batasan penilaian dimulai dari 10 sebagai
range terendah sampai dengan 100 sebagai
range tertinggi, sehingga pada akhirnya
kelayakan pemilihan tempat tinggal/kost
diukur dengan nilai sebagai : 80-100 kategori
diterima oleh pengguna untuk ditempati, 60-79
kategori dipertimbangkan apakah ditempati
atau tidak, 0-59 kategori ditolak artinya tidak
layak ditempati.
Bobot penilaiannya sudah ditentukan
berdasarkan kriteria yang telah ditetapkan oleh
peneliti dengan bersumber pada hasil
penelitian, namun hal ini untuk seterusnya bisa
diadakan perubahan-perubahan searah dengan
tuntutan kebutuhan. Bahwa sistem pada proses
penilaiannya mengacu kepada pemenuhan
kriteria-kriteria yang telah ditetapkan serta
mengacu pada beberapa kasus yang telah
terjadi, sehingga benar-benar mempunyai tolak
ukur yang baik.
Metode pembobotan yang digunakan
dalam sistem ini adalah pembobotan secara
langsung,
artinya
pengguna
langsung
memberikan bobot pada setiap kriteria dalam
skala tertentu. Bobot yang telah diinput
kemudian
dinormalisasi
untuk
mendistribusikan nilai kepada seleruh kriteria
sehingga jika semua bobot kriteria diproses
oleh sistem akan menghasilkan satu nilai
sebagai
pertimbangan
keputusan
bagi
pengguna.
Menurut Simon dalam buku Komputerisasi
Pengambilan Keputusan. Proses pengambilan
keputusan melalui tahapan:
1.1. Tahap Penelusuran (intelligence)
Dalam perancangan yang dilakukan
melahirkan rumusan masalah berupa sistem
pendukung keputusan pemilihan tempat kost
berdasarkan kriteria dari pemlih.
1.2. Tahap Perancangan (Design)
Setelah perumusan masalah, dilanjutkan
dengan penetapan kriteria-kriteria yang
dipakai dalam memilih tempat kost.
1.3. Tahap Pemilihan (Choice)
Dengan mengacu pada kriteria-kriteria
penilaian yang telah ditetapkan, dibuat modelmodel penilaian secara matematis.
1.4. Tahap Implementasi (Implementation)
Struktur Sistem Pendukung Keputusan
diimplementasikan
dengan
bahasa
pemrograman Poxpro. Sedangkan komponenkomponen Sistem Pendukung Keputusan yang
digunakan adalah:
1. Subsistem manajemen data, menyediakan
data bagi sistem yang berasal dari data
internal dan eksternal.
2. Subsistem manajemen model, berfungsi
sebagai pengelola berbagai model
3. Subsistem
antar
muka
pengguna,
merupakan
fasilitas
yang
mampu
mengintegrasikan sistem terpasang dengan
pengguna secara interaktif.
Perancangan basis data sistem pendukung
keputusan yang akan memberikan pemahaman
secara keseluruhan berupa hubungan antar
obyek data, aliran informasi dan transformasi
dari data input manjadi output yang
digambarkan secara grafik berupa entitas
relationship diagram flow.
ISSN : 1979-5661
3.2. Perancangan Basis Data
Perancangan basis data digunakan untuk
mendukung fasilitas pengolahan data, dimana
model yang digunakan dalam perancangan
basis data adalah model E-R (EntityRelationship), berikut adalah ER dari sistem
pendukung keputusan pemilihan tempat kost
di jogjakarta.
Gambar 1. ERD Sitem
-12-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Tabel 2. Kriteria fasilitas
No
Kriteria Fasilitas
3.3. Perancangan Basis Model
Dalam mendukung proses pengambilan
keputusan, digunakan model pembobotan yang
dibangun untuk menentukan prioritas tempat
tinggal dalam menghasilkan keluran sistem
secara keseluruhan melakukan langkahlangkah sebagai berikut:
a. Input nilai kriteria masing-masing model
b. Input bobot masing-masing kriteria
c. Hitung normalisasi dari bobot
1
2
3
4
5
6
7
NK =
7
n
 NK
3. Kriteria sistem kontrak
Model sistem kontrak dimaksudkan
untuk menentukan sistem pembayaran
tempat tinggal. Dengan pemberian nilai
mulai dari terkecil 40 sampai terbesar 100.
Tabel 3. Kriteria sistem kontrak
N Sub Kriteria Sistem
Nila Bobo
o
kontrak
i
t
1
Tahunan
100
2
Enam bulan
80
50%
3
Tiga bulan
60
4
Bulanan
40
n
Dimana
SBK : Kriteria
BBT : Bobot kriteria
NK : Nilai kriteria
Rancangan model untuk mengevaluasi
pemilihan tempat tinggal adalah sebagai
berikut:
1. Kriteria lokasi
Model lokasi dimaksudkan untuk
menentukan kenyamanan tempat tinggal
yang akan di ditempati oleh mahasiswa
serta berapa besar nilai dari masingmasing point tersebut. Dengan pemberian
nilai mulai dari terkecil 10 sampai terbesar
100.
Tabel 1. Kriteria lokasi
No
Kriteria Lokasi
Nilai Bobot
1
Dekat kampus
100
2
Dekat jalan raya
80
3
Dekat tempat
60
80 %
peribadahan
4
Dekat teman
40
sedaerah
5
Dekat rumah makan
20
6
Dekat tempat
10
hiburan
Nilai sistem kontrak adalah:
 (100 x 0,5)  (80 x 0,5)  (60 x0,5)  (40 x0,5)  35
4
4. Kriteria harga
Model harga dimaksudkan untuk
menentukan harga dari tempat tinggal.
Model ini terdiri dari 4 kriteria yaitu
tahunan, enam bulanan, tiga bulanan, dan
bulanan. Persentase nilai dari model harga
ditentukan berdasarkan hal-hal sebagai
berikut.
Tabel 4. Kriteria harga tahunan
No
Kriteria Harga
Nilai Bobot
tahunan
1
0 - 2.000.000
100
40%
2
2.001.000
- 80
2.500.000
3
2.501.000
- 60
3.000.000
Nilai lokasi adalah:
 (100 x 0,8)  (80 x 0,8)  (60 x0,8)  (40 x0,8)  (20 x0,8)  (10 x0,8)  41,333
6
2. Kriteria fasilitas
Model fasilitas dimaksudkan untuk
menentukan fasilitas yang didapatkan di
tempat kost dan berapa besar nilai dari
masing-masing point tersebut. Dengan
pemberian nilai mulai dari terkecil 20
sampai terbesar 100.
ISSN : 1979-5661
70 %
 (100 x 0,7)  (90 x 0,7)  (80 x 0,7)  (70 x0,7)  (60 x0,7)  (40 x0,7)  (20 x0,7)  46
BBT %
i 1
Nilai akhir =
Bobo
t
Nilai fasilitas adalah:
n
 (SBK ) x
Tempat tidur
Meja belajar
Lemari pakaian
Kamar mandi dalam
Kamar mandi luar
Dapur
Ruang tamu
Nila
i
100
90
80
70
60
40
20
Nilai kriteria tahunan adalah:
-13-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
 (100 x 0,4)  (80 x 0,4)  (60 x 0,4)  32
Berdasarkan nilai akhir yang didapat yaitu
30,30 dimana rentang nilai tersebut <=59 yang
artinya tempat kost tersebut tidak dipilih.
3
Tabel 5. Kriteria harga enam bulanan
No
Kriteria Harga
Nilai Bobo
enam bulan
t
1
0 - 1.050.000
80
30 %
2
1.051.000 60
1.300.000
3
1.301.000 40
1.550.000
3.4. Perancangan Basis Dialog
Rancangan dialog dari sistem pendukung
keputusan bertujuan untuk memudahkan
terjadinya interaksi antara pengguna dengan
sistem,
dimana
rancangan
dialognya
menggunakan gaya menu dengan strukturnya
seperti gambar berikut ini:
Nilai model enam bulanan adalah:
 (80 x 0,3)  (60 x 0,3)  (40 x 0,3)  18
3
Menu Utama
Menu Model
Tabel 6. Kriteria harga tiga bulanan
No
Kriteria Harga tiga
Nila Bobo
bulan
i
t
1
0 - 550.000
70
20%
2
551.000 - 675.000
50
3
676.000 - 6
30
800.000
Menu Kriteria
Input Model
Input Model
Edit Model
Edit Model
Hapus Model
Hapus Model
Laporan
Hasil Seleksi
Menu Tambahan
Informasi
Keluar Aplikasi
Gambar 2. Struktur Dialog
3.5. Perancangan Dialog Output Pemilihan
Tempat Kost di Yogyakarta
Rancangan dialog output yang dihasilkan
oleh sistem berupa laporan penilaian per
model, seperti ditunjukkan gambar berikut:
Nilai kriteria tiga bulanan adalah:
 (70 x 0,2)  (50 x 0,2)  (30 x 0,2)  10
3
Tabel 7. Kriteria harga bulanan
No
Kriteria
Nilai
Bobot
Harga
Bulanan
1
0 - 200.000
60
2
201.000 40
10%
250.000
3
251.000 20
300.000
Nilai kriteria harga nulanan adalah:
 (60 x 0,1)  (40 x 0,1)  (20 x 0,1)  4
3
Total nilai kriteria harga =  32  18  10  4  16
4
Proses perhitungan keseluruhan model
berdasarkan rumus dari pembobotan yang di
jelaskan di depan adalah sebagai berikut :
Nilai akhir adalah:
Gambar 3. Rancangan Dialog Output
 41,33  46  35  16  30,30
4
ISSN : 1979-5661
-14-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
4. IMPLEMENTASI MODEL
4.1. Menu Utama
Menu utama ditampilkan agar seseorang
mengetahui seluruh menu dan sub menu yang
ada di dalam sistem aplikasi dimana pengguna
dapat memilih menu-menu yang ditampilkan
oleh aplikasi.
Gambar 6. Menu Edit Model
4.4. Menu Hapus Model
Menu hapus model digunakan untuk
menghapus model yang telah diinputkan,
apabila model yang dimaksudkan tidak sesuai
dengan kelayakan penilaian pemilihan tempat
kost.
Gambar 4. Menu Utama
4.2. Menu Input Model
Menu input model digunakan untuk
memasukkan model atau kriteria-kriteria dari
sistem pemilihan kost. Di dalam menu ini ada
beberapa fitur yaitu simpan, batal, keluar dan
tampil data. tampil data berisi kriteria-kriteria
yang sudah terdapat di dalam sistem.
Gambar 7. Menu Hapus Model
4.5. Menu Input Kriteria
Menu input kriteria digunakan untuk
menginput nilai masing-masing kriteria
beserta bobot dari model yang digunakan.
Gambar 5. Menu Input Model
4.3. Menu Edit Model
Menu edit model digunakan untuk
memperbaiki model atau kriteria yang telah
diinputkan apabila terjadi perubahan pada
model yang ada.
Gambar 8. Menu Input Kriteria
4.6. Menu Edit Kriteria
Menu edit kriteria digunakan untuk
mengedit kriteria yang di dalam pemasukkan
ISSN : 1979-5661
-15-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
datanya ada kesalahan baik terhadap nilai,
bobot dan nama sub kriteria.
Gambar 9. Menu Input Kriteria
4.7. Menu Hapus Kriteria
Menu hapus kriteria digunakan untuk
menghapus kriteria yang didalam pemilihan
tempat kost tidak sesuai dengan kriteria
pemilihan
5. KESIMPULAN
Konsep rancangan sistem pendukung
keputusan penentuan tempat tinggal atau kost
diharapkan menjadi acuan bagi pengembangan
sistem nantinya atau computer base system.
Dari beragamnya tempat kost
yang ada
didaerah Yogyakarta diharapkan dapat
membantu mahasiswa dalam menentukan
tempat kost yang layak sesuai dengan
keinginan dari mahasiswa tersebut.
Gambar 10. Menu Hapus Kriteria
6. DAFTAR PUSTAKA
[1] Alter, S.L., 1980, Decision Support System:
Current
Practice
and
Continuing
Challenge, Reading, MA: AddisionWesley
[2] Kosasih, S., 2002, Sistem Pendukung
Keputusan, Proyek Peningkatan Penelitian
Tinggi Direktorat Jendral Pendidikan
Tinggi Departemen Pendidikan Nasional
[3] Little, J. D.C., 1970, Model and Managers:
The Concept of a Calculus, Management
Science, vol.16, no.8
[4] Turban, 2005, Decision Support System
and Intelligent System (Terjemahan: Sitem
Pendukung Keputusan dan Sistem Cerdas)
Jilid 1, Andi Offset, Yogyakarta.
4.8. Menu Lapotan Sistem
Menu laporan didasarkan atas kebutuhan
informasi yang telah diidentifikasi pada tahap
penentuan syarat-syarat informasi. Laporan
yang dihasilkan oleh sistem yaitu laporan
penentuan pemilihan tempat kost bagi
mahasiswa yang nantinya menentukan apakah
seorang mahasiswa memilih tempat kost,
mempertimbangkan atau menolak kost
tersebut.
ISSN : 1979-5661
-16-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
SISTEM TUTORIAL MATEMATIKA DISKRET DALAM MENUNJANG PROSES
BELAJAR BERBASIS KOMPETENSI
I Gede Santi Astawa
Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Email : [email protected]
ABSTRAK
Matematika Diskret merupakan salah satu mata kuliah yang cukup ditakuti oleh mahasiswa. Rasa
takut dan malu inilah yang seringkali menjadi hambatan dalam proses belajar mengajar di kelas,
karena mahasiswa cenderung untuk diam. Hal ini sangat bertentangan dalam system pembelajaran
berbasis KBK, dimana peran aktif mahasiswa menjadi point utama penilaian.
Sebuah aplikasi komputer yang mampu memberikan tutorial matematika diskret kepada
mahasiswa menjadi sangat dibutuhkan, karena dengan menggunakan aplikasi ini mahasiswa dapat
belajar dan menguji kemampuan dalam mata kuliah matematika diskret secara mandiri.
Dari hasil pengujian, kelompok mahasiswa yang menggunakan system tutorial berbasis computer
cenderung memiliki nilai (tingkat pemahaman) yang lebih baik dibandingkan dengan kelompok
mahasiswa yang hanya diberikan pembelajaran di kelas.
Kata kunci— Matematika Diskret, KBK, aplikasi komputer.
1. PENDAHULUAN
Kecemasan siswa merupakan salah satu faktor
penting yang mempengaruhi hasil belajar
siswa[1]. Beberapa hal berpengaruh pada
kecemasan dalam diri siswa, seperti tegang saat
mengerjakan soal atau saat kelas dimulai,
pesimis akan kemampuannya, khawatir jika hasil
pekerjaannya buruk, dan juga ketakutan akan
ditertawakan oleh teman yang lainnya [2,3].
Kecemasan juga muncul dari faktor di luar diri
siswa, seperti: cerita buruk mengenai suatu mata
pelajaran,sikap guru, dan juga tingkat persaingan
di kelas yang siswa rasakan[1].
Metode belajar mandiri berbantuan komputer
dalam proses pembelajaran dikembangkan untuk
mengatasi permasalahan kecemasan siswa dalam
belajar di kelas. Kombinasi metode kecerdasan
buatan, pengetahuan kognitif, dan teknologi
modern pada proses pembelajaran akan
menghasilkan sebuah sistem pembelajaran yang
efektif yang selanjutnya dikenal dengan istilah
Intelligent
Computer-Aided
Instruction
(ICAI)[4]. Pada beberapa penelitian ICAI
dihubungkan dengan sistem yang meggunakan
konten pembelajaran dan strategi pengajaran
ISSN : 1979-5661
sebagai basis data pengetahuan, kemudian
menggunakan
penalaran
berdasarkan
pemahaman siswa untuk secara dinamis
melakukan adaptasi pada proses pembelajaran,
sistem ini dikenal dengan sistem tutorial adaptif
[5,6].
Selain berfungsi sebagai alat bantu dalam
belajar, bahan pembelajaran berbasis Komputer
juga memiliki karakteristik tersendiri. Menurut
Slamet Suyanto. Ciri-ciri bahan pembelajaran
berbasis komputer adalah sebagai berikut :
1. Sistemik, Bahan pembelajaran berbasis
komputer disusun secara sistemik dan
terstruktur.
Selain itu pengembangan
pembelajaran berbasis komputer juga
mempertimbangkan penyusunan peta konsep
keilmuwan. Beberapa pilihan yang dapat
digunakan dalam menyusun peta konsep,
mulai dari konsep mudah ke sulit sampai
dengan umum ke khusus, hal ini tergantung
dari kebutuhan yang diinginkan.
2. Jelas dan Menarik, Pemaparan konsep yang
jelas dan tampilan yang menarik merupakan
hal pokok dalam pembelajaran berbasis
komputer. Penggunaan bahasa yang lugas,
tidak enterpretatif, penggunaan ilustrasi yang
-17-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
jelas dan detail juga termasuk syarat mutlak
dalam pengembangan pembelajaran berbasis
komputer.
3 Mudah digunakan, Sebagian besar produk
pembelajaran berbasis komputer sangat
mudah digunakan, meskipun bagi orang
awam
sekalipun.
Dengan
petunjuk
penggunaan yang jelas dan memiliki pola
logika yang konkrit menjadikan produk PBK
mudah dipahami.
4 Mudah diperbaiki, Produk pembelajaran
berbasis komputer juga mudah diperbaiki.
Penambahan, pengurangan, dan revisi
terhadap isi produk sangat mudah dilakukan.
Berbeda halnya dengan bahan cetak, setelah
mengalami proses pencetakkan bahan ajar
cetak sulit untuk direvisi secara langsung,
melainkan harus melakukan pencetakan
ulang.
Dengan
semakin
pesatnya
perkembangan teknologi, fitur-fitur yang
terdapat dalam fasilitas program juga semakin
berkembang. Sehingga semakin memudahkan
dalam pengeditan produk PBK.
5. Mudah disebarluaskan, Bahan ajar berbasis
komputer
sangat
mudah
untuk
disebarluaskan,
salah
satunya
adalah
penyebaran menggunakan media internet.
2. METODE PENELITIAN
Langkah-langkah dalam penelitian ini adalah
1. Studi Pustaka, dengan membaca beberapa
jurnal atau hasil penelitian terkait, sahingga
aplikasi yang dibuat memiliki arah dan tujuan
yang pasti.
2. Analisa kebutuhan system, dilakukan dengan
membaca
materi-materi
pada
buku
matematika diskret, membuat diagram
keterkaitan materi, dan mencari sifat-sifat dari
materi.
3. Perancangan system, disesuaikan dengan
kesimpulan pada tahap analisa kebutuhan
system
4. Aplikasi, system diaplikasikan pada bahasa
pemrograman Delphi, dengan database
paradox.
5. Pengujian, pengujian dilakukan dengan
membagi mahasiswa menjadi dua kelompok
pada satu sub bahasan matematika diskret,
dimana satu kelompok ditugaskan untuk
mencoba system tutorial yang sudah dibuat,
dan kelompok lain hanya diberikan
pembelajaran dikelas saja. Selanjutnya
diadakan sebuah test kecil untuk melihat
ISSN : 1979-5661
tingkat pemahaman siswa pada sub bahasan
tersebut.
3. DESAIN SISTEM TUTORIAL
Proses belajar dalam penelitian ini dibagi
menjadi empat tahap, yaitu:
1. Tahap membaca, pada tahap ini diberikan
materi bacaan, dan siswa diminta menjawab
pertanyaan bacaan.
2. Tahap pemahaman materi, pada tahap ini
materi bacaan dihilangkan dan siswa diminta
menjawab pertanyaan yang berhubungan
dengan materi.
3. Tahap contoh soal, pada tahap ini diberikan
tiga tipe soal contoh yang lebih bersifat
hitungan. Pada tahap ini, apabila jawaban
siswa salah, maka sistem akan menanyakan
data-data tentang apa yang diketahui atau
ditanyakan pada soal tersebut, dan
menyiapkan soal dengan tipe yang sama.
Tahap ini bertujuan untuk melatih
kemampuan siswa dalam menganalisa soal.
4. Tahap latihan soal, pada tahap ini diberikan
beberapa soal yang lebih bersifat hitungan.
Tahap ini bertujuan untuk mengetahui tingkat
pencapaian siswa pada materi pelajaran yang
sedang dipelajari.
Adaptasi pertama dilakukan pada tahap
membaca, dengan menggunakan nilai dan waktu
untuk menjawab sebagai faktor kelulusan,
apabila siswa dalam tahap ini tidak dapat
mencapai batas bawah kelulusan maka sistem
akan memberikan materi dan pertanyaan dengan
level yang lebih mudah terlebih dahulu sebelum
nantinya kembali ke level semula. Terdapat tiga
level materi atau soal pada tahap ini yaitu:
 Materi dengan lebih banyak contoh-contoh
atau pertanyaan-pertanyaan bacaan yang
jawabannya merupakan pengulangan dari
materi atau contoh yang sudah ada (level
rendah).
 Materi dengan beberapa contoh-contoh atau
pertanyaan-pertanyaan bacaan yang sedikit
berbeda dengan materi atau contoh yang
diberikan (level sedang).
 Materi dengan beberapa contoh atau
pertanyaan-pertanyaan
bacaan
yang
jawabannya memerlukan pemahaman maksud
dari materi atau contoh yang diberikan (level
tinggi).
Selanjutnya dirancang desain sistem berbasis
komputer yang diharapkan dapat membantu
mahasiswa dalam mempelajari cara-cara
-18-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
penyelesaian kasus materi pencacahan pada
matakuliah matematika diskret. Langkah pertama
akan disusun rencangan data flow diagram
(DFD) dari sistem yang akan dibuat sebagai
berikut:
Passwor
0 Sistem
Sis
wa
jawaban
Pertanyaan/
materi
Password,
materi baru
Tutorial
Matematika
Diskret
Data siswa,
data materi,
data aturan
Data siswa,
data materi
Gu
ru
Password,
aturan baru
Dan juga dirancang basis data yang akan
digunakan dalam system tutorial, basis data ini
pada dasarnya digunakan untuk menyimpan
berbagai file yang menyangkut materi belajar,
soal-jawaban, hint-hint, dan juga menyimpan file
pribadi pengguna system seperti gambar 2.
Rancangan sistem di atas, diimplementasikan
pada bahasa pemrograman Delphi 6.0. Bahasa
pemrograman Delphi dipilih karena sudah
mendukung sistem basis data dengan baik, dan
dapat berjalan dengan baik dalam lingkungan
sistem operasi Windows XP dan Windows 7
yang dewasa ini banyak digunakan di lingkungan
sekolah.
Admi
n
Gambar 1. DFD level 0 sistem tutorial
matematika diskret
syarat
m
Kode
soal
nama
jawa
b
Kode
TP
memiliki
nama
n
n
Test pendalaman
materi
1
soal
Kode
1
memiliki
1
Kode
1
rumus
memiliki
n
memiliki
soal
memiliki
Variable
n
Variable
Soal ujian
n
Langkah jawab
Langka
Langka
rum
1
1
memiliki
Langka
Kode
Kode
Contoh Soal
soa
Langka
h3
Gambar 2. ERD basis data sistem
ISSN : 1979-5661
-19-
soa
jawa
jawa
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
4. HASIL DAN PEMBAHASAN
Pengujian system yang akan dilakukan
bertujuan
untuk
mengetahui
efektifitas
penggunaan system tutorial ini bagi mahasiswa
dalam belajar metode pencacahan dalam kuliah
matematika diskret. Untuk itu pengujian akan
melibatkan 60 orang mahasiswa, dimana 30
mahasiswa dipilih secara acak untuk mencoba
sistem yang sudah dibuat. Akan diambil dua nilai
test, yaitu test pendahuluan (sebelum mencoba
sistem) dan test akhir (setelah selesai mencoba
system), analisis statistika akan digunakan untuk
menarik kesimpulan dari dua kelompok data
yang diperoleh. Sampai saat ini peneliti sudah
memberikan test pendahuluan kepada 60 orang
mahasiswa yang diambil secara acak dari 97
orang mahasiswa jurusan Ilmu Komputer UNUD
angkatan 2012 yang sedang mengambil
matakuliah matematika diskret. Gambar 3
dibawah adalah sebaran hasil pretest dan
pemilihan subyek penelitian yang dilakukan oleh
peneliti, pemilihan diambil secara acak dari
golongan mahasiswa dengan hasil pretest rendah,
sedang dan tinggi, sehingga diharapkan kondisi
awal kedua kelompok mahasiswa yang akan
dikenai perlakuan pada saat penelitian adalah
sama.
70
60
50
40
30
20
10
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
data1
data2
Gambar . 4. Perbandingan hasil pretest dua
kelompok subyek penelitian
Kelompok pertama adalah kelompok yang
diberikan perlakuan belajar di kelas, dengan
lebih banyak melakukan pembahasan soal (ratarata pretest 31,6333), sedangkan kelompok kedua
(rata-rata pretest 30,5) merupakan kelompok
yang selanjutnya diberikan kesempatan memakai
system tutorial yang sudah dirancang.
Dari hasil pretest yang dilakukan,
didapatkan hasil perbandingan nilai posttest dan
pretest dari masing-masing mahasiswa pada
kedua kelompok adaah sebagai berikut:
70
60
50
40
30
20
10
0
80
70
60
50
40
30
20
10
0
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
Hasil Pretest 60 Mahasiswa
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
Gambar. 3. Hasil Pretest seluruh mahasiswa
data1 pretest
Dari gambar 3 terlihat bahwa nilai pretest
tertinggi adalah 63, nilai pretest terendah adalah
15,sedangkan rata-rata perolehan 60 mahasiswa
adalah 30,0667. Langkah selanjutnya peneliti
membagi subyek penelitian menjadi dua bagian
dengan sebaran nilai pretest masing-masing
kelompok adalah
ISSN : 1979-5661
-20-
data1 postest
Gambar . 5. Perbandingan Pretest dan
Postest kelompok I
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
100
80
60
40
20
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
data2 pretest
data2 postest
Gambar. 6. Perbandingan Pretest dan
Postest kelompok II
Dari gambar 5. dan gambar.6, terlihat kelompok
yang mendapat kesempatan mencoba system
yang sudah dirancang memiliki kenaikan
nilai(selisih nilai posttest-pretest) yang lebih baik
dibandingkan kelompok yang hanya belajar di
kampus (kelompok I), dengan system
pembelajaran yang diberikan pada kelompok I
adalah system belajar yang lebih menitik
beratkan pada pembahasan contoh kasus. Dalam
bentuk table, hasil perbandingan ini dapat dilihat
sebagai berikut:
Median
Modus
Rata-rata
Tertinggi
Terendah
Sebaran
Kelompok I
Pretest Postest
Kelompok II
Pretest Postest
30
30
31,63
63
15
10,73
30
30
30,5
60
15
10,957
60
60
60,57
75
47
5,37
65
60
66,367
80
54
7,02
Dari table di atas, dapat disimpulkan bahwa
penggunaan system tutorial pada mata kuliah
matematika diskret khususnya pada materi
pencacahan,
menghasilkan
peningkatan
kemampuan mahasiswa yang lebih baik, dengan
rata-rata perolehan nilai adalah 66,3667.
5. KESIMPULAN
Berdasarkan proses perancangan, implementasi,
dan pengujian prototype system tutorial materi
matematika diskret yang telah dilaksanakan,
dapat disimpulkan bahwa:
1. Dari hasil analisa kebutuhan system,
ditemukan fakta bahwa salah satu
kesulitan mahasiswa dalam mempelajari
materi pencacahan adalah tidak adanya
ISSN : 1979-5661
panutan bagi mereka dalam belajar dan
berlatih diluar jam pelajaran kampus.
Sehingga keberadaan sebuah system
berbasis
computer
yang
mampu
menuntun mereka dalam belajar sangat
dibutuhkan.
2. Efektifitas penggunaan system tutorial
matematika diskret khususnya materi
pencacahan pada 30 orang mahasiswa,
adalah sangat baik apabila dibandingkan
dengan kelompok mahasiswa yang tidak
menggunakan system tersebut.
Pada beberapa tahapan penelitian, juga
ditemukan kendala-kendala seperti kesulitan
peneliti dalam menentukan hubungan kesalahan
yang dibuat mahasiswa dengan tingkat
pemahaman mereka. Sehingga disarankan untuk
penelitian selanjutnya perlu untuk dibahas
beberapa metode pendekatan mengenai hal ini,
sehingga system tutorial yang dihasilkan dapat
lebih baik.
6. DAFTAR PUSTAKA
[1] Abdurrahman, M., 1999, Pendidikan Bagi
Anak Berkesulitan Belajar. Jakarta :
Rineka Cipta.
[2] Elliot, S.N., Kratochwill, T.R., Litllefield,
J.,
Travers,
J.F.,
1996,
EducationalPsychology. Second edition,
Madition : Brown dan Benchmark
Company.
[3] Indiyani. N.E., Listiara, A., 2006,
Efektivitas Metode Pembelajaran Gotong
Royong(Cooperative Learning) untuk
Menurunkan Kecemasan Siswa dalam
Menghadapi Pelajaran Matematika, Jurnal
Psikologi Universitas Diponegoro Vol.3,
No. 1, Hal 12-20.
[4] Molnar A., 1997, Computers in education:
A brief history. THE Journal, 24,
http://www.thejournal.com/articles/13739,
diakses tanggal 14 January 2010.
[5] Zarlis, M., 2000, Sistem Tutorial Cerdas
dalam Pengajaran Kaidah Berangka bagi
Penyelesaian Model Matematik Kamiran
dalam Fisik , Disertasi, Universiti Sains
Malaysia.
[6] Korhan, G., 2006, Intelligent Tutoring
Systems for Education, Tesis, Graduate
School of Natural and Applied Sciences,
Dokuz Eyl ¨ul University.
[7]
Minarti, Yutmini S., dan Suwalni. 2004.
Pengaruh Media Transvisi dan Atribusi
-21-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Siswa terhadap Prestasi Belajar
Matematika. Jurnal Teknodika 2 (3) : 64 –
88.
[8]
Roger S. Pressman, 2009, Software
Engineering: A Practitioner's Approach
7th edition, McGraw-Hill
[9]
Suja, I., 2005, Pemrograman SQL dan
Database Server MySQL, Andi
Yogyakarta
[10] Sutomo, dkk. 2004. Penggunaan Alat
Peraga dalam Pembelajaran Matematika
dan Motivasi Belajar Siswa. Jurnal
Teknodika 2 (3) : 89 – 112.
[11] Wulan, E.R., dkk. 2004. Keefektifan
Penggunaan
Media
Model
dalam
Pembelajaran
Matematika.
Jurnal
Teknodika 2 (3) : 44-63.
ISSN : 1979-5661
-22-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
PENENTUAN KOMPOSISI BAHAN PAKAN IKAN LELE YANG OPTIMAL DENGAN
MENGGUNAKAN METODE IWO-SUBTRACTIVE CLUSTERING
Agus Muliantara
Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Udayana
email : [email protected]
ABSTRAK
Pakan selain sebagai salah satu faktor yang dapat meningkatkan produktifitas ikan, juga
merupakan satu komponen terbesar dalam biaya produksi. Dapat mencapai 60% dari keseluruhan
biaya produksi Saat ini harga pakan buatan sudah sekitar Rp 10.000,- per kg.
Untuk mendapatkan komposisi pakan yang berkualitas dan memiliki biaya yang efisien
tentunya tidak mudah. Salah satu cara yang mungkin digunakan adalah metode trial and error atau
metode coba-coba. Namun hal ini tentunya tidak mungkin karena akan terbentur masalah waktu.
Untuk itu perlu dilakukan suatu penggabungan beberapa bidang ilmu untuk mendapatkan nilai pakan
yang optimal tersebut.
Dalam bidang teknik informatika, permasalan mencari komposisi pakan yang optimal
(memiliki kandungan gizi baik, tapi harga yang efisien) dikatakan sebagai permasalahan multi
objective. Salah satu metode yang dapat digunakan untuk memecahkan permasalahan multi objective
adalah Multi Objective Optimiztion with Invasive Weed Optimization-Subtractive Clustering (IWOSC). Penerapan metode IWO-SC dapat digunakan pada kasus penentuan komposisi pakan ikan lele
yang optimal tingkat efisiensi biaya pakan menjadi sebesar Rp 922,00 /Kg.
Kata kunci: permasalahan tujuan ganda, optimasi tujuan ganda, Invasive Weed Optimization,
Subtractive Clusterting, pakan lele
ABSTRACT
Fish Feed apart as one of the factors that can increase the productivity of the fish, also the
largest component in the cost of production. Can reach 60% of the total cost of production of artificial
feed prices now are around Rp 10,000, - per kg.
To get high quality feed composition has a cost-efficient and certainly not easy. One way that
may be used is the method of trial and error or trial and error method. But it is certainly not possible
because it would spend the time. So it is necessary for the incorporation of multiple disciplines to
obtain the optimal feed value.
In the field of computer science, experiences to find the optimal feed composition (having
good nutritional content, but the price is efficient) said as a multi objective problem. One method that
can be used to solve multi objective is Optimiztion Multi Objective Optimization with Invasive
Weed-subtractive clustering (IWO-SC). Application of the Iwo-SC method can be used to optimalized
efficiency of feed cost to be Rp 922.00 / Kg.
Keywords: multi objective proble, multi objective optimization, Invasive Weed Optimization,
subtractive Clusterting, catfish’s feed
positif lain dari daerah pariwisata adalah
adanya pertumbuhan tempat makan seperti
restoran, depot, warung-warung tradisional
maupun pedagang kaki lima di pinggir jalan
yang menyediakan menu lokal yang beragam.
1. PENDAHULUAN
Selain peningkatan pertumbuhan ekonomi
yang cenderung meningkat, salah satu dampak
ISSN : 1979-5661
-23-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Bali sebagai salah satu tujuan wisatawan
mancanegara maupun lokal pun terkena
dampak positif tersebut.
Berbagai menu lokal maupun menu luar
negeri makin banyak menghiasi menu-menu
yang ditawarkan oleh tempat makan di Bali
sebagai salah satu upaya pemenuhan selera
makan wisatawan. Salah satu menu yang saat
ini sedang menjamurnya adalah menu
berbahan dasar ikan lele seperti pepes lele, lele
penyet, ikan lele bumbu balado dan lain-lain.
Rasa lele yang gurih dan dibumbui dengan cita
rasa lokal sangat menggugah selera para
wisatawan untuk mencoba menu berbahan
dasar lele tersebut. Kebutuhan restoran atau
rumah makan akan bahan baku ikan lele
sangatlah besar namun pasokan yang mampu
diberikan oleh peternak pembesaran ikan lele
masih belum mampu mengimbangi permintaan
ini.
Salah satu hal yang menyebabkan
pengusaha tidak mampu mengimbangi
permintaan yang sangat besar ini diantaranya
adalah harga pakan yang mahal sehingga
peternak hanya mampu membiakkan lele
dalam jumlah yang terbatas. Untuk
meningkatkan produksi lele, salah satu
solusinya adalah dengan penggunaan pakan
buatan.
Pakan buatan adalah merupakan campuran
dari bahan-bahan pakan yang memiliki
kandungan nutrisi dan harga yang berbedabeda. Kesalahan penentuan bahan-bahan
pakan dapat berdampak pada rendahnya
kandungan nutrisi dan tingginya biaya
penyediaan pakan buatan yang dihasilkan (luh
dkk, 2011). Namun pemilihan pakan yang
tepat akan berdampak sebaliknya yaitu harga
pakan buatan menjadi lebih murah dan
meningkatnya nilai gizi pakan. Peningkatan
nilai gizi pakan lele ini tentunya berakibat pula
pada meningkatnya produksi ikan lele.
Pakan selain sebagai salah satu faktor
yang dapat meningkatkan produktifitas ikan,
juga merupakan satu komponen terbesar dalam
biaya produksi. Dapat mencapai 60% dari
keseluruhan biaya produksi (Afrianto dan
Liviawaty, 2005). Saat ini harga pakan buatan
sudah sekitar Rp 10.000,- per kg. Karenanya,
para peternak lele biasanya memilih
menggunakan pakan ramuan sendiri hingga
marjin yang diperoleh bisa lebih besar
dibanding penggunaan pakan buatan pabrik.
Biasanya, para peternak akan meramu pakan
yang terdiri dari dedak halus (bekatul) 20%,
ISSN : 1979-5661
ampas tahu 20%, menir atau jagung giling
20%, dan ayam broiller mati yang dibeli
borongan di peternakan ayam atau ikan rucah
yang dibeli di Tempat Pelelangan Ikan (TPI)
sebanyak 35%, tepung tapioka 5% dan vitamin
C serta B Complex. Oleh karena itu agar
didapatkan tingkat produksi yang tinggi selain
kualitas pakan harus baik, efisiensi produksi
pakan juga harus dipertimbangkan.
Untuk mendapatkan komposisi pakan
yang berkualitas dan memiliki biaya yang
efisien tentunya tidak mudah. Salah satu cara
yang mungkin digunakan adalah metode trial
and error atau metode coba-coba. Tiap
komposisi kandungan gizi dan harga pakan
dihitung dan dicoba agar nantinya didapatkan
nilai yang optimal. Namun hal ini tentunya
tidak mungkin karena akan terbentur masalah
waktu. Untuk itu perlu dilakukan suatu
penggabungan beberapa bidang ilmu untuk
mendapatkan nilai pakan yang optimal
tersebut (kandungan gizi baik, harga efisien).
Dalam penelitian ini bidang ilmu yang
akan digunakan yaitu Peternakan dan Teknik
Informatika. Bidang Peternakan sebagai
bidang yang akan memberikan sekumpulan
aturan yang baik dalam menghasilkan pakan
yang baik, dan teknik informatika akan
digunakan sebagai bidang yang akan
mempercepat proses pencarian komposisi
pakan yang optimal tersebut.
Dalam bidang teknik informatika,
permasalan mencari komposisi pakan yang
optimal (memiliki kandungan gizi baik, tapi
harga yang efisien) dikatakan sebagai
permasalahan multi objective. Dimana tujuan
yang ingin dicapai adalah dua hal yang saling
bertentangan. Permasalahan multi objective
dapat pula ditemui seperti halnya dalam
pengembangan
kendaraan
agar
dapat
digunakan pada kecapatan tinggi namun juga
harus hemat bahan bakar. Dalam permasalahan
multi objective umumnya memiliki 2 atau
lebih tujuan yang saling bertentangan. Salah
satu metode yang dapat digunakan untuk
memecahkan permasalahan multi objective
adalah Multi Objective Optimiztion with
Invasive
Weed
Optimization-Subtractive
Clustering (IWO-SC) (muliantara, 2011).
MOEA banyak dikembangkan
karena
implementasinya yang sederhana serta dapat
digunakan untuk menyelesaikan permasalahan
pada ruang pencarian yang sangat besar dan
kompleks (Zitzler,-)
-24-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Pemilihan algoritma IWO-SC sebagai metode
optimasi pakan ikan lele ini karena
kemampuan IWO-SC yang mengadopsi
prilaku semak-semak di alam liar yang selalu
mampu bertahan walaupun tetap berusaha
dimusnahkan oleh manusia. Artinya sifat
semak-semak yang mampu mencari posisi
tempat tinggal yang optimal sangatlah cocok
diterapkan untuk mencari posisi (dalam hal ini
dapat disebut sebagai komposisi) pakan ikan
sehingga didapatkan kombinasi yang tepat
antara kandungan gizi dan harga yang efisien.
Beberapa keuntungan yang akan didapat
dalam penggunakan metode ini adalah :
algoritma IWO-SC akan dapat meminimalkan
waktu
komputasi
jika
dibandingkan
menggunakan cara manual, kesalahan
perhitungan secara manual pun akan dapat
diminimalkan.
2. ALGORITMA IWO-SC
IWO-SC diperkenalkan oleh muliantara
dkk yang dikembangkan dari metode
Multiobjective optimization with Invasive
Weed Optimization (IWO-MO) yang secara
khusus digunakan untuk memecahkan
permasalahan ganda. IWO-SC sendiri adalah
merupakan algoritma evolusi yang terinspirasi
oleh kelakuan koloni semak-semak (weed)
yang selalu menang. Semakin keras usaha
manusia untuk menyingkirkannya, maka
semakin baik semak-semak itu bertahan hidup.
Adapun algoritma yang digunakan pada
IWO-SC adalah sebagai berikut :
1. melakukan fitness terhadap sejumlah np
individu pada populasi
2. melakukan perankingan terhadap populasi
menggunakan Fuzzy Sort
3. penentuan jumlah benih berdasarkan pada
nilai fitness tiap individu menggunakan
perumusan sebagai berikut
(
(
normal dengan mean sama dengan nol.
Penentuan standar deviasi distribusi
didapatkan
menggunakan
perumusan
sebagai berikut
Dimana :
= standar deviasi distribusi pada individu
ke-iter
= inisialisasi standar deviasi
= inisialisasi standar deviasi
= jumlah iterasi maksimal
= nilai iterasi saat ini
= nonliniear modulation index (pada
IWO-MO n=1)
Proses ini akan menjamin kemungkinan
jatuhnya benih selalu berkurang secara non
linear pada area disekitar induknya. Sehingga
menghasilkan group suatu individu.
5. saat populasi mencapai jumlah maksimum,
maka proses eliminasi akan dilakukan
menggunakan subtractive clustering serta
memilih
sejumlah
Pmaxindividu
yang
diperbolehkan untuk bertahan.
Proses 1 sampai dengan proses 5 tersebut
dilakukan berulang-ulang sampai stopping
criterion tercapai.
flowchart metode IWO-SC dapat dilihat
pada Gambar 1.
Pada proses (ii) Menentukan Individu yang
merupakan
kandidat
solusi
sebanyak
maksimum populasi dijabarkan menjadi
beberapa sub proses sehingga keseluruhan
proses akan berurutan sebagai berikut :
(i)
inisialisasi awal,
(ii) perhitungan fitnes dari np individu,
(iii) Perankingan
menggunakan
fuzzy
dominance based sorting,
(iv) perhitungan jumlah benih yang dapat
diproduksi oleh tiap individu,
(v) penyebaran benih secara acak dengan
menggunakan distribusi normal,
Saat
individu
mencapai
jumlah
maksimum, dilakukan proses prunning)
menggunakan subtractiveclustering.
))
Dimana :
= benih ke-i dengan {i | 0 < i <= np}
= jumlah benih minimum
= jumlah benih maksimum
= jumlah individu pada populasi
= ranking benih ke-i
4. Benih yang sudah dibuat kemudian akan
disebar secara acak menggunakan distribusi
ISSN : 1979-5661
-25-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
3. DESAIN SISTEM
Di penelitian ini, langkah-langkah yang
dilakukan adalah (i) penentuan fungsi
objective, (ii) desain algoritma, (iii)
implementasi algoritma, (iv) uji coba, dan
PENENTUAN FUNGSI OBJECTIVE
Seperti yang telah disampaikan pada sub bab
F.2 bahwa pakan lele dumbo yang baik adalah
sebagai berikut :
Tabel 1. Persyaratan Nutrisi Pakan Lele
Dumbo
Maka dapat ditentukan fungsi objecktif
untuk beberapa usia lele adalah sebagai
berikut:
a. Untuk pembenihan
Fungsi kandungan pakan ikan lele adalah
sebagai berikut :
F1(x) = 0.48x1 + 0.20x2 + 0.13x3 + 0.06x4
dimana :
x1: jumlah pakan dengan kandungan
protein per kg
x2: jumlah pakan dengan kandungan lemak
per kg
x3: jumlah pakan dengan kandungan
karbohidrat per kg
x4 : jumlah pakan dengan kandungan serat
per kg
b. Untuk pembesaran
F1(x) = 0.37x1 + 0.20x2 + 0.13x3 + 0.08x4
Gambar 1. Metode IWO-SC
(vi) evaluasi. Alur metodologi
dapat dilihat pada Gambar 2.
dimana :
x1: jumlah pakan dengan kandungan
protein per kg
x2: jumlah pakan dengan kandungan kadar
lemak per kg
x3: jumlah pakan dengan kandungan
karbohidrat per kg
x4: jumlah pakan dengan kandungan serat
per kg
penelitian
Penentuan Fungsi Objective
Merancang modul IWO-SC
c. Untuk indukan
F1(x) = 0.38x1 + 0.20x2 + 0.13x3 + 0.08x4
Implementasi Modul menggunakan
Matlab 2010a
dimana :
x1: jumlah pakan
protein per kg
x2: jumlah pakan
lemak per kg
Uji coba
Gambar 2.Alur Desain Sistem
ISSN : 1979-5661
-26-
dengan
kandungan
dengan
kandungan
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
x3: jumlah pakan dengan kandungan
karbohidrat per kg
x4: jumlah pakan dengan kandungan serat
per kg
jumlah
yang
peternakannya.
akandigunakan
dalam
IWO-SC
Untuk desain sistem, seperti yang telah
dijelaskan pada sub bab 3, dimana flowchart
yang akan digunakan pada penelitian ini
adalah tampak pada Gambar 4.
MODUL PADA
d. berdasarkan
hasil
survey
yang
dilaksanakan, didapatkan beberapa harga
untuk pakan ikan lele, sebagai berikut :
protein (bekatul) :1500/kg --150.000/kw
lemak(ayammati) :1500/kg --150.000/kw
karbohidrat (jagung giling): 1500/kg -150.000/kw
serat (ampas tahu)
: 150/kg -15.000/kw
sehingga total biaya pembuatan pakan adalah
Rp 4.650/kg atau Rp 465.000/kwintal. Untuk
itu fungsi biaya yang digunakan adalah
sebagai berikut :
F2(x) = 1500 x1 + 1500 x2 + 1500 x3 +150x4
dimana :
x1 : jumlah pakan dengan kandungan protein
x2 : jumlah pakan dengan kandungan lemak
x3 : jumlah
pakan
dengan
kandungan
karbohidrat
x4 : jumlah pakan dengan kandungan serat
fungsi biaya yang digunakan adalah sama
untuk ketiga proses, karena harga pakan ikan
lele adalah tidak terpengaruh pada proses
pembenihan atau pembesaran maupun
indukan.
e. Konstrain yang akan digunakan dalam
membatasi jumlah pakan adalah tidak boleh
lebih dari 1Kg atau < 1Kg. sehingga fungsi
konstrainnya adalah
1 >= x1 + x2 + x3 + x4
dimana :
x1 : jumlah pakan dengan kandungan protein
x2 : jumlah pakan dengan kandungan lemak
x3 : jumlah
pakan
dengan
kandungan
karbohidrat
x4 : jumlahpakan dengan kandungan serat
Gambar 4. Flowchart system
DESAIN ANTAR MUKA
Adapun desain antar muka yang di gunakan
adalah sebagai berikut :
kombinasi dari ketiga fungsi objektif
inilah yang akan digunakan untuk menentukan
berapa banyak komposisi pakan lele agar
optimal (murah namun dengan kandungan gizi
yang baik dan tidak lebih dari 100Kg/1
kwintal). Berat maksimal yang diijinkan oleh
system adalah 100Kg dengan pertimbangan
jumlah pakan yang dijual dipasaran adalah
dalam satuan kwintal. Sehingga hal ini akan
memudahkan peternak dalm menentukan
ISSN : 1979-5661
Gambar 3. Antar muka program
-27-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
4. UJICOBA
Uji coba dilakukan dengan cara
melakukan beberapa kali perhitungan. Dari
masing-masing percobaan akan dicari nilai
rata-rata solusi sehingga itulah yang akan
digunakan sebagai solusi akhir. Adapun data
percobaan yang dilakukan adalah tampak pada
Tabel 2
Tabel 3 Pruning Pareto Front
Tabel 2. Data Hasil Percobaan
6. SIMPULAN
Dari
penelitian
yang
telah
dilaksanakan, dapat disimpulkan hal-hal
berikut :
1. Penerapan metode IWO-SC dapat
digunakan
pada
kasus
penentuan
komposisi pakan ikan lele yang optimal
2. Parameter yang digunakan pada system
ini yaitu jumlah dimensi : 4, populasi
awal : 20, populasi maksimum : 100,
modulation indeks : 1, acceptance ration:
0.5, rejection ratio : 0.15 dengan iterasi
maksimum : 5000, solusi counter : 10
menghasilkan efisiensi biaya pakan
menjadi sebesar Rp 922,00 /Kg.
5. ANALISA HASIL
Berdasarkan hasil percobaan didapatkan
30 nilai yang berbeda-beda. Masing-masing
nilai disebut sebagai pareto front. Solusi akhir
pada kasus multi objective adalah jamak.
Sehingga semua nilai yang diberikan adalah
merupakan solusi. Namun apabila ingin
dicapai solusi yang lebih baik. Constrain yang
digunakan haruslah diterapkan pada solusi
tersebut. Sehingga dengan mengggunakan
constraint harga pakan tertinggi adalah Rp
1200,00 per Kg maka solusi akhir akan
menjadi lebih sedikit yaitu tampak pada Tabel
3 berikut.
Berdasarkan Tabel 3 ini, maka peternak
bisa menggunakan salah satu kombinasi
komposisi pakan lele yang ada. Dimana pada
kasus ini, dibatasi harga maksimum untuk
sebuah pakan lele adalah Rp 1.200,00 per Kg.
ISSN : 1979-5661
7. DAFTAR PUSTAKA
Afrianto, E., Liviawaty,E. Pakan Ikan,
Yogyakarta:Kanisius, 2005
Luh Kesuma Dewi Wardhani, M. Safritzal,
Achmad
Chairi.
2011.
Optimasi
Komposisi pakan ikan air tawar
menggunakan metode multi-objective
genetic algorithm, seminar Nasional
Aplikasi Teknologi Informasi 2011,
Yogyakarta, 17-18 Juni 2011
Muliantara, Agus, Agus Zainal Arifin, Anny
Yuniarti, Optimasi Tujuan ganda
menggunakan algoritma IWO-Subtractive
Clustering, Seminar Nasional Pasca
Sarjana XI, Surabaya, 2011
Zitzler, Eckart, Marco Laumanns, and Stefan
Bleuler. "A tutorial on Evolutionary
Multiobjective Optimization." Zurich
Switzerland, n.d
-28-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
SISTEM PENGAMANAN DATA SIDIK JARI MENGGUNAKAN ALGORITMA AES PADA
SISTEM KEPENDUDUKAN BERBASIS RADIO FREQUENCY IDENTIFICATION (RFID)
I Gede Andika Putra1,I Made Widhi Wirawan2
Program Studi Teknik Informatika, Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Email :[email protected], [email protected]
ABSTRACT
Kebutuhan manusia akan perangkat informasi dan komunikasi seakan menjadi kebutuhan yang
tidak terpisahkan dalam kehidupan sehari-hari. teknologi RFID adalah proses identifikasi seseorang
atau objek dengan menggunakan frekuensi transmisi radio. Keamanan data sidik jari penduduk pada
tag RFID ini merupakan hal yang sangat penting untuk dilakukan. Metode kriptografi menjadi salah
satu pilihan dalam pengamanan untuk menghindari jika terjadinya ancaman penyalahgunaan kartu
identitas penduduk oleh orang yang tidak berhak.
Objek suatu pengamanan dalam hal ini adalah data sidik jari penduduk yang akan disimpan
dalam memori yang terkandung dalam tag RFID Mifare 1K. Data yang akan dituliskan ke dalam
memory tag di rubah ke bentuk yang sulit dimengerti menurut proses enkripsi algoritma AES.
Sedangkan dalam proses pembacaan tag akan dijalan kan proses dekripsi untuk mengetahui data
identitas penduduk yang tersekripsi menjadi data asli.
Metode Algoritma AES dapat memberikan keamanan pada sistem kependudukan berbasis
RFID. Bedasarkan pengujian RMS yang telah dilakukan data sidik jari yang diamankan dalam tag
RFID tidak dapat digunakan oleh penduduk yang tidak berhak. Disamping itu pada sistem ini
dilakukan proses dekripsi untuk menampilkan data penduduk.
Kata kunci : RFID (Radio Frequecy Identification), Algoritma AES, Sidik Jari, Keamanan RFID.
dan penyalah gunaan terhadap kartu identitas
penduduk perlu diamankannya suatu data
dengan kriptografi.
Kriptografi merupakan salah satu
solusi untuk menjamin keamanan dari suatu
data yaitu dengan menyandikan isi informasi
menjadi isi yang sulit bahkan tidak dipahami
dengan cara melalui proses enkripsi
(encryption), dan untuk memperoleh kembali
informasi yang asli dilakukan proses dekripsi
(decryption), disertai dengan menggunakan
kunci yang benar. Tujuan dari sistem
kriptografi yang terkait dengan aspek
keamanan
suatu
sistem
informasi,
kerahasian(privacy), integritas (Integrity),
otentikasi (Authentication), dan pembuktian
yang
tidak
bias
mengelak
(NonRepudiation).(Ariyus Dony, 2008).
Melihat hal ini, peneliti mencoba
untuk merancang sistem pengamanan data
sidik jari menggunakan algoritma AES pada
sistem
kependudukan
berbasis
RFID.
Algoritma AES merupakan algoritma yang
sudah terstandarisasi dan dapat dikatakan
1. PENDAHULUAN
1.1
LATAR BELAKANG MASALAH
Perkembangan teknologi informasi
dan komunikasi dari waktu ke waktu kian
meningkat.
Kebutuhan
manusia
akan
perangkat informasi dan komunikasi seakan
menjadi kebutuhan yang tidak terpisahkan
dalam kehidupan sehari-hari. Inovasi yang
terjadi
dalam bidang ini senantiasa
berkembang secara dinamis. Salah satu
contohnya adalah teknologi RFID.
RFID adalah proses identifikasi
seseorang atau objek dengan menggunakan
frekuensi transmisi radio. RFID menggunakan
frekuensi radio untuk membaca informasi dari
sebuah perangkat kecil yang disebut tag atau
transponder (Transmitter + Responder). Tag
RFID akan mengenali diri sendiri ketika
mendeteksi sinyal dari perangkat yang
kompatibel, yaitu pembaca RFID (RFID
Reader)
Salah satu pemanfaatan RFID adalah
pada Kartu Identitas Penduduk. Untuk
menghindari terjadinya kloning data digital
ISSN : 1979-5661
-29-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
relative murah, cepat dan dapat diterapkan
pada sistem RFID(Batbold T, 2006). kedalam
bentuk sistem yang dirancang untuk
melakukan enkripsi dan dekripsi data sidik jari
sehingga bisa melakukan pengamanan
terhadap data sidik jari agar dikemudian hari
tidak terjadi suatu penyalahgunaan baik data
digital kependudukan.
dan graphia. Crypto berarti secret (Rahasia)
dan graphia berarti writing (tulisan). Menurut
terminologinya, kriptografi adalah ilmu dan
seni untuk menjaga keamanan pesan ketika
pesan/ data dikirim dari suatu tempat ke
tempat yang lain
Kriptografi menjadi dasar bagi
keamanaan jaringan komputer. Karena yang
menjadi pokok dari fungsi komputer dan
jaringan adalah data dan informasi. Salah satu
cara yang paling banyak digunakan dalam
mengamankan
data
adalah
dengan
mengguanakan kriptografi. Data-data tersebut
diamankan oleh pengirim sehingga orang lain
tidak dapat mengenali data tersebut.
1.2 PERUMUSAN MASALAH
Berdasarkan latar belakang di atas,
maka permasalahan yang akan dikaji dalam
penelitian ini adalah bagaimana merancang
sistem
pengamanan
data
sidik
jari
menggunakan algoritma AES pada sistem
kependudukan berbasis RFID.
2.2 ALGORITMA KRIPTOGRAFI
Algoritma-algoritma kriptogrfi dapat
dibedakan menjadi dua macam yaitu simetrik
dan asimetrik. Algoritma simetrik (model
enkripsi konvensional) merupakan algoritma
yang menggunakan satu kunci untuk proses
enkripsi dan deskripsi data. Sedangkan
algoritma asimetrik (model enkripsi kunci
publik) menggunakan kunci yang berbeda
dalam proses enkripsi dan deskripsi pesan.
1.3 BATASAN MASALAH
1. Dalam penelitian ini, lebih difokuskan
pada pengamanan data sidik jari pada
sistem RFID dengan kasus sistem
kependudukan.
2. Alat pemindai yang digunakan adalah
fingerprint u are u 4500 dan Reader
RFID digunakan Omnikey 5321CL
3. Akuisisi data citra sidik jari langsung
dilakukan oleh alat pemindai, sistem
hanya melakukan pengolahan hasil
ekstraksi ciri dari data citra yang
diperoleh.
4. Pada sistem ini algoritma AES inputan
data sidik jari dibatasi masing-masing
dibatasi sebanyak 16 byte atau 128
bit. Dan panjang kunci selalu
mengikuti ukuran panjang dari
plainteks.
2.3 ALGORITMA AES
Dalam
kriptografi,
Anvanced
Encryption Standard (AES), juga dikenal
sebagai Rijndael, AES adalah sebuah block
cipher yang dijadikan standar enkripsi oleh
pemerintah Amerika Serikat. Enkripsi ini
diharapkan juga digunakan secara luas di
seluruh dunia dan dianalisa secara luas, seperti
pada pendahulunya , Data Encryption Standard
(DES). Rijndael (AES) diumumkan oleh
National Institute of Standards and
Technology (NIST) pada tanggal 26
Nopember 2001, setelah lima tahun proses
standardisasi. Metode enkripsi ini menjadi
standar secara efektif mulai tahun 2002. Pada
tahun 2006, AES adalah salah satu algoritma
populer yang digunakan dalam kriptografi
kunci simetris.
Algoritma
AES
menggunakan
substitusi, permutasi, dan sejumlah putaran
yang dikenakan pada tiap blok yang akan
dienkripsi / dekripsi. Untuk setiap putarannya,
Rijndael menggunakan kunci yang berbeda.
Rijndael beroperasi dalam orientasi byte
sehingga
memungkinkan
untuk
implementasi algoritma yang efisien ke
dalam software dan hardware.
1.4 TUJUAN PENELITIAN
Adapun tujuan yang hendak dicapai
dalam penelitian ini adalah untuk merancang
dan mengimplementasikan Algoritma AES
untuk pengamanan data sidik jari pada sistem
kependudukan berbasis RFID. Penggunaan
algoritma AES dalam penelitian ini untuk
mengamankan data sidik jari penduduk
sebelum disimpan dalam tag RFID.
2. TINJAUAN PUSTAKA
2.1 KRIPTOGRAFI
Kriptografi berasal dari bahasa
Yunani. Menurut bahasa tersebut kata
kriptografi dibagi menjadi dua,yaitu crypto
ISSN : 1979-5661
-30-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Algoritma Rijndael mempunyai 3
parameter sebagai berikut:
1. plainteks: array yang berukuran 16 byte,
yang berisi data masukan.
2. cipherteks: array yang berukuran 16
byte, yang berisi hasil enkripsi.
3. key: array yang berukuran 16 byte
(untuk panjang kunci 128 bit), yang
berisi kunci ciphering (disebut juga
cipher key).
kunci utama menggunakan penjadwalan kunci
(Key Scheduling)
2.3.1 Proses Enkripsi Algoritma AES
Proses yang dilakukan setiap rondenya
identik (dari ronde ke-0 sampai dengan ronde
ke Nr-1), kecuali untuk ronde terakhir Nr.
Proses yang identik tersebut terdiri atas
SubBytes(), ShiftRows(), MixColumns(), dan
AddRoundKey(). Sedangkan pada ronde
terakhir
Nr
tidak
dilakukan
fungsi
MixColumns().
Array 4 x 4 byte plaintext yang disebut
state dioperasikan XOR dengan kunci,
kemudian diolah sebanyak 9 ronde dengan
operasi SubBytes, ShiftRows, MixColumns,
AddRoundKey. Tiap ronde akan memilki
round key yang diturunkan dari kunci utama.
Pada ronde terakhir (ronde 10) tidak dilakukan
proses MixColumns, keseluruhan proses
enkripsi ini akan mengasilkan cipher 4 x 4
byte
3. ShiftRow
Tahap ShiftRows akan menggeser ke kiri
secara berputar setiap bytes dalam setiap baris
dari state. Jumlah pergeseran tiap byte berbeda
untuk setiap barisnya. Baris pertama akan tetap
pada keadaan semula. Setiap byte dari baris
kedua digeser satu langkah ke kiri. Baris ketiga
dan keempat digeser ke kiri sebanyak dua dan
tiga langkah.
2. SubBytes
Dalam tahap SubBytes, setiap byte dalam
state diganti dengan masukannya dalam
sebuah table s-box atau subtitusi box. Operasi
ini akan memberikan prinsip non-linieritas
pada cipher.
4.
MixColumns
Proses MixColumns akan beroperasi pada
tiap kolom dari tabel state. Operasi ini
menggabungkan 4 bytes dari setiap kolom
tabel state dan menggunakan transformasi
linier.Operasi Mix Columns memperlakukan
setiap kolom sebagai polinomial 4 suku dalam
Galois field dan kemudian dikalikan dengan
c(x)
modulo
(x4+1),
dimanac(x)=3x3+x2+x+2.
5.
Ekspansi Kunci
Algoritma aes melaksanakan kunci-kode
dan membuat suatu kunci ekspansi untuk
menghasilkan suatu kunci skedul. Kunci
ekspansi yang diperlukan AES Nb(Nr+1) kata
sehingga bisa digunakan AES 128 bit
2.4 SIDIK JARI
Sidik jari adalah gurat-gurat yang terdapat
di kulit ujung jari. Gurat-gurat ini tidak ada
yang sama antara satu manusia dengan
manusia yang lainnya. walaupun mereka
kembar identik. Sehingga sidik jari dapat
digunakan untuk mengidentifikasi seseorang
misalnya untuk mengidentifikasi pelaku
kejahatan ataupun untuk identifikasi pekerja
pabrik. (Kaselie, 2009)
Gambar berikut menggambarkan 3 buah
tipe pola utama sidik jari.
Gambar.2.1 Skema Enkripsi algoritma AES
1. AddRoundKey
Dalam tahap AddRoundKey, setiap byte
dari state digabungkan dengan sebuah byte
dari sub-kunci ronde, penggabungan ini
menggunakan operasi XOR Untuk setiap
rondenya, sebuah sub-kunci diturunkan dari
ISSN : 1979-5661
-31-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
(Personal Computer) yang dapat
membaca data dari tag melalui
pembaca RFID. Baik tag dan pembaca
RFID diperlengkapi dengan antena
sehingga dapat menerima dan
memancarkan
gelombang
elektromagnetik.
Gambar 2.2 Beberapa Pola Sidik Jari
titk minusi merupakan titik-titik
informasi yang dapat mencirikan suatu sidik
jari. beberapa bagian pada sidik jari yang dapat
dijadikan sebagai titik minusi antara lain :
akhir bukit (tidge termination), percabangan
(bifurcation) ,pulau (island) , danau (lake), taji
(spur), persilangan (crossover).
Gambar: 2.3 Sistem RFID
2.5.1 Tag RFID
Tag RFID adalah device yang dibuat
dari rangkaian elektronika dan antena yang
terintegrasi di dalam rangkaian tersebut.
Rangkaian elektronik dari tag RFID umumnya
memiliki memori sehingga tag ini mempunyai
kemampuan
untuk
menyimpan
data.
Berdasarkan catu daya tag, tag RFID dapat
digolongkan menjadi tag aktif,tag semi aktif
dan tag pasif.
2.5 RFID (RADIO FREQUENCY IDENTIFICATION)
RFID
(Radio
Frequency
Identification) adalah sistem teknologi
identifikasi berbasis gelombang radio yang
dalam proses identifikasinya tidak diperlukan
kontak langsung antara device pembaca
(Reader) dengan obyek yang diidentifikasi
(transponder) yang sering disebut tag, dimana
tag ini adalah device pembawa data.
RFID memiliki kelebihan dari pada
teknologi pengidentifikasi sebelumnya, seperti
barcode. Diantaranya mampu membaca suatu
objek data dengan ukuran tertentu tanpa
melalui kontak langsung (contacless) dan tidak
harus sejajar dengan objek yang dibaca, selain
dapat menyimpan informasi pada bagian tag
RFID sesuai dengan kapasitas penyimpanann.
Sistem RFID terdiri dari empat
komponen, di antaranya sebagai berikut :
(Erwin, 2004).
1. Tag : Ini adalah device yang
menyimpan
informasi
untuk
identifikasi objek. Tag RFID sering
juga disebut sebagai transponder.
2. Antena :
untuk mentransmisikan
sinyal frekuensi radio antara pembaca
RFID dengan tag RFID.
3. Reader RFID: adalah device yang
kompatibel dengan tag RFID yang
akan berkomunikasi secara wireless
dengan tag.
4. Software Aplikasi: adalah aplikasi
pada sebuah workstation atau PC
ISSN : 1979-5661
2.5.2 Reader RFID
Reader RFID mengirim gelombang
radio ke tag RFID untuk menanyakan tentang
isi data. Tag RFID kemudian merespon
dengan mengirimkan kembali data yang
diminta. RFID Reader terhubung melalui
RFID middleware dengan database untuk
melakukan pengolahan data. Berikut adalah
gambar alat yang dimaksud :
Gambar: 2.4 Reader RFID Omnikey 5321CL
3. METODOLOGI PENELITIAN
3.1 OBJEK PENELITIAN
Yang menjadi sebuah objek penelitian
adalah data sidik jari penduduk akan
disandikan sehingga data tersebut menjadi
tidak dapat di pahami. Penyandian data
tersebut akan dilakukan dengan menggunakan
Algoritma Kriptografi AES pada sistem
kependudukan berbasis RFID.
-32-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
3.2 FLOWCHART SISTEM
Mulai
Mulai
Beikut ini penjelasan mengenai flowchart
yang dibagun, diantaranya :Flowchart
Enkripsi pada data sidik jari
Input
Input
Masukan kunci
Masukan kunci
Addround key
Addround key
1. Flowchart proses enkripsi sidik jari
Proses pembelajaran ada beberapa
tahapan yang akan dilalui yaitu: Sensor
fingerprint akan melakukan pembacaan sidik
jari yang diinputkan, kemudian sistem akan
melakukan ekstraksi sidik jari untuk
mendapatkan ciri sidik jari, kemudian hasil
ekstraksi ciri sidik jari disimpan ke database.
Sebelum data tersebut ditulis ke dalam tag
RFID, data sidik jari tersebut dilakukan proses
enkripsi.
ROUND = 0
ROUND = 0
Round ++
Round ++
SubByte
Inverse SubByte
ShiftRows
Mulai
Inverse ShiftRows
Mix colum
Input data
sidik jari
Invese Mix colum
Addround key
Addround key
Ekstraksi ciri
False
Jika (Round =10)
Jika (Round =10)
False
Simpan Data
Database
True
True
SubByte
Inverse SubByte
ShiftRows
Inverse ShiftRows
Addround key
Addround key
Cipherteks
Plainteks
Selesai
Selesai
Proses Enkripsi
Ciphertext
Selesai
Gambar 3.5 Flowchart proses enkripsi pada
data sidik jari
Enkripsi
2. Flowchart Enkripsi dan Dekripsi Algoritma
AES
Pada gambar 3.6 flowcahrt enkripsi
dan dekripsi algoritma AES memiliki dasar
pengoprasian pada blok 128 bit dengan
pembangkitan kunci 128 bit adalah yang
pertama
dilakukan
adalah
SubByte
melakuakan
substitusi
byte
dengan
menggunakan tabel Substitusi (S-box).
ShiftRows melakukan pergesaran baris-baris
array
secara
wrapping.
MixColumns
mengacak data masing-masing kolom array
state. Dan ADdRoundKey melakukan XOR
antara state sekarang Roun key. Pada final
round proses yang dilakukan adalah SubBytes,
ShiftRows, dan AddRoundKey.
ISSN : 1979-5661
Dekripsi
Gambar 3.6 Flowchart enkripsi dan dekripsi
Algoritma AES
4. HASIL DAN PEMBAHASAN
4.1 TAMPILAN MENU SISTEM
Ada beberapa menu yang terdapat
dalam sistem kependudukan ini. Dalam
pembahasan menu sistem `pengguna ini yang
dibahas yaitu : menu data penduduk, menu
laporan, menu data admin. Berikut ini
tampilan yang dijelaskan pada sistem
kependudukan :
-33-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
1.
sidik jari dan banyaknya kunci yang digunakan
sebanyak 10 kunci dan didapat kan grafik
sebagai berikut:
Menu data penduduk
14
12
10
8
6
4
2
0
Gambar 4.2 Grafik panjang kunci berbeda
dengan data sidik jari sama
Gambar : 4.1 tampilan inputan data penduduk
Pada
gambar
diatas
menu
pengimputan data pendiuduk dan pengambilan
sample sidik jari penduduk.. data sisik jari
tersebut akan disimpan dalam database
sedangkan yang akan ditulis dalam tag adalah
data sidik jari yang sudah dilakukan proses
enkripsi(chiperteks). Kunci yang digunakan
pada proses enkripsi diinputkan oleh
penduduk. Dan proses dekripsi kartu tag
didekatkan dalam reader RFID maka akan
keluar menu inputkan kata sandi. Apabila kata
sandi benar akan muncul data penduduk.
Pada pengujian ini Penambahan nilai
kunci tidak terlalu berpengaruh terhadap nilai
RMS yang dihasilkan dari proses enkripsi
menggunakan algoritma AES
4.2.2.2 Pengujian RMS Berdasarkan Data
Sidik Jari Berbeda Dengan Nilai Kunci Sama
Pengujian dilakukan dengan mencari
nilai RMS dengan data sidik jari yang berbeda
dan nilai kunci yang sama, dalam pengujian ini
data sidik jari yang digunakan diambil dari
sample sidik jari penduduk dan nilai kunci
yang digunakan adalah AA penggujian
dilakukan sebanyak 10 kali pengujian bedasar
kan data penduduk. Hasil dari pengujian
tersebut di gambarkan dalam bentuk grafik
berikut:
4.2 PENGUJIAN
4.2.1 Pengujian Algoritma Menggunakan Root
Mean Square (RMS)
Untuk
mengetahui
besarnya
perbandingan data saat sebelum dan setelah
dienkripsi maka dilakukan uji coba dengan
RMS. Adapun rumus yang digunakan adalah :
1
RMS 
n
n
 (z
i 1
'
i
 zi )
14
12
2
10
8
RMS (Root
Mean Square)
6
Keterangan :
n = jumlah inputan karakter pesan
zi = nilai File sebelum disisipkan dengan
pesan teks
'
zi = nilai File setelah disisipkan dengan
pesan teks
4
2
0
1
2
3
4
5
6
7
8
9
10
Gambar 4.3 Grafik panjang kunci sama
dengan data sidik jari berbeda
Perbedaan data sidik jari dengan kunci
yang sama tidak berpengaruh nilai RMS yang
dihasilkan dari proses menggunakan algoritma
AES. Hal ini disebabkan karena algoritma
AES setiap putaran menghasilkan kunci yang
berbeda
4.2.2.1 Pengujian RMS Berdasarkan Nilai
Kunci Yang Berbeda Dengan Data Sidik Jari
Yang Sama
Pengujian dilakukan dengan mencari
nilai RMS dengan nilai kunci yang berbeda
dan data sidik jari yang sama, dalam pengujian
ini menggunakan data yang digunakan data
ISSN : 1979-5661
RMS (Root
Mean Square
-34-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
5. KESIMPULAN
Kesimpulan yang dapat diambil dari penelitian
yang telah dilakukan adalah sebagai berikut:
1. Bedasarkan penelitian yang dilakukan
pada sistem kependudukan berbasis
RFID. sistem ini dapat pengamanan
data sidik jari pada tag RFID adalah
data sidik jari yang di enkripsi
(chipertexs).
2. Bedasarkan pengujian RMS yang telah
dilakukan data sidik jari yang
diamankan dalam tag RFID tidak
dapat digunakan oleh penduduk yang
tidak berhak. Disamping itu pada
sistem ini dilakukan proses dekripsi
untuk menampilkan data penduduk.
6. DAFTAR PUSTAKA
Ariyus, Dony. 2008. Pengantar Ilmu
Kriptografi teori Analisis dan
Implementasi.
Yogyakarta:
Andi
Offset
Batbold Toiruul,,KyungOh Lee, 2006.”An
Advanced
Mutual-Authentication
Algorithm Using AES for RFID
Systems”.
Sunmoon
University
http://paper.ijcsns.org/07_book/20060
9/200609C02.pdf [Diakses Mei 17
2011]
Munir, Rinaldi. 2004 . Bahan Kuliah ke-13
IF5054 Kriptografi. Bandung.
Putra, Darma. 2009. Sistem Biometrika.
Yogyakarta : ANDI
Surian, D. 2006. Algoritma Kriptografi AES
Rijndael. Teknik Elektro. TESLA.
Vol. 8 No. 2 Hal. 97-101.
Mardhotillah, Rachma. 2011. Perancangan
Sistem
Keamanan
Dalam
Pentransmisian Data Dari Tag Menuju
Reader
Pada
Rfid.
http://digilib.its.ac.id/public/ITSUndergraduate-13206-Paper.pdf
Diakses tanggal 10 Januari 2011.
Virgan, R.Y. Agung, B.P. Agus S. “Aplikasi
Enkripsi dan Dekripsi Menggunakan
Algoritma Rijndael”. Jurusan Teknik
Elektro. Fakultas Teknik. Universitas
Diponegoro.
ISSN : 1979-5661
-35-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
PENINGKATAN RELEVANSI HASIL PENCARIAN KATA KUNCI DENGAN PENERAPAN
MODEL RUANG VEKTOR PADA SISTEM INFORMASI RUANG BACA DI JURUSAN
ILMU KOMPUTER UNIVERSITAS UDAYANA
Ngurah Agus Sanjaya ERa, Agus Muliantarab, I Made Widiarthac
Program Studi Teknik informatika, Jurusan Ilmu Komputer,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana
[email protected], [email protected], [email protected]
ABSTRAK
Sistem temu kembali informasi dapat memecahkan permasalahan pencarian informasi dengan
cara tradisional yang ruang pencariannya terbatas pada judul, pengarang ataupun penerbit dari suatu
dokumen. Dengan menggunakan query yang sesuai ruang pencarian pada sistem temu kembali
informasi menjadi tidak terbatas.
Pada penelitian ini dikembangkan suatu sistem temu kembali informasi pada ruang baca
Jurusan Ilmu Komputer, Universitas Udayana. Dokumen yang digunakan adalah berupa kumpulan
abstrak dari tugas akhir mahasiswa. Proses pencarian term dimulai dengan melakukan tokenization,
stop words removal dan stemming pada kumpulan dokumen. Kesamaan antara query masukan dengan
dokumen dihitung menggunakan cosine similarity pada vektor query dan dokumen. Hasil pencarian
berupa dokumen yang memiliki relevansi terhadap query dan diurut berdasarkan nilai cosine
similarity yang menurun. Evaluasi terhadap sistem diukur dengan menghitung mean average precision
dari uji coba.
Dari hasil pengujian yang dilakukan didapatkan kesimpulan bahwa sistem temu kembali
informasi yang diterapkan pada ruang baca Jurusan Ilmu Komputer Universitas Udayana memberikan
tingkat relevansi yang tinggi yang ditunjukkan oleh nilai mean average precision sebesar 70,84%.
Kata kunci: sistem temu kembali informasi, cosine similarity, mean average precision
ABSTRACT
Information retrieval can be applied to solve the problem of traditional searching where the
search space is limited to title, author or publisher of a document. By using the appropriate query, the
search space of an information retrieval system becomes unlimited.
In this research, an information retrieval system is developed for the reading room in
Computer Science Department at Udayana University. Collection of documents used is the abstract of
students thesis. Terms for dictionary are found by applying tokenization, stop words removal and
stemming process on documents. The similarity between input query and a document is calculated
using the cosine similarity its respective vectors. Search results for the user is given in the form of
ranked documents in relevance to the query and sorted based on the value of cosine similarity.
Evaluation of the system is measured by calculating the mean average precision of test results.
From the test results it can be concluded that the information retrieval system that is applied
to the reading room of Computer Science Department, Udayana University provides a high level of
relevance documents indicated by the mean average precision of 70.84%.
Keywords: information retrieval system, cosine similarity, mean average precision
ISSN : 1979-5661
-36-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
dokumen mana saja yang mengandung kata
tersebut. Kembalian yang diberikan ke
pengguna berupa kumpulan dokumen yang
diurut berdasarkan peringkat relevansinya
terhadap query masukan. Proses pemberian
peringkat ini didasarkan pada konsep
kesamaan (similarity) antara dokumen dengan
query.
Pada penelitian ini untuk dapat
mencari kesamaan antara dokumen dan query
maka telah digunakan suatu model yaitu ruang
vektor. Dokumen dan query masing-masing
diwakili oleh suatu vektor dalam model ruang
vektor ini. Besaran dari vektor-vektor tersebut
merupakan nilai tf-idf (term frequency-inverse
document frequency) dari dokumen dan query.
Kesamaan antara vektor dokumen dengan
query dihitung dengan fungsi kesamaan
cosine.
Dengan
menggunakan
fungsi
kesamaan cosine, vektor dokumen dan query
yang membentuk sudut 00 atau memiliki nilai
cosine 1 akan memiliki kesamaan maksimum.
Semakin besar sudut yang dibentuk antara
vektor dokumen dan query maka semakin
tidak relevan dokumen dan query tersebut.
Dokumen yang mendapat peringkat tertinggi
merupakan
dokumen
yang
vektornya
membentuk sudut terkecil dengan vektor query
atau memiliki nilai cosine terbesar.
1.
PENDAHULUAN
Ruang baca suatu jurusan dalam
universitas merupakan tempat dimana
mahasiswa dapat mencari segala informasi
untuk menunjang proses kegiatan belajar
mengajarnya. Untuk dapat menemukan
informasi yang dicari maka mahasiswa harus
melakukan pencarian pada tumpukan dokumen
tersebut dengan cara membacanya satu
persatu. Tentu saja selain menghabiskan
banyak tenaga, cara konvensional ini juga
memerlukan banyak waktu. Informasi yang
didapat pun belum tentu sesuai dengan yang
diinginkan.
Permasalahan pencarian ini dapat
diselesaikan dengan menerapkan sistem temu
kembali informasi (information retrieval
system)
yang
memungkinkan
seorang
pengguna, untuk mencari informasi tanpa
dikenai batasan apa saja informasi yang dapat
dicarinya. Informasi yang dicari disini harus
relevan dengan kebutuhan pengguna dan
proses pencariannya sendiri dilakukan secara
otomatis. Dengan demikian sistem temu
kembali informasi mendukung kebebasan
pengguna dalam berekspresi melalui query
untuk memenuhi kebutuhan informasinya.
Disamping menyediakan pencarian informasi,
sistem temu kembali informasi juga
menangani
permasalahan
repre¬sentasi,
penyimpanan dan organisasi dari informasi
tersebut (Baeza-Yates, 2011).
Informasi yang dikembalikan oleh
sistem temu kembali informasi berupa
kumpulan dokumen yang relevan terhadap
query yang dimasukkan oleh pengguna.
Dokumen merupakan unit dimana sistem temu
kembali
informasi
tersebut
dibangun
(Manning, 2008).
Dokumen bisa berupa
kalimat dalam satu paragraf, paragraf dalam
satu halaman, halaman yang membentuk satu
bab atau kumpulan bab yang membentuk suatu
buku. Jadi pengertian dokumen disini tidak
dapat diartikan secara harfiah menjadi buku,
namun dapat berupa unit-unit yang lebih kecil
dari buku.
Sebelum dapat memberikan kembalian
berupa kumpulan dokumen yang relevan
maka sistem temu kembali informasi harus
membangun suatu inverted index. Inverted
index terdiri atas dua bagian yaitu kamus
(dictionary) yang menyimpan kumpulan kata
dan posting yang menyimpan informasi
ISSN : 1979-5661
2.
SISTEM TEMU KEMBALI INFORMASI
Temu kembali informasi dapat
diartikan sebagai pencarian material
koleksi yang besar yang tersimpan dalam
komputer (Manning, 2008). Elemen penting
dari sistem temu kembali informasi adalah
inverted index yang menyimpan informasi
seluruh kata yang ada dalam kumpulan
dokumen yang digunakan untuk membangun
sistem temu kembali informasi tersebut.
Kumpulan seluruh kata tersebut sebagai kamus
(dictionary). Kata yang dimasukkan ke dalam
kamus didapatkan melalui proses tokenization
yang dilakukan pada kumpulan dokumen.
Tokenization menerima masukan berupa
karakter¬karakter
berurutan
(sequence)
kemudian memecahnya menjadi bagian-bagian
yang
lebih
kecil
(token)
dengan
menghilangkan karakter spesial seperti tanda
baca. Token yang merupakan kumpulan
karakter yang memiliki makna secara semantik
umumnya dianggap sama dengan kata (term)
walaupun sebenarnya tidak selalu memiliki
-37-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
arti. Proses tokenization dapat dilihat pada
Gambar 1.
dokumen maka dokumen ID yang digunakan
bisa dimulai dari 1 sampai dengan 1000. Satu
posting dalam posting list berisikan informasi
dokumen ID serta satu pointer yang menuju ke
posting berikutnya. Dengan adanya kamus dan
posting list ini maka data awal yang
dibutuhkan untuk membangun sistem temu
kembali
informasi
telah
tersedia.
Permasalahan berikutnya yang muncul adalah
bagaimana cara memberikan nilai kesamaan
untuk suatu dokumen terhadap query yang
diberikan pengguna. Konsep yang digunakan
dalam pembuatan peringkat ini adalah model
ruang vektor.
Dokumen Ilmu komputer memerlukan logika. Jadi asahlah logika ...
Tokens
Ilmu komputer memerlukan logika. Jadi asahlah logika ...
Term
ilmu komputer
perlu
logika jadi
asah
logika ...
Gambar 1. Proses Tokenization
Kata-kata yang didapat kemudian
melalui proses stemming yaitu penghapusan
imbuhan
(awalan,
akhiran
serta
awalan+akhiran) sehingga didapatkan kata
dasarnya. Disamping penghapusan imbuhan,
kata-kata tersebut juga dibandingkan dengan
daftar kata yang dianggap tidak penting dan
sering muncul (stop words) seperti ke, yang,
dan, dengan dan lain sebagainya. Kata-kata
pada dokumen yang diproses yang termasuk
ke dalam daftar stop words tidak akan
dimasukkan ke dalam kamus. Kata dasar yang
berhasil melalui proses stemming dan stop
words inilah yang dimasukkan ke dalam
kamus. Kamus juga menyimpan total jumlah
dokumen dimana masing-masing kata muncul.
Sedangkan informasi dokumen mana saja yang
mengandung suatu kata pada kamus disimpan
pada posting list (Gambar 2). Posting list
merupakan suatu struktur data berupa senarai
(linked list) yang menyimpan dokumen ID
dimana suatu kata pada kamus tersebut
muncul. Dokumen ID disini merupakan suatu
penanda unik yang biasanya berupa angka.
3.
{
Dengan menggunakan log frequency weight
maka jika suatu term muncul 1 kali maka
nilai wt,d adalah 1. Jika muncul 2 kali
maka wt,d menjadi 1,3; 10 kali nilainya
menjadi 2 dan 1000 kali menjadi 4. Dari
nilai tersebut dapat dilihat bahwa relevansi
tidak bertambah secara proporsional sesuai
dengan jumlah kemunculan suatu term t.
Dengan menggunakan nilai log frequency
weight ini maka nilai dari suatu pasangan
dokumen dan query dihitung dengan rumus
di bawah ini:
Gambar 2. Dictionary dan Posting
Pembentuk Inverted Index
∑
Jika kumpulan dokumen yang
digunakan untuk membangun sistem temu
kembali informasi ini berjumlah 1000
ISSN : 1979-5661
MODEL RUANG VEKTOR
a. Term Frequency (tf)
Term frequency (tft,d) dari suatu term (t)
pada dokumen (d) didefinisikan sebagai
jumlah kemunculan dari t pada d. Untuk
dapat menggunakan nilai tft,d dalam proses
pembuatan
peringkat
maka
harus
diperhatikan beberapa hal yaitu: suatu
dokumen A dimana t muncul sebanyak 10
kali adalah lebih relevan terhadap query
pengguna dibandingkan dokumen B
dimana t muncul hanya sekali. Walaupun
demikian tidak berarti bahwa dokumen A
10 kali lebih relevan dibandingkan
dokumen B terhadap query tersebut.
Dengan pertimbangan tersebut maka pada
proses pemberian peringkat biasanya
digunakan log frequency weight dari t pada
d yang dihitung sebagai berikut:
-38-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
c. Pembobotan Menggunakan tf-idf
Nilai tf-idf dari suatu kata (term) pada
dokumen d, merupakan hasil perkalian dari
bobot tf dan bobot idf dari kata tersebut.
b. Document
Frequency
dan
Inverse
Document Frequency (idf)
Penggunaan log frequency weight
untuk menentukan nilai dari suatu pasangan
dokumen dan query memunculkan suatu
permasalahan baru. Suatu term yang sering
muncul dalam dokumen d memiliki nilai
yang lebih besar dibandingkan dengan term
lain. Namun untuk query yang mengandung
kata yang jarang ditemui maka walaupun
kata tersebut hanya muncul sekali dalam
satu dokumen seharusnya memiliki nilai
relevansi yang besar dibandingkan kata
yang sering muncul tadi. Pemberian nilai
yang lebih tinggi untuk suatu kata yang
jarang ditemui dibandingkan kata yang
sering muncul maka digunakan konsep
document frequency. dft adalah document
frequency dari t yaitu banyaknya dokumen
yang mengandung t. Nilai dft tidak lebih
besar dari N yang merupakan jumlah
dokumen
yang
digunakan
untuk
membangun
sistem
temu
kembali
informasi. Inverse document frequency
(idf) dari t dihitung menggunakan rumus:
(
tf-idft,d
Nilai (q,d)
∑
Dari rumus di atas dapat disimpulkan
bahwa nilai suatu pasangan dokumen dan
query merupakan penjumlahan dari tf-idf
dari kata-kata yang muncul pada dokumen
dan query. Misalnya query yang
dimasukkan pengguna adalah “ilmu
komputer” maka nilai suatu dokumen A
terhadap
query
tersebut
adalah
penjumlahan dari tf-idfilmu dan tfidfkomputer, jika kata “ilmu” dan
“komputer” muncul pada dokumen A. Jika
pada dokumen B kata “komputer” tidak
muncul maka nilai dokumen B terhadap
query adalah tf-idf ilmu saja. Dengan
demikian, untuk query “ilmu komputer”
kemungkinan besar dokumen A memiliki
peringkat yang lebih baik dibandingkan
dokumen B.
Penggunaan rumus tersebut dimaksudkan
untuk dapat menekan efek dari dft. Sebagai
contoh, jika jumlah dokumen (N) yang
digunakan adalah 10.000 dokumen, dan
satu kata yaitu “Calpurnia” muncul
sebanyak 1 kali dalam 1 dokumen maka
nilai idf-nya menjadi:
4.
RANCANGAN SISTEM
a. Flowchart
Flowchart (diagram alir) dari sistem yang
dikembangkan dapat dilihat pada Gambar
3. Proses dimulai ketika pengguna
memasukkan query yang ingin dicari ke
sistem. Query pengguna ini kemudian
melalui proses tokenization untuk memecah
masukan menjadi token. Token-token
tersebut kemudian dihilangkan kata¬kata
yang tidak penting yang terkandung di
dalamnya
(stop
words
removal).
Sebelumnya kata-kata yang tidak penting
tersebut harus disimpan terlebih dahulu
pada basis data. Proses selanjutnya adalah
pencarian kata dasar (stemming) dari
masing-masing token. Proses stemming ini
dibantu dengan dictionary yang berisikan
kata-kata dasar dalam bahasa Indonesia.
)
Jika kata “yang” muncul sebanyak 1.000
kali maka nilai idf-nya menjadi 1. Dengan
menggunakan idf ini maka kata yang jarang
muncul akan memiliki nilai relevansi yang
lebih besar terhada query pengguna
dibandingkan kata yang sering muncul.
Kombinasi antara tf dan idf inilah yang
akan digunakan untuk memberikan nilai
terhadap suatu pasangan dokumen dan
query.
ISSN : 1979-5661
)
Jika kata yang terkandung dalam
query adalah lebih dari satu kata maka nilai
dari pasangan dokumen d dan query q
adalah:
)(Manning, 2009)
(
(
-39-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
 Tb_index, berisi hasil dari proses
preprocessing yang meliputi stopword
removal dan stemming.
 Tb_term, berisi kumpulan kata yang
terkandung dari masing-masing artikel.
 Tb_bobot dan tb_katakunci merupakan
suatu media penyimpanan untuk
menyimpan data bobot total dan
relevansi terhadap query pada masingmasing artikel.
Setelah query melalui proses penghilangan
kata-kata tidak penting dan pencarian kata
dasar maka selanjutnya bobot tf-idf untuk
query tersebut dapat dihitung. Kemudian
untuk semua dokumen yang terdapat pada
sistem dihitung pula bobot tf-idf-nya
terhadap query masukan pengguna.
Disamping itu dihitung pula cosine
similarity
masing-masing
dokumen
terhadap query masukan yang nantinya
digunakan sebagai dasar dalam pengurutan
hasil pencarian. Proses berakhir ketika
pengguna telah memberikan evaluasi
terhadap hasil pencarian dan nilai MAP
telah selesai dihitung.
tb_index
tb_dokumen
PK
PK
id
judul
FK1
dok_id
freq
id_term
FK2
tb_katadasar
PK
id
id_ktdasar
kata_dasar
tb_no_stem
PK
id_kt
tb_bobot
Mulai
kata
PK
id
tb_katakunci
FK1
id_dok
lnc
ltc
anc
PK
Query Pengguna
tb_term
id
PK
FK1
kata
dok_id
id_term
term
tb_stopword_list
PK
id
stopword
Tokenization
Query
Daftar
Stopwords
Stopwords
removal
Dictionary
Stemming Query
Gambar 4. Basis Data
c. Use Case
Use case diagram digunakan untuk
menggambarkan
fungsionalitas
yang
diharapkan dari sebuah sistem. Adapun use
case diagram dari sistem informasi ruang
baca ini adalah seperti yang ditunjukkan
pada Gambar 5.
Hitung tf-idf kata
pada query
For i=1 to
N (jumlah
dokumen)
Tampilkan
hasil pencarian
Hitung tf-idf kata
pada dokumen
Evaluasi hasil
pencarian
Sistem Ruang Baca
Indeks
dokumen dan
nilai cosine
similarity
Hitung cosine
similarity dokumen
ke-i dengan query
Hitung MAP
Selesai
Memasukkan Abstrak TA
Memasukkan Kata kunci
Gambar 3. Flowchart Sistem
<include>
Mencari Abstrak
b. Basis Data
Rancangan basis data yang digunakan
dapat dilihat pada Gambar 4. Basis data
yang dirancang terdiri atas 8 buah tabel
sebagai berikut:
 Tb_dokumen berisi kumpulan abstrak
yang merupakan objek penelitian.
 Tb_katadasar, berisi kumpulan kata
dasar yang diunduh dari internet yang
digunakan dalam proses stemming.
 Tb_no_stem, berisi kumpulan kata yang
tidak perlu melalui proses stemming.
 Tb_stopword_list, berisi kumpulan kata
yang umum yang sering digunakan tapi
tidak mempengaruhi proses pencarian,
seperti: di, oleh, ini, itu, dll. Dan data
pada tb_stopword_list digunakan pada
proses stopword removal.
ISSN : 1979-5661
Login
Gambar 5. Use Case Diagram Sistem Ruang
Baca
5.
HASIL
a. Antarmuka
Antarmuka (user interface) merupakan
perantara antara sistem dengan pengguna
sistem (user). Dalam sistem ruang baca ini
antarmuka pengguna dirancang sedemikian
rupa untuk kemudahan pengguna dalam
penggunaan sistem ruang baca ini.
Antarmuka dalam sistem ini seperti
Gambar 6 dan Gambar 7.
-40-
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
( )
( )
( )
( )
( )
( )
(
)
Penghitungan AP ini dilakukan untuk semua
query (Q1 sampai dengan Q10). Hasil
perhitungan nilai AP untuk masing-masing
query dapat dilihat pada tabel 2.
Tabel 2. Nilai Average Precision untuk Tiap
Query Masukan
Gambar 6. User Interface Halaman Muka
Query
Q1
Q2
Q3
Q4
Q5
Q6
Q7
Q8
Q9
0,6
2
0,8
66
0,7
62
0,8
9
0,5
83
0,5
49
0,6
82
0,7
33
0,6
46
doc
AP
Dari tabel 2 di atas, nilai mean average
precision (MAP) dapat dihitung sebagai
berikut:
Persentase MAP dapat dihitung berdasarkan
nilai MAP yaitu : 0,7084 * 100% = 70,84%
Gambar 7. User Interface
b. Pengujian Relevansi Hasil Pencarian
Tabel 1. Hasil Penilaian Relevansi Query
Doku
men
1
2
3
Q
1
Q
2
Q
3
Q
4
Query
Q
Q
5
6
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
T
R
R
R
R
R
T
R
R
R
R
T
R
T
R
R
T
R
R
T
R
R
T
R
T
R
R
R
R
R
R
R
R
R
R
T
R
Q
8
Q
9
Q
10
R
R
T
R
R
R
R
R
T
R
R
R
R
R
R
R
R
R
R
R
R
TR
R
R
R
R
T
R
R
T
R
R
R
T
R
R
R
R
R
R
R
TR
R
R
R
T
R
T
R
T
R
R
T
R
T
R
R
T
R
R
R
R
R
4
5
6
7
8
9
10
6.
Q
7
R
Dari hasil pengujian yang dilakukan
didapatkan kesimpulan bahwa sistem temu
kembali informasi yang diterapkan pada ruang
baca Jurusan Ilmu Komputer Universitas
Udayana memberikan tingkat relevansi yang
tinggi yang ditunjukkan oleh nilai mean
average precision sebesar 70,84%.
R
R
7.
SARAN
Sistem temu kembali informasi yang
dikembangkan pada penelitian ini tidak
memperhatikan urutan kata baik pada query
masukan pengguna maupun kemunculannya
pada dokumen. Pada penelitian selanjutnya
dapat dikembangkan sistem temu kembali
informasi yang memperhatikan urutan kata
untuk dibandingkan tingkat relevansinya
dengan sistem yang telah dikembangkan pada
penelitian ini.
Pengujian
relevansi
dilakukan
menggunakan sepuluh (10) buah query
masukan yang meliputi “basis data”,
“algoritma”,
“implementasi”, “analisis”,
“teknologi”, “sistem”, “informasi”, “metode”,
“proses” dan “perbandingan”. Relevansi
dinilai terhadap sepuluh (10) buah dokumen
hasil pencarian untuk masing-masing query
masukan. Tabel 1 memperlihatkan hasil
penilaian relevansi untuk masing-masing
query masukan.
Penghitungan average precision (AP)
untuk Q1:
ISSN : 1979-5661
SIMPULAN
8. DAFTAR PUSTAKA
Agusta, L. 2009. Perbandingan Algoritma
Stemming Porter dengan Algoritma
Nazief & Adriani untuk Stemming
Dokumen Teks Bahasa Indonesia,
Bali: Konferensi Nasional Sistem dan
Informatika 2009.
-41-
Q1
0
0,7
53
Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012
Baeza-Yates, R., Ribeiro-Neto. 2011. Modern
Information Retrieval: The Concepts
and Technology Behind Search. 2nd
Edition. Addison Wesley.
Croft, B., Metzler, D., Strohman, T. 2008.
Search Engines : Information Retrieval
in Practice. France, Addison Wesley.
Elmasri, R., Navathe, S. 2010. Fundamentals
of Basis data Systems, 6th Edition,
Pearson Education, Inc. Kendall, K.
E., Kendall, J.E. 2010. 8th Systems
Analysis and Design. Edition, Prentice
Hall.
ISSN : 1979-5661
Liu, Yan-Tie., Xu, J., Qin, T., Xiong, W., Li,
H. 2007. LETOR: Benchmark Dataset
for Research on Learning to Rank for
Information Retrieval. SIGIR '07 The
30th Annual International SIGIR
Conference, July 23-27, Amsterdam.
Manning, C.D., Raghavan, P., and Schutze, H.
2009. An Introduction to Information
Retrieval.
Cambridge
University
Press.
Pressman, R. S. 2009. Software Engineering:
A Practitioner’s Approach. 7th
Edition, McGraw-Hill.
-42-
Download