Jurnal ILMU KOMPUTER Volume 5 Nomor 2 September 2012 Daftar Isi : PERANCANGAN DAN IMPLEMENTASI AUTOMATED DOCUMENT INTEGRATION DENGAN MENGGUNAKAN ALGORITMA COMPLETE LINKAGE AGGLOMERATIVE HIERARCHICAL CLUSTERING ............................................................................................... 1 Gede Aditra Pradnyana, Ngurah Agus Sanjaya ER SISTEM PENDUKUNG KEPUTUSAN DALAM PEMILIHAN TEMPAT KOST DENGAN METODE PEMBOBOTAN ( STUDI KASUS : SLEMAN YOGYAKARTA)........................ 11 I Wayan Supriana SISTEM TUTORIAL MATEMATIKA DISKRET DALAM MENUNJANG PROSES BELAJAR BERBASIS KOMPETENSI ..................................................................................... 17 I Gede Santi Astawa PENENTUAN KOMPOSISI BAHAN PAKAN IKAN LELE YANG OPTIMAL DENGAN MENGGUNAKAN METODE IWO-SUBTRACTIVE CLUSTERING .................................... 22 Agus Muliantara SISTEM PENGAMANAN DATA SIDIK JARI MENGGUNAKAN ALGORITMA AES PADA SISTEM KEPENDUDUKAN BERBASIS RADIO FREQUENCY IDENTIFICATION (RFID) ......................................................................................................................................... 29 I Gede Andika Putra,I Made Widhi Wirawan PENINGKATAN RELEVANSI HASIL PENCARIAN KATA KUNCI DENGAN PENERAPAN MODEL RUANG VEKTOR PADA SISTEM INFORMASI RUANG BACA DI JURUSAN ILMU KOMPUTER UNIVERSITAS UDAYANA ................................................ 36 Ngurah Agus Sanjaya, Agus Muliantara, I Made Widiartha A CASE STUDY OF IT IMPLEMENTATION IN PUBLIC UNIVERSITY : IT’S BARRIERS AND CHALLANGES ................................................................................................................ 43 I Made Agus Setiawan JURUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA DENPASAR SUSUNAN DEWAN REDAKSI JURNAL ILMU KOMPUTER Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Ketua Agus Muliantara, S.Kom, M.Kom Penyunting Drs. Wayan Santiyasa, M.Si Ngurah Agus Sanjaya, S.Kom, M.Kom Cokorda Rai Adi Paramarta, S.T, M.M Ida Bagus Gede Dwidasmara, S.Kom.M.Cs Penyunting Tamu Imas Sitanggang, S.Si, M.Kom (IPB) Ir. A.A. Gede Raka Dalem, M.Sc (Hons) Prof. Pieter Hartel (Twente University) Pelaksana I Made Widiartha, S.Si, M.Kom Dra. Luh Gede Astuti, M.Kom Gede Santi Astawa, ST, M.Cs Ida Bagus Mahendra, S.Kom, M.Kom Alamat Redaksi Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Kampus Bukit Jimbaran – Badung Telpon. 0361 – 701805 Email : [email protected] Website : www.cs.unud.ac.id ISSN : 1979-5661 Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 PERANCANGAN DAN IMPLEMENTASI AUTOMATED DOCUMENT INTEGRATION DENGAN MENGGUNAKAN ALGORITMA COMPLETE LINKAGE AGGLOMERATIVE HIERARCHICAL CLUSTERING Gede Aditra Pradnyana1, Ngurah Agus Sanjaya ER2 Program Studi Teknik Informatika, Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Email : [email protected], [email protected] ABSTRAK Salah satu cara yang umum digunakan untuk memperoleh informasi adalah dengan membaca beberapa dokumen yang membahas topik yang sama. Walaupun cara ini merupakan yang paling mudah namun pada pelaksanaannya banyak menghabiskan waktu. Penggunaan suatu sistem automated document integration yang membantu menemukan kalimat penting dari masing-masing dokumen akan menghemat waktu serta tenaga yang diperlukan. Keluaran dari sistem yang dikembangkan dalam penelitian ini adalah suatu dokumen yang dibentuk dari integrasi (cluster) kalimat-kalimat dari dokumen asli. Kesamaan dokumen yang akan diintegrasikan ditentukan oleh cosine similarity. Sistem kemudian menghitung TF-IDF (term frequency-inverse document frequency) masing-masing kalimat pada dokumen. TF-IDF merupakan bobot dari suatu kalimat yang mencerminkan tingkat kepentingan dari kalimat pada suatu dokumen serta terhadap kalimat-kalimat lain pada dokumen yang berbeda. Kalimat-kalimat yang memiliki kesamaan yang tinggi kemudian digabungkan secara agglomerative hierarchical menggunakan metode complete linkage. Hasil uji coba memperlihatkan 75% responden menyatakan keluaran sistem adalah benar. Kata kunci: automated document integration, complete linkage agglomerative hierarchical clustering, cosine similarity ABSTRACT A common way of gaining knowledge or information is by reading through documents which discuss the same topic. Despite being the easiest method to implement, it requires a lot of time and effort. Thus, the use of an automated text integration system which serves in finding important sentences from each original document, greatly reduces the time and effort needed. The research output which implements this system is a new document constructed from clustered sentences in the original documents. The similarities of documents to be clustered is determined by using the cosine similarity. The system further calculates the TF-IDF (Term Frequency-Inverse Document Frequency) of each sentence in the documents. The TF-IDF serves as a weight of the sentence in a document to describe how important it is in comparison with other sentences in different documents. Sentences with high similarities are then clustered in an agglomerative hierarchical way using a complete linkage method. Experimental results show that 75% of respondents confirm that the output is correct. Keywords: automated document integration, complete linkage agglomerative hierarchical clustering, cosine similarity pengguna teknologi menuntut agar semua informasi dapat diperoleh dengan cepat, mudah, dan tidak membuang banyak waktu. Selain itu tingginya penggunaan internet telah memacu pesatnya pertumbuhan dan pertukaran 1. PENDAHULUAN Perkembangan teknologi informasi yang semakin pesat dewasa ini membuat para ISSN : 1979-5661 -1- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 informasi sehingga informasi yang beredar pun semakin banyak. Salah satu cara untuk memperoleh informasi adalah dengan membaca beberapa dokumen yang pada kenyataannya banyak membahas topik yang sama. Namun hal ini akan sangat menyulitkan pembaca untuk menangkap topik bahasan utama dari dokumen-dokumen tersebut karena harus mengingat isi dokumen yang telah dibaca sebelumnya. Pembaca harus mengintegrasikan dahulu dokumen-dokumen yang dia baca di dalam pikirannya sebelum dapat merangkum maksud dan topik utama dokumen-dokumen tersebut secara keseluruhan. Selain itu, seringkali ada pembaca yang tidak ingin membaca seluruh dokumen tersebut karena faktor waktu yang dibutuhkan terlalu lama atau adanya keterbatasan waktu. Seiring berkembangnya teknologi informasi, maka saat ini telah diperoleh suatu solusi yang memungkinkan pembaca dapat membuat integrasi dari beberapa dokumen tersebut menjadi suatu kesatuan dokumen dengan mudah. Maksud dari integrasi dokumen disini adalah sebuah proses untuk menghasilkan suatu dokumen baru dari beberapa dokumen dengan menggunakan bantuan komputer, tanpa menghilangkan arti dan bagian-bagian penting dari tiap dokumen tersebut. Tujuan dari integrasi dokumen ini adalah untuk mengambil sumber informasi dengan memperhatikan sebagian besar bagianbagian berupa kalimat-kalimat yang penting dari setiap dokumen yang berbeda dan menampilkan kepada pembaca dalam bentuk suatu dokumen baru yang sesuai dengan kebutuhan pembaca. Setelah melalui proses ini, diharapkan pembaca dapat terbantu dalam menyerap informasi penting yang ada dalam kumpulan dokumen yang berbeda dengan topik bahasan yang sama, karena pembaca tidak perlu lagi membaca kumpulan dokumen satu per satu. Proses integrasi dokumen ini akan menghasilkan suatu produk teks yang memiliki atau mengandung semua bagian penting dari dokumen-dokumen awal, namun memiliki susunan antar kalimat atau antar paragraf yang berbeda. Adapun algoritma yang digunakan dalam proses integrasi dokumen ini adalah agglomerative hierarchical clustering dengan metode complete linkage. Agglomerative hierarchical clustering adalah suatu metode ISSN : 1979-5661 hierarchical clustering yang bersifat bottomup yaitu menggabungkan n buah cluster (beberapa dokumen) menjadi satu cluster tunggal (sebuah dokumen hasil integrasi). Agglomerative hieararchical clustering merupakan metode yang umum digunakan dalam clustering dokumen dan memiliki beberapa kelebihan, antara lain : tidak memperhitungkan initial centroid sehingga tepat digunakan dalam proses pengelompokan dokumen dan kinerja information retrieval berbasis hierarchical clustering memiliki hasil yang lebih baik jika dibandingkan dengan metode partitional clustering (Hamzah, 2009). Algoritma agglomerative hierarchical clustering dengan metode complete linkage memiliki hasil clustering yang lebih baik dibandingkan dengan metode linkage yang lainnya (Soebroto, 2005). Dalam proses clustering, kesamaan antara satu dokumen dengan dokumen yang lain diukur dengan fungsi kesamaan (similarity) tertentu. Dalam sistem automated document integration ini digunakan algoritma cosine similarity dalam pengukuran kesamaan antar dokumen. Sebelum proses clustering dilakukan, suatu dokumen akan melalui proses parsing, stemming, dan pembobotan kalimat (TF – IDF) serta pembobotan relasi antar kalimat. Proses stemming dilakukan dengan menggunakan algoritma porter stemmer for Bahasa Indonesia. 2. TINJAUAN PUSTAKA 2.1 Complete Linkage Agglomerative Hierarchical Clustering Salah satu kategori algoritma clustering yang banyak dikenal adalah hierarchical clustering. Hierarchical clustering merupakan salah satu algoritma clustering yang fungsinya dapat digunakan untuk pengelompokkan dokumen (document clustering). Dari teknik hierarchical clustering, dapat dihasilkan suatu kumpulan partisi yang berurutan, dimana dalam kumpulan tersebut terdapat : Cluster-cluster yang mempunyai poinpoin individu. Cluster-cluster ini berada di level yang paling bawah. Sebuah cluster yang didalamnya terdapat poin-poin yang dipunyai semua cluster didalamnya. Single cluster ini berada di level yang paling atas. -2- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Dalam algoritma hierarchical clustering, cluster yang berada di level yang lebih atas (intermediate level) dari cluster yang lain dapat diperoleh dengan cara mengkombinasikan dua buah cluster yang berada pada level dibawahnya. Hasil keseluruhan dari algoritma hierarchical clustering secara grafik dapat digambarkan sebagai tree, yang disebut dengan dendogram (Tan, 2006). Pada algoritma agglomerative hierarchical clustering ini, proses hierarchical clustering dimulai dari cluster-cluster yang memiliki poin-poin individu yang berada di level paling bawah. Pada setiap langkahnya, dilakukan penggabungan sebuah cluster dengan cluster lainnya, dimana cluster-cluster yang digabungkan berada saling berdekatan atau mempunyai tingkat kesamaan yang paling tinggi (Tan, 2006). Salah satu metode yang digunakan dalam Agglomerative Hierarchical Clustering adalah Complete linkage (furthest neighbor methods). Complete Linkage adalah suatu metode yang menggunakan prinsip jarak minimum yang diawali dengan mencari jarak terjauh antar dua buah cluster dan keduanya membentuk cluster baru. Pada awalnya, dilakukan perhitungan jarak terpendek dalam D = {dik} dan menggabungkan objek-objek yang bersesuaian misalnya, U dan V , untuk mendapatkan cluster (UV). Kemudian jarakjarak antara (UV) dan cluster W yang lain dihitung dengan cara : d(UV)W = max{duw , dvw} diperlukan karena dokumen yang panjang cenderung mendapatkan nilai yang besar dibandingkan dengan dokumen yang lebih pendek. Perhitungan cosine similarity yang memperhitungkan perhitungan pembobotan kata pada suatu dokumen dapat dinyatakan dengan perumusan : t q d CosSim(d i , qi ) i i qi d i ij j 1 ij ) q . d t j 1 2 ij t j 1 2 ij Keterangan : qij = bobot istilah j pada dokumen i = tfij * idfj dij = bobot istilah j pada dokumen i = tfij * idfj 2.3 Proses Parsing dan Stemming Parsing adalah sebuah proses untuk membuat sebuah kalimat menjadi lebih bermakna. Hal ini dilakukan dengan cara memecah kalimat tersebut menjadi kata-kata atau frase-frase (Budhi, 2005). Proses parsing merupakan proses penguraian dokumen yang semula berupa kalimat-kalimat berisi kata-kata dan tanda pemisah antar kata seperti titik (.), koma (,), spasi dan tanda pemisah lain menjadi kata-kata saja. Stemming merupakan suatu proses yang terdapat dalam sistem IR (Information Retrieval) yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke katakata akarnya (root word) dengan menggunakan aturan-aturan tertentu untuk meningkatkan kualitas informasi yang didapatkan (Agusta, 2009). Proses tersebut akan menghilangkan imbuhan yang terkandung dalam suatu kata yang diproses. Sebagai contoh, kata bersama, kebersamaan, menyamai, setelah melaui proses stemming akan menjadi kata “sama”. Proses ini akan mendukung tingkat ketelitian dalam perhitungan daftar keyword pada proses berikutnya. Algoritma stemming untuk Bahasa Indonesia yang dikenal antara lain Algoritma Porter Stemmer dan Algoritma Nazief & Adriani. Porter Stemmer for Bahasa Indonesia dikembangkan oleh Fadillah Z. Tala pada tahun 2003. Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan English Porter Stemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992. 2.2 Algoritma Cosine Similarity Metode Cosine Similarity merupakan metode yang digunakan untuk menghitung similarity (tingkat kesamaan) antar dua buah objek. Secara umum penghitungan metode ini didasarkan pada vector space similarity measure. Metode cosine similarity ini menghitung similarity antara dua buah objek (misalkan D1 dan D2) yang dinyatakan dalam dua buah vektor dengan menggunakan keywords (kata kunci) dari sebuah dokumen sebagai ukuran. Metode pengukuran kesesuaian ini memiliki beberapa keuntungan, yaitu adanya normalisasi terhadap panjang dokumen. Hal ini memperkecil pengaruh panjang dokumen. Jarak euclidean (panjang) kedua vektor digunakan sebagai faktor normalisasi. Hal ini ISSN : 1979-5661 (q .d -3- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 induktif sesuai kaidah Bahasa Indonesia, ide pokok suatu paragraf terdapat pada kalimat yang berada di awal dan atau akhir dari paragraf tersebut. 4. Bagian keempat ini sangat berhubungan dengan hasil pemetaan dokumen. Pada bagian keempat ini akan dihitung jumlah relasi (yang disimbolkan dengan edge) suatu kalimat di dalam dokumen. Idenya adalah semakin banyak relasi yang dimiliki suatu kalimat dengan kalimat lainnya di dalam suatu dokumen maka kalimat tersebut kemungkinan mendiskusikan topik utama suatu dokumen. 5. Bobot kelima ini merepresentasikan seberapa penting sebuah kalimat dibandingkan dengan kalimatkalimat lain yang terdapat pada semua dokumen yang akan diintegrasikan. 2.4 Proses Stopword Removal Kebanyakan bahasa resmi di berbagai negara memiliki kata fungsi dan kata sambung seperti preposisi dan kata hubung yang hampir selalu muncul pada dokumen-dokumen teks. Kata-kata ini umumnya tidak memiliki arti yang lebih untuk memenuhi kebutuhan seorang searcher dalam mencari informasi. Kata-kata tersebut (misalnya a, an, the, on pada bahasa Inggris) yang disebut sebagai kata tidak penting misalnya “di”, “oleh”, “pada”, “sebuah”, “karena”, dan kata sambung lainnya. Sebelum proses stopword removal dilakukan, terlebih dulu dibuat daftar stopword (stoplist). Preposisi, kata hubung dan partikel biasanya merupakan kandidat stoplist. Stopword removal merupakan proses penghilangan kata tidak penting pada suatu dokumen, melalui pengecekan kata-kata hasil stemmer dokumen tersebut apakah termasuk kata di dalam daftar kata tidak penting (stoplist) atau tidak 2.5 Perhitungan Bobot Kalimat dan Bobot Relasi Antar Kalimat 2.5.1 TF-IDF (Terms Frequency-Inverse Document Frequency ) Metode ini merupakan metode untuk menghitung nilai/bobot suatu kata (term) pada dokumen. Metode ini akan mengabaikan setiap kata-kata yang tergolong tidak penting. Oleh sebab itu, sebelum melalukan metode ini, proses stemming dan stopword removal harus dilakukan terlebih dahulu oleh sistem. Karena melakukan pembobotan suatu kalimat bukan kata, pada metode ini terdapat 5 proses yang berbeda untuk perhitungan nilai suatu kalimat, yaitu (Budhi, 2008): 1. Kecocokan kata-kata pada kalimat dengan daftar kata kunci/keyword. Idenya adalah semakin tinggi nilai suatu kalimat, maka kalimat tersebut semakin penting keberadaannya di dalam suatu dokumen. 2. Menghitung frekuensi kata-kata suatu kalimat terhadap keseluruhan dokumen dan hasilnya akan dibagi dengan jumlah kata pada dokumen tersebut. 3. Bagian ketiga ini sangat sederhana yaitu hanya melihat posisi kalimat di dalam suatu paragraf. Berdasarkan metode deduktif ISSN : 1979-5661 Setelah mendapatkan hasil dari kelima bobo diatas, selanjutnya nilai tf akan dihitung dengan persamaan berikut: tf = bobot1 + bobot2 + bobot3 + bobot4 + bobot5 Faktor lain yang diperhatikan dalam pemberian bobot adalah kejarangmunculan kalimat (sentence scarcity) dalam koleksi. Kalimat yang muncul pada sedikit dokumen harus dipandang sebagai kata yang lebih penting (uncommon sentences) daripada kalimat yang muncul pada banyak dokumen. Pembobotan akan memperhitungkan faktor kebalikan frekuensi dokumen yang mengandung suatu kalimat (inverse document frequency). Nilai dari tf akan dikalikan dengan nilai idf seperti pada persamaan dibawah ini (Intan, 2005): Keterangan : W= bobot kalimat terhadap dokumen -4- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Proses – proses yang ada pada subsistem ini adalah : a. Proses upload dokumen ke dalam sistem. b. Proses konversi dokumen dengan format file PDF menjadi file txt. c. Proses devide to word atau parsing yaitu proses yang memecah kalimat-kalimat dalam file txt menjadi kata-kata. d. Proses stopword removal atau menghilangkan kata-kata tidak penting. e. Proses stemming dengan algoritma Porter Stemmer for Bahasa Indonesia. f. Proses perhitungan kesamaan dokumen dengan algoritma Cosine Similarity. 2. Subsistem Integration Process Proses – proses yang ada pada subsistem ini adalah : a. Proses perhitungan bobot kalimat dengan metode TF-IDF. b. Proses perhitugan bobot relasi antar kalimat. c. Proses clustering dengan algoritma Complete Linkage Agglomerative Hierarchical Clustering tf = jumlah kemunculan kata/term dalam dokumen N= jumlah semua dokumen yang ada dalam database n= jumlah dokumen yang mengandung kata/term idf = inverse document frequency 2.5.3 Perhitungan Bobot Edge Untuk perhitungan bobot edge akan digunakan persamaan berikut (Sjobergh, 2005) : Nilai overlap i,j diperoleh dengan menghitung jumlah kata yang sama antara kalimat ke-i dan kalimat ke-j dengan mengabaikan stopword yang ada di dalam kalimat-kalimat tersebut. Kemudian hasil dari persamaan diatas akan digunakan untuk menentukan nilai relasi dari setiap kalimat berdasarkan hasil pemetaan dari dokumen. 3. DESAIN AUTOMATED DOCUMENT INTEGRATION SYSTEM Tahap awal yang dilakukan dalam pengembangan sistem adalah penentuan input, proses, dan output dari sistem yang akan dibuat. Input – input yang masuk dan akan diproses dalam sistem dapat dibagi menjadi 2 bagian yaitu : 1. Penentuan input sistem yang berupa kumpulan dokumen yang akan diintegrasikan. Dokumen disini berperan sebagai suatu kumpulan data-data mentah yang akan dijadikan objek pada penelitian ini. Dokumen berupa artikel-artikel mengenai teknologi informasi dalam Bahasa Indonesia dengan format file PDF. 2. Penentuan input yang kedua adalah input dari user yang berupa nilai toleransi kesamaan antar dokumen yang akan diintegrasikan ( similarity tolerance value ) ke sistem. Setelah melakukan teknik kajian pustaka pada tahap sebelumnya, secara garis besar proses-proses yang ada pada sistem dapat dibagi ke dalam dua subsistem yaitu : 1. Subsistem Pre-Integration ISSN : 1979-5661 Pada proses integrasi dengan algoritma agglomerative hierarchical clustering, awalnya semua kalimat yang terdapat dalam tabel kalimat dianggap sebagai atomic cluster – atomic cluster. Langkah pertama yang dilakukan adalah mencari cluster-cluster dengan jarak terdekat, atau pasangan kalimat yang memiliki bobot relasi antar kalimat yang paling kecil. Pencarian dilakukan dengan menggunakan perintah query select yang mengurutkan data-data pada tabel kalimat_relasi secara ascending berdasarkan bobot relasinya. Langkah selanjutnya adalah melakukan update jarak cluster yang baru terbentuk dengan clustercluster lainnya dengan metode maximum distance. Setelah semua kalimat telah tergabung menjadi sebuah cluster, dilakukan proses untuk memecah cluster tersebut menjadi paragraf – paragraf. Caranya adalah, kalimat – kalimat yang bergabung terlebih dahulu menjadi cluster – cluster besar dianggap sebagai sebuah paragraf tersendiri. -5- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Asumsinya, bila secara natural kalimat – kalimat tersebut bergabung, dapat dianggap kalimat – kalimat tersebut memiliki similarity yang cukup tinggi dan membahas topik bahasan yang sama. Sementara untuk memproses kalimat – kalimat tersisa yang tidak mau bergabung kedalam cluster – cluster besar, dipakai aturan sebagai berikut: Bila hanya 1 kalimat akan digabungkan pada paragraf terakhir. Bila lebih dari satu kalimat, kalimat – kalimat yang tersisa tersebut akan dipaksakan bergabung menjadi satu paragraf tersendiri. Sementara, Output-output yang dihasilkan sistem melalui pemrosesan input dari user adalah : a. Report tingkat kesamaan antar dokumen yang akan diintegrasikan. b. Dokumen hasil proses integrasi yang dapat disimpan dalam format file .doc. Berikut ini adalah gambar rancangan alur pada subsistem Integration secara garis besar : dijalankan. Pengujian basis path pada penelitian ini difokuskan pada proses perhitungan bobot relasi antar kalimat dan proses integrasi dengan algoritma complete linkage agglomerative hierarchical clustering. Alur logika dari sistem diujicoba dengan menyediakan kasus ujicoba yang melakukan semua kondisi atau perulangan yang ada pada sistem. Dimana setelah melakukan pengujian, setiap path yang ada dalam tiap proses dapat dijalan dengan baik. 4.2 Pengujian Proses Integrasi Pengujian terhadap proses integrasi dilakukan dengan membandingkan proses integrasi dengan perhitungan manual dan dengan sistem. Dokumen yang dipergunakan adalah dokumen dengan judul Data Mining 1 dan Data Mining 2. Pada akhir pengujian didapatkan hasil bahwa hasil integrasi secara manual menghasilkan dokumen yang sama dengan dokumen yang diintegrasikan oleh sistem. Berikut ini adalah contoh dokumen yang akan diintegrasikan dengan automated document integration system. start Urut dokumen berdasarkan similarity Hitung bobot kalimat Proses pengelompokkan kalimat dengan clustering Parsing paragraf menjadi kalimat Hitung bobot kalimat dengan TF-IDF Print hasil Clustering Parsing kalimat menjadi kata Hitung bobot relasi antar kalimat “Data Mining 1” Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya. Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.). Hampir semua data tersebut dimasukkan dengan menggunakan aplikasi komputer yang digunakan untuk menangani transaksi seharihari yang kebanyakan adalah OLTP (On Line Transaction Processing). Bayangkan berapa tidak Save ? ya end Save menjadi file .doc Gambar 1. Perancangan Alur pada Subsistem Integration 4. PENGUJIAN SISTEM 4.1 Pengujian Sistem dengan White Box Pengujian white box yang digunakan dalam pembuatan automated document integration system ini adalah pengujian basis path. Pengujian tersebut ditujukan untuk mencari path-path yang dilalui saat program ISSN : 1979-5661 -6- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 transaksi yang dimasukkan oleh hypermarket semacam Carrefour atau transaksi kartu kredit dari sebuah bank dalam seharinya dan bayangkan betapa besarnya ukuran data mereka jika nanti telah berjalan beberapa tahun. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat menambangnya untuk mencari emas, berlian yaitu informasi yang berguna untuk organisasi kita. Banyak diantara kita yang kebanjiran data tapi miskin informasi. organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb). Hampir semua data tersebut dimasukkan dengan menggunakan aplikasi komputer yang digunakan untuk menangani transaksi seharihari yang kebanyakan adalah OLTP (On Line Transaction Processing). Bayangkan berapa transaksi yang dimasukkan oleh hypermarket semacam Carrefour atau transaksi kartu kredit dari sebuah bank dalam seharinya dan bayangkan betapa besarnya ukuran data mereka jika nanti telah berjalan beberapa tahun. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat menambangnya untuk mencari emas, berlian yaitu informasi yang berguna untuk organisasi kita. Banyak diantara kita yang kebanjiran data tapi miskin informasi. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya. Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Tetapi pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja seakan-akan “kuburan data” (data tombs). Perkembangan internet juga punya andil cukup besar dalam akumulasi data. Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan “Data Mining 2” Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data. Dalam review ini, penulis mencoba merangkum perkembangan terakhir dari teknik-teknik DM beserta implikasinya di dunia bisnis. Perkembangan data mining(DM) yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Sebagai contoh, toko swalayan merekam setiap penjualan barang dengan memakai alat POS(point of sales). Database data penjualan tsb. bisa mencapai beberapa GB setiap harinya untuk sebuah jaringan toko swalayan berskala nasional. Perkembangan internet juga punya andil cukup besar dalam akumulasi data. Tetapi pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja seakan-akan “kuburan data” (data tombs). Hasil dari proses integrasi kedua dokumen diatas adalah sebagai berikut : Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak ISSN : 1979-5661 -7- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 yang selama ini tidak diketahui secara manual dari suatu kumpulan data. Dalam review ini, penulis mencoba merangkum perkembangan terakhir dari teknik-teknik DM beserta implikasinya di dunia bisnis. Perkembangan data mining(DM) yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Sebagai contoh, toko swalayan merekam setiap penjualan barang dengan memakai alat POS(point of sales). Database data penjualan bisa mencapai beberapa GB setiap harinya untuk sebuah jaringan toko swalayan berskala nasional. 4.4 Evaluasi Relevansi Sistem Pengujian ini dilakukan dengan cara meminta bantuan 100 orang responden yang merupakan mahasiswa Jurusan Ilmu Komputer Universitas Udayana untuk membaca dokumen – dokumen asal yang berjenis eksposisi dan narasi serta membaca dokumen hasil integrasi, kemudian menjawab 3 pertanyaan berikut: 1) Menurut anda, apakah kata-kata pada dokumen hasil integrasi tersebut telah terorganisir dengan baik (tiap paragraf memberikan arti yang jelas dan dapat dipahami) ? A. Ya B. Tidak 4.3 Pengujian Terhadap Waktu Proses Integrasi 2) Menurut anda, apakah dokumen hasil integrasi tersebut telah memberikan gambaran secara umum dari keseluruhan dokumen yang ada sebelumnya ? A. Ya B. Tidak 3) Menurut anda, apakah dokumen hasil integrasi dapat memberikan informasi informasi penting yang terdapat pada dokumen sebelumnya secara jelas? A. Ya B. Tidak Berdasarkan hasil survei relevansi didapatkan kesimpulan bahwa sistem akan bekerja lebih baik pada dokumen yang bertipe eksposisi dibandingkan dengan dokumen yang bertipe narasi. Dimana lebih dari 75 persen mengatakan bahwa hasil integrasi dokumen yang bertipe eksposisi dapat mewakili dokumen asli, memiliki susunan antar paragraf yang jelas, dan tetap mengandung informasi penting dari dokumen awal. Tabel 1. Hasil Pengujian Waktu Untuk mendapatkan hasil uji coba yang terbaik mengenai lama proses clustering dan proses integrasi keseluruhan yang dilakukan sistem maka perlu dilakukan uji coba terhadap berbagai dokumen yang berbeda-beda. Dari dokumen yang berbedabeda tersebut yang perlu diperhatikan adalah dari segi jumlah dokumen yang diintegrasi, jumlah paragraf dari setiap dokumen asli, dan jumlah kalimat dari setiap dokumen asli. Pengujian waktu proses ini diujikan dengan keadaan hardware dan software sebagai berikut : Processor Intel Pentium Dual Core T2390 1,86 Ghz, RAM 1 GB. Hasil pengujian sistem terhadap waktu dapat dilihat pada tabel 1. ISSN : 1979-5661 5. KESIMPULAN DAN SARAN 5.1 Kesimpulan Secara umum sistem automated document integration dapat dibagi menjadi dua subsistem yaitu subsistem pre-integration dan subsistem integration. Adapun proses yang termasuk dalam subsistem preintegration adalah proses devide to word, proses stopword removal, proses stemming, dan proses perhitungan kesamaan. Proses integrasi dokumen berada dalam subsistem integration menggunakan algoritma complete linkage agglomerative hierarchical clustering -8- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 yang sebelumnya didahului dengan proses pembobotan kalimat dengan metode TF-IDF(term frequencyinverse document frequency) dan pembobotan relasi antar kalimat. Hasil dari pengujian terhadap waktu dari proses integrasi dan proses hierarchical clustering, menunjukkan bahwa semakin banyak dokumen paragraf dan kalimat yang yang diproses maka akan membutuhkan running time yang semakin besar pula. Berdasarkan hasil survei relevansi sistem kepada 100 orang responden, didapatkan kesimpulan bahwa sistem akan bekerja lebih baik pada dokumen yang bertipe eksposisi dibandingkan dengan dokumen yang bertipe narasi. Dimana lebih dari 75 persen mengatakan bahwa hasil integrasi dokumen yang bertipe eksposisi dapat mewakili dokumen asli, memiliki susunan antar paragraf yang jelas, dan tetap mengandung informasi penting dari dokumen awal. jenis dokumen selain dokumen berjenis eksposisi dan narasi. 6. DAFTAR PUSTAKA Agusta, Ledy. 2009. Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia. Bali : Fakultas Teknologi Informasi Universitas Kristen Satya Wacana. Budhi, Gregorius S, Arlinah I. Rahardjo, dan Hendrawan Taufik. 2008. Hierarchical Clustering Untuk Aplikasi Automated Text Integration. Surabaya : UK Petra Jurusan Teknik Informatika. Budhi, Gregorius S, Ibnu Gunawan dan Ferry Yuwono. 2005. Algoritma Porter Stemmer For Bahasa Indonesia Untuk Pre-Processing Text Mining Berbasis Metode Market Basket Analysis. Surabaya : UK Petra Jurusan Teknik Informatika. Hamzah, Amir. 2009. Temu Kembali Informasi Berbasis Kluster Untuk Sistem Temu Kembali Informasi Teks Bahasa Indonesia. Yogyakarta : Jurusan Teknik Informatika, Fakultas Teknologi Industri Institut Sains & Teknologi AKPRIND. Hartini, Entin. 2004. Metode Clustering Hirarki. Pusat Pengembangan Teknologi dan Komputasi Batan. Intan, Rolly dan Andrew Defeng. 2005. HARD: Subject-based Search Engine menggunakan TF-IDF dan Jaccard’s Coefficient. Surabaya : UK Petra Jurusan Teknik Informatika. Kendall, Kenneth E dan Julie E. Kendall. 2006. Analisis dan Perancangan Sistem.Edisi kelima. Indeks. Jakarta. Mandala, Rila dan Hendra Setiawan. 2002. Peningkatan Performansi Sistem Temu-Kembali Informasi dengan Perluasan Query Secara Otomatis. Bandung : Departemen Teknik Informatika Institut Teknologi Bandung. Pramudiono, Iko. 2003. Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data. Tokyo : The University of Tokyo. 5.2 Saran Sistem automated document integration memiliki kelemahan dalam menentukan urutan dokumen yang diintegrasi. Dalam sistem automated document integration ini urutan dokumen ditentukan berdasarkan tingkat kesamaannya dengan metode cosine similarity. Padahal cosine similarity merupakan metode yang bersifat simetris, sehingga tidak dapat menentukan suatu urutan. Untuk pengembangan selanjutnya disarankan agar menggunakan metode pengukuran kesamaan yang asimetris. Pada pengembangan selanjutnya, sistem dapat dikembangkan untuk melakukan integrasi dokumendokumen dengan bahasa lain, tidak terbatas pada dokumen yang berbahasa Indonesia saja. Pada pengembangan selanjutnya, sistem dapat dikembangkan dengan menggunakan algoritma lain sehingga dapat mengintegrasi dokumen narasi dengan baik, disamping itu juga dapat diteliti hasilnya dalam mengintegrasi ISSN : 1979-5661 -9- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Pressman, Roger S. 2005. Software Engineering A practitioner’s Approach Sixth Edition. New York : Mc-Graw-Hill. Sjobergh, Jonas dan Kenji Araki. 2005. Extraction Based Summarization Using Shortest Path Algorithm. Sweden : KTH Nada. Soebroto dan Arief Andy. 2005. Hybrid Average Complete Clustering sebagai Algoritma Kompromi antara Kualitas dan Waktu Komputasi Proses Clustering. Surabaya : Institut Teknologi Sepuluh November. Steinbach, Michael, George Karypis dan Vipin Kumar. 2005. A Comparisont of Document Clustering Techniques. Minnesota : University of Minnesota, Department of Computer Science and Engineering. Tan, P. N., M. Steinbach dan V. Kumar. 2005. Introduction to Data Mining. New York : Addison Wesley. ISSN : 1979-5661 -10- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 SISTEM PENDUKUNG KEPUTUSAN DALAM PEMILIHAN TEMPAT KOST DENGAN METODE PEMBOBOTAN ( STUDI KASUS : SLEMAN YOGYAKARTA) I Wayan Supriana Program Pascasarjana Ilmu Komputer Fakultas MIPA Universitas Gadjah Mada Skip Utara, Yogyakarta, 55281 Email: [email protected] ABSTRAK Penentuan tempat tinggal di daerah yang baru dikenal dipengaruhi oleh banyak factor, diantaranya lokasi, fasilitas, sistem kontrak dan harga. Makalah ini menentukan kriteria-kriteria yang digunakan didalam pemilihan tempat tinggal. kriteria-kriteria tersebut dianalisis menggunakan metode pembobotan. Hasil analisis yang didapat berupa kriteria lokasi untuk menentukan tempat kost yang paling sesuai. Kata kunci: Pembobotan, kriteria, analisis ABSTRACT Determination of residence in the newly recognized influenced by many factors, such as location, facilities, contracts and pricing. This paper determines the criteria used in the selection of a place to stay. criteria were analyzed using the methods of weighting. The results of the analysis are obtained in the form of criteria to determine the location of the most appropriate place of boarding. Keywords: Weighting, criteria, analysis Demikian juga halnya dengan pemilihan kost bagi mahasiswa yang menuntut ilmu di jogjakarta. Terkadang mahasiswa yang tidak mengetahui daerah jogjakarta tentunya akan menemui banyak kesulitan ataupun banyak kendala dalam memilih tempat kost. Penentuan tempat kost mana yang harus dipilih oleh mahasiswa dipengaruhi oleh banyak faktor, diantaranya lokasi, fasilitas, sistem kontrak dan harga. Makalah ini bertujuan untuk mencari kriteria-kriteria yang digunakan didalam memilih kost oleh mahasiswa yang kuliah dijogjakarta. Kriteriakriteria tersebut dianalisis menggunakan sistem pembobotan. Hasil analisis yang didapat dengan menjumlahkan hasil seluruh kriteria dan membagi dengan banyaknya kriteria . 1. PENDAHULUAN Persoalan pengambilan keputusan pada dasarnya adalah bentuk pemilihan dari berbagai altrenatif tindakan yang mungkin dipilih yang prosesnya melalui mekanisme tertentu, dengan harapan akan menghasilkan sebuah keputusan yang terbaik. Penyusunan model keputusan adalah suatu cara untuk mengembangkan hubungan-hubungan yang logis yang mendasari persoalan keputusan ke dalam suatu model matematis, yang mencerminkan hubungan yang terjadi di antara faktor-faktor yang terlibat, sehingga proses keputusan harus diambil melalui proses yang bertahap, sistematik, konsisten dan diusahakan dalam setiap langkah melalui dari awal telah mengikutsertakan dan mempertimbangkan berbagai faktor. ISSN : 1979-5661 -11- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 2. METODE PENELITIAN 3. PERANCANGAN SISTEM 3.1. Model dan Bobot Penilaian Sistem Pendukung Keputusan Model (kriteria) sistem pendukung keputusan pemilihan tempat tinggal/kost dibuat dalam 4 jenis kriteria yaitu : model lokasi, model fasilitas, model sistem kontrak rumah dan model harga. Dimana masingmasing model tersebut memiliki beberapa elemen yang akan menentukan hasil akhir sistem pendukung keputusan yang akan digunakan oleh para pengguna dalam menentukan suatu keputusan. Setiap elemen bobot penilaian yang berbeda-beda tergantung dari hasil jenis model. Batasan penilaian dimulai dari 10 sebagai range terendah sampai dengan 100 sebagai range tertinggi, sehingga pada akhirnya kelayakan pemilihan tempat tinggal/kost diukur dengan nilai sebagai : 80-100 kategori diterima oleh pengguna untuk ditempati, 60-79 kategori dipertimbangkan apakah ditempati atau tidak, 0-59 kategori ditolak artinya tidak layak ditempati. Bobot penilaiannya sudah ditentukan berdasarkan kriteria yang telah ditetapkan oleh peneliti dengan bersumber pada hasil penelitian, namun hal ini untuk seterusnya bisa diadakan perubahan-perubahan searah dengan tuntutan kebutuhan. Bahwa sistem pada proses penilaiannya mengacu kepada pemenuhan kriteria-kriteria yang telah ditetapkan serta mengacu pada beberapa kasus yang telah terjadi, sehingga benar-benar mempunyai tolak ukur yang baik. Metode pembobotan yang digunakan dalam sistem ini adalah pembobotan secara langsung, artinya pengguna langsung memberikan bobot pada setiap kriteria dalam skala tertentu. Bobot yang telah diinput kemudian dinormalisasi untuk mendistribusikan nilai kepada seleruh kriteria sehingga jika semua bobot kriteria diproses oleh sistem akan menghasilkan satu nilai sebagai pertimbangan keputusan bagi pengguna. Menurut Simon dalam buku Komputerisasi Pengambilan Keputusan. Proses pengambilan keputusan melalui tahapan: 1.1. Tahap Penelusuran (intelligence) Dalam perancangan yang dilakukan melahirkan rumusan masalah berupa sistem pendukung keputusan pemilihan tempat kost berdasarkan kriteria dari pemlih. 1.2. Tahap Perancangan (Design) Setelah perumusan masalah, dilanjutkan dengan penetapan kriteria-kriteria yang dipakai dalam memilih tempat kost. 1.3. Tahap Pemilihan (Choice) Dengan mengacu pada kriteria-kriteria penilaian yang telah ditetapkan, dibuat modelmodel penilaian secara matematis. 1.4. Tahap Implementasi (Implementation) Struktur Sistem Pendukung Keputusan diimplementasikan dengan bahasa pemrograman Poxpro. Sedangkan komponenkomponen Sistem Pendukung Keputusan yang digunakan adalah: 1. Subsistem manajemen data, menyediakan data bagi sistem yang berasal dari data internal dan eksternal. 2. Subsistem manajemen model, berfungsi sebagai pengelola berbagai model 3. Subsistem antar muka pengguna, merupakan fasilitas yang mampu mengintegrasikan sistem terpasang dengan pengguna secara interaktif. Perancangan basis data sistem pendukung keputusan yang akan memberikan pemahaman secara keseluruhan berupa hubungan antar obyek data, aliran informasi dan transformasi dari data input manjadi output yang digambarkan secara grafik berupa entitas relationship diagram flow. ISSN : 1979-5661 3.2. Perancangan Basis Data Perancangan basis data digunakan untuk mendukung fasilitas pengolahan data, dimana model yang digunakan dalam perancangan basis data adalah model E-R (EntityRelationship), berikut adalah ER dari sistem pendukung keputusan pemilihan tempat kost di jogjakarta. Gambar 1. ERD Sitem -12- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Tabel 2. Kriteria fasilitas No Kriteria Fasilitas 3.3. Perancangan Basis Model Dalam mendukung proses pengambilan keputusan, digunakan model pembobotan yang dibangun untuk menentukan prioritas tempat tinggal dalam menghasilkan keluran sistem secara keseluruhan melakukan langkahlangkah sebagai berikut: a. Input nilai kriteria masing-masing model b. Input bobot masing-masing kriteria c. Hitung normalisasi dari bobot 1 2 3 4 5 6 7 NK = 7 n NK 3. Kriteria sistem kontrak Model sistem kontrak dimaksudkan untuk menentukan sistem pembayaran tempat tinggal. Dengan pemberian nilai mulai dari terkecil 40 sampai terbesar 100. Tabel 3. Kriteria sistem kontrak N Sub Kriteria Sistem Nila Bobo o kontrak i t 1 Tahunan 100 2 Enam bulan 80 50% 3 Tiga bulan 60 4 Bulanan 40 n Dimana SBK : Kriteria BBT : Bobot kriteria NK : Nilai kriteria Rancangan model untuk mengevaluasi pemilihan tempat tinggal adalah sebagai berikut: 1. Kriteria lokasi Model lokasi dimaksudkan untuk menentukan kenyamanan tempat tinggal yang akan di ditempati oleh mahasiswa serta berapa besar nilai dari masingmasing point tersebut. Dengan pemberian nilai mulai dari terkecil 10 sampai terbesar 100. Tabel 1. Kriteria lokasi No Kriteria Lokasi Nilai Bobot 1 Dekat kampus 100 2 Dekat jalan raya 80 3 Dekat tempat 60 80 % peribadahan 4 Dekat teman 40 sedaerah 5 Dekat rumah makan 20 6 Dekat tempat 10 hiburan Nilai sistem kontrak adalah: (100 x 0,5) (80 x 0,5) (60 x0,5) (40 x0,5) 35 4 4. Kriteria harga Model harga dimaksudkan untuk menentukan harga dari tempat tinggal. Model ini terdiri dari 4 kriteria yaitu tahunan, enam bulanan, tiga bulanan, dan bulanan. Persentase nilai dari model harga ditentukan berdasarkan hal-hal sebagai berikut. Tabel 4. Kriteria harga tahunan No Kriteria Harga Nilai Bobot tahunan 1 0 - 2.000.000 100 40% 2 2.001.000 - 80 2.500.000 3 2.501.000 - 60 3.000.000 Nilai lokasi adalah: (100 x 0,8) (80 x 0,8) (60 x0,8) (40 x0,8) (20 x0,8) (10 x0,8) 41,333 6 2. Kriteria fasilitas Model fasilitas dimaksudkan untuk menentukan fasilitas yang didapatkan di tempat kost dan berapa besar nilai dari masing-masing point tersebut. Dengan pemberian nilai mulai dari terkecil 20 sampai terbesar 100. ISSN : 1979-5661 70 % (100 x 0,7) (90 x 0,7) (80 x 0,7) (70 x0,7) (60 x0,7) (40 x0,7) (20 x0,7) 46 BBT % i 1 Nilai akhir = Bobo t Nilai fasilitas adalah: n (SBK ) x Tempat tidur Meja belajar Lemari pakaian Kamar mandi dalam Kamar mandi luar Dapur Ruang tamu Nila i 100 90 80 70 60 40 20 Nilai kriteria tahunan adalah: -13- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 (100 x 0,4) (80 x 0,4) (60 x 0,4) 32 Berdasarkan nilai akhir yang didapat yaitu 30,30 dimana rentang nilai tersebut <=59 yang artinya tempat kost tersebut tidak dipilih. 3 Tabel 5. Kriteria harga enam bulanan No Kriteria Harga Nilai Bobo enam bulan t 1 0 - 1.050.000 80 30 % 2 1.051.000 60 1.300.000 3 1.301.000 40 1.550.000 3.4. Perancangan Basis Dialog Rancangan dialog dari sistem pendukung keputusan bertujuan untuk memudahkan terjadinya interaksi antara pengguna dengan sistem, dimana rancangan dialognya menggunakan gaya menu dengan strukturnya seperti gambar berikut ini: Nilai model enam bulanan adalah: (80 x 0,3) (60 x 0,3) (40 x 0,3) 18 3 Menu Utama Menu Model Tabel 6. Kriteria harga tiga bulanan No Kriteria Harga tiga Nila Bobo bulan i t 1 0 - 550.000 70 20% 2 551.000 - 675.000 50 3 676.000 - 6 30 800.000 Menu Kriteria Input Model Input Model Edit Model Edit Model Hapus Model Hapus Model Laporan Hasil Seleksi Menu Tambahan Informasi Keluar Aplikasi Gambar 2. Struktur Dialog 3.5. Perancangan Dialog Output Pemilihan Tempat Kost di Yogyakarta Rancangan dialog output yang dihasilkan oleh sistem berupa laporan penilaian per model, seperti ditunjukkan gambar berikut: Nilai kriteria tiga bulanan adalah: (70 x 0,2) (50 x 0,2) (30 x 0,2) 10 3 Tabel 7. Kriteria harga bulanan No Kriteria Nilai Bobot Harga Bulanan 1 0 - 200.000 60 2 201.000 40 10% 250.000 3 251.000 20 300.000 Nilai kriteria harga nulanan adalah: (60 x 0,1) (40 x 0,1) (20 x 0,1) 4 3 Total nilai kriteria harga = 32 18 10 4 16 4 Proses perhitungan keseluruhan model berdasarkan rumus dari pembobotan yang di jelaskan di depan adalah sebagai berikut : Nilai akhir adalah: Gambar 3. Rancangan Dialog Output 41,33 46 35 16 30,30 4 ISSN : 1979-5661 -14- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 4. IMPLEMENTASI MODEL 4.1. Menu Utama Menu utama ditampilkan agar seseorang mengetahui seluruh menu dan sub menu yang ada di dalam sistem aplikasi dimana pengguna dapat memilih menu-menu yang ditampilkan oleh aplikasi. Gambar 6. Menu Edit Model 4.4. Menu Hapus Model Menu hapus model digunakan untuk menghapus model yang telah diinputkan, apabila model yang dimaksudkan tidak sesuai dengan kelayakan penilaian pemilihan tempat kost. Gambar 4. Menu Utama 4.2. Menu Input Model Menu input model digunakan untuk memasukkan model atau kriteria-kriteria dari sistem pemilihan kost. Di dalam menu ini ada beberapa fitur yaitu simpan, batal, keluar dan tampil data. tampil data berisi kriteria-kriteria yang sudah terdapat di dalam sistem. Gambar 7. Menu Hapus Model 4.5. Menu Input Kriteria Menu input kriteria digunakan untuk menginput nilai masing-masing kriteria beserta bobot dari model yang digunakan. Gambar 5. Menu Input Model 4.3. Menu Edit Model Menu edit model digunakan untuk memperbaiki model atau kriteria yang telah diinputkan apabila terjadi perubahan pada model yang ada. Gambar 8. Menu Input Kriteria 4.6. Menu Edit Kriteria Menu edit kriteria digunakan untuk mengedit kriteria yang di dalam pemasukkan ISSN : 1979-5661 -15- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 datanya ada kesalahan baik terhadap nilai, bobot dan nama sub kriteria. Gambar 9. Menu Input Kriteria 4.7. Menu Hapus Kriteria Menu hapus kriteria digunakan untuk menghapus kriteria yang didalam pemilihan tempat kost tidak sesuai dengan kriteria pemilihan 5. KESIMPULAN Konsep rancangan sistem pendukung keputusan penentuan tempat tinggal atau kost diharapkan menjadi acuan bagi pengembangan sistem nantinya atau computer base system. Dari beragamnya tempat kost yang ada didaerah Yogyakarta diharapkan dapat membantu mahasiswa dalam menentukan tempat kost yang layak sesuai dengan keinginan dari mahasiswa tersebut. Gambar 10. Menu Hapus Kriteria 6. DAFTAR PUSTAKA [1] Alter, S.L., 1980, Decision Support System: Current Practice and Continuing Challenge, Reading, MA: AddisionWesley [2] Kosasih, S., 2002, Sistem Pendukung Keputusan, Proyek Peningkatan Penelitian Tinggi Direktorat Jendral Pendidikan Tinggi Departemen Pendidikan Nasional [3] Little, J. D.C., 1970, Model and Managers: The Concept of a Calculus, Management Science, vol.16, no.8 [4] Turban, 2005, Decision Support System and Intelligent System (Terjemahan: Sitem Pendukung Keputusan dan Sistem Cerdas) Jilid 1, Andi Offset, Yogyakarta. 4.8. Menu Lapotan Sistem Menu laporan didasarkan atas kebutuhan informasi yang telah diidentifikasi pada tahap penentuan syarat-syarat informasi. Laporan yang dihasilkan oleh sistem yaitu laporan penentuan pemilihan tempat kost bagi mahasiswa yang nantinya menentukan apakah seorang mahasiswa memilih tempat kost, mempertimbangkan atau menolak kost tersebut. ISSN : 1979-5661 -16- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 SISTEM TUTORIAL MATEMATIKA DISKRET DALAM MENUNJANG PROSES BELAJAR BERBASIS KOMPETENSI I Gede Santi Astawa Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Email : [email protected] ABSTRAK Matematika Diskret merupakan salah satu mata kuliah yang cukup ditakuti oleh mahasiswa. Rasa takut dan malu inilah yang seringkali menjadi hambatan dalam proses belajar mengajar di kelas, karena mahasiswa cenderung untuk diam. Hal ini sangat bertentangan dalam system pembelajaran berbasis KBK, dimana peran aktif mahasiswa menjadi point utama penilaian. Sebuah aplikasi komputer yang mampu memberikan tutorial matematika diskret kepada mahasiswa menjadi sangat dibutuhkan, karena dengan menggunakan aplikasi ini mahasiswa dapat belajar dan menguji kemampuan dalam mata kuliah matematika diskret secara mandiri. Dari hasil pengujian, kelompok mahasiswa yang menggunakan system tutorial berbasis computer cenderung memiliki nilai (tingkat pemahaman) yang lebih baik dibandingkan dengan kelompok mahasiswa yang hanya diberikan pembelajaran di kelas. Kata kunci— Matematika Diskret, KBK, aplikasi komputer. 1. PENDAHULUAN Kecemasan siswa merupakan salah satu faktor penting yang mempengaruhi hasil belajar siswa[1]. Beberapa hal berpengaruh pada kecemasan dalam diri siswa, seperti tegang saat mengerjakan soal atau saat kelas dimulai, pesimis akan kemampuannya, khawatir jika hasil pekerjaannya buruk, dan juga ketakutan akan ditertawakan oleh teman yang lainnya [2,3]. Kecemasan juga muncul dari faktor di luar diri siswa, seperti: cerita buruk mengenai suatu mata pelajaran,sikap guru, dan juga tingkat persaingan di kelas yang siswa rasakan[1]. Metode belajar mandiri berbantuan komputer dalam proses pembelajaran dikembangkan untuk mengatasi permasalahan kecemasan siswa dalam belajar di kelas. Kombinasi metode kecerdasan buatan, pengetahuan kognitif, dan teknologi modern pada proses pembelajaran akan menghasilkan sebuah sistem pembelajaran yang efektif yang selanjutnya dikenal dengan istilah Intelligent Computer-Aided Instruction (ICAI)[4]. Pada beberapa penelitian ICAI dihubungkan dengan sistem yang meggunakan konten pembelajaran dan strategi pengajaran ISSN : 1979-5661 sebagai basis data pengetahuan, kemudian menggunakan penalaran berdasarkan pemahaman siswa untuk secara dinamis melakukan adaptasi pada proses pembelajaran, sistem ini dikenal dengan sistem tutorial adaptif [5,6]. Selain berfungsi sebagai alat bantu dalam belajar, bahan pembelajaran berbasis Komputer juga memiliki karakteristik tersendiri. Menurut Slamet Suyanto. Ciri-ciri bahan pembelajaran berbasis komputer adalah sebagai berikut : 1. Sistemik, Bahan pembelajaran berbasis komputer disusun secara sistemik dan terstruktur. Selain itu pengembangan pembelajaran berbasis komputer juga mempertimbangkan penyusunan peta konsep keilmuwan. Beberapa pilihan yang dapat digunakan dalam menyusun peta konsep, mulai dari konsep mudah ke sulit sampai dengan umum ke khusus, hal ini tergantung dari kebutuhan yang diinginkan. 2. Jelas dan Menarik, Pemaparan konsep yang jelas dan tampilan yang menarik merupakan hal pokok dalam pembelajaran berbasis komputer. Penggunaan bahasa yang lugas, tidak enterpretatif, penggunaan ilustrasi yang -17- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 jelas dan detail juga termasuk syarat mutlak dalam pengembangan pembelajaran berbasis komputer. 3 Mudah digunakan, Sebagian besar produk pembelajaran berbasis komputer sangat mudah digunakan, meskipun bagi orang awam sekalipun. Dengan petunjuk penggunaan yang jelas dan memiliki pola logika yang konkrit menjadikan produk PBK mudah dipahami. 4 Mudah diperbaiki, Produk pembelajaran berbasis komputer juga mudah diperbaiki. Penambahan, pengurangan, dan revisi terhadap isi produk sangat mudah dilakukan. Berbeda halnya dengan bahan cetak, setelah mengalami proses pencetakkan bahan ajar cetak sulit untuk direvisi secara langsung, melainkan harus melakukan pencetakan ulang. Dengan semakin pesatnya perkembangan teknologi, fitur-fitur yang terdapat dalam fasilitas program juga semakin berkembang. Sehingga semakin memudahkan dalam pengeditan produk PBK. 5. Mudah disebarluaskan, Bahan ajar berbasis komputer sangat mudah untuk disebarluaskan, salah satunya adalah penyebaran menggunakan media internet. 2. METODE PENELITIAN Langkah-langkah dalam penelitian ini adalah 1. Studi Pustaka, dengan membaca beberapa jurnal atau hasil penelitian terkait, sahingga aplikasi yang dibuat memiliki arah dan tujuan yang pasti. 2. Analisa kebutuhan system, dilakukan dengan membaca materi-materi pada buku matematika diskret, membuat diagram keterkaitan materi, dan mencari sifat-sifat dari materi. 3. Perancangan system, disesuaikan dengan kesimpulan pada tahap analisa kebutuhan system 4. Aplikasi, system diaplikasikan pada bahasa pemrograman Delphi, dengan database paradox. 5. Pengujian, pengujian dilakukan dengan membagi mahasiswa menjadi dua kelompok pada satu sub bahasan matematika diskret, dimana satu kelompok ditugaskan untuk mencoba system tutorial yang sudah dibuat, dan kelompok lain hanya diberikan pembelajaran dikelas saja. Selanjutnya diadakan sebuah test kecil untuk melihat ISSN : 1979-5661 tingkat pemahaman siswa pada sub bahasan tersebut. 3. DESAIN SISTEM TUTORIAL Proses belajar dalam penelitian ini dibagi menjadi empat tahap, yaitu: 1. Tahap membaca, pada tahap ini diberikan materi bacaan, dan siswa diminta menjawab pertanyaan bacaan. 2. Tahap pemahaman materi, pada tahap ini materi bacaan dihilangkan dan siswa diminta menjawab pertanyaan yang berhubungan dengan materi. 3. Tahap contoh soal, pada tahap ini diberikan tiga tipe soal contoh yang lebih bersifat hitungan. Pada tahap ini, apabila jawaban siswa salah, maka sistem akan menanyakan data-data tentang apa yang diketahui atau ditanyakan pada soal tersebut, dan menyiapkan soal dengan tipe yang sama. Tahap ini bertujuan untuk melatih kemampuan siswa dalam menganalisa soal. 4. Tahap latihan soal, pada tahap ini diberikan beberapa soal yang lebih bersifat hitungan. Tahap ini bertujuan untuk mengetahui tingkat pencapaian siswa pada materi pelajaran yang sedang dipelajari. Adaptasi pertama dilakukan pada tahap membaca, dengan menggunakan nilai dan waktu untuk menjawab sebagai faktor kelulusan, apabila siswa dalam tahap ini tidak dapat mencapai batas bawah kelulusan maka sistem akan memberikan materi dan pertanyaan dengan level yang lebih mudah terlebih dahulu sebelum nantinya kembali ke level semula. Terdapat tiga level materi atau soal pada tahap ini yaitu: Materi dengan lebih banyak contoh-contoh atau pertanyaan-pertanyaan bacaan yang jawabannya merupakan pengulangan dari materi atau contoh yang sudah ada (level rendah). Materi dengan beberapa contoh-contoh atau pertanyaan-pertanyaan bacaan yang sedikit berbeda dengan materi atau contoh yang diberikan (level sedang). Materi dengan beberapa contoh atau pertanyaan-pertanyaan bacaan yang jawabannya memerlukan pemahaman maksud dari materi atau contoh yang diberikan (level tinggi). Selanjutnya dirancang desain sistem berbasis komputer yang diharapkan dapat membantu mahasiswa dalam mempelajari cara-cara -18- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 penyelesaian kasus materi pencacahan pada matakuliah matematika diskret. Langkah pertama akan disusun rencangan data flow diagram (DFD) dari sistem yang akan dibuat sebagai berikut: Passwor 0 Sistem Sis wa jawaban Pertanyaan/ materi Password, materi baru Tutorial Matematika Diskret Data siswa, data materi, data aturan Data siswa, data materi Gu ru Password, aturan baru Dan juga dirancang basis data yang akan digunakan dalam system tutorial, basis data ini pada dasarnya digunakan untuk menyimpan berbagai file yang menyangkut materi belajar, soal-jawaban, hint-hint, dan juga menyimpan file pribadi pengguna system seperti gambar 2. Rancangan sistem di atas, diimplementasikan pada bahasa pemrograman Delphi 6.0. Bahasa pemrograman Delphi dipilih karena sudah mendukung sistem basis data dengan baik, dan dapat berjalan dengan baik dalam lingkungan sistem operasi Windows XP dan Windows 7 yang dewasa ini banyak digunakan di lingkungan sekolah. Admi n Gambar 1. DFD level 0 sistem tutorial matematika diskret syarat m Kode soal nama jawa b Kode TP memiliki nama n n Test pendalaman materi 1 soal Kode 1 memiliki 1 Kode 1 rumus memiliki n memiliki soal memiliki Variable n Variable Soal ujian n Langkah jawab Langka Langka rum 1 1 memiliki Langka Kode Kode Contoh Soal soa Langka h3 Gambar 2. ERD basis data sistem ISSN : 1979-5661 -19- soa jawa jawa Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 4. HASIL DAN PEMBAHASAN Pengujian system yang akan dilakukan bertujuan untuk mengetahui efektifitas penggunaan system tutorial ini bagi mahasiswa dalam belajar metode pencacahan dalam kuliah matematika diskret. Untuk itu pengujian akan melibatkan 60 orang mahasiswa, dimana 30 mahasiswa dipilih secara acak untuk mencoba sistem yang sudah dibuat. Akan diambil dua nilai test, yaitu test pendahuluan (sebelum mencoba sistem) dan test akhir (setelah selesai mencoba system), analisis statistika akan digunakan untuk menarik kesimpulan dari dua kelompok data yang diperoleh. Sampai saat ini peneliti sudah memberikan test pendahuluan kepada 60 orang mahasiswa yang diambil secara acak dari 97 orang mahasiswa jurusan Ilmu Komputer UNUD angkatan 2012 yang sedang mengambil matakuliah matematika diskret. Gambar 3 dibawah adalah sebaran hasil pretest dan pemilihan subyek penelitian yang dilakukan oleh peneliti, pemilihan diambil secara acak dari golongan mahasiswa dengan hasil pretest rendah, sedang dan tinggi, sehingga diharapkan kondisi awal kedua kelompok mahasiswa yang akan dikenai perlakuan pada saat penelitian adalah sama. 70 60 50 40 30 20 10 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 data1 data2 Gambar . 4. Perbandingan hasil pretest dua kelompok subyek penelitian Kelompok pertama adalah kelompok yang diberikan perlakuan belajar di kelas, dengan lebih banyak melakukan pembahasan soal (ratarata pretest 31,6333), sedangkan kelompok kedua (rata-rata pretest 30,5) merupakan kelompok yang selanjutnya diberikan kesempatan memakai system tutorial yang sudah dirancang. Dari hasil pretest yang dilakukan, didapatkan hasil perbandingan nilai posttest dan pretest dari masing-masing mahasiswa pada kedua kelompok adaah sebagai berikut: 70 60 50 40 30 20 10 0 80 70 60 50 40 30 20 10 0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 Hasil Pretest 60 Mahasiswa 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Gambar. 3. Hasil Pretest seluruh mahasiswa data1 pretest Dari gambar 3 terlihat bahwa nilai pretest tertinggi adalah 63, nilai pretest terendah adalah 15,sedangkan rata-rata perolehan 60 mahasiswa adalah 30,0667. Langkah selanjutnya peneliti membagi subyek penelitian menjadi dua bagian dengan sebaran nilai pretest masing-masing kelompok adalah ISSN : 1979-5661 -20- data1 postest Gambar . 5. Perbandingan Pretest dan Postest kelompok I Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 100 80 60 40 20 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 data2 pretest data2 postest Gambar. 6. Perbandingan Pretest dan Postest kelompok II Dari gambar 5. dan gambar.6, terlihat kelompok yang mendapat kesempatan mencoba system yang sudah dirancang memiliki kenaikan nilai(selisih nilai posttest-pretest) yang lebih baik dibandingkan kelompok yang hanya belajar di kampus (kelompok I), dengan system pembelajaran yang diberikan pada kelompok I adalah system belajar yang lebih menitik beratkan pada pembahasan contoh kasus. Dalam bentuk table, hasil perbandingan ini dapat dilihat sebagai berikut: Median Modus Rata-rata Tertinggi Terendah Sebaran Kelompok I Pretest Postest Kelompok II Pretest Postest 30 30 31,63 63 15 10,73 30 30 30,5 60 15 10,957 60 60 60,57 75 47 5,37 65 60 66,367 80 54 7,02 Dari table di atas, dapat disimpulkan bahwa penggunaan system tutorial pada mata kuliah matematika diskret khususnya pada materi pencacahan, menghasilkan peningkatan kemampuan mahasiswa yang lebih baik, dengan rata-rata perolehan nilai adalah 66,3667. 5. KESIMPULAN Berdasarkan proses perancangan, implementasi, dan pengujian prototype system tutorial materi matematika diskret yang telah dilaksanakan, dapat disimpulkan bahwa: 1. Dari hasil analisa kebutuhan system, ditemukan fakta bahwa salah satu kesulitan mahasiswa dalam mempelajari materi pencacahan adalah tidak adanya ISSN : 1979-5661 panutan bagi mereka dalam belajar dan berlatih diluar jam pelajaran kampus. Sehingga keberadaan sebuah system berbasis computer yang mampu menuntun mereka dalam belajar sangat dibutuhkan. 2. Efektifitas penggunaan system tutorial matematika diskret khususnya materi pencacahan pada 30 orang mahasiswa, adalah sangat baik apabila dibandingkan dengan kelompok mahasiswa yang tidak menggunakan system tersebut. Pada beberapa tahapan penelitian, juga ditemukan kendala-kendala seperti kesulitan peneliti dalam menentukan hubungan kesalahan yang dibuat mahasiswa dengan tingkat pemahaman mereka. Sehingga disarankan untuk penelitian selanjutnya perlu untuk dibahas beberapa metode pendekatan mengenai hal ini, sehingga system tutorial yang dihasilkan dapat lebih baik. 6. DAFTAR PUSTAKA [1] Abdurrahman, M., 1999, Pendidikan Bagi Anak Berkesulitan Belajar. Jakarta : Rineka Cipta. [2] Elliot, S.N., Kratochwill, T.R., Litllefield, J., Travers, J.F., 1996, EducationalPsychology. Second edition, Madition : Brown dan Benchmark Company. [3] Indiyani. N.E., Listiara, A., 2006, Efektivitas Metode Pembelajaran Gotong Royong(Cooperative Learning) untuk Menurunkan Kecemasan Siswa dalam Menghadapi Pelajaran Matematika, Jurnal Psikologi Universitas Diponegoro Vol.3, No. 1, Hal 12-20. [4] Molnar A., 1997, Computers in education: A brief history. THE Journal, 24, http://www.thejournal.com/articles/13739, diakses tanggal 14 January 2010. [5] Zarlis, M., 2000, Sistem Tutorial Cerdas dalam Pengajaran Kaidah Berangka bagi Penyelesaian Model Matematik Kamiran dalam Fisik , Disertasi, Universiti Sains Malaysia. [6] Korhan, G., 2006, Intelligent Tutoring Systems for Education, Tesis, Graduate School of Natural and Applied Sciences, Dokuz Eyl ¨ul University. [7] Minarti, Yutmini S., dan Suwalni. 2004. Pengaruh Media Transvisi dan Atribusi -21- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Siswa terhadap Prestasi Belajar Matematika. Jurnal Teknodika 2 (3) : 64 – 88. [8] Roger S. Pressman, 2009, Software Engineering: A Practitioner's Approach 7th edition, McGraw-Hill [9] Suja, I., 2005, Pemrograman SQL dan Database Server MySQL, Andi Yogyakarta [10] Sutomo, dkk. 2004. Penggunaan Alat Peraga dalam Pembelajaran Matematika dan Motivasi Belajar Siswa. Jurnal Teknodika 2 (3) : 89 – 112. [11] Wulan, E.R., dkk. 2004. Keefektifan Penggunaan Media Model dalam Pembelajaran Matematika. Jurnal Teknodika 2 (3) : 44-63. ISSN : 1979-5661 -22- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 PENENTUAN KOMPOSISI BAHAN PAKAN IKAN LELE YANG OPTIMAL DENGAN MENGGUNAKAN METODE IWO-SUBTRACTIVE CLUSTERING Agus Muliantara Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana email : [email protected] ABSTRAK Pakan selain sebagai salah satu faktor yang dapat meningkatkan produktifitas ikan, juga merupakan satu komponen terbesar dalam biaya produksi. Dapat mencapai 60% dari keseluruhan biaya produksi Saat ini harga pakan buatan sudah sekitar Rp 10.000,- per kg. Untuk mendapatkan komposisi pakan yang berkualitas dan memiliki biaya yang efisien tentunya tidak mudah. Salah satu cara yang mungkin digunakan adalah metode trial and error atau metode coba-coba. Namun hal ini tentunya tidak mungkin karena akan terbentur masalah waktu. Untuk itu perlu dilakukan suatu penggabungan beberapa bidang ilmu untuk mendapatkan nilai pakan yang optimal tersebut. Dalam bidang teknik informatika, permasalan mencari komposisi pakan yang optimal (memiliki kandungan gizi baik, tapi harga yang efisien) dikatakan sebagai permasalahan multi objective. Salah satu metode yang dapat digunakan untuk memecahkan permasalahan multi objective adalah Multi Objective Optimiztion with Invasive Weed Optimization-Subtractive Clustering (IWOSC). Penerapan metode IWO-SC dapat digunakan pada kasus penentuan komposisi pakan ikan lele yang optimal tingkat efisiensi biaya pakan menjadi sebesar Rp 922,00 /Kg. Kata kunci: permasalahan tujuan ganda, optimasi tujuan ganda, Invasive Weed Optimization, Subtractive Clusterting, pakan lele ABSTRACT Fish Feed apart as one of the factors that can increase the productivity of the fish, also the largest component in the cost of production. Can reach 60% of the total cost of production of artificial feed prices now are around Rp 10,000, - per kg. To get high quality feed composition has a cost-efficient and certainly not easy. One way that may be used is the method of trial and error or trial and error method. But it is certainly not possible because it would spend the time. So it is necessary for the incorporation of multiple disciplines to obtain the optimal feed value. In the field of computer science, experiences to find the optimal feed composition (having good nutritional content, but the price is efficient) said as a multi objective problem. One method that can be used to solve multi objective is Optimiztion Multi Objective Optimization with Invasive Weed-subtractive clustering (IWO-SC). Application of the Iwo-SC method can be used to optimalized efficiency of feed cost to be Rp 922.00 / Kg. Keywords: multi objective proble, multi objective optimization, Invasive Weed Optimization, subtractive Clusterting, catfish’s feed positif lain dari daerah pariwisata adalah adanya pertumbuhan tempat makan seperti restoran, depot, warung-warung tradisional maupun pedagang kaki lima di pinggir jalan yang menyediakan menu lokal yang beragam. 1. PENDAHULUAN Selain peningkatan pertumbuhan ekonomi yang cenderung meningkat, salah satu dampak ISSN : 1979-5661 -23- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Bali sebagai salah satu tujuan wisatawan mancanegara maupun lokal pun terkena dampak positif tersebut. Berbagai menu lokal maupun menu luar negeri makin banyak menghiasi menu-menu yang ditawarkan oleh tempat makan di Bali sebagai salah satu upaya pemenuhan selera makan wisatawan. Salah satu menu yang saat ini sedang menjamurnya adalah menu berbahan dasar ikan lele seperti pepes lele, lele penyet, ikan lele bumbu balado dan lain-lain. Rasa lele yang gurih dan dibumbui dengan cita rasa lokal sangat menggugah selera para wisatawan untuk mencoba menu berbahan dasar lele tersebut. Kebutuhan restoran atau rumah makan akan bahan baku ikan lele sangatlah besar namun pasokan yang mampu diberikan oleh peternak pembesaran ikan lele masih belum mampu mengimbangi permintaan ini. Salah satu hal yang menyebabkan pengusaha tidak mampu mengimbangi permintaan yang sangat besar ini diantaranya adalah harga pakan yang mahal sehingga peternak hanya mampu membiakkan lele dalam jumlah yang terbatas. Untuk meningkatkan produksi lele, salah satu solusinya adalah dengan penggunaan pakan buatan. Pakan buatan adalah merupakan campuran dari bahan-bahan pakan yang memiliki kandungan nutrisi dan harga yang berbedabeda. Kesalahan penentuan bahan-bahan pakan dapat berdampak pada rendahnya kandungan nutrisi dan tingginya biaya penyediaan pakan buatan yang dihasilkan (luh dkk, 2011). Namun pemilihan pakan yang tepat akan berdampak sebaliknya yaitu harga pakan buatan menjadi lebih murah dan meningkatnya nilai gizi pakan. Peningkatan nilai gizi pakan lele ini tentunya berakibat pula pada meningkatnya produksi ikan lele. Pakan selain sebagai salah satu faktor yang dapat meningkatkan produktifitas ikan, juga merupakan satu komponen terbesar dalam biaya produksi. Dapat mencapai 60% dari keseluruhan biaya produksi (Afrianto dan Liviawaty, 2005). Saat ini harga pakan buatan sudah sekitar Rp 10.000,- per kg. Karenanya, para peternak lele biasanya memilih menggunakan pakan ramuan sendiri hingga marjin yang diperoleh bisa lebih besar dibanding penggunaan pakan buatan pabrik. Biasanya, para peternak akan meramu pakan yang terdiri dari dedak halus (bekatul) 20%, ISSN : 1979-5661 ampas tahu 20%, menir atau jagung giling 20%, dan ayam broiller mati yang dibeli borongan di peternakan ayam atau ikan rucah yang dibeli di Tempat Pelelangan Ikan (TPI) sebanyak 35%, tepung tapioka 5% dan vitamin C serta B Complex. Oleh karena itu agar didapatkan tingkat produksi yang tinggi selain kualitas pakan harus baik, efisiensi produksi pakan juga harus dipertimbangkan. Untuk mendapatkan komposisi pakan yang berkualitas dan memiliki biaya yang efisien tentunya tidak mudah. Salah satu cara yang mungkin digunakan adalah metode trial and error atau metode coba-coba. Tiap komposisi kandungan gizi dan harga pakan dihitung dan dicoba agar nantinya didapatkan nilai yang optimal. Namun hal ini tentunya tidak mungkin karena akan terbentur masalah waktu. Untuk itu perlu dilakukan suatu penggabungan beberapa bidang ilmu untuk mendapatkan nilai pakan yang optimal tersebut (kandungan gizi baik, harga efisien). Dalam penelitian ini bidang ilmu yang akan digunakan yaitu Peternakan dan Teknik Informatika. Bidang Peternakan sebagai bidang yang akan memberikan sekumpulan aturan yang baik dalam menghasilkan pakan yang baik, dan teknik informatika akan digunakan sebagai bidang yang akan mempercepat proses pencarian komposisi pakan yang optimal tersebut. Dalam bidang teknik informatika, permasalan mencari komposisi pakan yang optimal (memiliki kandungan gizi baik, tapi harga yang efisien) dikatakan sebagai permasalahan multi objective. Dimana tujuan yang ingin dicapai adalah dua hal yang saling bertentangan. Permasalahan multi objective dapat pula ditemui seperti halnya dalam pengembangan kendaraan agar dapat digunakan pada kecapatan tinggi namun juga harus hemat bahan bakar. Dalam permasalahan multi objective umumnya memiliki 2 atau lebih tujuan yang saling bertentangan. Salah satu metode yang dapat digunakan untuk memecahkan permasalahan multi objective adalah Multi Objective Optimiztion with Invasive Weed Optimization-Subtractive Clustering (IWO-SC) (muliantara, 2011). MOEA banyak dikembangkan karena implementasinya yang sederhana serta dapat digunakan untuk menyelesaikan permasalahan pada ruang pencarian yang sangat besar dan kompleks (Zitzler,-) -24- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Pemilihan algoritma IWO-SC sebagai metode optimasi pakan ikan lele ini karena kemampuan IWO-SC yang mengadopsi prilaku semak-semak di alam liar yang selalu mampu bertahan walaupun tetap berusaha dimusnahkan oleh manusia. Artinya sifat semak-semak yang mampu mencari posisi tempat tinggal yang optimal sangatlah cocok diterapkan untuk mencari posisi (dalam hal ini dapat disebut sebagai komposisi) pakan ikan sehingga didapatkan kombinasi yang tepat antara kandungan gizi dan harga yang efisien. Beberapa keuntungan yang akan didapat dalam penggunakan metode ini adalah : algoritma IWO-SC akan dapat meminimalkan waktu komputasi jika dibandingkan menggunakan cara manual, kesalahan perhitungan secara manual pun akan dapat diminimalkan. 2. ALGORITMA IWO-SC IWO-SC diperkenalkan oleh muliantara dkk yang dikembangkan dari metode Multiobjective optimization with Invasive Weed Optimization (IWO-MO) yang secara khusus digunakan untuk memecahkan permasalahan ganda. IWO-SC sendiri adalah merupakan algoritma evolusi yang terinspirasi oleh kelakuan koloni semak-semak (weed) yang selalu menang. Semakin keras usaha manusia untuk menyingkirkannya, maka semakin baik semak-semak itu bertahan hidup. Adapun algoritma yang digunakan pada IWO-SC adalah sebagai berikut : 1. melakukan fitness terhadap sejumlah np individu pada populasi 2. melakukan perankingan terhadap populasi menggunakan Fuzzy Sort 3. penentuan jumlah benih berdasarkan pada nilai fitness tiap individu menggunakan perumusan sebagai berikut ( ( normal dengan mean sama dengan nol. Penentuan standar deviasi distribusi didapatkan menggunakan perumusan sebagai berikut Dimana : = standar deviasi distribusi pada individu ke-iter = inisialisasi standar deviasi = inisialisasi standar deviasi = jumlah iterasi maksimal = nilai iterasi saat ini = nonliniear modulation index (pada IWO-MO n=1) Proses ini akan menjamin kemungkinan jatuhnya benih selalu berkurang secara non linear pada area disekitar induknya. Sehingga menghasilkan group suatu individu. 5. saat populasi mencapai jumlah maksimum, maka proses eliminasi akan dilakukan menggunakan subtractive clustering serta memilih sejumlah Pmaxindividu yang diperbolehkan untuk bertahan. Proses 1 sampai dengan proses 5 tersebut dilakukan berulang-ulang sampai stopping criterion tercapai. flowchart metode IWO-SC dapat dilihat pada Gambar 1. Pada proses (ii) Menentukan Individu yang merupakan kandidat solusi sebanyak maksimum populasi dijabarkan menjadi beberapa sub proses sehingga keseluruhan proses akan berurutan sebagai berikut : (i) inisialisasi awal, (ii) perhitungan fitnes dari np individu, (iii) Perankingan menggunakan fuzzy dominance based sorting, (iv) perhitungan jumlah benih yang dapat diproduksi oleh tiap individu, (v) penyebaran benih secara acak dengan menggunakan distribusi normal, Saat individu mencapai jumlah maksimum, dilakukan proses prunning) menggunakan subtractiveclustering. )) Dimana : = benih ke-i dengan {i | 0 < i <= np} = jumlah benih minimum = jumlah benih maksimum = jumlah individu pada populasi = ranking benih ke-i 4. Benih yang sudah dibuat kemudian akan disebar secara acak menggunakan distribusi ISSN : 1979-5661 -25- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 3. DESAIN SISTEM Di penelitian ini, langkah-langkah yang dilakukan adalah (i) penentuan fungsi objective, (ii) desain algoritma, (iii) implementasi algoritma, (iv) uji coba, dan PENENTUAN FUNGSI OBJECTIVE Seperti yang telah disampaikan pada sub bab F.2 bahwa pakan lele dumbo yang baik adalah sebagai berikut : Tabel 1. Persyaratan Nutrisi Pakan Lele Dumbo Maka dapat ditentukan fungsi objecktif untuk beberapa usia lele adalah sebagai berikut: a. Untuk pembenihan Fungsi kandungan pakan ikan lele adalah sebagai berikut : F1(x) = 0.48x1 + 0.20x2 + 0.13x3 + 0.06x4 dimana : x1: jumlah pakan dengan kandungan protein per kg x2: jumlah pakan dengan kandungan lemak per kg x3: jumlah pakan dengan kandungan karbohidrat per kg x4 : jumlah pakan dengan kandungan serat per kg b. Untuk pembesaran F1(x) = 0.37x1 + 0.20x2 + 0.13x3 + 0.08x4 Gambar 1. Metode IWO-SC (vi) evaluasi. Alur metodologi dapat dilihat pada Gambar 2. dimana : x1: jumlah pakan dengan kandungan protein per kg x2: jumlah pakan dengan kandungan kadar lemak per kg x3: jumlah pakan dengan kandungan karbohidrat per kg x4: jumlah pakan dengan kandungan serat per kg penelitian Penentuan Fungsi Objective Merancang modul IWO-SC c. Untuk indukan F1(x) = 0.38x1 + 0.20x2 + 0.13x3 + 0.08x4 Implementasi Modul menggunakan Matlab 2010a dimana : x1: jumlah pakan protein per kg x2: jumlah pakan lemak per kg Uji coba Gambar 2.Alur Desain Sistem ISSN : 1979-5661 -26- dengan kandungan dengan kandungan Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 x3: jumlah pakan dengan kandungan karbohidrat per kg x4: jumlah pakan dengan kandungan serat per kg jumlah yang peternakannya. akandigunakan dalam IWO-SC Untuk desain sistem, seperti yang telah dijelaskan pada sub bab 3, dimana flowchart yang akan digunakan pada penelitian ini adalah tampak pada Gambar 4. MODUL PADA d. berdasarkan hasil survey yang dilaksanakan, didapatkan beberapa harga untuk pakan ikan lele, sebagai berikut : protein (bekatul) :1500/kg --150.000/kw lemak(ayammati) :1500/kg --150.000/kw karbohidrat (jagung giling): 1500/kg -150.000/kw serat (ampas tahu) : 150/kg -15.000/kw sehingga total biaya pembuatan pakan adalah Rp 4.650/kg atau Rp 465.000/kwintal. Untuk itu fungsi biaya yang digunakan adalah sebagai berikut : F2(x) = 1500 x1 + 1500 x2 + 1500 x3 +150x4 dimana : x1 : jumlah pakan dengan kandungan protein x2 : jumlah pakan dengan kandungan lemak x3 : jumlah pakan dengan kandungan karbohidrat x4 : jumlah pakan dengan kandungan serat fungsi biaya yang digunakan adalah sama untuk ketiga proses, karena harga pakan ikan lele adalah tidak terpengaruh pada proses pembenihan atau pembesaran maupun indukan. e. Konstrain yang akan digunakan dalam membatasi jumlah pakan adalah tidak boleh lebih dari 1Kg atau < 1Kg. sehingga fungsi konstrainnya adalah 1 >= x1 + x2 + x3 + x4 dimana : x1 : jumlah pakan dengan kandungan protein x2 : jumlah pakan dengan kandungan lemak x3 : jumlah pakan dengan kandungan karbohidrat x4 : jumlahpakan dengan kandungan serat Gambar 4. Flowchart system DESAIN ANTAR MUKA Adapun desain antar muka yang di gunakan adalah sebagai berikut : kombinasi dari ketiga fungsi objektif inilah yang akan digunakan untuk menentukan berapa banyak komposisi pakan lele agar optimal (murah namun dengan kandungan gizi yang baik dan tidak lebih dari 100Kg/1 kwintal). Berat maksimal yang diijinkan oleh system adalah 100Kg dengan pertimbangan jumlah pakan yang dijual dipasaran adalah dalam satuan kwintal. Sehingga hal ini akan memudahkan peternak dalm menentukan ISSN : 1979-5661 Gambar 3. Antar muka program -27- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 4. UJICOBA Uji coba dilakukan dengan cara melakukan beberapa kali perhitungan. Dari masing-masing percobaan akan dicari nilai rata-rata solusi sehingga itulah yang akan digunakan sebagai solusi akhir. Adapun data percobaan yang dilakukan adalah tampak pada Tabel 2 Tabel 3 Pruning Pareto Front Tabel 2. Data Hasil Percobaan 6. SIMPULAN Dari penelitian yang telah dilaksanakan, dapat disimpulkan hal-hal berikut : 1. Penerapan metode IWO-SC dapat digunakan pada kasus penentuan komposisi pakan ikan lele yang optimal 2. Parameter yang digunakan pada system ini yaitu jumlah dimensi : 4, populasi awal : 20, populasi maksimum : 100, modulation indeks : 1, acceptance ration: 0.5, rejection ratio : 0.15 dengan iterasi maksimum : 5000, solusi counter : 10 menghasilkan efisiensi biaya pakan menjadi sebesar Rp 922,00 /Kg. 5. ANALISA HASIL Berdasarkan hasil percobaan didapatkan 30 nilai yang berbeda-beda. Masing-masing nilai disebut sebagai pareto front. Solusi akhir pada kasus multi objective adalah jamak. Sehingga semua nilai yang diberikan adalah merupakan solusi. Namun apabila ingin dicapai solusi yang lebih baik. Constrain yang digunakan haruslah diterapkan pada solusi tersebut. Sehingga dengan mengggunakan constraint harga pakan tertinggi adalah Rp 1200,00 per Kg maka solusi akhir akan menjadi lebih sedikit yaitu tampak pada Tabel 3 berikut. Berdasarkan Tabel 3 ini, maka peternak bisa menggunakan salah satu kombinasi komposisi pakan lele yang ada. Dimana pada kasus ini, dibatasi harga maksimum untuk sebuah pakan lele adalah Rp 1.200,00 per Kg. ISSN : 1979-5661 7. DAFTAR PUSTAKA Afrianto, E., Liviawaty,E. Pakan Ikan, Yogyakarta:Kanisius, 2005 Luh Kesuma Dewi Wardhani, M. Safritzal, Achmad Chairi. 2011. Optimasi Komposisi pakan ikan air tawar menggunakan metode multi-objective genetic algorithm, seminar Nasional Aplikasi Teknologi Informasi 2011, Yogyakarta, 17-18 Juni 2011 Muliantara, Agus, Agus Zainal Arifin, Anny Yuniarti, Optimasi Tujuan ganda menggunakan algoritma IWO-Subtractive Clustering, Seminar Nasional Pasca Sarjana XI, Surabaya, 2011 Zitzler, Eckart, Marco Laumanns, and Stefan Bleuler. "A tutorial on Evolutionary Multiobjective Optimization." Zurich Switzerland, n.d -28- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 SISTEM PENGAMANAN DATA SIDIK JARI MENGGUNAKAN ALGORITMA AES PADA SISTEM KEPENDUDUKAN BERBASIS RADIO FREQUENCY IDENTIFICATION (RFID) I Gede Andika Putra1,I Made Widhi Wirawan2 Program Studi Teknik Informatika, Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Email :[email protected], [email protected] ABSTRACT Kebutuhan manusia akan perangkat informasi dan komunikasi seakan menjadi kebutuhan yang tidak terpisahkan dalam kehidupan sehari-hari. teknologi RFID adalah proses identifikasi seseorang atau objek dengan menggunakan frekuensi transmisi radio. Keamanan data sidik jari penduduk pada tag RFID ini merupakan hal yang sangat penting untuk dilakukan. Metode kriptografi menjadi salah satu pilihan dalam pengamanan untuk menghindari jika terjadinya ancaman penyalahgunaan kartu identitas penduduk oleh orang yang tidak berhak. Objek suatu pengamanan dalam hal ini adalah data sidik jari penduduk yang akan disimpan dalam memori yang terkandung dalam tag RFID Mifare 1K. Data yang akan dituliskan ke dalam memory tag di rubah ke bentuk yang sulit dimengerti menurut proses enkripsi algoritma AES. Sedangkan dalam proses pembacaan tag akan dijalan kan proses dekripsi untuk mengetahui data identitas penduduk yang tersekripsi menjadi data asli. Metode Algoritma AES dapat memberikan keamanan pada sistem kependudukan berbasis RFID. Bedasarkan pengujian RMS yang telah dilakukan data sidik jari yang diamankan dalam tag RFID tidak dapat digunakan oleh penduduk yang tidak berhak. Disamping itu pada sistem ini dilakukan proses dekripsi untuk menampilkan data penduduk. Kata kunci : RFID (Radio Frequecy Identification), Algoritma AES, Sidik Jari, Keamanan RFID. dan penyalah gunaan terhadap kartu identitas penduduk perlu diamankannya suatu data dengan kriptografi. Kriptografi merupakan salah satu solusi untuk menjamin keamanan dari suatu data yaitu dengan menyandikan isi informasi menjadi isi yang sulit bahkan tidak dipahami dengan cara melalui proses enkripsi (encryption), dan untuk memperoleh kembali informasi yang asli dilakukan proses dekripsi (decryption), disertai dengan menggunakan kunci yang benar. Tujuan dari sistem kriptografi yang terkait dengan aspek keamanan suatu sistem informasi, kerahasian(privacy), integritas (Integrity), otentikasi (Authentication), dan pembuktian yang tidak bias mengelak (NonRepudiation).(Ariyus Dony, 2008). Melihat hal ini, peneliti mencoba untuk merancang sistem pengamanan data sidik jari menggunakan algoritma AES pada sistem kependudukan berbasis RFID. Algoritma AES merupakan algoritma yang sudah terstandarisasi dan dapat dikatakan 1. PENDAHULUAN 1.1 LATAR BELAKANG MASALAH Perkembangan teknologi informasi dan komunikasi dari waktu ke waktu kian meningkat. Kebutuhan manusia akan perangkat informasi dan komunikasi seakan menjadi kebutuhan yang tidak terpisahkan dalam kehidupan sehari-hari. Inovasi yang terjadi dalam bidang ini senantiasa berkembang secara dinamis. Salah satu contohnya adalah teknologi RFID. RFID adalah proses identifikasi seseorang atau objek dengan menggunakan frekuensi transmisi radio. RFID menggunakan frekuensi radio untuk membaca informasi dari sebuah perangkat kecil yang disebut tag atau transponder (Transmitter + Responder). Tag RFID akan mengenali diri sendiri ketika mendeteksi sinyal dari perangkat yang kompatibel, yaitu pembaca RFID (RFID Reader) Salah satu pemanfaatan RFID adalah pada Kartu Identitas Penduduk. Untuk menghindari terjadinya kloning data digital ISSN : 1979-5661 -29- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 relative murah, cepat dan dapat diterapkan pada sistem RFID(Batbold T, 2006). kedalam bentuk sistem yang dirancang untuk melakukan enkripsi dan dekripsi data sidik jari sehingga bisa melakukan pengamanan terhadap data sidik jari agar dikemudian hari tidak terjadi suatu penyalahgunaan baik data digital kependudukan. dan graphia. Crypto berarti secret (Rahasia) dan graphia berarti writing (tulisan). Menurut terminologinya, kriptografi adalah ilmu dan seni untuk menjaga keamanan pesan ketika pesan/ data dikirim dari suatu tempat ke tempat yang lain Kriptografi menjadi dasar bagi keamanaan jaringan komputer. Karena yang menjadi pokok dari fungsi komputer dan jaringan adalah data dan informasi. Salah satu cara yang paling banyak digunakan dalam mengamankan data adalah dengan mengguanakan kriptografi. Data-data tersebut diamankan oleh pengirim sehingga orang lain tidak dapat mengenali data tersebut. 1.2 PERUMUSAN MASALAH Berdasarkan latar belakang di atas, maka permasalahan yang akan dikaji dalam penelitian ini adalah bagaimana merancang sistem pengamanan data sidik jari menggunakan algoritma AES pada sistem kependudukan berbasis RFID. 2.2 ALGORITMA KRIPTOGRAFI Algoritma-algoritma kriptogrfi dapat dibedakan menjadi dua macam yaitu simetrik dan asimetrik. Algoritma simetrik (model enkripsi konvensional) merupakan algoritma yang menggunakan satu kunci untuk proses enkripsi dan deskripsi data. Sedangkan algoritma asimetrik (model enkripsi kunci publik) menggunakan kunci yang berbeda dalam proses enkripsi dan deskripsi pesan. 1.3 BATASAN MASALAH 1. Dalam penelitian ini, lebih difokuskan pada pengamanan data sidik jari pada sistem RFID dengan kasus sistem kependudukan. 2. Alat pemindai yang digunakan adalah fingerprint u are u 4500 dan Reader RFID digunakan Omnikey 5321CL 3. Akuisisi data citra sidik jari langsung dilakukan oleh alat pemindai, sistem hanya melakukan pengolahan hasil ekstraksi ciri dari data citra yang diperoleh. 4. Pada sistem ini algoritma AES inputan data sidik jari dibatasi masing-masing dibatasi sebanyak 16 byte atau 128 bit. Dan panjang kunci selalu mengikuti ukuran panjang dari plainteks. 2.3 ALGORITMA AES Dalam kriptografi, Anvanced Encryption Standard (AES), juga dikenal sebagai Rijndael, AES adalah sebuah block cipher yang dijadikan standar enkripsi oleh pemerintah Amerika Serikat. Enkripsi ini diharapkan juga digunakan secara luas di seluruh dunia dan dianalisa secara luas, seperti pada pendahulunya , Data Encryption Standard (DES). Rijndael (AES) diumumkan oleh National Institute of Standards and Technology (NIST) pada tanggal 26 Nopember 2001, setelah lima tahun proses standardisasi. Metode enkripsi ini menjadi standar secara efektif mulai tahun 2002. Pada tahun 2006, AES adalah salah satu algoritma populer yang digunakan dalam kriptografi kunci simetris. Algoritma AES menggunakan substitusi, permutasi, dan sejumlah putaran yang dikenakan pada tiap blok yang akan dienkripsi / dekripsi. Untuk setiap putarannya, Rijndael menggunakan kunci yang berbeda. Rijndael beroperasi dalam orientasi byte sehingga memungkinkan untuk implementasi algoritma yang efisien ke dalam software dan hardware. 1.4 TUJUAN PENELITIAN Adapun tujuan yang hendak dicapai dalam penelitian ini adalah untuk merancang dan mengimplementasikan Algoritma AES untuk pengamanan data sidik jari pada sistem kependudukan berbasis RFID. Penggunaan algoritma AES dalam penelitian ini untuk mengamankan data sidik jari penduduk sebelum disimpan dalam tag RFID. 2. TINJAUAN PUSTAKA 2.1 KRIPTOGRAFI Kriptografi berasal dari bahasa Yunani. Menurut bahasa tersebut kata kriptografi dibagi menjadi dua,yaitu crypto ISSN : 1979-5661 -30- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Algoritma Rijndael mempunyai 3 parameter sebagai berikut: 1. plainteks: array yang berukuran 16 byte, yang berisi data masukan. 2. cipherteks: array yang berukuran 16 byte, yang berisi hasil enkripsi. 3. key: array yang berukuran 16 byte (untuk panjang kunci 128 bit), yang berisi kunci ciphering (disebut juga cipher key). kunci utama menggunakan penjadwalan kunci (Key Scheduling) 2.3.1 Proses Enkripsi Algoritma AES Proses yang dilakukan setiap rondenya identik (dari ronde ke-0 sampai dengan ronde ke Nr-1), kecuali untuk ronde terakhir Nr. Proses yang identik tersebut terdiri atas SubBytes(), ShiftRows(), MixColumns(), dan AddRoundKey(). Sedangkan pada ronde terakhir Nr tidak dilakukan fungsi MixColumns(). Array 4 x 4 byte plaintext yang disebut state dioperasikan XOR dengan kunci, kemudian diolah sebanyak 9 ronde dengan operasi SubBytes, ShiftRows, MixColumns, AddRoundKey. Tiap ronde akan memilki round key yang diturunkan dari kunci utama. Pada ronde terakhir (ronde 10) tidak dilakukan proses MixColumns, keseluruhan proses enkripsi ini akan mengasilkan cipher 4 x 4 byte 3. ShiftRow Tahap ShiftRows akan menggeser ke kiri secara berputar setiap bytes dalam setiap baris dari state. Jumlah pergeseran tiap byte berbeda untuk setiap barisnya. Baris pertama akan tetap pada keadaan semula. Setiap byte dari baris kedua digeser satu langkah ke kiri. Baris ketiga dan keempat digeser ke kiri sebanyak dua dan tiga langkah. 2. SubBytes Dalam tahap SubBytes, setiap byte dalam state diganti dengan masukannya dalam sebuah table s-box atau subtitusi box. Operasi ini akan memberikan prinsip non-linieritas pada cipher. 4. MixColumns Proses MixColumns akan beroperasi pada tiap kolom dari tabel state. Operasi ini menggabungkan 4 bytes dari setiap kolom tabel state dan menggunakan transformasi linier.Operasi Mix Columns memperlakukan setiap kolom sebagai polinomial 4 suku dalam Galois field dan kemudian dikalikan dengan c(x) modulo (x4+1), dimanac(x)=3x3+x2+x+2. 5. Ekspansi Kunci Algoritma aes melaksanakan kunci-kode dan membuat suatu kunci ekspansi untuk menghasilkan suatu kunci skedul. Kunci ekspansi yang diperlukan AES Nb(Nr+1) kata sehingga bisa digunakan AES 128 bit 2.4 SIDIK JARI Sidik jari adalah gurat-gurat yang terdapat di kulit ujung jari. Gurat-gurat ini tidak ada yang sama antara satu manusia dengan manusia yang lainnya. walaupun mereka kembar identik. Sehingga sidik jari dapat digunakan untuk mengidentifikasi seseorang misalnya untuk mengidentifikasi pelaku kejahatan ataupun untuk identifikasi pekerja pabrik. (Kaselie, 2009) Gambar berikut menggambarkan 3 buah tipe pola utama sidik jari. Gambar.2.1 Skema Enkripsi algoritma AES 1. AddRoundKey Dalam tahap AddRoundKey, setiap byte dari state digabungkan dengan sebuah byte dari sub-kunci ronde, penggabungan ini menggunakan operasi XOR Untuk setiap rondenya, sebuah sub-kunci diturunkan dari ISSN : 1979-5661 -31- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 (Personal Computer) yang dapat membaca data dari tag melalui pembaca RFID. Baik tag dan pembaca RFID diperlengkapi dengan antena sehingga dapat menerima dan memancarkan gelombang elektromagnetik. Gambar 2.2 Beberapa Pola Sidik Jari titk minusi merupakan titik-titik informasi yang dapat mencirikan suatu sidik jari. beberapa bagian pada sidik jari yang dapat dijadikan sebagai titik minusi antara lain : akhir bukit (tidge termination), percabangan (bifurcation) ,pulau (island) , danau (lake), taji (spur), persilangan (crossover). Gambar: 2.3 Sistem RFID 2.5.1 Tag RFID Tag RFID adalah device yang dibuat dari rangkaian elektronika dan antena yang terintegrasi di dalam rangkaian tersebut. Rangkaian elektronik dari tag RFID umumnya memiliki memori sehingga tag ini mempunyai kemampuan untuk menyimpan data. Berdasarkan catu daya tag, tag RFID dapat digolongkan menjadi tag aktif,tag semi aktif dan tag pasif. 2.5 RFID (RADIO FREQUENCY IDENTIFICATION) RFID (Radio Frequency Identification) adalah sistem teknologi identifikasi berbasis gelombang radio yang dalam proses identifikasinya tidak diperlukan kontak langsung antara device pembaca (Reader) dengan obyek yang diidentifikasi (transponder) yang sering disebut tag, dimana tag ini adalah device pembawa data. RFID memiliki kelebihan dari pada teknologi pengidentifikasi sebelumnya, seperti barcode. Diantaranya mampu membaca suatu objek data dengan ukuran tertentu tanpa melalui kontak langsung (contacless) dan tidak harus sejajar dengan objek yang dibaca, selain dapat menyimpan informasi pada bagian tag RFID sesuai dengan kapasitas penyimpanann. Sistem RFID terdiri dari empat komponen, di antaranya sebagai berikut : (Erwin, 2004). 1. Tag : Ini adalah device yang menyimpan informasi untuk identifikasi objek. Tag RFID sering juga disebut sebagai transponder. 2. Antena : untuk mentransmisikan sinyal frekuensi radio antara pembaca RFID dengan tag RFID. 3. Reader RFID: adalah device yang kompatibel dengan tag RFID yang akan berkomunikasi secara wireless dengan tag. 4. Software Aplikasi: adalah aplikasi pada sebuah workstation atau PC ISSN : 1979-5661 2.5.2 Reader RFID Reader RFID mengirim gelombang radio ke tag RFID untuk menanyakan tentang isi data. Tag RFID kemudian merespon dengan mengirimkan kembali data yang diminta. RFID Reader terhubung melalui RFID middleware dengan database untuk melakukan pengolahan data. Berikut adalah gambar alat yang dimaksud : Gambar: 2.4 Reader RFID Omnikey 5321CL 3. METODOLOGI PENELITIAN 3.1 OBJEK PENELITIAN Yang menjadi sebuah objek penelitian adalah data sidik jari penduduk akan disandikan sehingga data tersebut menjadi tidak dapat di pahami. Penyandian data tersebut akan dilakukan dengan menggunakan Algoritma Kriptografi AES pada sistem kependudukan berbasis RFID. -32- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 3.2 FLOWCHART SISTEM Mulai Mulai Beikut ini penjelasan mengenai flowchart yang dibagun, diantaranya :Flowchart Enkripsi pada data sidik jari Input Input Masukan kunci Masukan kunci Addround key Addround key 1. Flowchart proses enkripsi sidik jari Proses pembelajaran ada beberapa tahapan yang akan dilalui yaitu: Sensor fingerprint akan melakukan pembacaan sidik jari yang diinputkan, kemudian sistem akan melakukan ekstraksi sidik jari untuk mendapatkan ciri sidik jari, kemudian hasil ekstraksi ciri sidik jari disimpan ke database. Sebelum data tersebut ditulis ke dalam tag RFID, data sidik jari tersebut dilakukan proses enkripsi. ROUND = 0 ROUND = 0 Round ++ Round ++ SubByte Inverse SubByte ShiftRows Mulai Inverse ShiftRows Mix colum Input data sidik jari Invese Mix colum Addround key Addround key Ekstraksi ciri False Jika (Round =10) Jika (Round =10) False Simpan Data Database True True SubByte Inverse SubByte ShiftRows Inverse ShiftRows Addround key Addround key Cipherteks Plainteks Selesai Selesai Proses Enkripsi Ciphertext Selesai Gambar 3.5 Flowchart proses enkripsi pada data sidik jari Enkripsi 2. Flowchart Enkripsi dan Dekripsi Algoritma AES Pada gambar 3.6 flowcahrt enkripsi dan dekripsi algoritma AES memiliki dasar pengoprasian pada blok 128 bit dengan pembangkitan kunci 128 bit adalah yang pertama dilakukan adalah SubByte melakuakan substitusi byte dengan menggunakan tabel Substitusi (S-box). ShiftRows melakukan pergesaran baris-baris array secara wrapping. MixColumns mengacak data masing-masing kolom array state. Dan ADdRoundKey melakukan XOR antara state sekarang Roun key. Pada final round proses yang dilakukan adalah SubBytes, ShiftRows, dan AddRoundKey. ISSN : 1979-5661 Dekripsi Gambar 3.6 Flowchart enkripsi dan dekripsi Algoritma AES 4. HASIL DAN PEMBAHASAN 4.1 TAMPILAN MENU SISTEM Ada beberapa menu yang terdapat dalam sistem kependudukan ini. Dalam pembahasan menu sistem `pengguna ini yang dibahas yaitu : menu data penduduk, menu laporan, menu data admin. Berikut ini tampilan yang dijelaskan pada sistem kependudukan : -33- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 1. sidik jari dan banyaknya kunci yang digunakan sebanyak 10 kunci dan didapat kan grafik sebagai berikut: Menu data penduduk 14 12 10 8 6 4 2 0 Gambar 4.2 Grafik panjang kunci berbeda dengan data sidik jari sama Gambar : 4.1 tampilan inputan data penduduk Pada gambar diatas menu pengimputan data pendiuduk dan pengambilan sample sidik jari penduduk.. data sisik jari tersebut akan disimpan dalam database sedangkan yang akan ditulis dalam tag adalah data sidik jari yang sudah dilakukan proses enkripsi(chiperteks). Kunci yang digunakan pada proses enkripsi diinputkan oleh penduduk. Dan proses dekripsi kartu tag didekatkan dalam reader RFID maka akan keluar menu inputkan kata sandi. Apabila kata sandi benar akan muncul data penduduk. Pada pengujian ini Penambahan nilai kunci tidak terlalu berpengaruh terhadap nilai RMS yang dihasilkan dari proses enkripsi menggunakan algoritma AES 4.2.2.2 Pengujian RMS Berdasarkan Data Sidik Jari Berbeda Dengan Nilai Kunci Sama Pengujian dilakukan dengan mencari nilai RMS dengan data sidik jari yang berbeda dan nilai kunci yang sama, dalam pengujian ini data sidik jari yang digunakan diambil dari sample sidik jari penduduk dan nilai kunci yang digunakan adalah AA penggujian dilakukan sebanyak 10 kali pengujian bedasar kan data penduduk. Hasil dari pengujian tersebut di gambarkan dalam bentuk grafik berikut: 4.2 PENGUJIAN 4.2.1 Pengujian Algoritma Menggunakan Root Mean Square (RMS) Untuk mengetahui besarnya perbandingan data saat sebelum dan setelah dienkripsi maka dilakukan uji coba dengan RMS. Adapun rumus yang digunakan adalah : 1 RMS n n (z i 1 ' i zi ) 14 12 2 10 8 RMS (Root Mean Square) 6 Keterangan : n = jumlah inputan karakter pesan zi = nilai File sebelum disisipkan dengan pesan teks ' zi = nilai File setelah disisipkan dengan pesan teks 4 2 0 1 2 3 4 5 6 7 8 9 10 Gambar 4.3 Grafik panjang kunci sama dengan data sidik jari berbeda Perbedaan data sidik jari dengan kunci yang sama tidak berpengaruh nilai RMS yang dihasilkan dari proses menggunakan algoritma AES. Hal ini disebabkan karena algoritma AES setiap putaran menghasilkan kunci yang berbeda 4.2.2.1 Pengujian RMS Berdasarkan Nilai Kunci Yang Berbeda Dengan Data Sidik Jari Yang Sama Pengujian dilakukan dengan mencari nilai RMS dengan nilai kunci yang berbeda dan data sidik jari yang sama, dalam pengujian ini menggunakan data yang digunakan data ISSN : 1979-5661 RMS (Root Mean Square -34- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 5. KESIMPULAN Kesimpulan yang dapat diambil dari penelitian yang telah dilakukan adalah sebagai berikut: 1. Bedasarkan penelitian yang dilakukan pada sistem kependudukan berbasis RFID. sistem ini dapat pengamanan data sidik jari pada tag RFID adalah data sidik jari yang di enkripsi (chipertexs). 2. Bedasarkan pengujian RMS yang telah dilakukan data sidik jari yang diamankan dalam tag RFID tidak dapat digunakan oleh penduduk yang tidak berhak. Disamping itu pada sistem ini dilakukan proses dekripsi untuk menampilkan data penduduk. 6. DAFTAR PUSTAKA Ariyus, Dony. 2008. Pengantar Ilmu Kriptografi teori Analisis dan Implementasi. Yogyakarta: Andi Offset Batbold Toiruul,,KyungOh Lee, 2006.”An Advanced Mutual-Authentication Algorithm Using AES for RFID Systems”. Sunmoon University http://paper.ijcsns.org/07_book/20060 9/200609C02.pdf [Diakses Mei 17 2011] Munir, Rinaldi. 2004 . Bahan Kuliah ke-13 IF5054 Kriptografi. Bandung. Putra, Darma. 2009. Sistem Biometrika. Yogyakarta : ANDI Surian, D. 2006. Algoritma Kriptografi AES Rijndael. Teknik Elektro. TESLA. Vol. 8 No. 2 Hal. 97-101. Mardhotillah, Rachma. 2011. Perancangan Sistem Keamanan Dalam Pentransmisian Data Dari Tag Menuju Reader Pada Rfid. http://digilib.its.ac.id/public/ITSUndergraduate-13206-Paper.pdf Diakses tanggal 10 Januari 2011. Virgan, R.Y. Agung, B.P. Agus S. “Aplikasi Enkripsi dan Dekripsi Menggunakan Algoritma Rijndael”. Jurusan Teknik Elektro. Fakultas Teknik. Universitas Diponegoro. ISSN : 1979-5661 -35- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 PENINGKATAN RELEVANSI HASIL PENCARIAN KATA KUNCI DENGAN PENERAPAN MODEL RUANG VEKTOR PADA SISTEM INFORMASI RUANG BACA DI JURUSAN ILMU KOMPUTER UNIVERSITAS UDAYANA Ngurah Agus Sanjaya ERa, Agus Muliantarab, I Made Widiarthac Program Studi Teknik informatika, Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana [email protected], [email protected], [email protected] ABSTRAK Sistem temu kembali informasi dapat memecahkan permasalahan pencarian informasi dengan cara tradisional yang ruang pencariannya terbatas pada judul, pengarang ataupun penerbit dari suatu dokumen. Dengan menggunakan query yang sesuai ruang pencarian pada sistem temu kembali informasi menjadi tidak terbatas. Pada penelitian ini dikembangkan suatu sistem temu kembali informasi pada ruang baca Jurusan Ilmu Komputer, Universitas Udayana. Dokumen yang digunakan adalah berupa kumpulan abstrak dari tugas akhir mahasiswa. Proses pencarian term dimulai dengan melakukan tokenization, stop words removal dan stemming pada kumpulan dokumen. Kesamaan antara query masukan dengan dokumen dihitung menggunakan cosine similarity pada vektor query dan dokumen. Hasil pencarian berupa dokumen yang memiliki relevansi terhadap query dan diurut berdasarkan nilai cosine similarity yang menurun. Evaluasi terhadap sistem diukur dengan menghitung mean average precision dari uji coba. Dari hasil pengujian yang dilakukan didapatkan kesimpulan bahwa sistem temu kembali informasi yang diterapkan pada ruang baca Jurusan Ilmu Komputer Universitas Udayana memberikan tingkat relevansi yang tinggi yang ditunjukkan oleh nilai mean average precision sebesar 70,84%. Kata kunci: sistem temu kembali informasi, cosine similarity, mean average precision ABSTRACT Information retrieval can be applied to solve the problem of traditional searching where the search space is limited to title, author or publisher of a document. By using the appropriate query, the search space of an information retrieval system becomes unlimited. In this research, an information retrieval system is developed for the reading room in Computer Science Department at Udayana University. Collection of documents used is the abstract of students thesis. Terms for dictionary are found by applying tokenization, stop words removal and stemming process on documents. The similarity between input query and a document is calculated using the cosine similarity its respective vectors. Search results for the user is given in the form of ranked documents in relevance to the query and sorted based on the value of cosine similarity. Evaluation of the system is measured by calculating the mean average precision of test results. From the test results it can be concluded that the information retrieval system that is applied to the reading room of Computer Science Department, Udayana University provides a high level of relevance documents indicated by the mean average precision of 70.84%. Keywords: information retrieval system, cosine similarity, mean average precision ISSN : 1979-5661 -36- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 dokumen mana saja yang mengandung kata tersebut. Kembalian yang diberikan ke pengguna berupa kumpulan dokumen yang diurut berdasarkan peringkat relevansinya terhadap query masukan. Proses pemberian peringkat ini didasarkan pada konsep kesamaan (similarity) antara dokumen dengan query. Pada penelitian ini untuk dapat mencari kesamaan antara dokumen dan query maka telah digunakan suatu model yaitu ruang vektor. Dokumen dan query masing-masing diwakili oleh suatu vektor dalam model ruang vektor ini. Besaran dari vektor-vektor tersebut merupakan nilai tf-idf (term frequency-inverse document frequency) dari dokumen dan query. Kesamaan antara vektor dokumen dengan query dihitung dengan fungsi kesamaan cosine. Dengan menggunakan fungsi kesamaan cosine, vektor dokumen dan query yang membentuk sudut 00 atau memiliki nilai cosine 1 akan memiliki kesamaan maksimum. Semakin besar sudut yang dibentuk antara vektor dokumen dan query maka semakin tidak relevan dokumen dan query tersebut. Dokumen yang mendapat peringkat tertinggi merupakan dokumen yang vektornya membentuk sudut terkecil dengan vektor query atau memiliki nilai cosine terbesar. 1. PENDAHULUAN Ruang baca suatu jurusan dalam universitas merupakan tempat dimana mahasiswa dapat mencari segala informasi untuk menunjang proses kegiatan belajar mengajarnya. Untuk dapat menemukan informasi yang dicari maka mahasiswa harus melakukan pencarian pada tumpukan dokumen tersebut dengan cara membacanya satu persatu. Tentu saja selain menghabiskan banyak tenaga, cara konvensional ini juga memerlukan banyak waktu. Informasi yang didapat pun belum tentu sesuai dengan yang diinginkan. Permasalahan pencarian ini dapat diselesaikan dengan menerapkan sistem temu kembali informasi (information retrieval system) yang memungkinkan seorang pengguna, untuk mencari informasi tanpa dikenai batasan apa saja informasi yang dapat dicarinya. Informasi yang dicari disini harus relevan dengan kebutuhan pengguna dan proses pencariannya sendiri dilakukan secara otomatis. Dengan demikian sistem temu kembali informasi mendukung kebebasan pengguna dalam berekspresi melalui query untuk memenuhi kebutuhan informasinya. Disamping menyediakan pencarian informasi, sistem temu kembali informasi juga menangani permasalahan repre¬sentasi, penyimpanan dan organisasi dari informasi tersebut (Baeza-Yates, 2011). Informasi yang dikembalikan oleh sistem temu kembali informasi berupa kumpulan dokumen yang relevan terhadap query yang dimasukkan oleh pengguna. Dokumen merupakan unit dimana sistem temu kembali informasi tersebut dibangun (Manning, 2008). Dokumen bisa berupa kalimat dalam satu paragraf, paragraf dalam satu halaman, halaman yang membentuk satu bab atau kumpulan bab yang membentuk suatu buku. Jadi pengertian dokumen disini tidak dapat diartikan secara harfiah menjadi buku, namun dapat berupa unit-unit yang lebih kecil dari buku. Sebelum dapat memberikan kembalian berupa kumpulan dokumen yang relevan maka sistem temu kembali informasi harus membangun suatu inverted index. Inverted index terdiri atas dua bagian yaitu kamus (dictionary) yang menyimpan kumpulan kata dan posting yang menyimpan informasi ISSN : 1979-5661 2. SISTEM TEMU KEMBALI INFORMASI Temu kembali informasi dapat diartikan sebagai pencarian material koleksi yang besar yang tersimpan dalam komputer (Manning, 2008). Elemen penting dari sistem temu kembali informasi adalah inverted index yang menyimpan informasi seluruh kata yang ada dalam kumpulan dokumen yang digunakan untuk membangun sistem temu kembali informasi tersebut. Kumpulan seluruh kata tersebut sebagai kamus (dictionary). Kata yang dimasukkan ke dalam kamus didapatkan melalui proses tokenization yang dilakukan pada kumpulan dokumen. Tokenization menerima masukan berupa karakter¬karakter berurutan (sequence) kemudian memecahnya menjadi bagian-bagian yang lebih kecil (token) dengan menghilangkan karakter spesial seperti tanda baca. Token yang merupakan kumpulan karakter yang memiliki makna secara semantik umumnya dianggap sama dengan kata (term) walaupun sebenarnya tidak selalu memiliki -37- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 arti. Proses tokenization dapat dilihat pada Gambar 1. dokumen maka dokumen ID yang digunakan bisa dimulai dari 1 sampai dengan 1000. Satu posting dalam posting list berisikan informasi dokumen ID serta satu pointer yang menuju ke posting berikutnya. Dengan adanya kamus dan posting list ini maka data awal yang dibutuhkan untuk membangun sistem temu kembali informasi telah tersedia. Permasalahan berikutnya yang muncul adalah bagaimana cara memberikan nilai kesamaan untuk suatu dokumen terhadap query yang diberikan pengguna. Konsep yang digunakan dalam pembuatan peringkat ini adalah model ruang vektor. Dokumen Ilmu komputer memerlukan logika. Jadi asahlah logika ... Tokens Ilmu komputer memerlukan logika. Jadi asahlah logika ... Term ilmu komputer perlu logika jadi asah logika ... Gambar 1. Proses Tokenization Kata-kata yang didapat kemudian melalui proses stemming yaitu penghapusan imbuhan (awalan, akhiran serta awalan+akhiran) sehingga didapatkan kata dasarnya. Disamping penghapusan imbuhan, kata-kata tersebut juga dibandingkan dengan daftar kata yang dianggap tidak penting dan sering muncul (stop words) seperti ke, yang, dan, dengan dan lain sebagainya. Kata-kata pada dokumen yang diproses yang termasuk ke dalam daftar stop words tidak akan dimasukkan ke dalam kamus. Kata dasar yang berhasil melalui proses stemming dan stop words inilah yang dimasukkan ke dalam kamus. Kamus juga menyimpan total jumlah dokumen dimana masing-masing kata muncul. Sedangkan informasi dokumen mana saja yang mengandung suatu kata pada kamus disimpan pada posting list (Gambar 2). Posting list merupakan suatu struktur data berupa senarai (linked list) yang menyimpan dokumen ID dimana suatu kata pada kamus tersebut muncul. Dokumen ID disini merupakan suatu penanda unik yang biasanya berupa angka. 3. { Dengan menggunakan log frequency weight maka jika suatu term muncul 1 kali maka nilai wt,d adalah 1. Jika muncul 2 kali maka wt,d menjadi 1,3; 10 kali nilainya menjadi 2 dan 1000 kali menjadi 4. Dari nilai tersebut dapat dilihat bahwa relevansi tidak bertambah secara proporsional sesuai dengan jumlah kemunculan suatu term t. Dengan menggunakan nilai log frequency weight ini maka nilai dari suatu pasangan dokumen dan query dihitung dengan rumus di bawah ini: Gambar 2. Dictionary dan Posting Pembentuk Inverted Index ∑ Jika kumpulan dokumen yang digunakan untuk membangun sistem temu kembali informasi ini berjumlah 1000 ISSN : 1979-5661 MODEL RUANG VEKTOR a. Term Frequency (tf) Term frequency (tft,d) dari suatu term (t) pada dokumen (d) didefinisikan sebagai jumlah kemunculan dari t pada d. Untuk dapat menggunakan nilai tft,d dalam proses pembuatan peringkat maka harus diperhatikan beberapa hal yaitu: suatu dokumen A dimana t muncul sebanyak 10 kali adalah lebih relevan terhadap query pengguna dibandingkan dokumen B dimana t muncul hanya sekali. Walaupun demikian tidak berarti bahwa dokumen A 10 kali lebih relevan dibandingkan dokumen B terhadap query tersebut. Dengan pertimbangan tersebut maka pada proses pemberian peringkat biasanya digunakan log frequency weight dari t pada d yang dihitung sebagai berikut: -38- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 c. Pembobotan Menggunakan tf-idf Nilai tf-idf dari suatu kata (term) pada dokumen d, merupakan hasil perkalian dari bobot tf dan bobot idf dari kata tersebut. b. Document Frequency dan Inverse Document Frequency (idf) Penggunaan log frequency weight untuk menentukan nilai dari suatu pasangan dokumen dan query memunculkan suatu permasalahan baru. Suatu term yang sering muncul dalam dokumen d memiliki nilai yang lebih besar dibandingkan dengan term lain. Namun untuk query yang mengandung kata yang jarang ditemui maka walaupun kata tersebut hanya muncul sekali dalam satu dokumen seharusnya memiliki nilai relevansi yang besar dibandingkan kata yang sering muncul tadi. Pemberian nilai yang lebih tinggi untuk suatu kata yang jarang ditemui dibandingkan kata yang sering muncul maka digunakan konsep document frequency. dft adalah document frequency dari t yaitu banyaknya dokumen yang mengandung t. Nilai dft tidak lebih besar dari N yang merupakan jumlah dokumen yang digunakan untuk membangun sistem temu kembali informasi. Inverse document frequency (idf) dari t dihitung menggunakan rumus: ( tf-idft,d Nilai (q,d) ∑ Dari rumus di atas dapat disimpulkan bahwa nilai suatu pasangan dokumen dan query merupakan penjumlahan dari tf-idf dari kata-kata yang muncul pada dokumen dan query. Misalnya query yang dimasukkan pengguna adalah “ilmu komputer” maka nilai suatu dokumen A terhadap query tersebut adalah penjumlahan dari tf-idfilmu dan tfidfkomputer, jika kata “ilmu” dan “komputer” muncul pada dokumen A. Jika pada dokumen B kata “komputer” tidak muncul maka nilai dokumen B terhadap query adalah tf-idf ilmu saja. Dengan demikian, untuk query “ilmu komputer” kemungkinan besar dokumen A memiliki peringkat yang lebih baik dibandingkan dokumen B. Penggunaan rumus tersebut dimaksudkan untuk dapat menekan efek dari dft. Sebagai contoh, jika jumlah dokumen (N) yang digunakan adalah 10.000 dokumen, dan satu kata yaitu “Calpurnia” muncul sebanyak 1 kali dalam 1 dokumen maka nilai idf-nya menjadi: 4. RANCANGAN SISTEM a. Flowchart Flowchart (diagram alir) dari sistem yang dikembangkan dapat dilihat pada Gambar 3. Proses dimulai ketika pengguna memasukkan query yang ingin dicari ke sistem. Query pengguna ini kemudian melalui proses tokenization untuk memecah masukan menjadi token. Token-token tersebut kemudian dihilangkan kata¬kata yang tidak penting yang terkandung di dalamnya (stop words removal). Sebelumnya kata-kata yang tidak penting tersebut harus disimpan terlebih dahulu pada basis data. Proses selanjutnya adalah pencarian kata dasar (stemming) dari masing-masing token. Proses stemming ini dibantu dengan dictionary yang berisikan kata-kata dasar dalam bahasa Indonesia. ) Jika kata “yang” muncul sebanyak 1.000 kali maka nilai idf-nya menjadi 1. Dengan menggunakan idf ini maka kata yang jarang muncul akan memiliki nilai relevansi yang lebih besar terhada query pengguna dibandingkan kata yang sering muncul. Kombinasi antara tf dan idf inilah yang akan digunakan untuk memberikan nilai terhadap suatu pasangan dokumen dan query. ISSN : 1979-5661 ) Jika kata yang terkandung dalam query adalah lebih dari satu kata maka nilai dari pasangan dokumen d dan query q adalah: )(Manning, 2009) ( ( -39- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Tb_index, berisi hasil dari proses preprocessing yang meliputi stopword removal dan stemming. Tb_term, berisi kumpulan kata yang terkandung dari masing-masing artikel. Tb_bobot dan tb_katakunci merupakan suatu media penyimpanan untuk menyimpan data bobot total dan relevansi terhadap query pada masingmasing artikel. Setelah query melalui proses penghilangan kata-kata tidak penting dan pencarian kata dasar maka selanjutnya bobot tf-idf untuk query tersebut dapat dihitung. Kemudian untuk semua dokumen yang terdapat pada sistem dihitung pula bobot tf-idf-nya terhadap query masukan pengguna. Disamping itu dihitung pula cosine similarity masing-masing dokumen terhadap query masukan yang nantinya digunakan sebagai dasar dalam pengurutan hasil pencarian. Proses berakhir ketika pengguna telah memberikan evaluasi terhadap hasil pencarian dan nilai MAP telah selesai dihitung. tb_index tb_dokumen PK PK id judul FK1 dok_id freq id_term FK2 tb_katadasar PK id id_ktdasar kata_dasar tb_no_stem PK id_kt tb_bobot Mulai kata PK id tb_katakunci FK1 id_dok lnc ltc anc PK Query Pengguna tb_term id PK FK1 kata dok_id id_term term tb_stopword_list PK id stopword Tokenization Query Daftar Stopwords Stopwords removal Dictionary Stemming Query Gambar 4. Basis Data c. Use Case Use case diagram digunakan untuk menggambarkan fungsionalitas yang diharapkan dari sebuah sistem. Adapun use case diagram dari sistem informasi ruang baca ini adalah seperti yang ditunjukkan pada Gambar 5. Hitung tf-idf kata pada query For i=1 to N (jumlah dokumen) Tampilkan hasil pencarian Hitung tf-idf kata pada dokumen Evaluasi hasil pencarian Sistem Ruang Baca Indeks dokumen dan nilai cosine similarity Hitung cosine similarity dokumen ke-i dengan query Hitung MAP Selesai Memasukkan Abstrak TA Memasukkan Kata kunci Gambar 3. Flowchart Sistem <include> Mencari Abstrak b. Basis Data Rancangan basis data yang digunakan dapat dilihat pada Gambar 4. Basis data yang dirancang terdiri atas 8 buah tabel sebagai berikut: Tb_dokumen berisi kumpulan abstrak yang merupakan objek penelitian. Tb_katadasar, berisi kumpulan kata dasar yang diunduh dari internet yang digunakan dalam proses stemming. Tb_no_stem, berisi kumpulan kata yang tidak perlu melalui proses stemming. Tb_stopword_list, berisi kumpulan kata yang umum yang sering digunakan tapi tidak mempengaruhi proses pencarian, seperti: di, oleh, ini, itu, dll. Dan data pada tb_stopword_list digunakan pada proses stopword removal. ISSN : 1979-5661 Login Gambar 5. Use Case Diagram Sistem Ruang Baca 5. HASIL a. Antarmuka Antarmuka (user interface) merupakan perantara antara sistem dengan pengguna sistem (user). Dalam sistem ruang baca ini antarmuka pengguna dirancang sedemikian rupa untuk kemudahan pengguna dalam penggunaan sistem ruang baca ini. Antarmuka dalam sistem ini seperti Gambar 6 dan Gambar 7. -40- Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 ( ) ( ) ( ) ( ) ( ) ( ) ( ) Penghitungan AP ini dilakukan untuk semua query (Q1 sampai dengan Q10). Hasil perhitungan nilai AP untuk masing-masing query dapat dilihat pada tabel 2. Tabel 2. Nilai Average Precision untuk Tiap Query Masukan Gambar 6. User Interface Halaman Muka Query Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 0,6 2 0,8 66 0,7 62 0,8 9 0,5 83 0,5 49 0,6 82 0,7 33 0,6 46 doc AP Dari tabel 2 di atas, nilai mean average precision (MAP) dapat dihitung sebagai berikut: Persentase MAP dapat dihitung berdasarkan nilai MAP yaitu : 0,7084 * 100% = 70,84% Gambar 7. User Interface b. Pengujian Relevansi Hasil Pencarian Tabel 1. Hasil Penilaian Relevansi Query Doku men 1 2 3 Q 1 Q 2 Q 3 Q 4 Query Q Q 5 6 R R R R R R R R R R R R R R R R R T R R R R R T R R R R T R T R R T R R T R R T R T R R R R R R R R R R T R Q 8 Q 9 Q 10 R R T R R R R R T R R R R R R R R R R R R TR R R R R T R R T R R R T R R R R R R R TR R R R T R T R T R R T R T R R T R R R R R 4 5 6 7 8 9 10 6. Q 7 R Dari hasil pengujian yang dilakukan didapatkan kesimpulan bahwa sistem temu kembali informasi yang diterapkan pada ruang baca Jurusan Ilmu Komputer Universitas Udayana memberikan tingkat relevansi yang tinggi yang ditunjukkan oleh nilai mean average precision sebesar 70,84%. R R 7. SARAN Sistem temu kembali informasi yang dikembangkan pada penelitian ini tidak memperhatikan urutan kata baik pada query masukan pengguna maupun kemunculannya pada dokumen. Pada penelitian selanjutnya dapat dikembangkan sistem temu kembali informasi yang memperhatikan urutan kata untuk dibandingkan tingkat relevansinya dengan sistem yang telah dikembangkan pada penelitian ini. Pengujian relevansi dilakukan menggunakan sepuluh (10) buah query masukan yang meliputi “basis data”, “algoritma”, “implementasi”, “analisis”, “teknologi”, “sistem”, “informasi”, “metode”, “proses” dan “perbandingan”. Relevansi dinilai terhadap sepuluh (10) buah dokumen hasil pencarian untuk masing-masing query masukan. Tabel 1 memperlihatkan hasil penilaian relevansi untuk masing-masing query masukan. Penghitungan average precision (AP) untuk Q1: ISSN : 1979-5661 SIMPULAN 8. DAFTAR PUSTAKA Agusta, L. 2009. Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia, Bali: Konferensi Nasional Sistem dan Informatika 2009. -41- Q1 0 0,7 53 Jurnal Ilmu Komputer - Volume 5 - No 2 – September 2012 Baeza-Yates, R., Ribeiro-Neto. 2011. Modern Information Retrieval: The Concepts and Technology Behind Search. 2nd Edition. Addison Wesley. Croft, B., Metzler, D., Strohman, T. 2008. Search Engines : Information Retrieval in Practice. France, Addison Wesley. Elmasri, R., Navathe, S. 2010. Fundamentals of Basis data Systems, 6th Edition, Pearson Education, Inc. Kendall, K. E., Kendall, J.E. 2010. 8th Systems Analysis and Design. Edition, Prentice Hall. ISSN : 1979-5661 Liu, Yan-Tie., Xu, J., Qin, T., Xiong, W., Li, H. 2007. LETOR: Benchmark Dataset for Research on Learning to Rank for Information Retrieval. SIGIR '07 The 30th Annual International SIGIR Conference, July 23-27, Amsterdam. Manning, C.D., Raghavan, P., and Schutze, H. 2009. An Introduction to Information Retrieval. Cambridge University Press. Pressman, R. S. 2009. Software Engineering: A Practitioner’s Approach. 7th Edition, McGraw-Hill. -42-