skripsi deteksi kemiripan source code pada bahasa

SKRIPSI
DETEKSI KEMIRIPAN SOURCE CODE
PADA BAHASA PEMROGRAMAN JAVA
MENGGUNAKAN METODE ANALISIS LEKSIKAL
Diajukan Untuk Memenuhi
Salah Satu Syarat Memperoleh Gelar Sarjana Teknik
HOLIS HERMANSYAH
E1E1 11 035
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS HALU OLEO
KENDARI
2016
i
ii
iii
iv
INTISARI
Holis Hermansyah, E1E1 11 035
DETEKSI
KEMIRIPAN
SOURCE
CODE
PADA
PEMROGRAMAN JAVA MENGGUNAKAN METODE
LEKSIKAL
BAHASA
ANALISIS
Skripsi, Fakultas Teknik, 2016
(xii+53+lampiran)
Kata kunci : Source Code, Analisis leksikal,Java,Token,Plagiarism
Laboratorium Pemrograman Jurusan Teknik Infomatika Fakultas Teknik
Universitas Halu Oleo sebagai tempat pembelajaran bagi para mahasiswa
informatika yang mengikuti kelas pemrograman selalu memberikan praktikum
sebagai salah satu media pengukur tingkat pemahaman mahasiswa dalam hal
membuat program. Banyaknya source code yang harus diperiksa oleh Dosen atau
Assisten Laboratorium mengakibatkan sulitnya melakukan pemeriksaan serta
sulitnya mengukur kredibilitas masing-masing tugas milik mahasiswa
Metode deteksi kemiripan kode menggunakan Analisis Leksikal dapat
digunakan untuk merubah kode menjadi token unik. Token ini digunakan untuk
mengidentifikasi struktur program yang diperiksa. Sebelum proses pencocokan
token menggunakan array, terlebih dahulu token yang terbentuk dari kedua source
code yang diperiksa di sorting atau diurutkan berdasarkan abjad. Setelah itu
dilakukan proses pencocokan string menggunakan array per posisi array.
Semakin besar kemiripan alur dan kode program maka semakin besar
kemungkinan kode tersebut merupakan plagiat.
Nilai presentase kemiripan kode program yang dihasilkan dari proses
pencocokan token ini yang nantinya digunakan sebagai acuan penentuan
plagiarisme dengan ketentuan jika nilai presentase lebih besar atau sama dengan
70 % maka source dianggap plagiat, namun jika lebih kecil dari 70% tidak
dianggap sebagai plagiat.
v
ABSTRACT
Holis Hermansyah, E1E1 11 035
Source Code Similarity Detection in Java Programming Language Using
Lexical Analysis Method
Mini Thesis, Faculty of Engineering, 2016
(xii+53+attachments)
Keyword : Source Code, Lexical Analysis, Java, Token, Plagiarism
Programming Laboratory of Informatics Engineering Department of
Engineering Faculty, Halu Oleo University is a learning place for college
students majoring in informatics to follow programming class that become one of
the standard to determine the student’s level of understanding in creating a
program.
Similarity detection method using Lexical analysis can be used to convert
the programming code into an unique token. This token later used to identify the
structure of a program that is being examined. After that, the token that already
formed from two different source codes will be sorted alphabetically before
entering the string matching process by using arrays. The string matching process
will do the matching based on the position of each array. The more the
similarities of the structure and the program codes, the more likely the code
represented as plagiarism.
The percentage value resulting from the token matching process later will
be used as reference to determine the percentage of plagiarism in the program. If
the similarities percentage greater than 70%, the examined source codes can be
considered as plagiarism, but if it less than 70% the examined source codes will
be not considered as plagiarism.
vi
KATA PENGANTAR
Assalamualaikum Wr. Wb.
Segala puji dan syukur penulis panjatkan kehadirat Allah SWT, karena
atas rahmat dan ridho-Nya penulisan skripsi yang berjudul “Deteksi Kemiripan
Source Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis
Leksikal” ini dapat disusun dan diselesaikan sebagai syarat menyelesaikan studi di
Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo Kendari.
Pada kesempatan ini dengan segala kerendahan hati penulis haturkan
sebuah ucapan terima kasih yang sebesar-besarnya kepada :
1.
Allah SWT yang telah menciptakan dan menuntun penulis hingga dapat
menyelesaikan skripsi ini.
2.
Ayahanda Jamidin, ibunda Saliyah, saudaraku Nuryoni, S.Pi, Sunarty, S.Ip, dan
Nurmiftahuddin, S.Hut atas doa dan dukungan moral yang diberikan kepada penulis.
3.
Bapak Bambang Pramono, S.Si.,MT dan Bapak Subardin, ST., MT sebagai dosen
pembimbing skripsi yang banyak memberikan masukan dan saran serta ketersediaan
untuk meluangkan waktunya dengan penulis untuk memberikan arahan – arahan
yang sangat berguna.
4.
Andi Iswahyuningsih, ST , Na’firul Hasna Ariyani dan Hasrul Dimas Asgari yang
turut membantu penulis dalam menyelsaikan tugas akhir ini.
5.
Kawan-kawan di jurusan Teknik Informatika, khususnya angkatan 2011 dan kawankawan di Fakultas Teknik pada umumnya yang memberikan saran dan semangatnya
selama proses penyelesaian skripsi ini.
Dengan keterbatasan pengalaman, pengetahuan maupun pustaka yang ditinjau,
penulis menyadari bahwa tugas akhir ini masih banyak kekurangan dan perlu
pengembangan lebih lanjut agar benar-benar bermanfaat. Oleh sebab itu, penulis sangat
mengharapkan kritik dan saran agar
tugas akhir ini lebih sempurna serta sebagai
masukan bagi penulis untuk penelitian dan penulisan karya ilmiah di masa yang akan
datang.
vii
Akhir kata, penulis berharap tugas akhir ini memberikan manfaat bagi kita
semua.
Kendari,
April 2016
Penulis
viii
DAFTAR ISI
HALAMAN JUDUL ...................................................................................... i
HALAMAN PENGESAHAN ........................................................................ ii
HALAMAN PERNYATAAN ....................................................................... iv
INTI SARI ...................................................................................................... v
ABSTRACT ................................................................................................... vi
KATA PENGANTAR ................................................................................... vii
DAFTAR ISI .................................................................................................. ix
DAFTAR TABEL ........................................................................................... xi
DAFTAR GAMBAR ..................................................................................... xii
BAB I PENDAHULUAN .............................................................................. 1
1.1 Latar Belakang ................................................................................. 1
1.2 Rumusan Masalah ............................................................................ 2
1.3 Batasan Masalah .............................................................................. 2
1.4 Tujuan Penelitian ............................................................................. 2
1.5 Manfaat Penelitian ........................................................................... 3
1.6 Sistematika Penulisan ...................................................................... 3
1.7 Tinjauan Pustaka .............................................................................. 4
BAB II LANDASAN TEORI ......................................................................... 6
2.1 Plagiarisme ....................................................................................... 6
2.1.1 Pengertian Plagiarisme............................................................. 6
2.1.2 Jenis-Jenis Plagiarisme ............................................................ 6
2.2 Source Code ...................................................................................... 8
2.3 Analisis Leksikal ............................................................................... 8
2.3.1 Tipe-Tipe Token ...................................................................... 9
2.3.2 Tahap Analisis Leksikal ........................................................... 11
2.3.3 Implementasi Analisis Leksikal ............................................... 12
2.4 Pemrograman Java ............................................................................ 12
2.5 Netbeans ............................................................................................ 13
2.6 Perancangan Sistem .......................................................................... 14
2.6.1 Pengertian UML (Unified Modeling Language) .................... 14
2.6.2 Bangun Dasar Metodologi UML ............................................ 15
2.6.3 Tujuan Penggunaan UML…………………………………...19
2.7 Flow Chart......................................................................................... 19
BAB III METODOLOGI PENELITIAN........................................................ 21
3.1 Waktu dan Tempat Penelitian .......................................................... 21
3.1.1 Waktu Penelitian ..................................................................... 21
3.1.2 Tempat Penelitian ................................................................... 21
3.2 Metode Pengumpulan Data ............................................................... 21
3.3 Metode Pengembangan Sistem ......................................................... 22
BAB IV ANALISIS DAN PERANCANGAN SISTEM ................................ 24
4.1. Analisis Sistem ................................................................................... 24
ix
4.1.1 Sistem Yang Sedang Berjalan ............................................... 24
4.1.2 Sistem Yang Diusulkan......................................................... 24
4.2 Perancangan Sistem .......................................................................... 25
4.2.1 Diagram Usecase .................................................................... 25
4.2.2 Diagram Activity ..................................................................... 25
4.2.3 Diagram Squence .................................................................... 27
4.3 Analisis Kebutuhan Sistem ............................................................... 28
4.3.1 Kebutuhan Data Masukan ....................................................... 28
4.3.2 Kebutuhan Data Keluaran ....................................................... 28
4.4 Flowchart .......................................................................................... 29
4.5 Perancangan Antar Muka (Interface)................................................ 30
4.6. Ilustrasi Metode Analisis Leksikal Terhadap Perencanaan Aplikasi 30
4.6.1 Analisis Leksikal ..................................................................... 30
4.6.2 Sorting ..................................................................................... 35
4.6.3 Perhitungan Nilai Kemiripan .................................................. 38
BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM .............................. 44
5.1. Implementasi Sistem .......................................................................... 44
5.1.1 Interface Aplikasi.................................................................... 44
5.2. Pengujian Sistem ............................................................................... 46
5.2.1 Pengujian Fungsionalitas Aplikasi .......................................... 46
5.2.2 Hasil Analisa ........................................................................... 50
BAB VI PENUTUP ........................................................................................ 53
6.1. Kesimpulan ....................................................................................... 53
6.2. Saran .................................................................................................. 53
DAFTAR PUSTAKA
LAMPIRAN
x
DAFTAR TABEL
Tabel 2.1 Tipe-Tipe Token .............................................................................. 9
Tabel 2.2 Simbol Use Case Diagram .............................................................. 17
Tabel 2.3 Simbol Squence Diagram ................................................................ 18
Tabel 2.4 Simbol Activity Diagram ................................................................ 18
Tabel 2.5 Simbol Flow Chart .......................................................................... 20
Tabel 3.1 Waktu Penelitian ............................................................................. 21
Tabel 4.1 Hasil Analisis Leksikal Source Asli ................................................ 32
Tabel 4.2 Hasil Analisis Leksikal Source Pembanding................................... 34
Tabel 4.3 Hasil Sorting Source Asli ................................................................ 35
Tabel 4.4 Hasil Sorting Source Pembanding ................................................... 36
Tabel 5.1 Daftar Nama Class Source Asli ....................................................... 51
Tabel 5.2 Daftar Nama Class Source Pembanding ......................................... 51
Tabel 5.3 Hasil Analisa Pengujian Sistem ...................................................... 52
xi
DAFTAR GAMBAR
Gambar 2.1 Flowchart Tahap Analisis Leksikal .......................................... 11
Gambar 4.1 Diagram Usecase ...................................................................... 25
Gambar 4.2 Diagram Activity Menu Scanning ............................................ 26
Gambar 4.3 Diagram Activity Menu Open File ........................................... 26
Gambar 4.4 Diagram Activity Menu Help ................................................... 27
Gambar 4.5 Diagram Squence submenu Scanning ...................................... 28
Gambar 4.6 Flowchart program ................................................................... 29
Gambar 4.7 Desain Interface Aplikasi ......................................................... 30
Gambar 4.8 Source Asli ............................................................................... 31
Gambar 4.9 Source Pembanding .................................................................. 33
Gambar 5.1 Tampilan Progress Bar ............................................................. 44
Gambar 5.2 Tampilan Utama ....................................................................... 45
Gambar 5.3 Tampilan Dialog Open Source ................................................. 47
Gambar 5.4 Tampilan Source Code Yang Telah Di Input ........................... 47
Gambar 5.5 Tampilan Hasil Scanning Kemiripan........................................ 48
Gambar 5.6 Menampilkan Hasil Analisis..................................................... 48
Gambar 5.7 Menampilkan Token Yang Sama ............................................. 49
Gambar 5.8 Menampilkan Token Yang Tidak Sama ................................... 49
Gambar 5.9 Tampilan Help .......................................................................... 50
Gambar 5.10 Tampilan About ........................................................................ 50
xii
BAB I
PENDAHULUAN
1.1.
Latar Belakang
Laboratorium Rekayasa Perangkat Lunak Jurusan Teknik Infomatika
Fakultas Teknik Universitas Halu Oleo sebagai tempat pembelajaran bagi para
mahasiswa informatika yang mengikuti kelas pemrograman selalu memberikan
praktikum sebagai salah satu media pengukur tingkat pemahaman mahasiswa
dalam hal membuat program. Pemrograman adalah proses menulis, menguji dan
memperbaiki, dan memelihara kode yang membangun sebuah program komputer.
Kode ini ditulis dalam berbagai bahasa pemrograman.
Bahasa pemrograman merupakan alat yang sangat penting bagi
programmer untuk mengimplementasikan algoritma. Tiap bahasa pemrograman
memiliki kelebihan dan kekurangan tersendiri, dan programmer memiliki
referensi tersendiri dalam memilih suatu bahasa pemrograman. Beberapa faktor
penting seseorang dalam memilih bahasa pemrograman adalah syntax, editor,
dokumentasi, performa, library, fleksibilitas, komunitas dan popularitas.
Banyaknya source code yang harus diperiksa oleh Dosen atau Assisten
laboratorium mengakibatkan sulitnya melakukan pemeriksaan serta sulitnya
mengukur kredibilitas masing-masing tugas milik mahasiswa. Kode program
terperiksa yang memiliki tingkat similarity (kemiripan) yang cukup tinggi antar
kode dapat dijadikan acuan adanya tindakan-tindakan kecurangan seperti
melakukan tindakan plagiat kode terhadap tugas mahasiswa lain.
Metode deteksi kemiripan kode menggunakan analisis leksikal dapat
digunakan untuk merubah kode menjadi node ataupun token unik masing-masing
kode terperiksa. Semakin besar kemiripan maka semakin besar kemungkinan kode
tersebut merupakan hasil plagiat. Pada judul yang diajukan, sistem akan
melakukan analisis leksikal pada program yang diperiksa dalam hal ini bahasa
pemrograman Java. Analisis ini meliputi pengubahan source code kedalam
1
2
bentuk token-token yang memiliki nama atau id yang unik, penghapusan
komentar,serta penghapusan white space. Kemudian dilakukan pencocokan
source code yang telah menjadi token yang memiliki kesamaan pada program
pembanding berdasarkan struktur yang terbentuk. Jika ditemukan id token dan
token yang sama pada posisi yang sama maka program akan mencatatnya dan
kemudian menghitung tingkaat kemiripan source code tersebut dan memberikan
nilai presentase (similarity).
1.2
Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah sebagai berikut:
1.
Bagaimana membangun aplikasi deteksi kemiripan Source code pada
bahasa pemrograman java menggunakan metode analisis leksikal.
2.
Bagaimana akurasi aplikasi deteksi kemiripan source code tersebut dapat
mendeteksi kemiripan dua source code.
1.3
Batasan Masalah
Batasan masalah dalam penelitian ini adalah sebagai berikut:
1.
Source code yang diperiksa dalam aplikasi ini adalah source code java.
2.
File pembanding yang diperiksa adalah dokumen dalam bentuk class file
java bukan dalam bentuk project.
3.
Source code yang diperiksa merupakan source code pemrograman dasar
yang sekurang-kurangnya memiliki algoritma.
1.4
Tujuan Penelitian
Tujuan dalam penelitian ini adalah sebagai berikut:
1.
Membangun sistem aplikasi deteksi kemiripan source code pada bahasa
pemrograman java menggunakan metode analisis leksikal.
2.
Mengetahui akurasi kemiripan (similarty) antara satu file dengan file
lainnya.
3
1.5.
Manfaat Penelitian
Manfaat penelitian dalam penelitan ini adalah :
1.
Dapat membantu instansi pendidikan dalam mendeteksi hasil praktikum
dan tugas yang diberikan.
2.
Mengetahui tingkat kemiripan (similarity) source code antara file yang
satu dengan yang lain.
3.
Dengan mengetahui persentase kemiripan source code, sehingga dapat
digunakan sebagai bahan pertimbangan untuk mendeteksi adanya tindakan
plagiat.
4.
1.6.
Mempercepat proses pengoreksian dengan cepat dan efektif.
Sistematika Penulisan
Sistematika dalam skripsi ini terdiri dari beberapa bagian utama yaitu
sebagai berikut:
BAB I Pendahuluan
Merupakan bab pendahuluan yang menguraikan latar belakang masalah,
rumusan masalah, tujuan penelitian, manfaat penelitian, batasan masalah dan
sistematika penulisan.
BAB II Landasan Teori
Membahas mengenai dasar-dasar teori pendukung yang digunakan dalam
penelitian ini seperti plagiat, bahasa pemrograman java, metode leksikal, source
code.
BAB III Metodologi Penelitian
Membahas mengenai waktu dan tempat penelitian, metode pengumpulan
data, metode pengembangan sistem yang digunakan dalam penelitian tugas akhir
ini.
BAB IV Analisis dan Perancangan Sistem
Pada bagian ini diuraikan analisis sistem yang akan dibuat dan kebutuhan
sistem yang meliputi kebutuhan fungsional, kebutuhan non fungsional sistem.
4
Rancangan sistem meliputi rancangan arsitektur sistem, rancangan proses,
rancangan prosedural, rancangan data, dan rancangan user interface.
BAB V Implementasi dan Pengujian Sistem
Menguraikan tentang implementasi dan pengujian dari perangkat lunak
yang dibangun berdasarkan hasil analisis dan perancangan (desain) pada bab
sebelumnya.
BAB VI Penutup
Menguraikan kesimpulan penelitian dan saran-saran sebagai bahan
pertimbangan untuk pengembangan penelitian.
1.7.
Tinjauan Pustaka
Penelitian ini didasarkan pada penelitian sebelumnya yang dilakukan oleh
Budhy (2014) yang berjudul “Deteksi Similarity Source Code Menggunakan
Metode Deteksi Abstract Syntax Tree” dalam penelitian tersebut cara mendeteksi
kemiripan code menggunakan Abstract Syntax Tree dapat digunakan untuk
merubah code menjadi node ataupun token unik masing-masing code terperiksa.
Semakin besar kemiripan maka semakin besar kemungkinan code tersebut
merupakan hasil plagiat.
Salah satu penelitian yang mendasari penelitian ini adalah penelitian yang
dilakukn oleh Aulia, (2013) “Pemanfaatan Algoritma Rabin-Karp untuk
Mengetahui Tingkat Kemiripan dari Source Code pada pemrograman lisp” dalam
penelian tersebut membangun sistem deteksi plagiarism kode sumber lisp dengan
tahapan pencocokan yang diawali dengan menghilangkan spasi pada string,
membagi string ke substring substring, menghitung hash tiap substring
menggunakan teknik rolling hash kemudian menghitung persentase kemiripan
antar dokumen menggunakan Dice Similarity Coeficient.
Redya Febriyanto dkk. (2006) dalam penelitiannya yang berjudul
“Penerapan Algoritma Boyer-Moore Untuk Pengecekan Plagiatisme Source
Code” dalam penelitian tersebut proses pendeteksian plagiatisme menggunakan
penghitungan jumlah prosedur/fungsi, loop, if dan variable dengan pembobotan
5
sederhana. Aplikasi melakukan scanning keyword-keyword tertentu menggunakan
Boyer-Moore untuk menentukan bagian dari source yang memenuhi kondisi
tertentu. Setelah seluruh prosedur/fungsi selesai diperiksa maka langkah terakhir
membandingkan elemen array dari source code yang dicurigai melakukan
plagiatisme terhadap source yang asli. Jika didapati ada prosedur/fungsi yang
sama maka akan dicatat sebagai satu kesamaan kemudian dilakukan perhitungan
presentase kemiripan.
Dari beberapa penelitian tersebut yang mendasari penulis untuk
melakukan penelitian yang berjudul “Deteksi Kemiripan Source Code Pada
Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal”. Yang
membedakan dengan penelitian sebelumnya yaitu, pada penelitian ini tidak hanya
mendeteksi source-nya saja melainkan juga dengan mendeteksi dari alur atau
struktur source code yang diperiksa. Sebagai contoh pada program perulangan,
walaupun isi source mempunyai banyak kesamaan namun secara logika source
berbeda, misalkan source satu menggunakan perulangan for sedangkan yang
source kedua menggunakan while, maka source tersebut tidak bias dianggap
sebagai plagiat, begitu juga sebaliknya.
BAB II
LANDASAN TEORI
2.1.
Plagiarisme
2.2.1. Pengertian Plagiarisme
Plagiarisme merupakan tindakan kriminal yang sering terjadi dalam dunia
akademis. Plagiarisme itu sendiri berasal dari kata latin “Plagiarus” yang berarti
penculik dan “Plagiare” yang berarti mencuri. Jadi, secara sederhana plagiat
berarti mengambil ide, kata-kata, dan kalimat seseorang dan memposisikannya
sebagai hasil karyanya sendiri atau mengunakan ide, kata-kata, dan kalimat tanpa
mencantumkan sumber dimana seorang penulis mengutipnya (Sastroasmoro,
2007).
Dalam Kamus Besar Bahasa Indonesia (2008) disebutkan: "Plagiat adalah
pengambilan karangan (pendapat dan sebagainya) orang lain dan menjadikannya
seolah-olah karangan (pendapat) sendiri". Plagiat dapat di anggap sebagai tindak
kriminal karena mencuri hak cipta orang lain. Di dalam dunia akademis, pelaku
plagiarisme akan mendapat hukuman yang berat. Pelaku plagiat disebut
plagiator.
2.2.2. Jenis-Jenis Plagiarisme
Terdapat jenis jenis plagiarism, menurut Sudigdo Sastroasmoro dalam
makalahnya berjudul Beberapa Catatan tentang Plagiarisme pada tahun 2007,
mengklasifikasikan plagiarisme dalam empat jenis. Jenis plagiarisme berdasarkan
klasifikasinya diantaranya:
a. Jenis plagiarisme berdasarkan aspek yang dicuri
Dalam klasifikasi ini terdiri atas 4 kategori yaitu kategori plagiarisme ide,
plagiarisme isi, plagiarisme kata, kalimat, paragraf, dan plagiarisme total.
Plagiarisme ide sering dikaitkan dengan penelitian replikatif. Penelitian reflikatif
adalah penelitian yang berdasarkan atas ide orang lain. Apabila dalam melakukan
penelitian, analisis yang digunakan sama dengan penelitian sebelumnya sama,
6
7
maka harus mencantumkan sumber dan alasan ilmiah mengapa penelitian ulang
tersebut perlu dilakukan.
b. Klasifikasi berdasarkan sengaja atau tidaknya plagiarisme
Plagiarisme sengaja adalah mencuri atau dengan sengaja menjiplak hasill karya
orang lain dengan kepentingannya sendiri. Hal ini dapat terjadi bila seseorang
menjiplak ide, kata, frasa, kalimat atau pragraf tanpa mencantumkan sumbernya
dan dilakukan dengan sadar untuk kepentingan sendiri.
Plagiarisme tidak disengaja adalah plagiarisme yang terjadi karena ketidaktahuan.
Ketidaktahuan ini biasa terjadi dalam menggunakan dokumentasi, teknik
mengutip karya tulis, dan parafrase kalimat yang keliru. Meskipun plagirisme
tidak disengaja namun sanksi yang dikenakan sama seperti plagiarisme yang
disengaja. Hal
tersebut
dapat
dicegah dengan menunjukan bagaimana
menghindari plagiarisme.
c.
Klasifikasi berdasarkan proporsi atau persentase kata, kalimat, paragraf yang
dibajak
1.
Plagiarisme ringan, plagiarisme yang jumlah poporsi atau persentase kata,
kalimat, paragraf yang dibajak tidak melebihi 30 persen (< 30%).
2.
Plagiarisme sedang, plagiarisme yang jumlah poporsi atau persentase kata,
kalimat, paragraf yang dibajak antara 30-70 persen.
3.
Plagiarisme berat, plagiarisme yang jumlah poporsi atau persentase kata,
kalimat, paragraf yang dibajak lebih dari 70 persen (>70%).
d. Berdasarkan pada pola plagiarisme
Berdasarkan pada pola plagiarisme dibedakan menjadi dua yaitu plagiarisme kata
demi kata (word for word plagiarizing) dan plagiarisme mosaik. Plagiarisme kata
demi kata (word for word plagiarizing) adalah pola plagiarisme dengan
melakukan penjiplakan sebagian kecil kalimat, dapat juga satu paragraf, atau
seluruh isi meskipun di tulis dengan bahasa lain. Sedangkan plagiarisme mosaik
adalah penyajian tidak dilakukan kata demi kata, tapi menyipkan kata atau frase
dari beberapa karya orang lain tanpa menuliskan sumbernya sehingga memberi
kesan kalimat tersebut adalah asli penulis.
8
2.2.
Source Code
Dalam bahasa pemrograman, kita mengenal adanya Source Code, Dalam
ilmu komputer, source code (atau disebut juga source) adalah kumpulan
pernyataan atau deklarasi bahasa pemrogramman komputer yang ditulis dan dapat
di baca manusia. Source Code memungkinkan programmer untuk berkomunikasi
dengan komputer menggunakan beberapa perintah yang telah terdefinisi.
Source code merupakan sebuah program yang biasanya dibuat dalam satu
atau lebih file teks, kadang-kadang disimpan dalam database yang disimpan
sebagai prosedur dan dapat juga muncul sebagai potongan kode yang tercetak di
buku atau media lainnya. Banyaknya koleksi file source code dapat diatur dalam
direktori pohon, dalam hal ini mungkin juga dikenal sebagai source tree.
Executable Binary atau yang lebih dikenal dengan Executable-code adalah
kode yang bisa dieksekusi oleh komputer sedangkan source code tidak dapat
dieksekusi oleh komputer. Sedangkan intermediate-code (kode antara) merupakan
bentuk yang terletak diantara source-code dan executable-code (Arifin, 2011).
2.3.
Analisis Leksikal
Menurut Henryw (2014) analisis leksikal merupakan fungsi analisis dalam
compiler yang bertugas mendekomposisi program sumber menjadi bagian-bagian
kecil (token). Analisis leksikal atau scanner bertugas mengidentifikasi semua
besaran pembangun bahasa (leksikal) yang ada pada source code. Scanner
menerima masukan source code berupa serangkaian karakter kemudian memilahmilahnya menjadi bagian-bagian kecil yang mempunyai satu arti yang disebut
token, seperti : konstanta, nama variabel, keyword, operator. Token-token ini akan
menjadi masukan bagi analisis selanjutnya yaitu analisis sintaksis. Dari
fungsi scanner secara umum seperti telah disebutkan di atas, maka tugas
scanner secara rinci adalah:
1. Membaca serangkaian karakter dari source code.
2. Mengenalinya ke dalam satuan leksikal.
3. Mengubahnya menjadi token dan menentukan jenis tokennya.
4. Mengirimkan token ke proses analisis selanjutnya, yaitu analisis sintaksis.
9
5.
Mengabaikan karakter white space (spasi, enter, ganti baris, penanda akhir
file) dan komentar (remark) apabila ada di dalam source code.
6. Menangani error.
7. Menangani tabel simbol
Scanner bekerja berdasarkan prinsip mesin Finite State Automata (FSA).
Diagram keadaan dapat digunakan untuk membantu mengkonstruksi scanner.
Besaran pembangun bahasa (leksikal) meliputi:
1. Identifier
Identifier atau pengenal dapat berupa:
a.
Kata tercadang atau kata kunci (reserve word) yang telah didefinisikan oleh
bahasa pemrograman.
b.
Kata yang dideklarasikan sendiri oleh pemakai (si pembuat program) disebut
dengan variabel.
2.
Nilai konstanta
Nilai konstanta disini dapat berupa: integer, real, boolean, character, String, dan
sebagainya.
3. Operator dan Delimineter
a.
Operator aritmatika ( +, -, *, /
b.
Operator logika (<, =, >, <=, >=, !=, <>)
c.
Delimiter berguna sebagai pemisah atau pembatas, contoh:
d.
Karakter sebagai berikut ( ) { } ; . , :
e.
Karakter white space.
2.3.1. Tipe-Tipe Token
Berikut ini contoh tipe-tipe token yang digunakan pada saat proses analisis
leksikal pada bahasa java :
Tabel 2.1 Tipe-Tipe Token
No Token
1
Tipe Token
ID Token
Keyword
KW
class,abstract, assert, break, const,
boolean, byte, case, catch, char,
continue, default, do, double, else,
10
enum, extends, final, finally, float,
for, goto, if, implements, import,
instance of, int, interface, long,
native,
new,
protected,
package,
public,
return,
private,
short,
static, super, switch, synchronized,
String, strictfp, this, throw, throws,
transient, try, void, volatile, false,
true, null, while
2
Variabel
Identifier
ID
3
;
Semicolon
SM
4
+
Plus Operator
PO
5
-
Minus Operator
MO
6
*
Multiplication Operator TO
7
,
Comma
FA
8
(
Left parenthesis
LP
9
)
Right Parenthesis
RP
10
{
Left Brace
LB
11
}
Right Brace
RB
12
[
Left Square
LS
13
]
Right Square
RS
14
<
Less Than
LT
15
>
Greater Than
GT
16
.
Dot
DT
17
%
Modulus
MD
18
1,2,3,4,5,6,7,8,9,0
Numeric
NM
19
==
Equals
EQ
20
=
Equals Operator
AO
21
!=
Not Equals
NE
22
& atau &&
Logical AND
LA
11
23
| atau ||
Logical OR
LO
24
A-Z / a-z
String
ST
25
/
Division Operator
DO
2.3.2. Tahap Analisis Leksikal
Pada tahap analisa terjadi interaksi antara scanner dan parser. Scanner
dipanggil saat parser memerlukan token berikutnya. Pendekatan ini lebih baik
karena bentuk internal program sumber yang lengkap tidak perlu dibangun dan
disimpan di memori sebelum parsing dimulai (Henryw, 2014).
Gambar 2.1 Flowchart Tahap Analisis Leksikal
12
2.3.3. Implementasi Analisis Leksikal
Berikut ini contoh analisis leksikal (scanner) pada potongan program
menggunakan bahasa java :
public void main(String[]args){
for(int j=0;j<=5;j++){
System.out.println("Helo world..");
}
}
Setelah listing program tersebut diproses menggunakan analisis leksikal maka
akan menjadi seperti berikut :
KW
KW
ID
LP
KW
public
void
main
(
String
AO
NM
SM
ID
LT
=
0
;
j
<
DT
ID
DT
ID
LP
.
out
.
println
(
LS
[
AO
=
ST
"Helo world.."
RS
ID
RP
LB
KW
LP
KW
ID
]
args
)
{
for
(
int
j
NM
SM
ID
PO
PO
RP
LB
ID
5
;
j
+
+
)
{
System
RP
SM
RB
RB
)
;
}
}
2.4.
Pemrograman Java
Java adalah sebuah bahasa pemrograman yang dikembangkan sebagai komponen
utama platform Java oleh Sun MicroSystems dan diluncurkan pada tahun 1995.
Bahasa ini banyak mengadopsi sintaksis yang terdapat pada C dan C++ namun
dengan sintaksis model objek yang lebih sederhana serta dukungan rutin-rutin aras
bawah
yang
minimal.
Aplikasi-aplikasi
berbasis
java
umumnya
13
dikompilasi ke dalam p-code (bytecode) dan dapat dijalankan pada berbagai Java
Virtual Machine (JVM). Java merupakan bahasa pemrograman yang bersifat
umum/non-spesifik (general purpose), dan secara khusus didisain untuk
memanfaatkan
dependensi
implementasi
seminimal
mungkin.
Karena
fungsionalitasnya yang memungkinkan aplikasi java mampu berjalan di beberapa
platform sistem operasi yang berbeda, java dikenal pula dengan slogannya, "Tulis
sekali, jalankan di mana pun". Saat ini java merupakan bahasa pemrograman yang
paling populer digunakan, dan secara luas dimanfaatkan dalam pengembangan
berbagai jenis perangkat lunak aplikasi ataupun aplikasi berbasis web.
Versi awal Java ditahun 1996 sudah merupakan versi release sehingga
dinamakan Java Versi 1.0. Java versi ini menyertakan banyak paket standar awal
yang terus dikembangkan pada versi selanjutnya:
1. java.lang: Peruntukan kelas elemen-elemen dasar.
2.
java.io: Peruntukan kelas input dan output, termasuk penggunaan berkas.
3. java.util: Peruntukan kelas pelengkap seperti kelas struktur data dan
kelaskelas penanggalan.
4. java.net: Peruntukan kelas TCP/IP, yang memungkinkan berkomunikasi
dengan komputer lain menggunakan jaringan TCP/IP.
5. java.awt: Kelas dasar untuk aplikasi antarmuka dengan pengguna (GUI)
6. java.applet: Kelas dasar aplikasi antar muka untuk diterapkan pada penjelajah
2.5.
Netbeans
Netbeans adalah salah satu aplikasi IDE yang digunakan programmer
untuk menulis, mengompile, mencari kesalahan, dan menyebarkan program.
Netbeans ditulis dalam bahasa java namun dapat juga mendukung Bahasa
pemrogramman lain (Miftahul, 2010).
1. Smart code completion: mengusulkan nama variabel dari suatu tipe,melengkapi
keyword, dan mengusulkan tipe parameter dari method
2. Menggunakan code generator: dengan menggunakan fitur ini kita dapatmenggenerate constructor, setter and getter method, dll.
3. Error stripe: fitur yang menandai baris yang error dengan menghiglight merah.
14
4. Bookmarking: fitur yang digunakan untuk menandai baris yang suatu saat
hendak kita modifikasi.
5. Go to commands: fitur yang digunakan untuk jump ke deklarasi
variable,Source Code atau file yang ada pada project yang sama.
Database yang didukung Netbeans
a. JDBC merupakan spesifikasi standar dari javasoft API yang memungkinkan
program java untuk mengakses sistem database manajemen.
b. JDBC API terdiri dari satu set interface dan kelas yang ditulis dengan bahasa
pemrogramman java.
c. OJDBC (oracle java database conectivity) adalah driver yangmenghubungkan
program java dan oracle.
d. mysql-connector-java adalah driver yang menghubungkan program java dan
mysql
e. JDBC-ODBC
f. mySQL-server
2.6.
Perancangan Sistem
2.6.1. Pengertian UML (Unified Modeling Language)
UML (Unified Modeling Language) adalah ‘bahasa’ pemodelan untuk
sistem atau perangkat lunak yang berparadigma ‘berorientasi objek”. Pemodelan
(modeling) sesungguhnya digunakan untuk penyederhanaan permasalahanpermasalahan yang kompleks sedemikian rupa sehingga lebih mudah dipelajari
dan dipahami( Rosa & Shalahuddin, 2013)
Unified Modeling Language adalah metodologi kolaborasi antara metodemetode Booch, OMT (Object Modeling Technique), serta OOSE (ObjectOriented
Software Enggineering) dan beberapa metoda lainnya, merupakan metodologi
yang paling sering digunakan saat ini untuk analisa dan perancangan sistem
dengan metodologi berorientasi objek mengadaptasi maraknya penggunaan
bahasa pemrograman berorientasi objek (OOP).
Berdasarkan pendapat yang dikemukakan sebelumnya, dapat ditarik
kesimpulan bahwa Unified Modelling Language(UML) adalah sebuah bahasa
15
yang berdasarkan grafik atau gambar untuk menvisualisasikan, menspesifikasikan,
membangun dan pendokumentasian dari sebuah sistem pengembangan perangkat
lunak berbasis Objek (Object Oriented programming).
2.6.2. Bangunan Dasar Metodologi Unified Modeling Language (UML)
Bangunan dasar metodologi Unified Modeling Language (UML)
menggunakan tiga bangunan dasar untuk mendeskripsikan sistem/perangkat lunak
yang akan dikembangkan yaitu:
1. Sesuatu (things)
Ada 4 things dalam Unified Modeling Language (UML), yaitu:
a. Structural things
Merupakan bagian yang relatif statis dalam model Unified Modeling Language
(UML). Bagian yang relatif statis dapat berupa elemen-elemen yang bersifat fisik
maupun konseptual.
b. Behavioral things
Merupakan bagian yang dinamis pada model Unified Modeling Language (UML),
biasanya merupakan kata kerja dari model Unified Modeling Language (UML),
yang mencerminkan perilaku sepanjang ruang dan waktu.
c. Grouping things
Merupakan bagian pengorganisasi dalam Unified Modeling Language (UML).
Dalam penggambaran model yang rumit kadang diperlukan penggambaran paket
yang menyederhanakan model. Paket-paket ini kemudian dapat didekomposisi
lebih lanjut. Paket berguna bagi pengelompokkan sesuatu, misalnya model-model
dan subsistem.
d. Annotational things
Merupakan bagian yang memperjelas model Unified Modeling Language (UML)
dan dapat berupa komentar-komentar yang menjelaskan fungsi serta ciri-ciri
setiap elemen dalam model Unified Modeling Language (UML) .
2. Relasi (Relationship)
Ada 4 (empat) macam relationship dalam Unified Modeling Language
(UML), yaitu:
16
a. Kebergantungan
Merupakan hubungan dimana perubahan yang terjadi pada suatu elemen mandiri
(independent) akan mempengaruhi elemen yang bergantung pada elemen yang
tidak mandiri (independent).
b. Asosiasi
Merupakan apa yang menghubungkan antara objek satu dengan objek lainnya,
bagaimana hubungan suatu objek dengan objek lainnya. Suatu bentuk asosiasi
adalah agregasi yang menampilkan hubungan suatu objek dengan bagianbagiannya.
c. Generalisasi
Merupakan hubungan dimana objek anak (descendent) berbagi perilaku dan
struktur data dari objek yang ada diatasnya objek induk (ancestor). Arah dari atas
kebawah dari objek induk ke objek anak dinamakan spesialisasi, sedangkan arah
berlawanan sebaliknya dari arah bawah keatas dinamakan generalisasi.
d. Realisasi
Merupakan operasi yang benar-benar dilakukan oleh suatu objek.
3.
Diagram
Ada berbagai macam diagram dalam Unified Modeling Language
(UML), yaitu:
a. Diagram Usecase
b. Diagram Class
c. Diagram Package
d. Diagram Sequence
e. Diagram Collaboration
f. Diagram StateChart
g. Diagram Activity
h. Diagram Deployment
UML yang akan digunakan yaitu diagram usecase, sequence dan activity.
1. Diagram Usecase
Diagram usecase menggambarkan fungsionalitas yang diharapkan dari
sebuah sistem. Pada diagaram ini yang ditekankan adalah “apa” yang diperbuat
17
sistem dan bukan “bagaimana”. Menggambarkan kebutuhan sistem dari sudut
pandang user.Mengfokuskan pada proses komputerisasi (automated processes).
Menggambarkan hubungan antara Usecase dan actor Usecase menggambarkan
proses sistem (kebutuhan sistem dari sudut pandang user).
Tabel 2.2 Simbol usecase diagram
Simbol
Deskripsi
Aktor, mewakili peran orang sistem yang
lain atau alat ketika berkomunikasi
Aktor
dengan usecase
Usecase abstraksi dari interaksi antara
Nama use case
sistem dan actor
Association
adalah
abstraksi
dari
penghubung antara actor dan usecase
Menunjukan
<<include>>
seluruhnya
bahwa
suatu
merupakan
usecase
fungsionalitas
dari usecase lainnya
Menunjukan
<<extend>>
bahwa
suatu
usecase
merupakan tambahan fungsionalitas dari
usecase lainnya
Genealisasi,
menunjukan
spesialisasi
actor untuk dapat berpartisipasi dalam
usecase
(Sumber : Rosa A.S & M.Shalahuddin, 2013)
2. Diagram Sequence
Diagram ini memperlihatkan interaksi yang menekankan pada pengiriman
pesan (message) dalam suatu waktu tertentu.Diagram squence biasa digunakan
untuk menggambarkan skenario atau rangkaian langkah-langkah yang dilakukan
sebagai respons dari sebuah event untuk menghasilkan output tertentu.
18
Tabel 2.3 Simbol diagram squence
Simbol
Nama
Deskripsi
Objek entity, antarmuka yang saling
LifeLine
berinteraksi.
Spesifikasi dari komunikasi antar objek
Message
yang
memuat
informasi-informasi
tentang aktifitas yang terjadi
Spesifikasi dari komunikasi antar objek
Message
yang
memuat
informasi-informasi
tentang aktifitas yang terjadi
(Sumber : Rosa A.S & M.Shalahuddin, 2013)
3. Diagram Activity
Diagram Activity memodelkan workflow proses dan urutan aktivitas
dalam sebuah proses. Diagram ini sangat mirip dengan flowchart karena
memodelkan workflow dari satu aktivitas ke aktivitas lainnya atau dari aktivitas
ke status. Menguntungkan untuk membuat Diagram Activity pada awal
pemodelan proses untuk membantu memahami keseluruhan proses. Diagram
Activity juga bermanfaat untuk menggambarkan parallel behaviour atau
menggambarkan interaksi antara beberapa usecase.
Tabel 2.4 Simbol Diagram Activity
Simbol
Deskripsi
Titik awal
Titik akhir
Activity/action
19
Pilihan untuk mengambil keputusan dan
mengakhiri kondisi
Fork
&Join;
untuk
menunjukan
kegiatan yang dilakukan secara paralel
dan digabungkan kembali
(Sumber : Rosa A.S & M.Shalahuddin, 2013)
2.6.3. Tujuan Penggunaan UML
Tujuan Penggunaan Unified Modeling Language (UML) adalah :
1. Memberikan bahasa pemodelan yang bebas dari berbagai bahasa pemrograman
dan proses rekayasa.
2. Menyatukan praktek-praktek terbaik yang terdapat dalam pemodelan.
3. Memberikan model yang siap pakai, bahsa pemodelan visual yang ekspresif
untuk mengembangkan dan saling menukar model dengan mudah dan dimengerti
secara umum.
4. UML bisa juga berfungsi sebagai sebuah (blue print) cetak biru karena sangat
lengkap dan detail. Dengan cetak biru ini maka akan bias diketahui informasi
secara detail tentang coding program atau bahkan membaca program dan
menginterpretasikan kembali ke dalam bentuk diagram (reserve enginering).
2.7.
Flowchart
Algoritma merupakan suatu alur pemikiran seseorang yang harus dapat
dituangkan secara tertulis. Salah satu caranya adalah dengan menggunakan
simbol-simbol yang memang sudah standar pada dunia komputer. Simbol itu
disebut dengan flowchart (Antonius, 2010). Dengan menggunakan flowchart
(diagram alir) maka seseorang programmer dapat memberikan idenya secara
tertulis sehingga dapat dipahami oleh programmer lain, oleh klien, atau oleh tim
kerjanya.
Flowchart merupakan alur pemikiran yang dituangkan ke dalam bentuk
simbol. Dengan demikian perlu dipelajari terlebih dahulu bentuk-bentuk simbol
standar beserta kegunaan masing-masing. Berikut adalah tabel simbol-simbol
flowchart :
20
Tabel 2.5 Simbol flowchart
Deskripsi
Simbol
Mulai
Selesai
Start
Finish
Aliran data
Proses / kejadian
Percabangan
Input
Output
(Sumber : Antonius , 2010)
X=y+z
X>2
Masukan data
Tampilkan data
BAB III
METODOLOGI PENELITIAN
3.1
Waktu dan Tempat Penelitian
3.1.1 Waktu Penelitian
Waktu pelaksanaan penelitian tugas akhir dilaksanakan mulai dari bulan
Februari 2016. Rincian kegiatan dapat dilihat pada tabel 3.1.
Tabel 3.1 Waktu penelitian
Tahun 2016
No
Uraian
1
Studi Literatur
2
3
4
Analisis
Desain
Pembuatan
Program
Pengujian
Pemeliharaan
5
6
Februari
(Minggu ke-)
1 2 3 4
Maret
(Minggu ke-)
1
2
3 4
April
(Minggu ke-)
1
2
3.1.2 Tempat Penelitian
Penelitian tugas akhir ini bertempat di Laboraturium Rekayasa Perangkat
Lunak Fakultas Teknik Universitas Halu Oleo
3.2
Metode Pengumpulan Data
Beberapa metode yang digunakan dalam pengumpulan data adalah sebagai
berikut:
1. Wawancara (Interview)
Pengumpulan data dengan wawancara ini dilakukan untuk mencari data dan
informasi tentang hal-hal yang dibutuhkan dalam penelitian. Wawancara
dilakukan dengan dosen yang bertanggung jawab pada Laboraturium Perangkat
21
22
Lunak untuk mendapatkan informasi yang berhubungan dengan pengaambilan
sample yang akan dilakukan.
2. Studi Literatur
Guna mendapatkan data, gambaran dan keterangan yang lebih lengkap
peneliti menggunakan studi literatur dengan cara mengumpulkan dan mempelajari
literatur yang berkaitan dengan teori sistem perancangan aplikasi kesamaan
Source Code pada bahasa pemrograman java dan metode leksikal. Sumber
literatur berupa paper, jurnal, karya ilmiah, dan situs-situs penunjang.
3. Sampling
Pada tahap ini peneliti membutuhkan suatu sampel data yang berupa file
project dari tugas mahasiswa yang melakukan praktikum di Laboraturium
Rekayasa Perangkat Lunak sebagai bahan uji coba pada aplikasi Deteksi
Kemiripan Source Code Pada Bahasa Pemrograman Java Menggunakan Metode
Analisis Leksikal.
3.3 Metode Pengembangan Sistem
Metode
pengembangan
perangkat
lunak
yang
digunakan
dalam
pembangunan sistem ini adalah metode Waterfall yang terdiri dari beberapa tahap
yaitu :
1. Studi Literatur
Tahap pertama yang dilakukan peneliti yaitu mengumpulkan data,
gambaran dan keterangan yang lebih lengkap dalam penelitian ini dengan cara
mengumpulkan dan mempelajari literatur yang berkaitan dengan judul penelitian.
Yang bersumber dari buku teks, paper, jurnal, karya ilmiah, dan situs-situs
penunjang lainnya.
2. Analisis
Tahap analisis adalah tahap dimana peneliti menganalisis permasalahan
yang ada yaitu kriteria-kiteria dan persyaratan penerimaan peserta didik baru dan
melakukan perhitungan.
23
3. Desain
Pada tahap desain merupakan tahap peneliti merancang pembuatan
tampilan awal atau interface dari aplikasi yang akan dibangun. Tampilan interface
akan dirancang melalui data-data yang telah diperoleh pada saat tahap analisis.
4. Pembuatan Program
Pada tahap pengkodean yaitu menerjemahkan aplikasi kedalam bahasa
pemrograman yang telah ditentukan yaitu bahasa pemograman Java.
5. Pengujian
Merupakan tahap pengujian terhadap aplikasi yang telah dibuat menjadi
suatu perangkat lunak yang siap pakai dengan tujuan apakah sistem yang sudah
jadi sudah sesuai dengan yang diharapkan.
6. Pemeliharaan
Pada tahap pemeliharan yaitu tahap dimana melakukan koreksi dari
berbagai error yang tidak ditemukam pada tahap-tahap sebelumnya sehingga
dapat dilakukan perbaikan, agar dapat menghasilkan sistem yang lebih baik dari
sebelumnya.
BAB IV
ANALISIS DAN PERANCANGAN SISTEM
4.1.
Analisis Sistem
4.1.1. Sistem yang Sedang Berjalan
Laboratorium Rekayasa Perangkat Lunak Jurusan Teknik Informatika
Universitas Halu Oleo saat ini belum memiliki sistem yang dapat mendeteksi
kemiripan source code untuk memeriksa adanya tindakan plagiat secara otomatis
berbasis aplikasi komputer. Sistem yang sedang berjalan saat ini dalam
mendeteksi kemiripan source code dilakukan secara manual, dimana Dosen atau
Asisten laboratorium harus memeriksa satu persatu file source code yang
diperiksa. Pendeteksian secara manual selain membutuhkan waktu yang lama juga
tingkat ketelitiannya masih kurang. Hal ini disebabkan faktor ketelitian manusia
berbeda dengan komputer.
4.1.2. Sistem yang Diusulkan
Sistem yang diusulkan dalam pedeteksi kemiripan source code adalah
sistem yang dilakukan secara otomatis. Aplikasi proses pendeteksi kemiripan
source code yang diusulkan ini menggunakan metode Analisis Leksikal. File yang
diperiksa dalam sistem ini adalah file class yang berekstensi .java. User
memasukan dua buah file dimana file pertama merupakan file pembanding dan file
kedua merupakan file yang akan diperiksa kemiripannya. Keluaran dari sistem ini
adalah presentase tingkat kemiripan isi source code. Setelah user memasukan
kedua file yang akan diperiksa maka sistem akan melakukan tahap analisis. Untuk
melihat persentasi kemiripan user memilih menu scanning, maka presentase
kemiripan akan tampil.
24
25
4.2.
Perancangan Sistem
4.2.1. Diagram Usecase
Gambar 4.1 Diagram Usecase
Pada diagram Usecase, pengguna dapat mengakses form utama, membuka
file, melakukan scanning, mengakses menu Help.
4.2.2. Diagram Activity
1.
Diagram Activity menu Scanning
Pada diagram activity scanning, user dapat membuka dua file yang akan
dibandingkan. Setelah user memilih file yang akan dibandingkan user dapat
memilih menu scanning untuk mengetahui presentase dari hasil perbandingan
dari kedua file tersebut.
26
Gambar 4.2 Diagram Activity Menu Scanning
2. Diagram Activity submenu Open File
Pada diagram activity menu Open File, user mengakses aplikasi, kemudian
sistem menampilkan halaman utama, lalu user memilih menu Open File, sistem
kemudian menampilkan dialog open file. Seperti dijelaskan pada gambar 3.2
berikut.
Gambar 4.3 Diagram Activity Menu Open File
27
3. Diagram Activity menu Help
Pada menu Help user dapat membaca tutorial penggunaan aplikasi dengan
cara pilih menu Help kemudian pilih sumenu Help
Gambar 4.4 Diagram Activity Menu Help
4.2.3. Diagram Sequence
1.
Diagram Sequence Menu Scanning
Pada diagram Sequence dapat dilihat setelah user melakukan input file
maka sistem akan membaca dan akan menampilkan isi dari file tersebut. Setelah
itu sistem akan melakukan proses analisis leksikal. Setelah user memilih submenu
scanning, sistem akan melakukan pencocokan token berdasarkan posisi array dan
28
menghitung jumlah kemiripan sehingga akan keluar hasil presentase nilai
similarity atau kemiripan source code dan waktu proses yang dibutuhkan.
Gambar 4.5 Diagram Sequences submenu scanning
4.3.
Analisis Kebutuhan Sistem
4.3.1. Kebutuhan Data Masukan
Untuk data masukan yang dibutuhkan dari sistem ini adalah adanya file
class java yang akan dihitung presentase kemiripannya minimal dua buah file
class, selanjutnya sistem akan menggunakan metode analisis leksikal dan
pencocokan string untuk menghasilkan output.
4.3.2. Kebutuhan Data Keluaran
Data keluaran dari sistem yang telah di proses untuk kemudian
ditampilkan kepada pengguna sistem yaitu presentase nilai kemiripan dan
kesimpulan dari hasil presentase apakah file tersebut merupakan plagiat atau
bukan.
29
4.4.
Flowchart
Flowchart dari proses sistem yang dilakukan secara keseluruhan dapat
dijelaskan seperti gambar berikut:
Gambar 4.6 flowchart program
30
4.5.
Peracangan Antar Muka (Interface)
Perancangan antar muka (interface) merupakan perancangan untuk melihat
desain awal dari sebuah sistem. Berikut adalah perancangan sistem interface dari
peracangan aplikasi pendeteksi kemiripan source code.
Gambar 4.7 Desain interface aplikasi
Gambar diatas merupakan rancangan desain dari halaman utama aplikasi yang
terdiri dari tiga meu, yaitu: file, process dan help. Pada menu File terdiri submenu
Open Source 1 dan Open Source 2 yang berfungsi untuk menginsert file dan exit.
Pada menu Process terdiri submenu Scanning yang berfungsi untuk mencocokan
kedua file Source code yang akan dibandingkan, show analisis untuk
menampilkan hasil analisis, show similar untuk menampilkan token-token yang
mempunyai kemiripan, show not similar untuk menampilkan token-token yang
tidak sama dan reset untuk merefresh halaman utama ke default. Pada menu Help
merupakan batuan tentang bagaimana menjalankan aplikasi. Terdiri dari submenu
help dan about.
4.6.
Ilustrasi Metode Analisis Leksikal Terhadap Perencanaan Aplikasi
4.6.1. Analisis Leksikal
Tahap ini merupakan tahap awal sebelum dilakukan perhitungan
kemiripan kedua source code yang akan diperiksa. Setelah source code dimasukan
31
maka sistem otomatis akan mentransformasikan source code tersebut kedalam
bentuk token berdasarkan id masing-masing tipe. Untuk daftar tipe-tipe token
dapat dilihat pada tabel tipe token pada bab sebelumnnya.
Berikut contoh analisis leksikal pada dua buah source code yang akan
diperiksa kemiripannya.
1.
Source Asli
Gambar 4.8 source asli
Setelah dilakukan analisis leksikal maka source asli akan berbentuk seperti
tabel 4.1
32
Tabel 4.1 Hasil Analisis Leksikal Source Asli.
ID
Token
KW
ID
SM
KW
KW
ID
LB
KW
ID
Token
package
contoh
;
public
class
Mobil
{
String
warna
ID
Token
LP
ST
PO
ID
PO
ST
RP
SM
RB
Token
(
"Mobil maju sejauh "
+
maju
+
" meter"
)
;
}
ID
Token
SM
RB
KW
KW
KW
ID
LP
KW
LS
Token
;
}
public
static
void
main
(
String
[
SM
;
KW
public
RS
]
KW
ID
SM
KW
ID
SM
KW
KW
ID
LP
KW
ID
RP
LB
KW
int
jumlah_pintu
;
float
isi_tangki
;
public
void
Maju
(
int
maju
)
{
int
KW
ID
LP
KW
ID
RP
LB
KW
ID
AO
NM
SM
ID
AO
ID
void
Mundur
(
int
mundur
)
{
int
mundurbelakang
=
0
;
mundurbelakang
=
mundurbelakang
ID
RP
LB
ID
ID
AO
KW
ID
LP
RP
SM
ID
DT
ID
LP
args
)
{
Mobil
BMW
=
new
Mobil
(
)
;
BMW
.
Maju
(
ID
majukedepan
PO
+
NM
75
AO
NM
SM
=
0
;
ID
SM
ID
mundur
;
System
RP
SM
ID
)
;
BMW
ID
majukedepan
DT
.
DT
.
AO
ID
PO
ID
=
majukedepan
+
maju
ID
DT
ID
LP
out
.
println
(
ID
LP
NM
RP
Mundur
(
5
)
33
SM
;
ST
ID
DT
ID
DT
ID
System
.
out
.
println
PO
ID
PO
ST
RP
2.
"Mobil
sejauh "
+
mundur
+
" meter"
)
mundur
SM
;
RB
RB
}
}
Source Pembanding
Gambar 4.9 Source Pembanding
Setelah dilakukan analisis leksikal maka source pembanding ini akan
berbentuk seperti tabel 4.2
34
Tabel 4.2 Hasil Analisis Source Pembanding
ID
Token
KW
ID
SM
KW
KW
ID
LB
KW
ID
SM
KW
ID
SM
KW
ID
SM
KW
KW
ID
LP
KW
ID
RP
LB
KW
Token
package
contoh2
;
public
class
Mobil2
{
String
warna
;
int
jumlah_pintu
;
float
isi_tangki
;
public
void
Maju
(
int
maju
)
{
int
ID
Token
LP
ST
PO
ID
PO
ST
RP
SM
RB
KW
KW
ID
LP
KW
ID
RP
LB
KW
ID
AO
NM
SM
ID
AO
ID
Token
(
"Mobil maju sejauh "
+
maju
+
" meter"
)
;
}
public
void
Mundur
(
int
mundur
)
{
int
mundurbelakang
=
0
;
mundurbelakang
=
mundurbelakang
ID
Token
SM
RB
KW
KW
KW
ID
LP
KW
LS
RS
ID
RP
LB
ID
ID
AO
KW
ID
LP
RP
SM
ID
DT
ID
LP
Token
;
}
public
static
void
main
(
String
[
]
args
)
{
Mobil
BMW
=
new
Mobil
(
)
;
BMW
.
Maju
(
ID
majukedepan
PO
+
NM
75
AO
NM
SM
=
0
;
ID
SM
ID
mundur
;
System
RP
SM
ID
)
;
BMW
ID
majukedepan
DT
.
DT
.
AO
ID
PO
ID
=
majukedepan
+
maju
ID
DT
ID
LP
out
.
println
(
ID
LP
NM
RP
Mundur
(
5
)
35
SM
;
ST
ID
DT
ID
DT
ID
System
.
out
.
println
PO
ID
PO
ST
RP
"Mobil
sejauh "
+
mundur
+
" meter"
)
mundur
SM
;
RB
RB
}
}
4.6.2. Sorting
Proses ini merupakan proses mengurutkan token-token yang terbentuk dari
kedua source code yang diperiksa menurut abjad. Proses ini dilakukan dengan
tujuan supaya jika terdapat source code yang sama tetapi terdapat fungsi atau
prosedure yang sama pada posisi yang berbeda tetap akan terdeteksi.
Setelah kedua source code diurutkan, maka masing-masing akan
berbentuk sebagai berikut.
1.
Source Asli
Tabel 4.3. Hasil Sorting Source Asli
ID Token
AO
AO
AO
AO
AO
DT
DT
DT
DT
DT
DT
ID
ID
ID
ID
ID
ID
Token
=
=
=
=
=
.
.
.
.
.
.
args
BMW
BMW
BMW
contoh
isi_tangki
ID
Token
ID
ID
ID
ID
ID
KW
KW
KW
KW
KW
KW
KW
KW
KW
KW
KW
KW
Token
println
println
System
System
warna
class
float
int
int
int
int
int
new
package
public
public
public
ID
Token
NM
PO
PO
PO
PO
PO
PO
RB
RB
RB
RB
RP
RP
RP
RP
RP
RP
Token
75
+
+
+
+
+
+
}
}
}
}
)
)
)
)
)
)
36
ID
jumlah_pintu
KW
public
RP
)
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
main
maju
maju
maju
Maju
Maju
majukedepan
majukedepan
majukedepan
Mobil
Mobil
Mobil
mundur
mundur
mundur
Mundur
Mundur
KW
KW
KW
KW
KW
KW
LB
LB
LB
LB
LP
LP
LP
LP
LP
LP
LP
static
String
String
void
void
void
{
{
{
{
(
(
(
(
(
(
(
RP
RS
SM
SM
SM
SM
SM
SM
SM
SM
SM
SM
SM
SM
SM
ST
ST
LP
(
ST
LS
[
ST
)
]
;
;
;
;
;
;
;
;
;
;
;
;
;
" meter"
" meter"
"Mobil maju
sejauh "
"Mobil
mundur
sejauh "
NM
0
NM
NM
0
5
ID
mundurbelakang
ID
mundurbelakang
ID
mundurbelakang
out
out
ID
ID
2.
Source Pembanding
Tabel 4.4. Hasil Sorting Source Pembanding
ID Token
AO
AO
AO
AO
AO
DT
Token
=
=
=
=
=
.
ID
Token
ID
ID
ID
ID
ID
KW
Token
println
println
System
System
warna
class
ID
Token
NM
PO
PO
PO
PO
PO
Token
75
+
+
+
+
+
37
DT
DT
DT
DT
DT
ID
ID
ID
ID
ID
ID
.
.
.
.
.
args
BMW
BMW
BMW
contoh2
isi_tangki
KW
KW
KW
KW
KW
KW
KW
KW
KW
KW
KW
float
int
int
int
int
int
new
package
public
public
public
PO
RB
RB
RB
RB
RP
RP
RP
RP
RP
RP
+
}
}
}
}
)
)
)
)
)
)
ID
jumlah_pintu
KW
public
RP
)
ID
ID
ID
ID
ID
ID
main
maju
maju
maju
Maju
Maju
KW
KW
KW
KW
KW
KW
static
String
String
void
void
void
RP
RS
SM
SM
SM
SM
)
]
;
;
;
;
ID
majukedepan
LB
{
SM
;
ID
majukedepan
LB
{
SM
;
ID
ID
ID
ID
ID
ID
ID
ID
ID
majukedepan
Mobil
Mobil2
Mobil
mundur
mundur
mundur
Mundur
Mundur
LB
LB
LP
LP
LP
LP
LP
LP
LP
{
{
(
(
(
(
(
(
(
SM
SM
SM
SM
SM
SM
SM
ST
ST
LP
(
ST
LS
[
ST
;
;
;
;
;
;
;
" meter"
" meter"
"Mobil maju
sejauh "
"Mobil
mundur
sejauh "
NM
0
NM
NM
0
5
ID
mundurbelakang
ID
mundurbelakang
ID
ID
ID
mundurbelakang
out
out
38
4.6.3. Perhitungan Nilai Kemiripan
Setelah kedua source code berbentuk token dan token-token telah terurut,
maka proses selanjutnya adalah perhitungan nilai kemiripan kedua source
menggunakan array. Panjang array sesuai dengan panjang token yang terbentuk.
Pada contoh diatas panjang token adalah 117.
Metode perhitungan kemiripan ini didasarkan atas posisi dan isi dari token
tersebut. Jika pada posisi array ke-0 di cocokan dengan posisi array ke-0 pada
source kedua sama, baik id token dan isi dari token maka program akan mencatat
sebagi satu kemiripan. Kemdian program akan melanjutkan pada posisi array
selanjutnya sampai posisi terakhir pada array.
Jika panjang array pada kedua source berbeda dikarenakan banyaknya
token yang terbentuk pada kedua source berbeda, maka pencocokan diberhentikan
pada nilai array yang terpendek dan sisanya dianggap sebagai ketidaksamaan.
Berikut ilustrasi perhitungan nilai kemiripan menggunakan array pada
kedua source code yang telah berbentuk token.
Source Asli
Source Pembanding
AO
=
sama
AO
=
AO
=
sama
AO
=
AO
=
sama
AO
=
AO
=
sama
AO
=
AO
=
sama
AO
=
DT
.
sama
DT
.
DT
.
sama
DT
.
DT
.
sama
DT
.
DT
.
sama
DT
.
DT
.
sama
DT
.
DT
.
sama
DT
.
ID
args
sama
ID
args
ID
BMW
sama
ID
BMW
39
ID
BMW
sama
ID
BMW
ID
BMW
sama
ID
BMW
ID
contoh
beda
ID
contoh2
ID
isi_tangki
sama
ID
isi_tangki
ID
jumlah_pintu
sama
ID
jumlah_pintu
ID
main
sama
ID
main
ID
maju
sama
ID
maju
ID
maju
sama
ID
maju
ID
maju
sama
ID
maju
ID
Maju
sama
ID
Maju
ID
Maju
sama
ID
Maju
ID
majukedepan
sama
ID
majukedepan
ID
majukedepan
sama
ID
majukedepan
ID
majukedepan
sama
ID
majukedepan
ID
Mobil
sama
ID
Mobil
ID
Mobil
sama
ID
Mobil
ID
Mobil
beda
ID
Mobil2
ID
mundur
sama
ID
mundur
ID
mundur
sama
ID
mundur
ID
mundur
sama
ID
mundur
ID
Mundur
sama
ID
Mundur
ID
Mundur
sama
ID
Mundur
ID
mundurbelakang
sama
ID
mundurbelakang
ID
mundurbelakang
sama
ID
mundurbelakang
ID
mundurbelakang
sama
ID
mundurbelakang
ID
out
sama
ID
out
ID
out
sama
ID
out
ID
println
sama
ID
println
ID
println
sama
ID
println
ID
System
sama
ID
System
40
ID
System
sama
ID
System
ID
Warna
sama
ID
Warna
KW
class
sama
KW
class
KW
float
sama
KW
float
KW
int
sama
KW
int
KW
int
sama
KW
int
KW
int
sama
KW
int
KW
int
sama
KW
int
KW
int
sama
KW
int
KW
new
sama
KW
new
KW
package
sama
KW
package
KW
public
sama
KW
public
KW
public
sama
KW
public
KW
public
sama
KW
public
KW
public
sama
KW
public
KW
static
sama
KW
static
KW
String
sama
KW
String
KW
String
sama
KW
String
KW
void
sama
KW
void
KW
void
sama
KW
void
KW
void
sama
KW
void
LB
{
sama
LB
{
LB
{
sama
LB
{
LB
{
sama
LB
{
LB
{
sama
LB
{
LP
(
sama
LP
(
LP
(
sama
LP
(
LP
(
sama
LP
(
LP
(
sama
LP
(
LP
(
sama
LP
(
41
LP
(
sama
LP
(
LP
(
sama
LP
(
LS
[
sama
LS
[
NM
0
sama
NM
0
NM
0
sama
NM
0
NM
5
sama
NM
5
NM
75
sama
NM
75
PO
+
sama
PO
+
PO
+
sama
PO
+
PO
+
sama
PO
+
PO
+
sama
PO
+
PO
+
sama
PO
+
PO
+
sama
PO
+
RB
}
sama
RB
}
RB
}
sama
RB
}
RB
}
sama
RB
}
RB
}
sama
RB
}
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RP
)
sama
RP
)
RS
]
sama
RS
]
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
42
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
SM
;
sama
SM
;
ST
" meter"
sama
ST
" meter"
ST
" meter"
sama
ST
" meter"
ST
"Mobil maju
sama
ST
"Mobil maju
sejauh "
ST
sejauh "
"Mobil mundur
sama
sejauh "
ST
"Mobil mundur
sejauh "
Pada ilustrasi diatas dapat kita lihat bahwa, dari kedua source yang
diperiksa terdapat 115 jumlah kemiripan dan terdapat 2 perbedaan saja yang
ditemukan. Sehingga dari data tersebut kita dapat menentukan nilai kemiripan
dengan ketentuan:
Jumlah kesamaan
= 115
Jumlah perbedaan = 2
Jumlah elemen objek
= 117
= (115/117) x 100 %
= 98,29 %
43
Karena hasil dari perhitungan lebih besar dari 70%, maka source code
tersebut dianggap sebagai plagiat.
BAB V
IMPLEMENTASI DAN PENGUJIAN SISTEM
5.1
Implementasi Sistem
Pada tahap ini merupakan tahap penerapan sistem pada keadaan yang
sebenarnya agar dapat berfungsi sesuai kebutuhan, sehingga dapat diketahui
apakah sistem yang dibuat sesuai dengan perancangan sebelumnya. Disini akan
dijelaskan bagaimana sistem ini dengan memberikan contoh-contoh tampilan
aplikasi yang terdapat pada aplikasi ini.
5.1.1 Interface aplikasi
Adapun interface dan preview dari aplikasi Deteksi Kemiripan Source
Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal
adalah sebagai berikut :
1.
Progress Bar
Tampilan ini merupakan tampilan progress bar yang berjalan ketika pertama
kali aplikasi dijalankan.
Gambar 5.1. Tampilan progress bar
2.
Tampilan Utama
Pada tampilan utama ini terdapat tiga menu yaitu menu file,process dan help.
Pada menu file terdapat tiga submenu file yaitu open source 1,open source 2 dan
exit. Pada menu process terdapat lima submenu yaitu submenu scanning,show
44
45
analysis, show similar, show not similar dan reset. Sedangkan pada menu help
terdapat dua submenu yaitu submenu help dan about.
Gambar 5.2 Tampilan utama
a.
Submenu Open source
Merupakan submenu untuk menginput source yang akan diperiksa. Submenu
open source 1 berfungsi menginput source pertama dan submenu open source 2
berfungsi untuk menginput source yang kedua kemudian source akan tampil
pada masing-masing text editor. Setelah source
telah dimasukan maka akan
tampil properties dari kedua source berupa jumlah kata, jumlah simbol, jumlah
angka, jumlah token dan letak source .
b.
Submenu exit
Submenu ini berfungsi untuk keluar dari aplikasi
c.
Submenu Scanning
Submenu ini berada pada menu Process, dimana submenu ini berfungsi untuk
mengetahui presentase kemiripan source
code yang diperiksa. Setelah user
memilih submenu scanning maka akan tampil Jumlah token yang sama, jumlah
token yang tidak sama, jumlah token yang diperiksa , presentase kemiripan,
keterangan plagiat atau bukan plagiat dan waktu pada saat proses scanning.
46
d.
Submenu Show analysis
Submenu ini berfungsi untuk menampilkan hasil analisis leksikal setelah user
menginput source yang akan diperiksa. Hasil analisis ini akan tampil pada text
editor masing-masing source .
e.
Submenu show similar
Merupakan submenu untuk melihat token-token mana saja yang memiliki
kemiripan pada kedua source yang diperiksa
f.
Submenu not similar
Merupakan submenu untuk menampilkan token-token yang tidak sama pada kedua
source.
g.
Submenu reset
Submenu ini berfungsi untuk mereset tampilan utama ke default
h.
Submenu Help
Submenu ini akan menampilkan bantuan atau panduan cara menggunakan aplikasi
dalam bentuk pdf.
i.
Submenu About
Merupakan submenu untuk menampilkan informasi tentang aplikasi deteksi
kemiripan source code ini.
5.2. Pengujian Sistem
5.2.1. Pengujian Fungsionalitas Aplikasi
Pengujian ini dilakukan untuk memeriksa apakah semua menu dan
submenu yang ada pada sistem dapat berfungsi dengan baik. Pengujian ini
dilakukan dengan memasukkan source
code, scanning, menampilkan hasil
analisis, menampilkan token yang mirip dan yang tidak mirip pada source code
yang diperiksa serta menampilkan menu help dan about.
1. Memasukan dua buah source code yang akan diperiksa kedalam text editor.
47
Gambar 5.3 Tampilan dialog open source
2. Setelah source code terinput maka pada menu utama akan tampil properties
masing-masing source
code yang berupa jumlah kata,jumlah simbol,jumlah
angka dan total token yang terbentuk.
Gambar 5.4 Tampilan source code yang telah di input
3. Langkah selanjutnya yaitu melakukan proses scanning dengan menekan menu
process dan memilih submenu scanning. Setelah sistem selesai menscan kedua
source maka akan tampil jumlah token yang sama, jumlah token yang tidak sama,
jumlah token yang diperiksa, presentase kemiripan, keterangan plagiat atau bukan
48
dalam bentuk radio button dan waktu yang diperlukan pada saat melakukan proses
scanning.
Gambar 5.5 Tampilan hasil scanning kemiripan
4. Menampilkan hasil analisis keseluruahan
Gambar 5.6 Menampilkan hasil analisis
49
5. Menampilkan token yang sama/mirip
Gambar 5.7 Menampilkan token yang sama
6. Menampilkan token yang tidak sama/tidak mirip
Gambar 5.8 Menampilkan token yang tidak sama
7. Langkah selanjutnya yaitu menguji menu help. Pilih menu help kemudian pilih
submenu help maka akan tampil bantuan penggunaan aplikasi dalam bentuk PDF.
50
Gambar 5.9 Tampilan Help
8. Selanjutnya menu about
Gambar 5.10 Tampilan About
5.2.2. Hasil Analisa
Pada pengujian sistem yang dilakukan, sistem memeriksa dua source code
yang masing-masing berjumlah 10 file class. Daftar file class yang di uji dapat di
lihat pada tabel 5.1 dan tabel 5.2.
51
Tabel 5.1 Daftar Nama Class Source Asli
NO
1
2
3
4
5
6
7
8
9
10
SOURCE ASLI
∑
∑
NAMA CLASS
KATA SIMBOL
BilPrima.java
42
48
CekNilai.java
94
120
HitungLingkaran.java
47
47
test1.java
20
25
test3.java
25
31
test5.java
28
36
NilaiUjian.java
75
104
scanner.java
33
33
MembuatPolaXDiJava.java
59
88
Main.java
100
123
∑ANGKA
2
5
2
2
2
4
10
0
3
1
TOTAL
TOKEN
92
219
96
47
58
68
189
66
154
224
Tabel 5.2 Daftar Nama Class Source Pembanding
SOURCE PEMBANDING
NO
1
2
3
4
5
6
7
8
9
10
NAMA
CLASS
prima.java
nilai.java
Lingkaran.java
test2.java
test4.java
test6.java
nilaiujian.java
inputNama.java
NewMain2.java
Main.java
∑ KATA
∑ SIMBOL
∑ANGKA
46
94
49
20
25
29
75
33
60
100
49
120
50
25
31
36
104
33
87
123
2
5
2
2
2
4
10
0
3
1
TOTAL
TOKEN
97
219
101
47
58
69
189
66
154
224
Untuk hasil analisa pengujian sistem terhadap kinerja algoritma dapat
dilihat pada tabel 5.3.
52
Tabel 5.3 Hasil Analisa Pengujian Sistem
NO
1
2
3
4
5
6
7
8
9
10
∑TOKEN
YG SAMA
23
16
26
41
52
22
169
60
152
224
∑TOKEN YG
DIPERIKSA
92
219
96
47
58
68
189
66
154
224
KEMIRIPAN
(%)
25
7,31
27,08
87,23
89,66
32,35
89,42
90,91
98,7
100
WAKTU (S)
0,31
0,55
0,23
0,11
0,11
0,16
0,5
0,14
0,31
0,44
Pada tabel 5.3 diatas terdapat 10 hasil pengujian, dimana pengujian nomor
1 merupakan hasil pengujian Antara source nomor 1 pada tabel 5.1 dan source
nomor 1 pada tabel 5.2. Begitu juga dengan hasil pengujian pada nomor dua
merupakan hasil pengujian Antara source nomor 2 pada tabel 5.1 dengan source
nomor 2 pada tabel 5.2, begitu juga dengan hasil pengujian nomor 3 sampai 10
diuji berdasarkan urutan nomor tabel 5.1 dan tabel 5.2.
BAB VI
PENUTUP
6.1
Kesimpulan
Berdasarkan uraian dan hasil analisa yang telah dilakukan selama
pengembangan Aplikasi Deteksi Kemiripan Source Code Pada Bahasa
Pemrograman Java Menggunakan Metode Analisis Leksikal ini, dapat diambil
kesimpulan sebagai berikut :
1.
Pada dasarnya proses deteksi kemiripan source code ini dilakukan dengan
mendeteksi struktur atau alur serta source code dari program tersebut dengan
metode analisis leksikal.
2.
Hasil dari aplikasi ini berupa nilai presentase kemiripan yang dapat
digunakan sebagai acuan penentuan adanya tindakan plagiarisme.
6.2
Saran
Dalam pembuatan Aplikasi Deteksi Kemiripan Source Code Pada Bahasa
Pemrograman Java Menggunakan Metode Analisis Leksikal ini masih banyak
terdapat kekurangan dan jauh dari kata sempurna. Untuk itu masih perlu
dilakukan sebuah penyempurnaan. Berikut beberapa saran untuk pengembangan
lebih lanjut dari aplikasi ini :
1.
Aplikasi ini mendeteksi kemiripan kode program hanya pada bahasa java,
untuk kedepannya diharapkan dapat mendeteksi lebih dari satu bahasa
pemrograman.
2.
code,
Jumlah file yang diperiksa pada aplikasi ini berjumlah dua buah source
untuk
lebih
menghemat
waktu
pemeriksaan
kedepannya
dapat
dikembangkan dengan memeriksaa file lebih dari satu.
3.
Aplikasi medeteksi source code yang diperiksa berupa source java atau
bukan dengan cara membaca ekstensi file yang di input, untuk pengembangan
lebih lanjut diharapkan bisa mendeteksi bahasa pemrograman dari isi dan
strukturnya.
53
Daftar Pustaka
Anonymous, 2011, Netbeans, http://infoini.com/2011/pengertian-netbeans.html.
Diakses tanggal 2 Mei 2015.
Arifin, 2011, Pengertian Source Code, https://rahmatarifin93. wordpress.com
/2011/09/22 /pengertian-source-code/. Diakses tanggal 29 februari 2016.
Aulia, Ahmad, 2013, Pemanfaatan Algoritma Rabin-Karp Untuk Mengetahui
Tingkat Kemiripan Dari Source Code Pada Pemrograman Lisp, jurnal,
Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung.
Budhy, eka, 2014, Deteksi Similarity Source Code menggunakan Metode deteksi
abstract syntax tree, seminar, Seminar Nasional Sains dan Teknologi
2014. Fakultas Tenik, Universitas Muhammadiyah Jakarta.
Febriyanto Redya,dkk, 2006, Penerapan Algoritma Boyer-Moore Untuk
Pengecekan Plagiatisme Source Code, jurnal, Laboratorium Ilmu dan
Rekayasa Komputasi, Institut Teknologi Bandung.
Henryw, 2014. Teknik Kompilasi, http://henryw.blog.binusian.org/teknikkompilasi.html. Diakses tanggal 29 Februari 2016.
Miftahul dan Bunafit Komputer, 2010, Membuat Aplikasi Database dengan Java,
MySQL dan NetBeans. PT Elex Media Komputindo, Jakarta.
RosaA dan M.Shalahuddin,
2010, Modul Pembelajaran Pemograman
Berorientasi Objek, Modula: Bandung.
Sastroasmoro, S, 2007, Beberapa Catatan Tentang Plagiarisme, Majalah
Kedokteran Indonesia, Volum: 57, Nomor: 8, Agustus 2007.
LAMPIRAN
LAMPIRAN
Lampiran 1
Analisis_leksikal.java
package Proses;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
public class Analisis_Leksikal {
private BufferedReader reader;
private char curr;
private static final char EOF = (char) (-1);
public Analisis_Leksikal(String file) {
try {
reader = new BufferedReader(new FileReader(file));
} catch (Exception e) {
e.printStackTrace();
}
curr = read();
}
private char read() {
try {
return (char) (reader.read());
} catch (IOException e) {
e.printStackTrace();
return EOF;
}
}
private boolean isNumeric(char c) {
if (c >= '0' && c <= '9') {
return true;
}
return false;
}
public boolean isAlpha(char c) {
if (c >= 'a' && c <= 'z') {
return true;
}
if (c >= 'A' && c <= 'Z') {
return true;
}
return false;
}
public Token nextToken() {
int state = 1;
int numBuffer = 0;
String alphaBuffer = "";
int decBuffer = 0;
boolean skipped = false;
while (true) {
if (curr == EOF && !skipped) {
skipped = true;
} else if (skipped) {
try {
reader.close();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
switch(state) {
case 1:
switch(curr) {
case ' ':
case '\n':
case '\b':
case '\f':
case '\r':
case '\t':
curr = read();
continue;
case ';':
curr = read();
return new Token("SM",
case '+':
curr = read();
return new Token("PO",
case '-':
curr = read();
return new Token("MO",
case '*':
curr = read();
return new Token("TO",
case '/':
curr = read();
state = 14;
continue;
case ',':
curr = read();
return new Token("FA",
case '(':
curr = read();
return new Token("LP",
case ')':
curr = read();
return new Token("RP",
case '{':
curr = read();
return new Token("LB",
case '}':
curr = read();
";");
"+");
"-");
"*");
",");
"(");
")");
"{");
return new Token("RB",
case '[':
curr = read();
return new Token("LS",
case '<':
curr = read();
return new Token("LT",
case '>':
curr = read();
return new Token("GT",
case ']':
curr = read();
return new Token("RS",
case '.':
curr = read();
return new Token("DT",
case '%':
curr = read();
return new Token("MD",
case '=':
curr = read();
state = 8;
continue;
case '!':
curr = read();
state = 9;
continue;
case '&':
curr = read();
state = 10;
continue;
case '|':
curr = read();
state = 11;
continue;
case '"':
curr = read();
state = 13;
alphaBuffer = "";
continue;
default:
state = 2;
continue;
}o
case 2:
if (isNumeric(curr)) {
numBuffer = 0;
numBuffer += (curr - '0');
state = 3;
curr = read();
} else {
state = 5;
}
continue;
case 3:
if (isNumeric(curr)) {
"}");
"[");
"<");
">");
"]");
".");
"%");
numBuffer *= 10;
numBuffer += (curr - '0');
curr = read();
} else if (curr == '.') {
curr = read();
state = 4;
} else {
return new Token("NM", "" + numBuffer);
}
continue;
case 4:
if (isNumeric(curr)) {
decBuffer = 0;
decBuffer += (curr - '0');
state = 7;
curr = read();
} else {
return new Token("ERROR", "Invalid input:
" + numBuffer + ".");
}
continue;
case 7:
if (isNumeric(curr)) {
decBuffer *= 10;
decBuffer += (curr - '0');
curr = read();
} else {
return new Token("NM", "" + numBuffer +
"." + decBuffer);
}
continue;
case 5:
if (isAlpha(curr) || curr == '_') {
alphaBuffer = "";
alphaBuffer += curr;
state = 6;
curr = read();
} else {
alphaBuffer = "";
alphaBuffer += curr;
curr = read();
return new Token("ERROR", "Invalid input:"
+ alphaBuffer);
}
continue;
case 6:
if ((isAlpha(curr) || isNumeric(curr) || curr
== '_')) {
alphaBuffer += curr;
curr = read();
} else {
if (alphaBuffer.equals("class") ||
alphaBuffer.equals("abstract") || alphaBuffer.equals("assert") ||
alphaBuffer.equals("break") || alphaBuffer.equals("const") ||
alphaBuffer.equals("boolean") || alphaBuffer.equals("byte") ||
alphaBuffer.equals("case") || alphaBuffer.equals("catch") ||
alphaBuffer.equals("char") || alphaBuffer.equals("continue") ||
alphaBuffer.equals("default") || alphaBuffer.equals("do") ||
alphaBuffer.equals("double") || alphaBuffer.equals("else") ||
alphaBuffer.equals("enum") || alphaBuffer.equals("extends") ||
alphaBuffer.equals("final") || alphaBuffer.equals("finally") ||
alphaBuffer.equals("float") || alphaBuffer.equals("for") ||
alphaBuffer.equals("goto") || alphaBuffer.equals("if") ||
alphaBuffer.equals("implements") || alphaBuffer.equals("import")
|| alphaBuffer.equals("instanceof") || alphaBuffer.equals("int")
|| alphaBuffer.equals("interface") || alphaBuffer.equals("long")
|| alphaBuffer.equals("native") || alphaBuffer.equals("new") ||
alphaBuffer.equals("package") || alphaBuffer.equals("private") ||
alphaBuffer.equals("protected") || alphaBuffer.equals("public") ||
alphaBuffer.equals("return") || alphaBuffer.equals("short") ||
alphaBuffer.equals("static") || alphaBuffer.equals("super") ||
alphaBuffer.equals("switch") || alphaBuffer.equals("synchronized")
|| alphaBuffer.equals("String") || alphaBuffer.equals("strictfp")
|| alphaBuffer.equals("this") || alphaBuffer.equals("throw") ||
alphaBuffer.equals("throws") || alphaBuffer.equals("transient") ||
alphaBuffer.equals("try") || alphaBuffer.equals("void") ||
alphaBuffer.equals("volatile") || alphaBuffer.equals("false") ||
alphaBuffer.equals("true") || alphaBuffer.equals("null") ||
alphaBuffer.equals("while")) {
return new Token("KW", "" +
alphaBuffer);
} else if (alphaBuffer.equals("true") ||
alphaBuffer.equals("false")) {
return new Token("BL", "" +
alphaBuffer);
}
return new Token("ID", "" + alphaBuffer);
}
continue;
case 8:
if (curr == '=') {
curr = read();
return new Token("EQ", "==");
} else {
return new Token("AO", "=");
}
case 9:
if (curr == '=') {
curr = read();
return new Token("NE", "!=");
} else {
return new Token("ERROR", "Invalid input:
!");
}
case 10:
if (curr == '&') {
curr = read();
return new Token("LA", "&&");
} else {
return new Token("ERROR", "Invalid input:
&");
}
case 11:
if (curr == '|') {
curr = read();
return new Token("LO", "||");
} else {
return new Token("ERROR", "Invalid input:
|");
}
case 13:
if (curr == '"') {
curr = read();
return new Token("ST", "\"" + alphaBuffer
+ "\"");
} else if (curr == '\n' || curr == EOF) {
curr = read();
return new Token("ERROR", "Invalid string
literal");
} else {
alphaBuffer += curr;
curr = read();
}
continue;
case 14:
if (curr == '/') {
state = 15;
curr = read();
} else if (curr == '*') {
state = 16;
curr = read();
} else {
return new Token("DO", "/");
}
continue;
case 15:
if (curr == '\n') {
state = 1;
}
curr = read();
continue;
case 16:
if (curr == '*') {
state = 17;
}
curr = read();
continue;
case 17:
if (curr == '/') {
curr = read();
state = 1;
} else {
curr = read();
state = 16;
}
continue;
}
}
Lampiran 2
Token.java
package Proses;
public class Token {
private String token;
private String lexeme;
public Token(String token, String lexeme) {
this.token = token;
this.lexeme = lexeme;
}
public String getTokenType() {
return token;
}
public String getLexeme() {
return lexeme;
}
@Override
public String toString() {
return token + "\t" + lexeme;
}
}
Lampiran 3
sort.java
package Proses;
import
import
import
import
import
import
import
import
java.io.BufferedReader;
java.io.FileReader;
java.io.FileWriter;
java.io.IOException;
java.text.Collator;
java.util.ArrayList;
java.util.Collections;
java.util.List;
/**
*
* @author zero
*/
public class sort {
public static void sortFile(String namaFile) throws
IOException {
FileReader fileReader = new FileReader("C:\\LOG\\Analisis
Leksikal File 1.txt");
BufferedReader bufferedReader = new
BufferedReader(fileReader);
List<String> lines = new ArrayList<String>();
String line = null;
while ((line = bufferedReader.readLine()) != null) {
lines.add(line);
}
bufferedReader.close();
Collections.sort(lines, Collator.getInstance());
FileWriter writer = new FileWriter("C:\\LOG\\Analisis
Leksikal File 1.txt");
for (String str : lines) {
writer.write(str + "\r\n");
}
writer.close();
}
Lampiran 5
Frame Scanner.java
package User_Interface;
import
import
import
import
import
import
import
import
import
import
import
import
import
Proses.Baca_File;
Proses.sort;
java.io.BufferedWriter;
java.io.File;
java.io.FileWriter;
java.io.IOException;
java.util.StringTokenizer;
java.util.logging.Level;
java.util.logging.Logger;
javax.swing.JFileChooser;
javax.swing.JOptionPane;
javax.swing.UnsupportedLookAndFeelException;
org.fife.ui.rsyntaxtextarea.SyntaxConstants;
/**
*
* @author zero
*/
public class Scanner extends javax.swing.JFrame {
private File a;
String inFile;
String outFile = "C:\\LOG\\Analisis Leksikal File 1.txt";
String outFile2 = "C:\\LOG\\Analisis Leksikal File 2.txt";
/**
* Creates new form Scanner
*/
public Scanner() {
String lookAndFeel =
javax.swing.UIManager.getSystemLookAndFeelClassName();
try {
javax.swing.UIManager.setLookAndFeel(lookAndFeel);
} catch (ClassNotFoundException | InstantiationException |
IllegalAccessException | UnsupportedLookAndFeelException e) {
}
initComponents();
this.setExtendedState(MAXIMIZED_BOTH);
refresh();
jTextArea1.setSyntaxEditingStyle(SyntaxConstants.SYNTAX_STYLE_JAVA
);
jTextArea1.setCodeFoldingEnabled(true);
jTextArea2.setSyntaxEditingStyle(SyntaxConstants.SYNTAX_STYLE_JAVA
);
jTextArea2.setCodeFoldingEnabled(true);
}
private void refresh() {
jTextArea1.setText("");
jTextArea2.setText("");
jmlKata1.setText("0");
jmlSimbol1.setText("0");
jmlAngka1.setText("0");
path1.setText("");
totalToken1.setText("0");
jmlKata2.setText("0");
jmlSimbol2.setText("0");
jmlAngka2.setText("0");
totalToken2.setText("0");
path2.setText("");
jmlKesamaan.setText("0");
total_sintaks.setText("0");
hasil.setText("0 %");
buttonGroup1.clearSelection();
waktu.setText("0 second");
notsimilar.setText("0");
hapusFile();
}
private void jumlahSimbol() {
String simbol = " SM PO MO TO FA LP RP LB RB LS LT GT RS
DT MD EQ AO NE LA LO DO";
StringTokenizer st = new StringTokenizer(simbol, " ");
String pat = "C:\\LOG\\Analisis Leksikal File 1.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
while (st.hasMoreTokens()) {
String kata = st.nextToken();
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
}
jmlSimbol1.setText(String.valueOf(jumlah));
}
private void jumlahLexem() {
String simbol = " KW ST ID";
StringTokenizer st = new StringTokenizer(simbol, " ");
String pat = "C:\\LOG\\Analisis Leksikal File 1.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
while (st.hasMoreTokens()) {
String kata = st.nextToken();
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
}
jmlKata1.setText(String.valueOf(jumlah));
}
private void jumlah() {
String pat = "C:\\LOG\\Analisis Leksikal File 1.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
String kata = "NM";
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
jmlAngka1.setText(String.valueOf(jumlah));
}
private void totalToken() {
String pat = "C:\\LOG\\Analisis Leksikal File 1.txt";
String teks = Baca_File.bacaFile(pat);
StringTokenizer st = new StringTokenizer(teks, "\n");
int jumlah;
jumlah = st.countTokens();
totalToken1.setText(String.valueOf(jumlah));
}
private void jumlahSimbol2() {
String simbol = " SM PO MO TO FA LP RP LB RB LS LT GT RS
DT MD EQ AO NE LA LO DO";
StringTokenizer st = new StringTokenizer(simbol, " ");
String pat = "C:\\LOG\\Analisis Leksikal File 2.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
while (st.hasMoreTokens()) {
String kata = st.nextToken();
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
}
jmlSimbol2.setText(String.valueOf(jumlah));
}
private void jumlahLexem2() {
String simbol = " KW ST ID";
StringTokenizer st = new StringTokenizer(simbol, " ");
String pat = "C:\\LOG\\Analisis Leksikal File 2.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
while (st.hasMoreTokens()) {
String kata = st.nextToken();
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
}
jmlKata2.setText(String.valueOf(jumlah));
}
private void jumlah2() {
String pat = "C:\\LOG\\Analisis Leksikal File 2.txt";
String teks = Baca_File.bacaFile(pat);
int jumlah = 0;
int indeks = -1;
String kata = "NM";
indeks = teks.indexOf(kata);
while (indeks >= 0) {
++jumlah;
indeks += kata.length();
indeks = teks.indexOf(kata, indeks);
}
jmlAngka2.setText(String.valueOf(jumlah));
}
private void totalToken2() {
String pat = "C:\\LOG\\Analisis Leksikal File 2.txt";
String teks = Baca_File.bacaFile(pat);
StringTokenizer st = new StringTokenizer(teks, "\n");
int jumlah;
jumlah = st.countTokens();
totalToken2.setText(String.valueOf(jumlah));
}
private void openFile1() {
JFileChooser pilihfile = new JFileChooser(".");
int pilih1 = pilihfile.showOpenDialog(this);
if (pilih1 == JFileChooser.APPROVE_OPTION) {
a = pilihfile.getSelectedFile();
inFile = pilihfile.getSelectedFile().toString();
if (a.getPath().endsWith(".java") ||
a.getPath().endsWith(".JAVA")) {
Proses.Analisis_Leksikal lexer = new
Proses.Analisis_Leksikal(inFile);
try {
BufferedWriter writer = new BufferedWriter(new
FileWriter(outFile));
Proses.Token t;
while ((t = lexer.nextToken()) != null) {
writer.write(t.toString());
writer.newLine();
}
writer.close();
sort.sortFile();
} catch (IOException ieo) {
ieo.addSuppressed(ieo);
}
String teks =
Baca_File.bacaFile(a.getAbsolutePath());
jTextArea1.setText(teks);
jTextArea1.setSyntaxEditingStyle(SyntaxConstants.SYNTAX_STYLE_JAVA
);
jTextArea1.setCodeFoldingEnabled(true);
path1.setText(a.getPath());
jumlah();
jumlahLexem();
jumlahSimbol();
totalToken();
} else {
JOptionPane.showMessageDialog(rootPane, "Please
choose java file");
}
} else {
System.out.println("gagal membaca file");
}
}
private void openFile2() {
JFileChooser pilihfile = new JFileChooser(".");
int pilih1 = pilihfile.showOpenDialog(this);
if (pilih1 == JFileChooser.APPROVE_OPTION) {
a = pilihfile.getSelectedFile();
inFile = pilihfile.getSelectedFile().toString();
if (a.getPath().endsWith(".java") ||
a.getPath().endsWith(".JAVA")) {
Proses.Analisis_Leksikal lexer = new
Proses.Analisis_Leksikal(inFile);
try {
BufferedWriter writer = new BufferedWriter(new
FileWriter(outFile2));
Proses.Token t;
while ((t = lexer.nextToken()) != null) {
writer.write(t.toString());
writer.newLine();
}
writer.close();
sort.sortFile2();
} catch (IOException ieo) {
ieo.addSuppressed(ieo);
}
String teks =
Baca_File.bacaFile(a.getAbsolutePath());
jTextArea2.setText(teks);
jTextArea2.setSyntaxEditingStyle(SyntaxConstants.SYNTAX_STYLE_JAVA
);
jTextArea2.setCodeFoldingEnabled(true);
path2.setText(a.getPath());
jumlah2();
jumlahLexem2();
jumlahSimbol2();
totalToken2();
} else {
JOptionPane.showMessageDialog(rootPane, "Please
choose java file");
}
} else {
System.out.println("gagal membaca file");
}
}
private void similar() {
jTextArea1.setText("");
jTextArea2.setText("");
String src1 = "C:\\LOG\\similar1.txt";
String src2 = "C:\\LOG\\similar2.txt";
String source1 = Baca_File.bacaFile(src1);
String source2 = Baca_File.bacaFile(src2);
StringTokenizer st = new StringTokenizer(source1, "\n");
StringTokenizer st2 = new StringTokenizer(source2, "\n");
String teks1 = "";
String teks2 = "";
while (st.hasMoreTokens()) {
teks1 += st.nextToken() + "\n";
}
while (st2.hasMoreTokens()) {
teks2 += st2.nextToken() + "\n";
}
jTextArea1.setText(teks1);
jTextArea2.setText(teks2);
}
private void notsimilar() {
jTextArea1.setText("");
jTextArea2.setText("");
String src1 = "C:\\LOG\\notsimilar1.txt";
String src2 = "C:\\LOG\\notsimilar2.txt";
String source1 = Baca_File.bacaFile(src1);
String source2 = Baca_File.bacaFile(src2);
StringTokenizer st = new StringTokenizer(source1, "\n");
StringTokenizer st2 = new StringTokenizer(source2, "\n");
String teks1 = "";
String teks2 = "";
while (st.hasMoreTokens()) {
teks1 += st.nextToken() + "\n";
}
while (st2.hasMoreTokens()) {
teks2 += st2.nextToken() + "\n";
}
jTextArea1.setText(teks1);
jTextArea2.setText(teks2);
}
private void showResult() {
jTextArea1.setText("");
jTextArea2.setText("");
String src1 = "C:\\LOG\\Analisis Leksikal File 1.txt";
String src2 = "C:\\LOG\\Analisis Leksikal File 2.txt";
String source1 = Baca_File.bacaFile(src1);
String source2 = Baca_File.bacaFile(src2);
StringTokenizer st = new StringTokenizer(source1, "\n");
StringTokenizer st2 = new StringTokenizer(source2, "\n");
String teks1 = "";
String teks2 = "";
while (st.hasMoreTokens()) {
teks1 += st.nextToken() + "\n";
}
while (st2.hasMoreTokens()) {
teks2 += st2.nextToken() + "\n";
}
jTextArea1.setText(teks1);
jTextArea2.setText(teks2);
}
private void hapusFile() {
File f1 = new File("C:\\LOG\\similar1.txt");
File f2 = new File("C:\\LOG\\similar2.txt");
File f3 = new File("C:\\LOG\\notsimilar1.txt");
File f4 = new File("C:\\LOG\\notsimilar2.txt");
f1.delete();
f2.delete();
f3.delete();
f4.delete();
}
long start;
long end;
private void perhitunganKemiripan() {
start = System.currentTimeMillis();
String path3 = "C:\\LOG\\Analisis Leksikal File 1.txt";
String path4 = "C:\\LOG\\Analisis Leksikal File 2.txt";
String simpan = "C:\\LOG\\similar1.txt";
String simpan2 = "C:\\LOG\\similar2.txt";
String simpan3 = "C:\\LOG\\notsimilar1.txt";
String simpan4 = "C:\\LOG\\notsimilar2.txt";
String teks = Baca_File.bacaFile(path3);
String teks2 = Baca_File.bacaFile(path4);
StringTokenizer st = new StringTokenizer(teks, "\n");
StringTokenizer st2 = new StringTokenizer(teks2, "\n");
int i = 0, x = 0, found = 0, notfound = 0;
String[] f1 = new String[st.countTokens()];
String[] f2 = new String[st2.countTokens()];
if (st2.countTokens() > st.countTokens()) {
int totToken = st2.countTokens() - st.countTokens();
while (st2.hasMoreTokens()) {
while (st.hasMoreTokens()) {
f1[i] = st.nextToken();
f2[x] = st2.nextToken();
if (f1[i].equals(f2[x])) {
found = found + 1;
Baca_File.tulisFile(f1[i], simpan);
Baca_File.tulisFile(f2[x], simpan2);
} else {
notfound = notfound + 1;
Baca_File.tulisFile(f1[i], simpan3);
Baca_File.tulisFile(f2[x], simpan4);
}
x++;
}
double tot = found + notfound;
int total = found + notfound;
double persen = (found / tot) * 100;
jmlKesamaan.setText(String.valueOf(found));
notsimilar.setText(String.valueOf(notfound));
total_sintaks.setText(String.valueOf(total));
hasil.setText(String.format("%.2f", persen) + "
%");
if (persen >= 70) {
jRadioButton1.setSelected(true);
} else {
jRadioButton2.setSelected(true);
}
end = System.currentTimeMillis();
waktu.setText(String.format("%.2f", (end - start)
/ 1000.00) + " seconds");
i++;
break;
}
} else {
int totToken = st.countTokens() - st2.countTokens();
while (st.hasMoreTokens()) {
while (st2.hasMoreTokens()) {
f1[i] = st.nextToken();
f2[x] = st2.nextToken();
if (f1[i].equals(f2[x])) {
found = found + 1;
Baca_File.tulisFile(f1[i], simpan);
Baca_File.tulisFile(f2[x], simpan2);
} else {
notfound = notfound + 1;
Baca_File.tulisFile(f1[i], simpan3);
Baca_File.tulisFile(f2[x], simpan4);
}
x++;
}
double tot =
Double.parseDouble(totalToken1.getText());
int total =
Integer.parseInt(totalToken1.getText());
double persen = (found / tot) * 100;
jmlKesamaan.setText(String.valueOf(found));
notsimilar.setText(String.valueOf(notfound));
total_sintaks.setText(String.valueOf(total));
hasil.setText(String.format("%.2f", persen) + "
%");
if (persen >= 70) {
jRadioButton1.setSelected(true);
} else {
jRadioButton2.setSelected(true);
}
end = System.currentTimeMillis();
waktu.setText(String.format("%.2f", (end - start)
/ 1000.00) + " seconds");
i++;
break;
}
}
}
private void tulisSource1() {
String input1 = "C:\\LOG\\source1.java";
Baca_File.write(jTextArea1.getText(), input1);
Proses.Analisis_Leksikal lexer = new
Proses.Analisis_Leksikal("C:\\LOG\\source1.java");
try {
BufferedWriter writer = new BufferedWriter(new
FileWriter("C:\\LOG\\Analisis Leksikal File 1.txt"));
Proses.Token t;
while ((t = lexer.nextToken()) != null) {
writer.write(t.toString());
writer.newLine();
}
writer.close();
sort.sortFile();
jumlah();
jumlahLexem();
jumlahSimbol();
totalToken();
} catch (IOException ieo) {
ieo.addSuppressed(ieo);
}
}
private void tulisSource2() {
String input1 = "C:\\LOG\\source2.java";
Baca_File.write(jTextArea2.getText(), input1);
Proses.Analisis_Leksikal lexer = new
Proses.Analisis_Leksikal("C:\\LOG\\source2.java");
try {
BufferedWriter writer = new BufferedWriter(new
FileWriter("C:\\LOG\\Analisis Leksikal File 2.txt"));
Proses.Token t;
while ((t = lexer.nextToken()) != null) {
writer.write(t.toString());
writer.newLine();
}
writer.close();
sort.sortFile2();
jumlah2();
jumlahLexem2();
jumlahSimbol2();
totalToken2();
} catch (IOException ieo) {
ieo.addSuppressed(ieo);
}
}

Download

skripsi deteksi kemiripan source code pada bahasa

Products

Support

skripsi deteksi kemiripan source code pada bahasa

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib