PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PENGENALAN POLA CITRA PENYAKIT TANAMAN PADI PADA DAUN MENGGUNAKAN GABOR WAVELET DAN ALGORITMA KMEANS JUDUL SKRIPSI SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh: DHIAH RUSDIANA PRIINDARYANTI NIM. 115314037 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017 i PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI IMAGE PATTERN RECOGNITION IN LEAVES OF RICE PLANT DISEASES USING GABOR WAVELET AND K-MEANS ALGORITHM HALAMAN JUDUL (Bahasa Inggris) THESIS Presented as Partitial Fulfilment of The Requirements To Obtain Sarjana komputer degree In Informatics Engineering Department By : DHIAH RUSDIANA PRIINDARYANTI Student Number : 115314037 INFORMATICS ENGINEERING STUDY PROGRAM INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2017 ii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI iii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI iv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PERNYATAAN KEASLIAN KARYA Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah. v PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Saya yang bertanda tangan di bawah ini, mahasiswa Universitas Sanata Dharma nama : Dhiah Rusdiana Priindaryanti nomor mahasiswa : 115314037 Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul: PENGENALAN POLA CITRA PENYAKIT TANAMAN PADI PADA DAUN MENGGUNAKAN GABOR WAVELET DAN ALGORITMA K-MEANS Dengan demikian saya memeberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikannya di internet atau media lain untuk kepentingan akademik tanpa perlu meminta ijin dari saya maupun memberi royalti kepada saya selama mencantumkan nama saya sebagai penulis. Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di Yogyakarta Pada tanggal 31 Januari 2017 Yang menyatakan, Dhiah Rusdiana Priindaryanti vi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ABSTRAK Penelitian ini bertujuan membuat sistem untuk mengelompokkan penyakit yang menyerang daun padi. Penelitian ini menggunakan dua jenis penyakit, yaitu : Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae. Penelitian ini menggunakan 20 data berupa citra. Setiap citra dirubah menjadi data vektor menggunakan filter gabor wavelet. Penelitian ini menggunakan metode K-Means Clustering untuk pengelompokan penyakit. Data pada penelitian ini berupa data vektor. Proses penelitian ini melalui tahap preprocessing, clustering, dan uji akurasi. Preprocessing meliputi filter gabor wavelet untuk mengambil data vektor dari citra asli. Clustering menggunakan K-Means dengan menentukan titik awal secara manual dan menghitung kemiripan dengan menggunakan Euclidean Distance. Pengujian akurasi secara mandiri dengan membandingkan sistem dan manual. Akurasi tertinggi sebesar 70% dan akurasi terendah 55% dari 100 uji akurasi. Data yang digunakan sebanyak 20 data. Hasil akurasi tertinggi dengan perbandingan antara sistem dan manual. Kata Kunci: Penyakit padi pada daun, Filter Gabor Wevelet, K-Means Clustering, Euclidean Distance, Akurasi. vii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ABSTRACT This research aims to create a system to clustering diseases that attacked in rice leaves. This research used two types of diseases: Cochliobolus Miyabeanus and Xanthomonas oryzae pv. Oryzae. This research used 20 data in the form of images. Each image is converted into vector data using filter Gabor wavelet. This research used K-Means Clustering method to clustering of the disease. The data on this research in the form of vector data. This research process through stages of preprocessing, clustering, and test the accuracy. Preprocessing included Gabor wavelet filters for vector data from the original image. The Clustering used KMeans by choosing the start point and manually calculate the similarities by using Euclidean Distance. Accuracy Test independently compare between systems and manual. Highest accuracy of 70% and accuracy of the lowest 55% of the 100 test accuracy. The data used as many as 20 data. The results of highest accuracy with comparison between systems and manual. Keywords: Rice disease on the leaves, Filter Gabor Wavelet, K-Means Clustering, Euclidean Distance, Accuracy. viii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI KATA PENGANTAR Dengan mengucap puji syukur kepada Tuhan Yang Maha Esa atas kasih dan anugerahNya yang telah memberi kesempatan bagi penulis untuk dapat menyelesaikan laporan tugas akhir dengan judul “Pengenalan Pola Citra Penyakit Tanaman Padi Pada Daun Menggunakan Gabor Wavelet Dan Algoritma K-Means”. Laporan tugas akhir merupakan salah satu persyaratan bagi para mahasiswa/mahasiswi untuk dapat menyelesaikan jenjang pendidikan S1 pada Program Studi Teknik Mesin, Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta. Dalam laporan tugas akhir ini membahas mengenai perancangan, pembuatan kincir angin sumbu horizontal jenis propeler, dan perbandingan daya. Dalam kesempatan ini, penulis ingin mengucapkan banyak terima kasih kepada: 1. Bapak Sudi Mungkasi,S.Si.,M.Math.Sci.,PhD., selaku Dekan Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta. 2. Ibu Dr. Anastasia Rita Widiarti, S.Si., M.Kom selaku Ketua Program Studi Teknik Informatika. 3. Ibu Sri Hartati Wijono, S.Si., M.Kom selaku Dosen Pembimbing Tugas Akhir. 4. Bapak J.B. Budi Darmawan, S.T., M.Sc. selaku Dosen Pembimbing Akademik. 5. Seluruh dosen program studi Teknik Informatika yang telah mendidik dan memberikan ilmu pengetahuan kepada penulis. 6. Seluruh staf Fakultas Sains dan Teknologi atas kerja sama dan dukungan kepada penulis untuk dapat menyelesaikan laporan tugas akhir. 7. Bapak Suyana dan Ibu Eka Mardayanti sebagai orang tua dari penulis, serta Rahmad Anwar Rhomadhoni sebagai saudara dari penulis yang selalu berdoa, mendukung secara material dan yang lain – lain kepada penulis. 8. Sisil, Vina, Pasca, Simeon, Enda, temen-temenku seperjuangan yang selalu memberi semangat dan hiburan. 9. Teguh, Bianca dan Zahra Squad sebagai teman, sahabat dan keluarga baru yang selalu memberi semangat dan dukungan. ix PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10. Teman-teman Teknik Informatika, angkatan 2011, yang telah memberi saran, kritik, dan dukungan kepada penulis dalam menyelesaikan tulisan ini. Penulis menyadari bahwa masih ada kekurangan yang perlu diperbaiki. Oleh karena itu, penulis mengharapkan saran dan kritik yang membangun untuk menyempurnakan laporan tugas akhir. Semoga bermanfaat bagi semua pihak. Yogyakarta, 31 Januari 2017 Penulis x PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR ISI JUDUL SKRIPSI ..................................................................................................................................... i HALAMAN JUDUL (Bahasa Inggris) ................................................................................................... ii HALAMAN PERSETUJUAN.............................................................. Error! Bookmark not defined. HALAMAN PENGESAHAN................................................................................................................ iv PERNYATAAN KEASLIAN KARYA ................................................................................................. v LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI................................................................. vi ABSTRAK ............................................................................................................................................ vii ABSTRACT......................................................................................................................................... viii KATA PENGANTAR ........................................................................................................................... ix DAFTAR ISI.......................................................................................................................................... xi DAFTAR GAMBAR ........................................................................................................................... xiv DAFTAR TABEL................................................................................................................................. xv BAB I ...................................................................................................................................................... 1 PENDAHULUAN .................................................................................................................................. 1 1.1 Latar Belakang .............................................................................................................................. 1 1.2 Rumusan Masalah ......................................................................................................................... 2 1.3 Tujuan ........................................................................................................................................... 2 1.4 Batasan Masalah ........................................................................................................................... 2 1.5 Manfaat Penelitian ........................................................................................................................ 2 1.6 Metodologi Penelitian ................................................................................................................... 2 1.7 Luaran Penelitian .......................................................................................................................... 3 1.8 Sistematika Penulisan ................................................................................................................... 4 2.1 Teori Pola ................................................................................................................................ 6 2.1.1 Pengertian Pola ...................................................................................................................... 6 2.1.2 Ciri-Ciri Pola .......................................................................................................................... 6 2.1.3 2.2 Sistem pengenalan pola................................................................................................... 6 Distance (Jarak) ...................................................................................................................... 8 a. Euclidean Distance.................................................................................................................. 8 b. Normalized Euclidean Distance .............................................................................................. 8 2.3 Citra......................................................................................................................................... 9 2.3.1 Pengertian .............................................................................................................................. 9 2.3.2 Macam-macam Citra .............................................................................................................. 9 xi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2.3.3 Jenis-jenis Citra Digital ........................................................................................................ 10 2.4 Format File Citra ................................................................................................................... 11 a. Bipmap (.bmp) ...................................................................................................................... 11 b. Portable Network Graphics (.png) ........................................................................................ 11 c. JPEG (.jpg) ............................................................................................................................ 11 2.5 Teori Warna dan Texture ............................................................................................................ 12 2.5.1 Warna ................................................................................................................................... 12 2.5.2 Tekstur ................................................................................................................................. 13 2.6 Filter Gabor Wavelet................................................................................................................... 13 2.7 Algoritma K-Means Clustering................................................................................................... 15 BAB III ................................................................................................................................................. 19 PERANCANGAN SISTEM ................................................................................................................. 19 3.1 DATA ......................................................................................................................................... 19 3.1.2 Data vektor ........................................................................................................................... 21 3.2 DESKRIPSI SISTEM ................................................................................................................. 21 3.3 MODEL ANALISIS ................................................................................................................... 21 3.3.1 Preprocessing Citra .............................................................................................................. 22 3.3.2 K-Means Clustering ............................................................................................................. 22 3.3.3. Perancangan hitung akurasi ................................................................................................ 23 3.4 KEBUTUHAN HARDWARE DAN SOFTWARE.................................................................... 23 3.4.1 Hardware .............................................................................................................................. 23 3.4.2 Software ............................................................................................................................... 23 BAB IV ................................................................................................................................................. 24 IMPLEMENTASI SISTEM.................................................................................................................. 24 4.1 IMPLEMENTASI ....................................................................................................................... 24 4.1.1 Preprocessing ....................................................................................................................... 24 4.1.2 K-Means Clustering ...................................................................................................... 26 4.1.3 Hitung akurasi ...................................................................................................................... 37 BAB V .................................................................................................................................................. 42 PENGUJIAN DAN ANALISA HASIL ................................................................................................ 42 5.1 ANALISIS HASIL...................................................................................................................... 42 5.1.1 UJI AKURASI ..................................................................................................................... 42 PENUTUP ............................................................................................................................................ 47 5.1 Kesimpulan ................................................................................................................................. 47 DAFTAR PUSTAKA ........................................................................................................................... 49 LAMPIRAN.......................................................................................................................................... 50 xii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI LAMPIRAN I ....................................................................................................................................... 51 I. Data vektor .................................................................................................................................... 51 LAMPIRAN II .................................................................................................................................. 56 II. PROGRAM .................................................................................................................................. 57 xiii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR GAMBAR Gambar 3. 1 Penyakit Cochliobolus Miyabeanus (Bercak Coklat) ...................................................... 20 Gambar 3. 2 Penyakit Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) ........................................... 20 Gambar 3. 3 Model Analisis ................................................................................................................. 21 Gambar 4. 1 Contoh Citra Penyakit ...................................................................................................... 24 Gambar 4. 2 Tampilan Antarmuka ....................................................................................................... 26 Gambar 4. 3 Tampilan Cari .................................................................................................................. 27 Gambar 4. 4 Mencari Data dalam File .................................................................................................. 28 Gambar 4. 5 Menampilkan File data1................................................................................................... 28 Gambar 4. 6 Mencari File data2............................................................................................................ 29 Gambar 4. 7 Menampilkan File data2................................................................................................... 29 Gambar 4. 8 Tampilan Proses ............................................................................................................... 30 Gambar 4. 9 Tampilan Memilih Titik Awal ......................................................................................... 34 Gambar 4. 10 Tampilan Proses dan Hasil K-Means ............................................................................. 35 xiv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR TABEL Tabel 5. 1 Hasil Uji Akurasi ................................................................................................................. 42 xv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB I PENDAHULUAN 1.1 Latar Belakang Pada zaman globalisasi ini masih banyak petani padi yang tidak mengenali jenis-jenis penyakit pada tanaman padi mereka. Banyak sekali penyakit-penyakit pada tanaman padi, sehingga membuat petani sulit mengetahui tanaman padi yang terkena penyakit. Dengan begitu banyak juga yang tidak bisa mengelompokan penyakit tanaman padi pada daun yang terkena penyakit, misalnya disebabkan fungi(jamur) dan bakteri. Pengetahuan tentang penyakit-penyakit padi dan pengelompokan penyakit hanya berdasarkan pengalaman, penyuluhan dan belum bersifat komputerisasi yang dalam sewaktu-waktu dapat dengan mudah menambah data baru tentang penyakit dan hama terbaru dengan mengelompokan penyakit padi yang baru dimasukan dalam sistem, sehingga petani dapat mengetahui dan memahami kelompok penyakit tersebut. Pengelompokan penyakit ini berdasarkan jenis penyakit dan bentuk bercak pada daun padi. Dalam hal ini diperlukan suatu metode untuk merumuskan masalah tersebut. Metode yang dipakai adalah citra digital dengan mengolah gambar penyakit tanaman padi pada daun menggunakan Gabor Wavelet dan K-Means Clustering. Masalah yang dibahas meliputi pada tanaman padi pada daun yaitu Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae. Dari masalah tersebut penulis akan membuat sistem pengenalan pola citra penyakit tanaman padi pada daun menggunakan Gabor Wavelet dengan algoritma K-Means Clustering, untuk mengelompokan penyakit pada tanaman padi. Sistem ini juga dapat membantu petani padi mengelompokan penyakit pada tanaman padi dengan cara mengambil gambar pada padi yang terserang penyakit agar gambar dapat diproses untuk di masukkan pada sistem tersebut. 1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2 Dengan begitu petani dapat mengelompokan penyakit pada tanaman padi dengan memasukkan citra tanaman padi yang sedang terkena penyakit, yaitu pada daun, kemudian akan didapatkan sebuah vektor dengan menggunakan Gabor Wavelet kemudian akan dikelompokkan menggunakan algoritma KMeans Clustering sehingga mengetahui kelompok penyakit tanaman padi. 1.2 Rumusan Masalah 1. Bagaimana mengelompokan penyakit Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae pada daun tanaman padi? 2. Bagaimana membuat fitur vector Gabor Wavelet dari citra asli? 1.3 Tujuan 1. Untuk membantu petani mengelompokan dan mengenali penyakit Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae pada daun tanaman padi. 1.4 Batasan Masalah Dalam tugas akhir ini penulis menentukan beberapa batasan masalah untuk mempersempit lingkup permasalahan, antara lain: 1. Data citra yang dipakai hanya berupa citra berwarna RGB 2. Tipe data citra yang dipakai hanya bertipe .JPG dan.JPEG 3. Penyakit dibatasi yang disebabkan oleh bakteri dan jamur yaitu Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae 4. Hanya diproses melalui citra foto daun. 1.5 Manfaat Penelitian Manfaat yang didapat dari penelitian ini : 1. Membantu memudahkan masyarakat untuk mengetahui penyakit Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae pada tanaman padi. 1.6 Metodologi Penelitian Metodologi yang digunakan yaitu: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3 1. Studi pustaka menegenai metode pengolahan citra 2. Pengembangan program menggunakan Langkah-langkah: System Engineering dan analysis. Mengumpulkan data menentukan semua kebutuhan elemen sistem Software Requirement Analysis. Melakukan analisis terhadap permasalahan yang dihadapi dan menetapkan kebutuhan software. Kebutuhan tersebut meliputi Netbeans 7.3 dan Matlab Design. Proses menterjemahkan kebutuhan sistem kedalam sebuah gambaran program. Desain akan menjadi dokumen dari program. Coding. Pengkodean merupakan proses penterjemahan desain ke dalam bentuk yang dapat dieksekusi. Testing. Proses pengujian memastikan apakah semua fungsi-fungsi program berjalan dengan baik dan menghasilkan output yang sesuai dengan yang dibutuhkan. 1.7 Luaran Penelitian Luaran penelitian ini adalah sebuah aplikasi yang mampu mengelompokan penyakit pada tanaman padi. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4 1.8 Sistematika Penulisan BAB I. PENDAHULUAN Bab ini menjelaskan tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan penulisan, manfaat penelitian, metodologi penelitian yang digunakan dan sistematika penulisan dari tugas akhir ini. BAB II. LANDASAN TEORI Bab ini membahas tentang landasan teori yang digunakan dalam tugas akhir ini, yaitu: pengertian pola, pengertian citra, jenis-jenis citra, sistem pencitraan, dan teori texture dengan menggunakan Gabor Wavelet BAB III. PERANCANGAN SISTEM Bab ini membahas membahas analisis masalah yang mempermudah dalam menyusun rancangan disain. Analisis ini terdiri dari spesifikasi perangkat lunak, spesifikasi perangkat keras dan sistem yang akan dikembangkan. Hasil rancangan program terdiri dari rancangan antarmuka grafis yang akan diterapkan dalam pembuatan aplikasi. BAB IV. IMPLEMENTASI Bab ini membahas tentang langkah-langkah implementasi dan hasil program yang terdiri dari tampilan program, alur program dan penjelasan program. BAB V. PENGUJIAN DAN ANALISA HASIL Bab ini membahas tentang uji akurasi dan menganalisa hasil akhir. Hasil dari implementasi di bab iv akan di uji dan di analisa lebih lanjut. BAB VI. KESIMPULAN DAN SARAN PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 5 Bab ini menjelaskan tentang kesimpulan dari uji coba perangkat lunak dan saran untuk pengembangan, perbaikan serta penyempurna terhadap aplikasi yang telah dibuat. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB II LANDASAN TEORI 2.1 Teori Pola 2.1.1 Pengertian Pola Pengenalan pola adalah suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu obyek.Pola adalah entitas yang terdefinisi dan dapat diidentifikasi melalui ciri-cirinya. Ciri-ciri tersebut digunakan untuk membedakan suatu pola dengan pola lainnya. Ciri yang bagus adalah ciri yang memiliki daya pembeda yang tinggi, sehingga pengelompokan pola berdasarkan ciri yang dimiliki dapat dilakukan dengan keakuratan yang tinggi. 2.1.2 Ciri-Ciri Pola Ciri pada suatu pola diperoleh dari hasil pengukuran terhadap objek uji. Khusus pada pola yang terdapat di dalam citra, ciri-ciri yang dapat diperoleh berasal dari informasi: a. Spasial: intensitas pixel, histogram b. Tepi: arah, kekuatan c. Kontur: garis, elips, lingkaran d. Wilayah/bentuk: keliling, luas, pusat massa e. Hasil transformasi Fourier: frekuensi. 2.1.3 Sistem pengenalan pola Pengenalan pola bertujuan menentukan kelompok atau kategori pola berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata lain, pengenalan pola membedakan suatu objek dengan objek lain. Terdapat 6 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 7 dua pendekatan yang dilakukan dalam pengenalan pola, yaitu pendekatan secara statistik dan pendekatan secara sintaktik atau struktural. Pendekatan ini menggunakan teori-teori ilmu peluang dan statistik. Ciri-ciri yang dimiliki oleh suatu pola ditentukan distribusi statistiknya. Pola yang berbeda memiliki distribusi yang berbeda pula. Dengan menggunakan teori keputusan di dalam statistik, kita menggunakan distribusi ciri untuk mengklasifikasikan pola. Gambar 2. 1 Sistem Pengenalan Pola dengan Pendekatan Statistik a. Pengenalan pola secara Sintaktik Pendekatan ini menggunakan teori bahasa formal. Ciri-ciri yang terdapat pada suatu pola ditentukan primitif dan hubungan struktural antara primitif kemudian menyusun tata bahasanya. Dari aturan produksi pada tata bahasa tersebut kita dapat menentukan kelompok pola. Gambar 2. 2 Sistem pengenalan pola dengan pendekatan sintaktik PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 8 2.2 Distance (Jarak) Jarak digunakan untuk menentukan tingkat kesamaan (similarity degree) atau ketidaksamaan (dissimilarity degree) dua vektor fitur. Tingkat kesamaan berupa suatu nilai dan berdasarkan sekor tersebut dua vektor fitur akan dikatakan mirip atau tidak. Metode jarak yang dapat digunakan untuk mengukur tingkat kemiripan dua vektor fitur adalah : a. Euclidean Distance Euclidean Distance adalah metrika yang paling digunakan untuk menghitung kesamaan 2 vektor. Euclidean Distance menghitung akar dari kuadrat perbedaan 2 vektor. Rumus dari Euclidean distance: .............................................. 2.1 b. Normalized Euclidean Distance Jarak Euclidean ternomalisasi dari dua vektor ciri u dan v adalah: ............................................ 2.2 dengan: .............................................. 2.3 disebut norm dari v yang dinyatakan sebagai: .............................................2.4 Semakin kecil skor maka semakin mirip kedua vektor fitur yang di cocokkan. Sebaliknya semakin besar skor maka PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 9 semakin berbeda kedua vektor ciri. Sifat dari jarak Euclidean ternomalisasi adalah hasilnya berada pada rentang Normalized Euclidean distance dari vektor A dan B diatas adalah: ............... 2.5 ................2.6 ...............2.7 ................2.8 .................2.10 .................2.11 2.3 Citra 2.3.1 Pengertian Citra adalah suatu representasi (gambaran), kemiripan atau imitasi dari suatu objek. Citra sebagai keluaran suatu sistem perekaman data dapat bersifat optic berupa foto, bersifat analog berupa sinyal-sinyal video seperti gambar pada monitor televise, atau bersifat digital yang dapat langsung disimpan pada suatu media penyimpan. 2.3.2 Macam-macam Citra 2.3.2.1 Citra Analog Citra analog adalah citra yang bersifat kontinu, seperti gambar pada monitor televise, fotosinar X, foto yang di cetak di kertasfoto, lukisan, pemandangan alam, hasil CT scan, gambargambar yang terekam pada pita kaset, dan lain sebagai. Citra PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10 analog tidak dapat direpresentasikan dalam komputer sehingga tidakbisa diproses di komputer secara langsung. 2.3.2.1 Citra Digital Citra digital adalahcitra yang dapat diolah oleh komputer. Sebuah citra grayscale ukuran 150x150 piksel (elemen terkecil dari sebuah citra) diambil sebagai (kotak kecil) berukuran 9x9 piksel.Maka, monitor akan menampilkan sebuah kotak kecil. Namun, yang disimpan dalam memori komputer hanyalah angka-angka yang menunjukan besar intensitas pada masingmasing piksel tersebut. 2.3.3 Jenis-jenis Citra Digital 2.3.3.1Citra Biner (Monokrom) Banyaknya warna 2, yaitu hitam dan putih. Dibutuhkan 1 bit di memori untuk menyimpan kedua warna ini. Gradiasi warna: 0 1 bit 0 : warna hitam bit 1 : warna putih 2.3.3.2 Citra Grayscale (Skala Keabuan) Banyak warna tergantung pada jumlah bit yang disediakan di memori untuk menampung kebutuhan warna ini. Citra 2 bit mewakili dengan gradiasi warna berikut: 0 1 2 3 Citra 3 bit mewakili 8 warna dengan gradiasi warna berikut: 0 1 2 3 4 5 6 7 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11 2.3.3.3 Citra Warna (True Color) Setiap pixel pada citra warna yang merupakan kombinasi dari tiga warna dasar, yaitu RGB (Red Green Blue). Setiap warna dasar menggunakan penyimpanan 8 bit =1 byte, yang berarti setiap warna mempunyai gradiasi sebanyak 255 warna. Setiap pixel mempunyai kombinasi warna sebanyak 28.28.28=224= 16 juta warna lebih. Dengan begitu maka dinamakan true color karena mempunyai jumlah warna yang cukup besar sehingga bisa dikatakan hamper mencakup semua di alam. 2.4 Format File Citra Format file citra standar yang digunakan saat ini terdiri dari beberapa jenis. Format-format ini digunakan dalam menyimpan citra dalam sebuah file. Setiap format memiliki karakteristik masing-masing. Berikut ini beberapa format umum yang digunakan saat ini: a. Bipmap (.bmp) Format .bmp adalah format penyimpanan standar tanpa kompresi yang umum dapat digunakan untuk menyimpan citra biner hingga citra warna. Format ini terdiri dari beberapa jenis yang setiap jenisnya ditentukan dengan jumlah bit digunakan untuk menyimpan nilai pixel. b. Portable Network Graphics (.png) Format .png adalah format penyimpanan citra terkompresi. Format ini dapat digunakan pada citra grayscale, citra dengan palet warna, dan juga citra fullcolor. c. JPEG (.jpg) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 12 Format .jpg adalah format yang sangat umum digunakan saat ini khususnya untuk transmisi citra. Format ini digunakan untuk menyimpan citra hasil kompresi dengan metode JPEG. 2.5 Teori Warna dan Texture 2.5.1 Warna Citra berdasarkan warna yang dikandungnya adalah salah satu teknik yang paling banyak digunakan. Secara umum feature warna hanya memperhatikan distribusi warna piksel-piksel dalam citra tanpa memperhatikan ukuran dan orientasi posisi citra.. Berikut merupakan proses pengklasifikasian dengan menghitung rata-rata nilai Red, Green, dan Blue (RGB) : ...................................... 2.12 ........................................ 2.13 ........................................ 2.14 ........................................ 2.15 ......................................... 2.16 ………………................... 2.17 Keterangan: = rata-rata Red = rata-rata Green = rata-rata Blue PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 13 = nilai piksel Red = nilai piksel Green = nilai piksel Blue M = lebar citra (kolom matriks) N = tinggi citra (baris matriks) 2.5.2 Tekstur Tekstur adalah tampilan permukaan (corak) dari suatu benda yang dapat dinilai dengan cara dilihat atau diraba. Yang pada prakteknya, tekstur sering dikategorikan sebagai corak dari suatu permukaan benda, misalnya permukaan karpet, baju, kulit kayu, dan lain sebagainya. Pada suatu citra, tekstur merupakan komponen dasar pembentuk citra. Sehingga tekstur kerap kali digunakan sebagai pembeda antara satu citra dengan citra lainnya. 2.6 Filter Gabor Wavelet Filter Gabor merupakan sekelompok wavelet, dan setiap wavelet menyimpan energi pada frekuensi dan arah/ruang tertentu. Reprentasi Gabor Wavelet dari sebuah citra merupakan konvolusi citra dengan filter Gaboor gmn. Untuk setiap citra I(x,y) dengan ukuran PxQ, maka transformasi Gabor Wavelet Wmn didefinisikan (Manjunath, 1996) : gmn* merupakan complex conjugate dari gmn. gmn adalah fungsi self similar yang dibentuk dari proses dilasi dan rotasi terhadap mother wavelet G(x,y). Wmn merupakan hasil complex conjugate terhadap filter Gabor pada orientasi n dan skala m. Filter Gabor akan dihitung untuk S skala dan K orientasi ................2.18 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 14 ..................2.19 .................2.20 ...................2.21 ..................2.22 ..................2.23 ..................2.24 Dengan : m : skala =0,1,2,.......(S-1) n : orientasi =0,1,2,.......(K-1) Uh : Batas atas pusat frekuensi Ul : Batas bawah pusat frekuensi Self similar Gabor Wavelet adalah : gmn (x,y) = aS-mG(x’ , y’ ) x’=x cos +y sin y’=-x sin + y cos = PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 15 Setelah filter Gabor di konvolusi terhadap citra dengan skala m dan orientasi n, maka akan didapat energi citra pada skala dan orientasi yang berbeda : .................2.25 Untuk mendapatkan tekstur ciri dapat sebuah area atau citra, maka digunakan mean dan standar deviasi dari energi Emn tersebut. .................2.26 ................2.27 Vektor ciri f dari sebuah citra atau area dibuat menggunakan dan sebagai komponen ciri. ..................2.28 2.7 Algoritma K-Means Clustering Algoritma K-means merupakan algoritma pengelompokan iteratif yang melakukan partisi set data ke dalam sejumlah K cluster yang sudah ditetapkan di awal. Algoritma K-Means sederhana untuk diimplimentasikan dan dijalankan, relatif cepat, mudah beradaptasi, umum penggunaannya dalam praktek. Secara historis, K-Means menjadi salah satu algoritma yang paling penting dalam bidang data mining (Wu dan Kumar, 2009). Bentuk esensial K-Means ditemukan oleh sejumlah peneliti dari lintas disiplin ilmu. Yang paling berpengaruh adalah harus ada di pustaka, ambil salah satu saja dan masukkan ke pustaka. Algoritma K-Means berkembang hingga menjadi konteks yang lebih besar sebagai algoritma hill-climbing, seperti yang disampaikan oleh Gray dan Nuhoff(1998). PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 16 K-Means dapat diterapkan pada data yang direpresentasikan dalam rdimensi ruang tepat. K-means mengelompokkan set data r-dimensi, X={ᵡᵢǀ i=1, ..., N}, dimana ᵡᵢ € Rd yang menyatakan data ke-i sebagai “titik data”. Seperti yang dijelaskan sebelumnya bahwa K-Means mempartisi X ke dalam cluster, Algoritma K-Means mengelompokkan semua titik data dalam X sehingga setiap xi hanya jauh dalam satu dari K partisi. Yang perlu diperhatikan adalah titik berada dalam cluster yang mana, dilakukan dengan cara memberikan setiap titik sebuah ID cluster. Titik dengan ID cluster yang sama berarti beada dalam satu cluster yang sama, sedangkan titik dengan ID cluster yang berbeda berada dalam cluster yang berbeda. Untuk menyatakan hal ini, biasanya dilakukan dengan vektor keanggotaan cluster m dengan panjang N, dimana mi bernilai ID cluster titik xi. Dalam K-Means, setiap cluster dari K cluster diwakili oleh titik tunggal dalam Rd. Set representatif cluster dinyatakan C={cjǀ=1, ..., K}. Sejumlah K representatif cluster tersebut disebut juga sebagai cluster means atau cluster centroid (atau centroid saja). Untuk set data dalam X dikelompokkan berdasarkan konsep kedekatan atau kemiripan. Meskipun konsep yang dimaksud untuk data-data yang berkumpul dalam satu cluster adalah datadata yang mirip, tetapi kuantitas yang digunakan untuk mengukurnya adalah ketidakmiripan (dissimilarity). Artinya, data-data dengan ketidakmiripan (jarak) yang kecil/dekat maka lebih besar kemungkinannya untuk untuk bergabung dalam cluster. Metrik yang umum digunakan untuk ketidakmiripannya adalah Euclidean. Pada saat data sudah dihitung ketidakmiripan terhadap setiap centroid, maka selanjutnya dipilih ketidakmiripan yang paling kecil sebagai cluster yang akan diikuti sebagai relokasi data pada cluster di sebuah iterasi. Relokasi sebuah data dalam cluster yang diikuti dapat dinyatakan dengan nilai keanggotaan a yang bernilai 0 dan 1. Nilai 0 jika tidak menjadi anggota sebuah cluster dan 1 jika menjadi anggota sebuah cluster. Karena K-Means mengelompokkan secara tegas data hanya pada satu cluster, maka nilai a PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 17 sebuah data pada semua cluster, hanya satu yang bernilai 1, sedangkan lainnya 0 seperti dinyatakan persamaan berikut: ..................2.29 d(xi,cj) menyatakan ketidakmiripan (jarak) dari ke-i ke cluster cj. Langkah-langkah K-Means Clustering: 1. Analisasi: tentukan nilai K sebagai jumlah cluster yang diinginkan dan metrik ketidakmiripan (jarak) yang diinginkan. Kika perlu, tetapkan ambang batas perubahan fungsi objektif dan ambang batas perubahan posisi centroid. 2. Pilih K dari set data X sebagai centroid. 3. Alokasikan semua data ke centroid terdekat dengan metrik jarak yang sudah ditetapkan (memperbarui cluster ID setiap data). 4. Hitung kembali centroid C berdasarkan data yang mengikuti cluster masing-masing. 5. Ulangi langkah 3 dan 4 hingga kondisi konvergen tercapai, yaitu (a) perubahan fungsi objektif sudah di bawah ambang batas yang diinginkan; atau (b) tidak ada data yang berpindah cluster; atau (c) perubahan posisi centroid sudah di bawah ambang batas yang ditetapkan. Secara iteratif melakukan dua langkah berikut sampai tercapai kondisi konvergen: Langkah 1: Data assignment. Setiap data ditetapkan ke centroid terdekat dengan memecahkan hubungan apa adanya. Hasilnya berupa data yang terpartisi. Langkah 2: Relocation of “means”. Setiap representasi cluster direlokasi ke pusat (center) dengan rata-rata aritmatika dari semua data yang ditetapkan masuk ke dalamnya. Rasionalnya langkah ini didasarkan pada observasi bahwa dalam memberikan set titik, representasikan tunggal yang terbaik PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 18 untuk set tersebut (dalam hal meminimalkan jumlah kuadrat Euclidean di antara setiap titik data dan representatif) dalah dari rata-rata dari titik data. Hal ini jugalah yang menyebabkan metode ini sering disebut dengan cluster means atau cluster centroid, seperti nama yang dimiliki. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB III PERANCANGAN SISTEM 3.1 DATA Data yang digunakan pada penelitian ini adalah citra penyakit tanaman padi. Citra yang dikumpulkan hanya penyakit pada daun dan hanya dua penyakit yang dikumpulkan untuk penelitian yaitu Cochliobolus Miyabeanus (Bercak Coklat) dan Xanthomonas oryzae pv. Oryzae (Hawar Bakteri). Penulis mengumpulkan masing-masing 10 citra untuk setiap kelompok penyakit sehingga total citra yang digunakan sebagai data berjumlah 20 citra. Pengumpulan data dilakukan pada bulan Agustus sampai November 2015 secara manual yaitu menyalin citra penyakit tanaman padi dari pencarian di web page. Pencarian dan pengumpulan data menggunakan kueri Cochliobolus Miyabeanus dan Xanthomonas oryzae pv. Oryzae. Mencari kueri Cochliobolus Miyabeanus di google search image. Kemudian lihat satu gambar dan lihat keterangan gambar untuk dapat informasi mulai dari ciri-ciri penyakit bahwa gambar penyakit tersebut ialah penyakit Cochliobolus Miyabeanus File citra tersebut kemudian menjadi input pada sistem untuk diolah lebih lanjut. 19 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 20 3.1.1 Data Citra Penyakit 3.1.1.1 Citra Penyakit Cochliobolus Miyabeanus (Bercak Coklat) Gambar 3. 1 Penyakit Cochliobolus Miyabeanus (Bercak Coklat) 3.1.1.2 Citra Penyakit Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) Gambar 3. 2 Penyakit Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 21 3.1.2 Data vektor Data vektor dihasilkan menggunakan perintah pada Matlab yaitu untuk mendapatkan vector Gabor Wavelet dari data 20 citra. Data vektor tersebut dapat dilihat pada lampiran nomor 1 halaman 51. 3.2 DESKRIPSI SISTEM Setelah citra asli diubah menjadi vektor menggunakan filter gabor wevelet, maka vektor ini akan di proses menggunakan K-means Clustering untuk mengelompokan vektor-vektor dengan jenis penyakit yang sama. Data yang ada sebanyak 20 data vektor dengan dua jenis penyakit tanaman padi. Sistem ini menggunakan rumus jarak yaitu Euclidean Distance untuk menghitung jarak antara vektor satu ke vektor yang lain, kemudian dikelompokkan menggunakan rumus K-Means Clustering menjadi dua kelompok dengan menentukan titik awal dari dua vektor dengan dua jenis penyakit berbeda. Vektor yang mempunyai jarak yang terdekat maka akan menjadi satu kelompok. Dengan begitu akan menjadi dua kelompok vektor dengan centroid baru. Sistem ini akan dirancang seperti ini supaya mudah dimengerti dan dioperasikan. 3.3 MODEL ANALISIS Gambar 3. 3 Model Analisis PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22 3.3.1 Preprocessing Citra Preprocesing bertujuan untuk mengubah citra asli ke dalam data vektor menggunakan filter Gabor Wavelet. Pertama membaca gambar, kemudian gambar dirubah menjadi abu-abu. Mengubah size kolom dan baris sampai ukuran maksimal. . Filter Gabor Wavelet dari sebuah citra merupakan konvolusi citra dengan filter Gabor gmn. Filter Gabor Wavelet akan dihitung untuk skala dan orientasi. Setelah filter Gabor di konvolusi terhadap citra dengan skala m dan orientasi n, maka akan didapat energi citra pada skala dan orientasi yang berbeda. Untuk nilai F menggunakan perhitungan, yaitu : (kolom dikali dengan (skala dikurang 1) ditambah 1 sebanyak kolom, baris dikali dengan (orientasi dikurang 1) ditambah 1 sebanyak baris. Dari perhitungan tersebut di dapat mean dan standar deviasi untuk kolom dan baris. Vektor ciri dari sebuah citra dibuat menggunakan µmn dan σmn sebagai komponen ciri. 3.3.2 K-Means Clustering Proses K-Means Clustering ini pertama menentukan jumlah cluster yang diingikan untuk mengelompokkan data yang ada akan menjadi berapa kelompok. Kemudian pilih beberapa data sejumlah cluster sebagai centroid. Perbandingkan data centroid dengan data yang lainnya untuk mengetahui apakah data 1 dengan centroid mempunyai kemiripan atau tidak, jika mempunyai kemiripan maka akan menjadi satu kelompok dan begitu sebaliknya dengan mengitung menggunakan Euclidean Distance. Kemudian setelah perhitungan tersebut mendapatkan kelompok sejumlah cluster yang telah ditentukan, maka kita mendapatkan centroid baru dan membandingkan centroid baru dengan data yang lain dan mengulangi lagi lagi langkah perhitungan Euclidean Distance sampai cluster tidak berubah atau data akhirnya sudah sama. Lalu mendapatkan cluster akhir pengelompokan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 23 3.3.3. Perancangan hitung akurasi Hitung akurasi dengan cara membandingkan pengelompokan cluster dari sistem dengan cluster manual. Jika cluster sistem dengan cluster manual sama-sama satu kelompok maka dinilai benar tetapi jika ada yang tidak sama maka akan dinilai error. Menghitung akurasinya cluster 1 yang dinilai benar dengan cluster 2 yang dinilai benar akan dijumlahkan kemudian dibagi sejumlah data yang ada. Maka akan mendapatkan berapa persen tingkat akurasi. Hal tersebut dilakukan dengan semua data yang ada samapi mendapatkan titik akurasi paling tinggi dari semua data. 3.4 KEBUTUHAN HARDWARE DAN SOFTWARE 3.4.1 Hardware Spesifikasi perangkat keras yang digunakan untuk sistem yang akan dibangun adalah sebagai berikut: 1. Prosesor Intel Pentium 2. RAM minimal 1 GB 3. Monitor SVGA 4. Keyboard 5. Mouse 6. Kamera minimal 2 MP 3.4.2 Software Untuk menunjang kinerja perangkat keras yang ada, dibutuhkan perangkat lunak dengan spesifikasi sebagai berikut: 1. Sistem operasi minimal Windows 7 2. Bahasa pemrograman yang digunakan adalah java dengan Netbeans 7.3 dan Matlab R2012b. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB IV IMPLEMENTASI SISTEM 4.1 IMPLEMENTASI 4.1.1 Preprocessing Inputan citra asli Gambar 4. 1 Contoh Citra Penyakit Program untuk mengubah citra asli menjadi vektor. Memasukkan citra asli kedalam coding. Membaca citra menjadi abuabu. Kemudian di resize citra untuk memproses ukuran gambar sesuai. 24 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25 Output dari proses citra asli menjadi vektor PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26 4.1.2 K-Means Clustering 4.1.2.1 Tampilan Antarmuka Sistem Gambar 4. 2 Tampilan Antarmuka Ketika aplikasi pertama dibuka maka akan menampilkan frame utama untuk form percarian data yang akan diinput untuk tampilan data. Kemudian untuk form proses data yang sudah diinputkan dan akan dimunculkan kedalam form data 1 dan form data 2, selanjutkan dari form data 1 dan form data 2 tersebut dapat kita pilih data yang akan diproses kedalam KMeans Clustering. Proses K-Means Clustering untuk PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 27 mengelompokan data-data vektor yang paling dekat akan menjadi satu kelompok. 4.1.2.2 TAMPILAN CARI Gambar 4. 3 Tampilan Cari Frame ini akan menampilkan proses pencarian data. Jika mengklik button cari maka akan muncul form untuk mencari data akan diinput kedalam frame dengan memilih file yang data tersebut. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28 Button cari proses pencarian data dengan mencari letak file data yang ingin dibuka, jika file yang diingikan sudah terpilih maka dapat ditampilkan ke dalam frame tersebut. Gambar 4. 4 Mencari Data dalam File Jika file data sudah terpilih maka klik open untuk menampilkan data ke dalam frame tampilan. Gambar 4. 5 Menampilkan File data1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29 Frame ini menampilkan data yang sudah dicari dalam form pencarian dan ditampilkan di dalam scrollpane yang sudah tersedia. Gambar 4. 6 Mencari File data2 Frame ini menampilkan untuk pencarian file data yang kedua, karena file data yang digunakan dua maka mencari dan membuka dua kali untuk form pencarian. Gambar 4. 7 Menampilkan File data2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 30 Frame ini menampilkan jumlah file data yang sudah diinputkan ke dalam scrollpane. 4.1.2.3 TAMPILAN PROSES Gambar 4. 8 Tampilan Proses Frame ini menampilkan form proses data yang sudah diinput kedalam scrollpane untuk dimunculkan kedalam scrollpane, untuk proses pecarian data 1 maka akan muncul kedalam tampilan scrollpane data 1 dan untuk data 2 maka akan muncul kedalam tampilan scrollpane data 2. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 31 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 32 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 33 Form proses diatas dapat menampilkan data yang ada dalam vektor. Data tersebut ditampilkan kedalam from output data pada aplikasi untuk mengecek bahwa data yang tampil dalam scroll pane data 1 dan data 2 tersebut berisi data vektor sebanyak data yang diproses. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 34 Gambar 4. 9 Tampilan Memilih Titik Awal Frame ini menampilkan data 1 dan data dua dapat dipilih untuk menentukan titik awal data yang akan dihitung untuk K-Means Clustering dengan mengklik data-data yang diinginkan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 35 4.1.2.4 TAMPILAN PROSES K-MEANS Gambar 4. 10 Tampilan Proses dan Hasil K-Means Frame ini menampilkan perhitungan K-Means Clustering dengan menampilkan perhitungan centroid 1 dan centroid 2, membandingkan nilai terkecil atau perhitungan terdekat dengan titik awal maka dikelompokkan dengan menampilkan cluster. Cluster 1 untuk kelompok titik data awal 1 dan cluster 2 untuk titik data awal 2. Perhitungan ini menampilkan sampai beberapa iterasi. Iterasi akan berhenti atau selesai jika perhitungannya sama dan cluster sudah tidak berubah lagi. data PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 37 4.1.3 Hitung akurasi Menghitung akurasi dari pengelompokan K-means Clustering yaitu membandingkan tingkat kemiripan dari hasil perhitungan centroid 1 dan centroid 2. Misalnya membadingkan vektor 3 dengan vektor 13, untuk centrod 1 menghitung kemiripan vektor 3 dengan semua vektor dan untuk centroid menghitung kemiripan vektor 13 dengan semua vektor. Misal, mehitung tingkat kemiripan untuk vektor 3 dengan vektor 4 untuk centroid 1 dan menghitung vektor 13 dengan 4 untuk centroid 2, jika hasil perhitungan centroid 1 lebih kecil dari hasil PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 38 perhitungan centroid 2 maka vektor 4 masuk dalam kelompok centroid 1 dan begitu sebaliknya. Centroid 1: menghitung kemiripan vektor 3 ke semua vektor. Centroid 2: menghitung kemiripan vektor 13 ke semua vektor. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 39 Untuk cluster sistem menggunakan angka, karena hanya dua cluster maka angka yang digunakan 1 dan 2. Untuk cluster manual menggunakan abjad, cluster hanya dua sama seprti di cluster sistem. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 40 Gambar diatas untuk warna kuning kelompok cluster 1 yang benar dan untuk warna hijau kelompok cluster 2 yang benar. Cluster 1 : 8 centroid Cluster 2 : 5 centroid Untuk perbandingan antara sistem dengan manual menghasilkan penjumlahan cluster 1 dan cluster 2. Tingkat akurasi untuk perhitungan perbandingan vektor 3 dan vektor 13 adalah 65%. Jika sudah dapat pengelompokan cluster seperti diatas maka membandingkan angka 1 sama dengan huruf A dan angka 2 sama dengan huruf B. Jika cluster sistem 1 dan cluster manual A maka pengelompokannya benar, tetapi jika cluster sistem 1 dan cluster manual B maka disebut pengelompokan error dan begitu juga jika cluster sistem 2 dan cluster manual B maka pengelompokannya benar, tetapi jika cluster sistem 2 dan cluster manual A maka disebut pengelompokan error. Menghitung akurasi cluster untuk cluster sistem 1 dan cluster manual A dihitung yang sama, dan untuk cluster sistem 2 dan cluster manual B dihitung yang sama. Kemudian centroid 1 dan centroid dua yang bernilai benar dijumlahkan. Misalnya, gambar diatas yang bernilai benar untuk centroid 1 berjumlah 8 dengan warna kuning dan bernilai benar untuk centroid 2 berjumlah 5 dengan warna hijau. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 41 Cluster 1 dan cluster 2 di jumlahkan yaitu 8+5= 13. Kemudian hasil penjumlahannya dibagi dengan jumlah vektor yang ada dan di sistem tersebut ada 20 data, maka 13/20= 0,65 hasil tersebut diubah menjadi persen untuk hasil akurasi perbandingan pengelompokan vektor 3 dan vektor 13 maka hasilnya 0,65*100= 65%. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB V PENGUJIAN DAN ANALISA HASIL 5.1 ANALISIS HASIL 5.1.1 UJI AKURASI Uji akurasi ini dari data sebanyak 20 data dari dua penyakit yaitu Cochliobolus Miyabeanus(Bercak Coklat) dan Xanthomonas Oryzae pv. Oryzae (Hawar Bakteri) masing penyakit ada 10 data. Untuk akurasi ini setiap penyakit di ambil lima gambar atau vektor dengan jarak kemiripan paling jauh. 5.1.1.1 Hasil Uji Akurasi dari Perbandingan sistem dengan manual Tabel 5. 1 Hasil Uji Akurasi Titik Awal Centroid 1 Centroid 2 Vektor 1 Vektor 11 Vektor 1 Vektor 12 Vektor 1 Vektor 13 Vektor 1 Vektor 14 Vektor 1 Vektor 15 Vektor 1 Vektor 16 Vektor 1 Vektor 17 Vektor 1 Vektor 18 Vektor 1 Vektor 19 Vektor 1 Vektor 20 Vektor 2 Vektor 11 Vektor 2 Vektor 12 Vektor 2 Vektor 13 Vektor 2 Vektor 14 Vektor 2 Vektor 15 Vektor 2 Vektor 16 Vektor 2 Vektor 17 Vektor 2 Vektor 18 Vektor 2 Vektor 19 Vektor 2 Vektor 20 42 Akurasi 65% 65% 60% 60% 65% 60% 65% 65% 60% 60% 60% 55% 55% 60% 55% 55% 55% 60% 60% 60% PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 43 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 3 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 4 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 5 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 6 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 55% 55% 65% 60% 65% 60% 55% 60% 60% 60% 70% 55% 55% 55% 60% 55% 55% 60% 60% 55% 55% 55% 55% 65% 55% 55% 55% 60% 60% 55% 55% 55% 60% 65% 65% 60% 55% 70% 60% PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44 Vektor 6 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 7 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 8 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 9 Vektor 10 Vektor 10 Vektor 10 Vektor 10 Vektor 10 Vektor 10 Vektor 10 Vektor 10 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 Vektor 19 Vektor 20 Vektor 11 Vektor 12 Vektor 13 Vektor 14 Vektor 15 Vektor 16 Vektor 17 Vektor 18 55% 65% 65% 60% 60% 60% 60% 65% 60% 55% 55% 60% 60% 65% 55% 60% 60% 60% 60% 60% 55% 60% 60% 60% 60% 60% 60% 60% 60% 65% 60% 60% 55% 65% 55% 55% 60% 55% 65% PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 45 Vektor 10 Vektor 10 Vektor 19 Vektor 20 60% 55% 5.1.1.2 Kesimpulan akurasi Uji akurasi diperoleh dari data sebanyak 20 data vektor dari dua penyakit yaitu Cochliobolus Miyabeanus(Bercak coklat) dan Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) masingmasing penyakit ada 10 data vektor. Vektor-vektor pengujian didapat dengan membandingkan vektor 1 (citra 1) dengan semua vektor untuk satu kelompok penyakit Cochliobolus Miyabeanus(Bercak coklat) dan membandingan vektor 11 (citra 11) dengan semua vektor untuk satu kelompok Xanthomonas oryzae pv. Oryzae (Hawar Bakteri). Perhitungan akurasi dari pengelompokan K-means Clustering dengan membandingkan jarak kemiripan dari hasil perhitungan centroid 1 dan centroid 2 untuk memndapatkan cluster setiap centroid. Jika hasil perhitungan jarak centroid lebih dekat ke centroid 1 maka akan dikelompokkan ke centroid 1 dan jika hasil perhitungan jarak centroid lebih dekat ke centroid 2 maka akan dikelompokkan ke centroid 2. Dari hasil pengelompokkan tersebut akan diuji akurasi hasil pengelompokan sistem dengan hasil pengelompokkan manual. Jika kelompok sistem dengan kelompok manual mempunyai cluster yang sama maka pengelompokkan benar tetapi jika tidak mempunyai kelompok yang sama maka pengelompokkan error. Cluster sistem dan cluster manual yang pengelompokkannya benar dijumlahkan, ada 2 cluster dalam pengelompokkan tersebut cluster 1 yang benar dijumlahkan dan cluster 2 yang benar dijumlahkan. Kemudian cluster 1 dan cluster 2 dijumlahkan dan hasil penjumlahan dibagi dengan 20 data yang digunakan dalam sistem ini. Hasil pembagian tersebut diubah menjadi persen PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 46 untuk hasil akurasi. Dengan perbandingan tersebut memndapatkan tingkat akurasi paling tinggi yaitu 70% dan akurasi paling rendah 55% dari 100 uji akurasi. Tingkat akurasi tertinggi didapat dengan perhitungan perbandingan vektor 6 dengan vektor 18 dan perbandingan vektor 4 dengan vektor 11 dari perhitungan tersebut mendapatkan tingkat akurasi sebesar 70% dari 100 pengujian ada dua uji akurasi yang tingkat akurasinya 70%. Untuk tingkat akurasi paling rendah didapat dari perhitungan tersebut mendapatkan tingkat akurasi 55% dari 100 pengujian ada 34 perbandingan yang mendapatkan tingkat akurasi 55%. Dari data citra asli diubah menjadi vektor sebanyak 20 data dari 2 penyakit, kemudian di kelompokkan menggunakan KMeans Clustering. Hasil pengelompokkan K-Means Clustering, kemudian di uji akurasi dengan membandingan cluster sistem dengan cluster manual dan di dapat hasil dari tingkat akurasi tertinngi sebesar 70% dan tingkat akurasi paling rendah sebesar 55%. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB VI PENUTUP 5.1 Kesimpulan Berdasarkan hasil penelitian ini, pengenalan pola citra tanaman padi pada daun menggunakan Gabor Wavelet dan K-Means Clustering, di peroleh kesimpulan sebagai berikut: 1. Uji akurasi diperoleh dari data sebanyak 20 data dari dua penyakit yaitu Cochliobolus Miyabeanus(Bercak coklat) dan Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) masing-masing penyakit ada 10 data. 2. Perhitungan akurasi dari pengelompokan K-means Clustering dengan membandingkan jarak kemiripan dari hasil perhitungan centroid 1 dan centroid 2 untuk memndapatkan cluster setiap centroid Cluster sistem dan cluster manual yang pengelompokkannya benar dijumlahkan, ada 2 cluster dalam pengelompokkan tersebut cluster 1 yang benar dijumlahkan dan cluster 2 yang benar dijumlahkan. Kemudian cluster 1 dan cluster 2 dijumlahkan dan hasil penjumlahan dibagi dengan 20 data yang digunakan dalam sistem ini. Hasil pembagian tersebut diubah menjadi persen untuk hasil akurasi. Dengan perbandingan tersebut memndapatkan tingkat akurasi paling tinngi yaitu 70% dan akurasi paling rendah 55% dari 100 uji akurasi. Vektor yang digunakan untuk perbandingan uji akurasi 20 vektor. 5.2 Saran Berikut ini adalah saran yang dapat membantu peneliti ini agar lebih baik dan berkembang: 1. Sistem dapat dikembangkan dengan penyakit tamanan pada padi lebih banyak dan lebih komplit. 2. Data yang digunakan lebih banyak sehingga dapat mencakup lebih banyak data penyakit padi pada daun. 47 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 48 3. Jumlah data yang digunakan lebih banyak dalam pengujian akurasi sehingga tingkat akurasinya lebih tinggi. 4. Pengumpulan data dilakukan menggunakan hasil foto asli agar lebih tinggi hasil uji akurasi. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR PUSTAKA Fadhilah, Anisa Nurul dkk. Perncangan Aplikasi Sistem Pakar Penyakit Kulit pada Anak dengan Metode Expert System Development Life Cycle.Vol 09 No. 13 2012. Ferdian, Erhandkk. Sistem Pakar Mengidentifikasi Kerusakan Gangguan Sambungan Telepon PT. TELKOM. 2001 Gunadharma. Modul Kuliah Pengenalan Sistem pakar. ITS EDU. Modul Kuliah Sistem Pakar Teknik Informatika. Kadir, Abdul and Susanto, Adhi. Teori dan Aplikasi Pengolahan Citra. Yogyakarta:ANDI. Prasetyo, Eko. 2014. Data Mining Mengolah Data Menjadi Informasi Menggunakan Matkab. Yogyakarta:ANDI. Putra, Dharma. 2010. Pengolahan Citra Digital. Yogyakarta:ANDI. Sutoyo, T dkk. 2009. Teori Pengolahan Citra Digital. Yogyakarta:ANDI. Wijono, Sri Hartati, and Aniati Murni. "PENAMBANGAN CITRA INDERAJA MENGGUNAKAN INFORMASI SPASIAL DAN SPEKTRAL." Seminar Nasional Aplikasi Teknologi Informasi (SNATI). 2010. Nixon, Mark, and Alberto Aguado. “FEATURE EXTRACTION & IMAGE PROCESSING.” Second edition. 2008. 49 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI LAMPIRAN 50 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 51 LAMPIRAN I I. Data vektor I.1. Data Cochliobolus Miyabeanus (Bercak Coklat) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 52 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54 I.2. Vektor Xanthomonas oryzae pv. Oryzae (Hawar Bakteri) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57 LAMPIRAN II II. PROGRAM II. 1. FrameUtama.java PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 61 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 64 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 65 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 66 II.2. ObjekVektor.java PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 67 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 68 II.3. ReadData PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 69 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 70 II.4. Kmeans.java PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 71