Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 ISSN: 2089-9815 PENCOCOKAN DNA NR_108049 DAN DNA DI203322 MENGGUNAKAN ALGORITMA BOYER MOORE Yulius Denny Prabowo1 Program Studi Teknik Informatika, Fakultas Ilmu Komputer dan Ilmu Komunikasi, Kalbis Institute JL Pulomas Selatan Kav.22, Jakarta Timur 13210 Telp. (021) 4788 3900, Fax. (021) 29568966 E-mail: [email protected] ABSTRAK Penggunaan algoritma sebagai alat bantu untuk memecahkan masalah dalam bidang diluar ilmu komputer mulai banyak diterapkan. Algoritma boyer moore merupakan algoritma yang cukup baik untuk digunakan dalam pemrosesan teks. Deoxyribose Nucleic Acid (DNA) pada prakteknya dapat disimpan dalam bentuk data teks untuk dianalisa, pada prakteknya pencocokan DNA sering dilakukan. Jumlah gen yang banyak membuat diperlukannya algoritma yang dapat digunakan untuk membantu proses tersebut. Penelitian ini bertujuan untuk menerapkan algoritma boyer moore dalam hal pencocokan data DNA. Data yang digunakan adalah data DNA dengan kode DI203322 sebagai pattern dan data DNA dengan kode NR_108049 sebagai data teks. Kata Kunci: boyer moore, pencocokan string, dna matching pencocokan untuk rangkaian Deoxyribose Nucleic Acid (DNA). DNA merupakan polimer yang terdiri dari gugus fosfat, gula deoksiribosa dan basa nitrogen. Bentuk dari DNA adalah dua buah untaian yang berpilin (double helix), kedua untaian ini disatukan oleh ikatan hidrogen antara basa-basa yang terdapat pada masing-masing untaian. Empat basa yang terdapat pada DNA adalah adenin (A), sitosin (C), guanin (G) dan timin (T). 1. PENDAHULUAN Algoritma Boyer-Moore merupakan algoritma pencocokan string yang dianggap paling baik sejauh ini sehingga banyak digunakan pada berbagai aplikasi (Vina, 2013 dan Soleh, 2010). Penerapan algoritma ini yang paling dekat pada keseharian kita adalah pada aplikasi teks editor (dalam fungsi find and replace). Algoritma ini mencocokkan teks string dari kanan ke kiri, secara umum algoritma ini dilakukan dalam dua tahap. Tahap pertama adalah tahap preprocessing, dalam tahap ini ada dua buah fungsi untuk menggeser pola ke arah kanan. Fungsi yang pertama disebut dengan good-suffixshift, fungsi ini akan menyimpan hasilnya ke dalam sebuah tabel bmGs yang berukuran m+1. Tabel Good Suffix dihitung dari pattern yang ada pada karakter saat verifikasi salah. Dua kasus yang terjadi adalah pattern yang cocok terjadi juga di string pattern dan hanya sebagian dari pattern yang cocok ada pada awal dari string pattern. Fungsi yang kedua disebut dengan badcharacter-shift, hasil dari fungsi ini akan disimpan ke dalam sebuah tabel bmBc yang berukuran n. Tabel Bad Characters dihitung dari string pattern dengan cara memasukkan posisi tertinggi semua karakter alfabet pada pattern. Bila pattern tidak mengandung karakter tersebut maka nilainya adalah -1, yang nanti akan menyebabkan pergeseran sebesar panjang pattern tersebut. Tahap kedua adalah tahapan pencarian, dari kedua fungsi diatas nilai yang paling besar diambil untuk setiap pattern karakter dari i sampai panjang string pattern. Pencocokan string merupakan masalah yang berhubungan dengan pemrosesan teks, mulai dari pencocokan yang sederhana yang dapat ditemui dalam keseharian seperti: pencarian kata pada perangkat lunak pengolah kata, hingga pada Gambar 1. Ilustrasi untaian berpilin DNA Pencocokan DNA merupakan proses yang hampir selalu digunakan dalam berbagai macam cara memanipulasi DNA, tujuannya adalah untuk mendapatkan karakteristik dari sebuah DNA. Karenanya diperlukan algoritma yang dapat membantu proses pencocokan DNA sehingga proses dapat dilakukan secara efisien dari segi waktu. Algoritma Boyer-Moore telah digunakan pada berbagai aplikasi, antara lain : Pencocokan String (Susilowati, 2001), simulasi pencocokan DNA 197 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 pattern (Minandar, 2011) dan (Pratama,2008), Algoritma ini juga digunakan dalam pencarian kata dalam bahasa batak (Irfan, 2013), pengajuan judul skripsi (Ginting, 2014), pembuatan contact manager pada platform android (Suntoro, 2015), dan Aplikasi search engine (Soleh, 2011). Penelitian ini bertujuan untuk meneliti apakah algoritma Boyer-Moore dapat diterapkan dalam pencocokan DNA, menggunakan data DNA sebenarnya. Data DNA yang digunakan adalah data Homo sapiens colon cancer dengan kode data NR_108049, sedangkan data pembandingnya adalah data Treatment of Colon Cancer dengan kode data DI203322. ISSN: 2089-9815 Gambar 2. U yang terjadi lagi dengan didahului karakter c yang berbeda dari a Jika tidak ada segmen yang sama dengan segmen u, maka selanjutnya akan dicari u yang merupakan suffiks terpanjang dari u, seperti yang terjadi pada gambar 3. 2. PEMBAHASAN Pencarian string pada dasarnya adalah mencari sebuah string yang terdiri dari beberapa karakter (pattern) dalam sebuah dokumen teks. Didalam pencarian sting dilakukan proses pencocokan string, pencocokan string sendiri secara garis besar dibagi menjadi dua bagian yaitu: pencocokan string secara exact atau pencocokan string yang sama persis dan pencocokan string berdasarkan kemiripan atau sering disebut inexact string matching. Pada penelitian ini pencocokan string yang dimaksud adalah pencocokan string yang sama persis atau exact string matching menggunakan metode BoyerMoore. Algoritma Boyer-Moore akan menyimpan informasi pergeseran untuk melakukan pencarian string. Dengan metode pencarian dari kanan (belakang) ke kiri maka jika ada ketidaksesuaian saat perbandingan string, pattern akan bergerak lebih jauh, hal ini bertujuan untuk menghindari perbandingan karakter pada string yang kemungkinan gagalnya tinggi. Saat terjadi kegagalan dalam pencocokan string algoritma Boyer-Moore menggunakan dua buah tabel untuk membantu pengolahan komputasinya. Pada dasarnya kedua tabel ini akan menghitung banyaknya pergeseran yang harus dilakukan. Tabel bad-character-shift menghitung banyaknya pergeseran yang harus dilakukan berdasarkan identitas karakter yang menyebabkan kegagalan. Tabel good-suffix-shift menghitung banyaknya pergeseran berdasar jumlah karakter yang berhasil dicocokkan sebelum pencocokan string tersebut gagal. Gambar 3. Suffix u yang terjadi pada pattern x 2.2 Bad character shift Bad character shift adalah karakter pada teks masukan, yang ditulis dalam notasi matematik sebagai y [i+j] yang tidak sesuai dengan karakter pada pattern. Misalkan bad character y [i+j] terdapat pada pattern di posisi paling kanan, dimana posisi tersebut terletak lebih kiri dari x[i] maka pattern akan digeser sejauh i-k , seperti ditunjukkan pada gambar 4. Gambar 4. Jika b terdapat pada pattern x Namun seandainya bad character y [i+j] tidak ditemukan pada pattern, maka pattern akan digeser ke arah kanan sejauh i , untuk lebih jelasnya dapat dilihat pada gambar 5. 2.1 Good suffix shift Dalam notasi matematis, good sufix shift dapat digambarkan sebagai pergeseran yang dilakukan dari x[i]=a ke karakter lain yang letaknya lebih ke kiri dibanding dengan x[i] serta terletak disebelah kiri segmen u. Untuk lebih jelas dapat dilihat pada gambar 2. Gambar 4. Jika b tidak ditemukan ada dalam pattern x Jika bad character y [i+j] ada pada posisi paling kanan pada pattern yang letaknya di sebelah kanan dari x[i] maka pattern akan digeser ke kanan sejauh i-k, biasanya hasil perhitungan merupakan bilangan negatif, hal ini berarti pattern digeser kembali ke 198 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 ISSN: 2089-9815 kiri. Jika hal ini yang terjadi maka hal ini akan diabaikan. Pada kasus ketidakcocokan maka algoritma akan membandingkan langkah-langkah good suffix shift dan bad character shift, dalam hal ini maka algoritma akan memilih langkah yang paling besar. Langkah – langkah yang dilakukan algoritma Boyer-Moore saat mencocokkan string adalah : a. Algoritma akan mencocokkan karakter dari kanan ke kiri, algoritma akan mencocokkan karakter per karakter pattern dengan karakter teks yang besesuaian, algoritma tidak akan berhenti sampai kondisi berikut terpenuhi : a) Karakter di pattern dan di teks yang dibandingkan tidak cocok (mismatch). b) Ada karakter di pattern yang cocok dengan di teks pembanding. b. Langkah selanjutnya adalah algoritma kemudian akan menggeser pattern dengan memaksimalkan nilai pergeseran good-suffixshift dan bad-character-shift, langkah ini yang akan terus diulang, demikian seterusnya algoritma akan mengulang mulai dari langkah pertama hingga pattern berada di ujung kiri teks pembanding. Langkah awalnya program akan menjalankan preBmBc dan preBmGs untuk mendapatkan inisialisasi. Kemudian prosedur preBmBc akan dijalankan, menjalankan prosedur suffix pada pattern, menjalankan prosedur preBmGs dan kemudian melakukan pencarian string menggunakan hasil perhitungan prosedur preBmBc dan prosedur preBGs yang disimpan pada tabel BmBc dan BmGs. 2.3 Fungsi dari prosedur preBmBc adalah untuk menentukan berapa banyak pergeseran yang harus dilakukan sehingga mencapai karakter tertentu pada pattern dari karakter paling kanan, hasilnya disimpan pada sebuah tabel. Pseudocode prosedur ini dapat dilihat pada gambar 7. Gambar 7. Pseudocode prosedur preBmBc Pseudocode Bayer-Moore Pseudocode algoritma Boyer-Moore,dapat dilihat pada gambar 6. Gambar 8. Pseudocode prosedur preSuffix Gambar 6. Pseudocode pencarian boyer moore 199 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 Prosedur suffix berguna untuk memeriksa kesamaan karakter, pemeriksaan ini dilakukan mulai dari karakter paling kanan. Pencocokan dilakukan terhadap sejumlah karakter yang terletak di sebelah kiri dari karakter awal yang diperiksa. Hasil dari prosedur ini juga disimpan dalam sebuah tabel. Pseudocode prosedur ini dapat dilihat pada gambar 8. ISSN: 2089-9815 posisi paling kanan. Dengan pattern dan string diatas maka banyaknya pergeseran yang harus dilakukan berdasar perhitungan adalah 1, 6, 2 dan 8. Perhitungan prosedur suffiks akan menghasilkan data sebagai berikut : suff[0] = 1, 1 karakter G posisi 7 cocok dengan 1 karakter G posisi 0. suff[1] = 0, karakter G posisi 7 tidak cocok dengan karakter C posisi 1. suff[2] = 0, karakter G posisi 7 tidak cocok dengan karakter A posisi 2. suff[3] = 2, 2 karakter dimulai dari karakter G posisi 7 cocok dengan 2 karakter dimulai dari karakter G posisi 3, yang artinya karakter A,G posisi 6,7 cocok dengan karakter A,G posisi 2,3. suff[4] = 0, karakter G posisi 7 tidak cocok dengan karakter A posisi 4. suff[5] = 4, 4 karakter dimulai dari karakter G posisi 7 cocok dengan 4 karakter dimulai dari karakter 5, artinya karakter A,G,A,G posisi 4,5,6,7 cocok dengan karakter A,G,A,G posisi 2,3,4,5. suff[6] = 0,karakter G posisi 7 tidak cocok dengan karakter A posisi 6. suff[7] = 8, 8 karakter G,C,A,G,A,G,A,G posisi 0,1,2,3,4,5,6,7 cocok dengan 8 karakter G,C,A,G,A,G,A,G posisi 0,1,2,3,4,5,6,7. Prosedur proBmGs akan menghasilkan data sebagai berikut : 0 1 2 3 4 5 6 7 GCAGAGAG bmGs[0]= 7, karakter ke-0 G adalah karakter sebelah kiri segmen CAGAGAG.Tidak ada segmen CAGAGAG lain dengan karakter sebelah kiri bukan G maka digeser 7 langkah. bmGs[1]= 7, karakter ke-1 C adalah karakter sebelah kiri segmen AGAGAG. Tidak ada segmen AGAGAG lain dengan karakter sebelah kiri bukan C maka digeser 7 langkah. bmGs[2]= 7, karakter ke-2 A adalah karakter sebelah kiri segmen GAGAG. Tidak ada segmen GAGAG lain dengan karakter sebelah kiri bukan A maka digeser 7 langkah. bmGs[3]= 2. karakter ke-3 G adalah karakter sebelah kiri segmen AGAG. Karena ada segmen AGAG posisi 2,3,4,5 dengan karakter sebelah kiri bukan G yaitu C posisi 1 maka digeser 2 langkah. bmGs[4]= 7, karakter ke-4 A adalah karakter sebelah kiri segmen GAG. Karena tidak ada seamen GAG lain dengan karakter sebelah kiri bukan A maka digeser 7 langkah. bmGs[5]= 4. karakter ke-5 G adalah karakter sebelah kiri seamen AG. Karena ada segmen AG posisi 2,3 dengan karakter sebelah kiri bukan G yaitu C posisi 1 maka digeser 4 langkah. Gambar 9. Pseudocode prosedur preBmBc Prosedur preBmGs berfungsi untuk mengetahui banyaknya langkah pada pattern dari satu segmen ke segmen lain yang sama, namun letaknya lebih ke kiri dibanding dengan karakter di sebelah kiri segmen yang berbeda. Prosedur ini menggunakan hasil perhitungan dari tabel suffix untuk mengetahui semua pasangan segmen yang sama. Itulah mengapa sebelum prosedur ini dijalankan, prosedur suffix harus terlebih dahulu dieksekusi. Hasil dari prosedur ini juga disimpan dalam sebuah tabel. Pseudocode prosedur ini dapat dilihat pada gambar 9. 2.4 Inisialisasi dalam pencocokan gen Misalkan pattern yang akan dicari adalah GCAGAGAG. Pencarian akan dilakukan pada string dengan data sebagai berikut GCATCGCAGAGAGTATACAGTACG, dengan data tersebut, maka insisasi awal algoritma Boyer Moore akan mengikuti tahapan yang ditetapkan. Perhitungan prosedur preBmBc menghasilkan banyaknya pergeseran yang harus dilakukan pada pattern untuk sampai pada karakter A,C,G,T dari 200 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 ISSN: 2089-9815 3. KESIMPULAN Penelitian ini bertujuan untuk menguji algoritma boyer moore dengan menggunakan data sebenarnya. Dari hasil pengujian, penggunaan algoritma boyer moore berhasil menemukan kesamaan antara pattern dan data teks dalam waktu 0,991 detik. Maka dapat disimpulkan bahwa algoritma ini dapat digunakan dalam pencocokan DNA. Untuk pengembangannya algoritma ini dapat digunakan untuk pencocokan satu pattern dengan berberapa data teks. Hal ini akan sangat berguna untuk misalnya menebak pembawa penyakit berdasarkan analisis gen pembawa penyakit tersebut (sebagai data teks) dan sampel gen yang terinfeksi penyakit tersebut. bmGs[6]= 7, karakter ke-6 A adalah karakter sebelah kiri segmen yaitu A posisi 7. Karena tidak ada segmen G dengan karakter sebelah kirinya bukan A maka digeser 7 langkah. bmGs[7]= 1, karakter ke-7 G adalah karakter sebelah kiri segmen dan karena segmen tidak ada maka digeser 1 langkah 2.5 Data Penelitian ini menggunakan data primer yang diperoleh dari NCBI, untuk data pattern yang dicari digunakan penyakit kanker yang sudah diobati (Treatment of Colon Cancer) dengan kode data DI203322. Sedangkan untuk data string yang dicocokkan digunakan data manusia yang terkena kanker kolon (Homo sapiens colon cancer) dengan kode data NR_108049. Data tersebut kemudian dibandingkan untuk mendapatkan apakah pattern ditemukan pada data teksnya. Metode pengolahan data pattern dan data teks dilakukan menggunakan algoritma boyer moore dengan logika yang sama yang sudah dijelaskan diatas. Hanya saja data yang digunakan lebih banyak jumlahnya. Untuk data pattern terdapat 1034 karakter dan untuk data teks terdiri dari 4991 karakter. Data lengkap yang digunakan pada penelitian ini, dilampirkan beserta paper ini PUSTAKA Ginting. 2014. Penerapan algoritma boyer moore pada aplikasi pengajuan judul skripsi berbasis web. Dipublikasikan pada majalah ilmiah Informasi dan Teknologi Ilmiah, Volume III. Gossett, E.2009. Discrete mathematics with proof. John Wiley. Irfan. 2013. Perancangan aplikasi pencarian kata dala kamus bahasa batak dengan menggunakan Algoritma boyer moore.Pusat Informatika Budi Darma Volume 5. Minandar, A., Tanoto, A., Tanadi, D., 2011 Aplikasi Algoritma Pencarian String. Pratama. 2008. Pencocokan DNA pattern dengan algorima boyer moore. Dimuat dalam majalah ilmiah IFF 12251. Soleh. 2011. Implementasi Algoritma KMP dan Boyer-Moore dalam Aplikasi Search Engine Sederhana. Dimuat dalam makalah Strategi Algoritma. Suntoro, M., 2015. Implementasi Algoritma Pencocokan String Boyer-Moore dalam Pembuatan Contact Manager pada platform Android. Susilowati. 2001. Pencocokan string menggunakan algoritma boyer moore. Stephen, G.A. 2000. String Searching Algorithms. School of Electronic Engineering and Computer System University of Wales UK, World Scientific. Vina, S., dan Prasetiyowati M.I., 2013 Studi Perbandingan Implementasi algoritma BoyerMoore, Turbo Boyer-Moore dan Tuned BoyerMore dalam pencarian string. Yellin, F.N. 1980. The Boyer-Moore Patternmatching Algorithm. Harvard University. 2.6 Hasil Penelitian Algoritma boyer moore dibuat menggunakan bahasa pemrograman python versi 2.7. Pemilihan bahasa pemrograman ini dilakukan dengan alasan bahwa bahasa pemrograman ini relatif lebih mudah digunakan dalam pengolahan teks. Data yang digunakan adalah data kanker kolon dan data DNA kanker yang sudah diobati. Tidak ada kriteria khusus dalam pemilihan data yang akan digunakan. Hal ini disebabkan karena penelitian ini hanya akan menguji algoritma boyer moore untuk mencocokkan gen menggunakan data gen sebenarnya. Program algoritma boyer moore yang dibuat berhasil menemukan kesamaan dari data pattern sebagai data masukan dan data teks sebagai data yang dianalisa. Waktu yang diperlukan program algoritma boyer moore untuk menemukan hasilnya adalah 0,991detik. Screenshoot dari program yang dibuat dapat dilihat pada gambar 10. Gambar 10. Screenshoot perhitungan algoritma boyer moore menggunakan python 2.7 201 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 Lampiran Data pattern yang dicari (DI203322) ISSN: 2089-9815 CAGTCAGTCAGTTTTTTTTTTTTTTTCCCCC CCCCCCCCCCCAAAAAAAAAAAAAAAAGG GGGGGGGGGGGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTTTTTTT TTTTTTTTTCCCCCCCCCCCCCCCCAAAAAA AAAAAAAAAAGGGGGGGGGGGGGGGGTT TTCCCCAAAAGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTTTTTTTTTTTTTTTTCCCCCCCC CCCCCCCCAAAAAAAAAAAAAAAAGGGGG GGGGGGGGGGGTTTTCCCCAAAAGGGGTT TTCCCCAAAAGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA AAAAAAAAGGGGGGGGGGGGGGGGTTTTC CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT TCCCCAAAAGGGGTTTTCCCCAAAAGGGG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC CCCCAAAAAAAAAAAAAAAAGGGGGGGG GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT CCCCAAAAGGGGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT TTCCCCCCCCCCCCCCCCAAAAAAAAAAA AAAAAGGGGGGGGGGGGGGGGTTTTCCCC AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC CAAAAAAAAAAAAAAAAGGGGGGGGGGG GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC CAAAAGGGGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTTTTTTTTTTTTTTTTC CCCCCCCCCCCCCCCAAAAAAAAAAAAAA AAGGGGGGGGGGGGGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTTTTCCCCAAAAGGGGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTT TTTTTTTTTTTTTTCCCCCCCCCCCCCCCCA AAAAAAAAAAAAAAAGGGGGGGGGGGGG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTTTTTTTTTTTTTTTTCCC CCCCCCCCCCCCCAAAAAAAAAAAAAAAA GGTTTTCCCCAAAAGGGGTTTTCCCCAAAA GGGGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTTTTTTTTTTTTTTTCCCCCCCC CCCCCCCCAAAAAAAAAAAAAAAAGGGGG GGGGGGGGGGGTTTTCCCCAAAAGGGGTT TTCCCCAAAAGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA AAAAAAAAGGGGGGGGGGGGGGGGTTTTC CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT TCCCCAAAAGGGGTTTTCCCCAAAAGGGG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC CCCCAAAAAAAAAAAAAAAAGGGGGGGG GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT CCCCAAAAGGGGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT TTCCCCCCCCCCCCCCCCAAAAAAAAAAA AAAAAGGGGGGGGGGGGGGGGTTTTCCCC AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC CAAAAAAAAAAAAAAAAGGGGGGGGGGG GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC CAAAAGGGGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGT Lampiran Data Teks (NR_108049) TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCC AAAAAAAAAAAAAAAAGGGGGGGGGGGG GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA AAGGGGTTTTCCCCAAAAGGGGTTTTCCCC AAAAGGGGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTTTTTTTTTTTTTTTTCC CCCCCCCCCCCCCCAAAAAAAAAAAAAAA AGGGGGGGGGGGGGGGGTTTTCCCCAAAA GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA AAGGGGTTTTCCCCAAAAGGGGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTTT TTTTTTTTTTTTTCCCCCCCCCCCCCCCCAA AAAAAAAAAAAAAAGGGGGGGGGGGGGG GGTTTTCCCCAAAAGGGGTTTTCCCCAAAA GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA AAGGGGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT 202 Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016 GGGGGGGGGGGGGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTTTT TTTTTTTTTTTTCCCCCCCCCCCCCCCCAAA AAAAAAAAAAAAAGGGGGGGGGGGGGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTTTTTTTTTTTTTTTTCCCCC CCCCCCCCCCCAAAAAAAAAAAAAAAAGG GGGGGGGGGGGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTTTTTTT TTTTTTTTTCCCCCCCCCCCCCCCCAAAAAA AAAAAAAAAAGGGGGGGGGGGGGGGGTT TTCCCCAAAAGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTTTTTTTTTTTTTTTTCCCCCCCC CCCCCCCCAAAAAAAAAAAAAAAAGGGGG GGGGGGGGGGGTTTTCCCCAAAAGGGGTT TTCCCCAAAAGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA AAAAAAAAGGGGGGGGGGGGGGGGTTTTC CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT TCCCCAAAAGGGGTTTTCCCCAAAAGGGG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC CCCCAAAAAAAAAAAAAAAAGGGGGGGG GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT CCCCAAAAGGGGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT TTCCCCCCCCCCCCCCCCAAAAAAAAAAA AAAAAGGGGGGGGGGGGGGGGTTTTCCCC AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC CCAAAAGGGGTTTTCCCCAAAAGGGGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC CAAAAAAAAAAAAAAAAGGGGGGGGGGG GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC CAAAAGGGGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTTTTTTTTTTTTTTTTC CCCCCCCCCCCCCCCAAAAAAAAAAAAAA AAGGGGGGGGGGGGGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA ISSN: 2089-9815 AAAGGGGTTTTCCCCAAAAGGGGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTT TTTTTTTTTTTTTTCCCCCCCCCCCCCCCCA AAAAAAAAAAAAAAAGGGGGGGGGGGGG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA AAAGGGGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTTTTTTTTTTTTTTTTCCC CCCCCCCCCCCCCAAAAAAAAAAAAAAAA GGGGGGGGGGGGGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTTTTCCCCAAAAGGGGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTCAGTCAGTCAGTCAGTTTT TTTTTTTTTTTTCCCCCCCCCCCCCCCCAAA AAAAAAAAAAAAAGGGGGGGGGGGGGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA AGGGGTCAGTCAGTCAGTCAGTCAGTCAG TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC AGTCAGTCAGTTTTTTTTTTTTTTTTCCCCC CCCCCCCCCCCAAAAAAAAAAAAAAAAGG GGGGGGGGGGGGGGTTTTCCCCAAAAGGG GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT CAGTCAGTCAGTCAGTCAGTCAG 203