pencocokan dna nr_108049 dan dna di203322

advertisement
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
ISSN: 2089-9815
PENCOCOKAN DNA NR_108049 DAN DNA DI203322 MENGGUNAKAN
ALGORITMA BOYER MOORE
Yulius Denny Prabowo1
Program Studi Teknik Informatika, Fakultas Ilmu Komputer dan Ilmu Komunikasi, Kalbis Institute
JL Pulomas Selatan Kav.22, Jakarta Timur 13210
Telp. (021) 4788 3900, Fax. (021) 29568966
E-mail: [email protected]
ABSTRAK
Penggunaan algoritma sebagai alat bantu untuk memecahkan masalah dalam bidang diluar ilmu komputer
mulai banyak diterapkan. Algoritma boyer moore merupakan algoritma yang cukup baik untuk digunakan dalam
pemrosesan teks. Deoxyribose Nucleic Acid (DNA) pada prakteknya dapat disimpan dalam bentuk data teks
untuk dianalisa, pada prakteknya pencocokan DNA sering dilakukan. Jumlah gen yang banyak membuat
diperlukannya algoritma yang dapat digunakan untuk membantu proses tersebut. Penelitian ini bertujuan untuk
menerapkan algoritma boyer moore dalam hal pencocokan data DNA. Data yang digunakan adalah data DNA
dengan kode DI203322 sebagai pattern dan data DNA dengan kode NR_108049 sebagai data teks.
Kata Kunci: boyer moore, pencocokan string, dna matching
pencocokan untuk rangkaian Deoxyribose Nucleic
Acid (DNA).
DNA merupakan polimer yang terdiri dari gugus
fosfat, gula deoksiribosa dan basa nitrogen. Bentuk
dari DNA adalah dua buah untaian yang berpilin
(double helix), kedua untaian ini disatukan oleh
ikatan hidrogen antara basa-basa yang terdapat pada
masing-masing untaian. Empat basa yang terdapat
pada DNA adalah adenin (A), sitosin (C), guanin
(G) dan timin (T).
1.
PENDAHULUAN
Algoritma Boyer-Moore merupakan algoritma
pencocokan string yang dianggap paling baik sejauh
ini sehingga banyak digunakan pada berbagai
aplikasi (Vina, 2013 dan Soleh, 2010). Penerapan
algoritma ini yang paling dekat pada keseharian kita
adalah pada aplikasi teks editor (dalam fungsi find
and replace). Algoritma ini mencocokkan teks string
dari kanan ke kiri, secara umum algoritma ini
dilakukan dalam dua tahap. Tahap pertama adalah
tahap preprocessing, dalam tahap ini ada dua buah
fungsi untuk menggeser pola ke arah kanan.
Fungsi yang pertama disebut dengan good-suffixshift, fungsi ini akan menyimpan hasilnya ke dalam
sebuah tabel bmGs yang berukuran m+1. Tabel
Good Suffix dihitung dari pattern yang ada pada
karakter saat verifikasi salah. Dua kasus yang terjadi
adalah pattern yang cocok terjadi juga di string
pattern dan hanya sebagian dari pattern yang cocok
ada pada awal dari string pattern.
Fungsi yang kedua disebut dengan badcharacter-shift, hasil dari fungsi ini akan disimpan
ke dalam sebuah tabel bmBc yang berukuran n.
Tabel Bad Characters dihitung dari string pattern
dengan cara memasukkan posisi tertinggi semua
karakter alfabet pada pattern. Bila pattern tidak
mengandung karakter tersebut maka nilainya adalah
-1, yang nanti akan menyebabkan pergeseran sebesar
panjang pattern tersebut. Tahap kedua adalah
tahapan pencarian, dari kedua fungsi diatas nilai
yang paling besar diambil untuk setiap pattern
karakter dari i sampai panjang string pattern.
Pencocokan string merupakan masalah yang
berhubungan dengan pemrosesan teks, mulai dari
pencocokan yang sederhana yang dapat ditemui
dalam keseharian seperti: pencarian kata pada
perangkat lunak pengolah kata, hingga pada
Gambar 1. Ilustrasi untaian berpilin DNA
Pencocokan DNA merupakan proses yang
hampir selalu digunakan dalam berbagai macam
cara memanipulasi DNA, tujuannya adalah untuk
mendapatkan karakteristik dari sebuah DNA.
Karenanya diperlukan algoritma yang dapat
membantu proses pencocokan DNA sehingga proses
dapat dilakukan secara efisien dari segi waktu.
Algoritma Boyer-Moore telah digunakan pada
berbagai aplikasi, antara lain : Pencocokan String
(Susilowati, 2001), simulasi pencocokan DNA
197
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
pattern (Minandar, 2011) dan (Pratama,2008),
Algoritma ini juga digunakan dalam pencarian kata
dalam bahasa batak (Irfan, 2013), pengajuan judul
skripsi (Ginting, 2014), pembuatan contact manager
pada platform android (Suntoro, 2015), dan Aplikasi
search engine (Soleh, 2011).
Penelitian ini bertujuan untuk meneliti apakah
algoritma Boyer-Moore dapat diterapkan dalam
pencocokan DNA, menggunakan data DNA
sebenarnya. Data DNA yang digunakan adalah data
Homo sapiens colon cancer dengan kode data
NR_108049, sedangkan data pembandingnya adalah
data Treatment of Colon Cancer dengan kode data
DI203322.
ISSN: 2089-9815
Gambar 2. U yang terjadi lagi dengan didahului
karakter c yang berbeda dari a
Jika tidak ada segmen yang sama dengan segmen
u, maka selanjutnya akan dicari u yang merupakan
suffiks terpanjang dari u, seperti yang terjadi pada
gambar 3.
2.
PEMBAHASAN
Pencarian string pada dasarnya adalah mencari
sebuah string yang terdiri dari beberapa karakter
(pattern) dalam sebuah dokumen teks. Didalam
pencarian sting dilakukan proses pencocokan string,
pencocokan string sendiri secara garis besar dibagi
menjadi dua bagian yaitu: pencocokan string secara
exact atau pencocokan string yang sama persis dan
pencocokan string berdasarkan kemiripan atau
sering disebut inexact string matching.
Pada
penelitian ini pencocokan string yang dimaksud
adalah pencocokan string yang sama persis atau
exact string matching menggunakan metode BoyerMoore.
Algoritma Boyer-Moore akan menyimpan
informasi pergeseran untuk melakukan pencarian
string. Dengan metode pencarian dari kanan
(belakang) ke kiri maka jika ada ketidaksesuaian
saat perbandingan string, pattern akan bergerak
lebih jauh, hal ini bertujuan untuk menghindari
perbandingan
karakter
pada
string
yang
kemungkinan gagalnya tinggi.
Saat terjadi kegagalan dalam pencocokan string
algoritma Boyer-Moore menggunakan dua buah
tabel untuk membantu pengolahan komputasinya.
Pada dasarnya kedua tabel ini akan menghitung
banyaknya pergeseran yang harus dilakukan. Tabel
bad-character-shift
menghitung
banyaknya
pergeseran yang harus dilakukan berdasarkan
identitas karakter yang menyebabkan kegagalan.
Tabel good-suffix-shift menghitung banyaknya
pergeseran berdasar jumlah karakter yang berhasil
dicocokkan sebelum pencocokan string tersebut
gagal.
Gambar 3. Suffix u yang terjadi pada pattern x
2.2
Bad character shift
Bad character shift adalah karakter pada teks
masukan, yang ditulis dalam notasi matematik
sebagai y [i+j] yang tidak sesuai dengan karakter
pada pattern.
Misalkan bad character y [i+j] terdapat pada
pattern di posisi paling kanan, dimana posisi
tersebut terletak lebih kiri dari x[i] maka pattern
akan digeser sejauh i-k , seperti ditunjukkan pada
gambar 4.
Gambar 4. Jika b terdapat pada pattern x
Namun seandainya bad character y [i+j] tidak
ditemukan pada pattern, maka pattern akan digeser
ke arah kanan sejauh i , untuk lebih jelasnya dapat
dilihat pada gambar 5.
2.1
Good suffix shift
Dalam notasi matematis, good sufix shift dapat
digambarkan sebagai pergeseran yang dilakukan dari
x[i]=a ke karakter lain yang letaknya lebih ke kiri
dibanding dengan x[i] serta terletak disebelah kiri
segmen u. Untuk lebih jelas dapat dilihat pada
gambar 2.
Gambar 4. Jika b tidak ditemukan ada dalam
pattern x
Jika bad character y [i+j] ada pada posisi paling
kanan pada pattern yang letaknya di sebelah kanan
dari x[i] maka pattern akan digeser ke kanan sejauh
i-k, biasanya hasil perhitungan merupakan bilangan
negatif, hal ini berarti pattern digeser kembali ke
198
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
ISSN: 2089-9815
kiri. Jika hal ini yang terjadi maka hal ini akan
diabaikan.
Pada kasus ketidakcocokan maka algoritma akan
membandingkan langkah-langkah good suffix shift
dan bad character shift, dalam hal ini maka
algoritma akan memilih langkah yang paling besar.
Langkah – langkah yang dilakukan algoritma
Boyer-Moore saat mencocokkan string adalah :
a. Algoritma akan mencocokkan karakter dari
kanan ke kiri, algoritma akan mencocokkan
karakter per karakter pattern dengan karakter
teks yang besesuaian, algoritma tidak akan
berhenti sampai kondisi berikut terpenuhi :
a) Karakter di pattern dan di teks yang
dibandingkan tidak cocok (mismatch).
b) Ada karakter di pattern yang cocok dengan
di teks pembanding.
b. Langkah selanjutnya adalah algoritma kemudian
akan
menggeser
pattern
dengan
memaksimalkan nilai pergeseran good-suffixshift dan bad-character-shift, langkah ini yang
akan terus diulang, demikian seterusnya
algoritma akan mengulang mulai dari langkah
pertama hingga pattern berada di ujung kiri teks
pembanding.
Langkah awalnya program akan menjalankan
preBmBc dan preBmGs untuk mendapatkan
inisialisasi. Kemudian prosedur preBmBc akan
dijalankan, menjalankan prosedur suffix pada
pattern, menjalankan prosedur preBmGs dan
kemudian melakukan pencarian string menggunakan
hasil perhitungan prosedur preBmBc dan prosedur
preBGs yang disimpan pada tabel BmBc dan BmGs.
2.3
Fungsi dari prosedur preBmBc adalah untuk
menentukan berapa banyak pergeseran yang harus
dilakukan sehingga mencapai karakter tertentu pada
pattern dari karakter paling kanan, hasilnya
disimpan pada sebuah tabel. Pseudocode prosedur
ini dapat dilihat pada gambar 7.
Gambar 7. Pseudocode prosedur preBmBc
Pseudocode Bayer-Moore
Pseudocode algoritma Boyer-Moore,dapat dilihat
pada gambar 6.
Gambar 8. Pseudocode prosedur preSuffix
Gambar 6. Pseudocode pencarian boyer moore
199
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
Prosedur suffix berguna untuk memeriksa
kesamaan karakter, pemeriksaan ini dilakukan mulai
dari karakter paling kanan. Pencocokan dilakukan
terhadap sejumlah karakter yang terletak di sebelah
kiri dari karakter awal yang diperiksa. Hasil dari
prosedur ini juga disimpan dalam sebuah tabel.
Pseudocode prosedur ini dapat dilihat pada gambar
8.
ISSN: 2089-9815
posisi paling kanan. Dengan pattern dan string
diatas maka banyaknya pergeseran yang harus
dilakukan berdasar perhitungan adalah 1, 6, 2 dan 8.
Perhitungan prosedur suffiks akan menghasilkan
data sebagai berikut :
 suff[0] = 1, 1 karakter G posisi 7 cocok dengan
1 karakter G posisi 0.
 suff[1] = 0, karakter G posisi 7 tidak cocok
dengan karakter C posisi 1.
 suff[2] = 0, karakter G posisi 7 tidak cocok
dengan karakter A posisi 2.
 suff[3] = 2, 2 karakter dimulai dari karakter G
posisi 7 cocok dengan 2 karakter dimulai dari
karakter G posisi 3, yang artinya karakter A,G
posisi 6,7 cocok dengan karakter A,G posisi
2,3.
 suff[4] = 0, karakter G posisi 7 tidak cocok
dengan karakter A posisi 4.
 suff[5] = 4, 4 karakter dimulai dari karakter G
posisi 7 cocok dengan 4 karakter dimulai dari
karakter 5, artinya karakter A,G,A,G posisi
4,5,6,7 cocok dengan karakter A,G,A,G posisi
2,3,4,5.
 suff[6] = 0,karakter G posisi 7 tidak cocok
dengan karakter A posisi 6.
 suff[7] = 8, 8 karakter G,C,A,G,A,G,A,G posisi
0,1,2,3,4,5,6,7 cocok dengan 8 karakter
G,C,A,G,A,G,A,G posisi 0,1,2,3,4,5,6,7.
Prosedur proBmGs akan menghasilkan data
sebagai berikut :
0 1 2 3 4 5 6 7
GCAGAGAG
 bmGs[0]= 7, karakter ke-0 G adalah karakter
sebelah kiri segmen CAGAGAG.Tidak ada
segmen CAGAGAG lain dengan karakter
sebelah kiri bukan G maka digeser 7 langkah.
 bmGs[1]= 7, karakter ke-1 C adalah karakter
sebelah kiri segmen AGAGAG. Tidak ada
segmen AGAGAG lain dengan karakter
sebelah kiri bukan C maka digeser 7 langkah.
 bmGs[2]= 7, karakter ke-2 A adalah karakter
sebelah kiri segmen GAGAG. Tidak ada
segmen GAGAG lain dengan karakter sebelah
kiri bukan A maka digeser 7 langkah.
 bmGs[3]= 2. karakter ke-3 G adalah karakter
sebelah kiri segmen AGAG. Karena ada
segmen AGAG posisi 2,3,4,5 dengan karakter
sebelah kiri bukan G yaitu C posisi 1 maka
digeser 2 langkah.
 bmGs[4]= 7, karakter ke-4 A adalah karakter
sebelah kiri segmen GAG. Karena tidak ada
seamen GAG lain dengan karakter sebelah kiri
bukan A maka digeser 7 langkah.
 bmGs[5]= 4. karakter ke-5 G adalah karakter
sebelah kiri seamen AG. Karena ada segmen
AG posisi 2,3 dengan karakter sebelah kiri
bukan G yaitu C posisi 1 maka digeser 4
langkah.
Gambar 9. Pseudocode prosedur preBmBc
Prosedur preBmGs berfungsi untuk mengetahui
banyaknya langkah pada pattern dari satu segmen ke
segmen lain yang sama, namun letaknya lebih ke kiri
dibanding dengan karakter di sebelah kiri segmen
yang berbeda. Prosedur ini menggunakan hasil
perhitungan dari tabel suffix untuk mengetahui
semua pasangan segmen yang sama. Itulah mengapa
sebelum prosedur ini dijalankan, prosedur suffix
harus terlebih dahulu dieksekusi. Hasil dari prosedur
ini juga disimpan dalam sebuah tabel. Pseudocode
prosedur ini dapat dilihat pada gambar 9.
2.4
Inisialisasi dalam pencocokan gen
Misalkan pattern yang akan dicari adalah
GCAGAGAG. Pencarian akan dilakukan pada string
dengan
data
sebagai
berikut
GCATCGCAGAGAGTATACAGTACG,
dengan
data tersebut, maka insisasi awal algoritma Boyer
Moore akan mengikuti tahapan yang ditetapkan.
Perhitungan prosedur preBmBc menghasilkan
banyaknya pergeseran yang harus dilakukan pada
pattern untuk sampai pada karakter A,C,G,T dari
200
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016


ISSN: 2089-9815
3.
KESIMPULAN
Penelitian ini bertujuan untuk menguji algoritma
boyer moore dengan menggunakan data sebenarnya.
Dari hasil pengujian, penggunaan algoritma boyer
moore berhasil menemukan kesamaan antara pattern
dan data teks dalam waktu 0,991 detik. Maka dapat
disimpulkan bahwa algoritma ini dapat digunakan
dalam pencocokan DNA.
Untuk pengembangannya algoritma ini dapat
digunakan untuk pencocokan satu pattern dengan
berberapa data teks. Hal ini akan sangat berguna
untuk misalnya menebak pembawa penyakit
berdasarkan analisis gen pembawa penyakit tersebut
(sebagai data teks) dan sampel gen yang terinfeksi
penyakit tersebut.
bmGs[6]= 7, karakter ke-6 A adalah karakter
sebelah kiri segmen yaitu A posisi 7. Karena
tidak ada segmen G dengan karakter sebelah
kirinya bukan A maka digeser 7 langkah.
bmGs[7]= 1, karakter ke-7 G adalah karakter
sebelah kiri segmen dan karena segmen tidak
ada maka digeser 1 langkah
2.5
Data
Penelitian ini menggunakan data primer yang
diperoleh dari NCBI, untuk data pattern yang dicari
digunakan penyakit kanker yang sudah diobati
(Treatment of Colon Cancer) dengan kode data
DI203322. Sedangkan untuk data string yang
dicocokkan digunakan data manusia yang terkena
kanker kolon (Homo sapiens colon cancer) dengan
kode data NR_108049.
Data tersebut kemudian dibandingkan untuk
mendapatkan apakah pattern ditemukan pada data
teksnya. Metode pengolahan data pattern dan data
teks dilakukan menggunakan algoritma boyer moore
dengan logika yang sama yang sudah dijelaskan
diatas. Hanya saja data yang digunakan lebih banyak
jumlahnya. Untuk data pattern terdapat 1034
karakter dan untuk data teks terdiri dari 4991
karakter. Data lengkap yang digunakan pada
penelitian ini, dilampirkan beserta paper ini
PUSTAKA
Ginting. 2014. Penerapan algoritma boyer moore
pada aplikasi pengajuan judul skripsi berbasis
web. Dipublikasikan pada majalah ilmiah
Informasi dan Teknologi Ilmiah, Volume III.
Gossett, E.2009. Discrete mathematics with proof.
John Wiley.
Irfan. 2013. Perancangan aplikasi pencarian kata
dala kamus bahasa batak dengan menggunakan
Algoritma boyer moore.Pusat Informatika Budi
Darma Volume 5.
Minandar, A., Tanoto, A., Tanadi, D., 2011 Aplikasi
Algoritma Pencarian String.
Pratama. 2008. Pencocokan DNA pattern dengan
algorima boyer moore. Dimuat dalam majalah
ilmiah IFF 12251.
Soleh. 2011. Implementasi Algoritma KMP dan
Boyer-Moore dalam Aplikasi Search Engine
Sederhana. Dimuat dalam makalah Strategi
Algoritma.
Suntoro, M., 2015. Implementasi Algoritma
Pencocokan
String
Boyer-Moore
dalam
Pembuatan Contact Manager pada platform
Android.
Susilowati. 2001. Pencocokan string menggunakan
algoritma boyer moore.
Stephen, G.A. 2000. String Searching Algorithms.
School of Electronic Engineering and Computer
System University of Wales UK, World Scientific.
Vina, S., dan Prasetiyowati M.I., 2013 Studi
Perbandingan Implementasi algoritma BoyerMoore, Turbo Boyer-Moore dan Tuned BoyerMore dalam pencarian string.
Yellin, F.N. 1980. The Boyer-Moore Patternmatching Algorithm. Harvard University.
2.6
Hasil Penelitian
Algoritma boyer moore dibuat menggunakan
bahasa pemrograman python versi 2.7. Pemilihan
bahasa pemrograman ini dilakukan dengan alasan
bahwa bahasa pemrograman ini relatif lebih mudah
digunakan dalam pengolahan teks.
Data yang digunakan adalah data kanker kolon
dan data DNA kanker yang sudah diobati. Tidak ada
kriteria khusus dalam pemilihan data yang akan
digunakan. Hal ini disebabkan karena penelitian ini
hanya akan menguji algoritma boyer moore untuk
mencocokkan gen menggunakan data gen
sebenarnya.
Program algoritma boyer moore yang dibuat
berhasil menemukan kesamaan dari data pattern
sebagai data masukan dan data teks sebagai data
yang dianalisa. Waktu yang diperlukan program
algoritma boyer moore untuk menemukan hasilnya
adalah 0,991detik. Screenshoot dari program yang
dibuat dapat dilihat pada gambar 10.
Gambar 10. Screenshoot perhitungan algoritma
boyer moore menggunakan python 2.7
201
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
Lampiran Data pattern yang dicari (DI203322)
ISSN: 2089-9815
CAGTCAGTCAGTTTTTTTTTTTTTTTCCCCC
CCCCCCCCCCCAAAAAAAAAAAAAAAAGG
GGGGGGGGGGGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTTTTTTT
TTTTTTTTTCCCCCCCCCCCCCCCCAAAAAA
AAAAAAAAAAGGGGGGGGGGGGGGGGTT
TTCCCCAAAAGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTTTTTTTTTTTTTTTTCCCCCCCC
CCCCCCCCAAAAAAAAAAAAAAAAGGGGG
GGGGGGGGGGGTTTTCCCCAAAAGGGGTT
TTCCCCAAAAGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT
TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA
AAAAAAAAGGGGGGGGGGGGGGGGTTTTC
CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT
TCCCCAAAAGGGGTTTTCCCCAAAAGGGG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC
CCCCAAAAAAAAAAAAAAAAGGGGGGGG
GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT
CCCCAAAAGGGGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT
TTCCCCCCCCCCCCCCCCAAAAAAAAAAA
AAAAAGGGGGGGGGGGGGGGGTTTTCCCC
AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC
CAAAAAAAAAAAAAAAAGGGGGGGGGGG
GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC
CAAAAGGGGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTTTTTTTTTTTTTTTTC
CCCCCCCCCCCCCCCAAAAAAAAAAAAAA
AAGGGGGGGGGGGGGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTTTTCCCCAAAAGGGGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTT
TTTTTTTTTTTTTTCCCCCCCCCCCCCCCCA
AAAAAAAAAAAAAAAGGGGGGGGGGGGG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTTTTTTTTTTTTTTTTCCC
CCCCCCCCCCCCCAAAAAAAAAAAAAAAA
GGTTTTCCCCAAAAGGGGTTTTCCCCAAAA
GGGGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTTTTTTTTTTTTTTTCCCCCCCC
CCCCCCCCAAAAAAAAAAAAAAAAGGGGG
GGGGGGGGGGGTTTTCCCCAAAAGGGGTT
TTCCCCAAAAGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT
TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA
AAAAAAAAGGGGGGGGGGGGGGGGTTTTC
CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT
TCCCCAAAAGGGGTTTTCCCCAAAAGGGG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC
CCCCAAAAAAAAAAAAAAAAGGGGGGGG
GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT
CCCCAAAAGGGGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT
TTCCCCCCCCCCCCCCCCAAAAAAAAAAA
AAAAAGGGGGGGGGGGGGGGGTTTTCCCC
AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC
CAAAAAAAAAAAAAAAAGGGGGGGGGGG
GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC
CAAAAGGGGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGT
Lampiran Data Teks (NR_108049)
TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCC
AAAAAAAAAAAAAAAAGGGGGGGGGGGG
GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA
AAGGGGTTTTCCCCAAAAGGGGTTTTCCCC
AAAAGGGGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTTTTTTTTTTTTTTTTCC
CCCCCCCCCCCCCCAAAAAAAAAAAAAAA
AGGGGGGGGGGGGGGGGTTTTCCCCAAAA
GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA
AAGGGGTTTTCCCCAAAAGGGGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTTT
TTTTTTTTTTTTTCCCCCCCCCCCCCCCCAA
AAAAAAAAAAAAAAGGGGGGGGGGGGGG
GGTTTTCCCCAAAAGGGGTTTTCCCCAAAA
GGGGTTTTCCCCAAAAGGGGTTTTCCCCAA
AAGGGGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
202
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016)
Yogyakarta, 18-19 Maret 2016
GGGGGGGGGGGGGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTTTT
TTTTTTTTTTTTCCCCCCCCCCCCCCCCAAA
AAAAAAAAAAAAAGGGGGGGGGGGGGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTTTTTTTTTTTTTTTTCCCCC
CCCCCCCCCCCAAAAAAAAAAAAAAAAGG
GGGGGGGGGGGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTTTTTTT
TTTTTTTTTCCCCCCCCCCCCCCCCAAAAAA
AAAAAAAAAAGGGGGGGGGGGGGGGGTT
TTCCCCAAAAGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTTTTTTTTTTTTTTTTCCCCCCCC
CCCCCCCCAAAAAAAAAAAAAAAAGGGGG
GGGGGGGGGGGTTTTCCCCAAAAGGGGTT
TTCCCCAAAAGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTTTTTTTTTT
TTTTTTCCCCCCCCCCCCCCCCAAAAAAAA
AAAAAAAAGGGGGGGGGGGGGGGGTTTTC
CCCAAAAGGGGTTTTCCCCAAAAGGGGTTT
TCCCCAAAAGGGGTTTTCCCCAAAAGGGG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTTTTTTTTTTTTTTTTCCCCCCCCCCCC
CCCCAAAAAAAAAAAAAAAAGGGGGGGG
GGGGGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTTTT
CCCCAAAAGGGGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTTTTTTTTTTTTTT
TTCCCCCCCCCCCCCCCCAAAAAAAAAAA
AAAAAGGGGGGGGGGGGGGGGTTTTCCCC
AAAAGGGGTTTTCCCCAAAAGGGGTTTTCC
CCAAAAGGGGTTTTCCCCAAAAGGGGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAGTCAGTCA
GTTTTTTTTTTTTTTTTCCCCCCCCCCCCCCC
CAAAAAAAAAAAAAAAAGGGGGGGGGGG
GGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTTTTCCCCAAAAGGGGTTTTCCC
CAAAAGGGGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTTTTTTTTTTTTTTTTC
CCCCCCCCCCCCCCCAAAAAAAAAAAAAA
AAGGGGGGGGGGGGGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
ISSN: 2089-9815
AAAGGGGTTTTCCCCAAAAGGGGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTT
TTTTTTTTTTTTTTCCCCCCCCCCCCCCCCA
AAAAAAAAAAAAAAAGGGGGGGGGGGGG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTTTTCCCCA
AAAGGGGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTTTTTTTTTTTTTTTTCCC
CCCCCCCCCCCCCAAAAAAAAAAAAAAAA
GGGGGGGGGGGGGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTTTTCCCCAAAAGGGGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTCAGTCAGTCAGTCAGTTTT
TTTTTTTTTTTTCCCCCCCCCCCCCCCCAAA
AAAAAAAAAAAAAGGGGGGGGGGGGGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTTTTCCCCAAA
AGGGGTCAGTCAGTCAGTCAGTCAGTCAG
TCAGTCAGTCAGTCAGTCAGTCAGTCAGTC
AGTCAGTCAGTTTTTTTTTTTTTTTTCCCCC
CCCCCCCCCCCAAAAAAAAAAAAAAAAGG
GGGGGGGGGGGGGGTTTTCCCCAAAAGGG
GTTTTCCCCAAAAGGGGTTTTCCCCAAAAG
GGGTTTTCCCCAAAAGGGGTCAGTCAGTCA
GTCAGTCAGTCAGTCAGTCAGTCAGTCAGT
CAGTCAGTCAGTCAGTCAGTCAG
203
Download