BAB II KONSEP DASAR PENYEJAJARAN DUA BARISAN DNA

advertisement
BAB II
KONSEP DASAR PENYEJAJARAN DUA BARISAN DNA
DNA merupakan salah satu pembawa informasi genetik dari makhluk
hidup. DNA terdiri dari 4 karakter huruf, yaitu G (Guanine), A (Alanine), T
(Thymine), dan C (Cytosine). Dari susunan karakter-karakter pada barisan
DNA dapat diketahui sifat makhluk hidup. Suatu barisan DNA tidak muncul
dengan sendirinya tetapi berasal dari barisan yang telah ada sebelumnya.
Jika ditemukan barisan baru yang belum diketahui sebelumnya, maka
dengan membandingkan barisan tersebut dengan barisan yang sudah
diketahui sebelumnya dapat memberikan informasi genetik dari barisan yang
baru.
Jika beberapa barisan berasal dari ancestor (nenek moyang) yang
sama, maka susunan karakter-karakter pada beberapa barisan tersebut
belum tentu sama secara keseluruhan. Hal ini disebabkan adanya proses
evolusi. Oleh karena itu dilakukan penyejajaran barisan untuk melihat tingkat
kemiripan antar barisan tersebut.
Penyejajaran barisan DNA dapat dilakukan antardua barisan (pairwise)
dan lebih dari dua barisan (multiple). Dalam tugas akhir ini yang akan
dibahas adalah konsep dasar dari penyejajaran dua barisan yang diperlukan
untuk memudahkan pemahaman pada bab-bab selanjutnya. Selain itu juga
akan dibahas pemberian skor pada penyejajaran dua barisan.
5 FMIPA UI, 2008
Penyejajaran barisan..., Erizkia Melati,
6
2.1
Definisi Penyejajaran Dua Barisan
Diberikan dua barisan, yaitu A = a1, a2, …, am dan B = b1, b2, …, bn, ai
menyatakan karakter ke-i pada barisan A dan bj menyatakan barisan ke-j
pada barisan B. Penyejajaran barisan A dan B dapat didefinisikan sebagai
himpunan berurutan dari pasangan karakter (ai, bj) dan dari pasangan
karakter dengan gap, yaitu ( _, bj) dan (ai, _ ), dengan kendala jika spasi ( _ )
dihilangkan maka akan diperoleh barisan awal [3].
2.2
Konsep Penyejajaran Barisan
Penyejajaran barisan dimaksudkan untuk memasangkan sebanyak
mungkin karakter yang sama antardua barisan tanpa mengubah urutan
karakter pada setiap barisan. Penyejajaran dua barisan dilakukan dengan
meletakkan salah satu barisan di atas barisan yang lain, kemudian
menyisipkan satu atau lebih dari satu spasi di awal, di tengah, atau di
belakang barisan. Penyisipan spasi pada salah satu atau kedua barisan
tersebut menyebabkan kedua barisan memiliki panjang yang sama.
Dari definisi penyejajaran barisan pada subbab sebelumnya, untuk
melakukan penyejajaran ada beberapa hal yang harus diperhatikan, yaitu
sebagai berikut
1. Urutan karakter pada barisan setelah disejajarkan sama seperti barisan
awal yang belum disejajarkan.
2. Tidak ada pemasangan spasi dengan spasi.
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
7
3. Setiap karakter pada suatu barisan harus dipasangkan dengan karakter
pada barisan lain atau dipasangkan dengan spasi.
Barisan A :
a1 a2 _ a3 …. ai ….
Barisan B :
b1 _ b2 b3 …. bj …. bn-1 bn
_
am
Gambar 2.1. Salah satu penyejajaran barisan A dengan barisan B
Gambar 2.1 merupakan salah satu penyejajaran barisan A dengan
barisan B. Pada penyejajaran tersebut karakter pertama pada barisan
pertama dipasangkan dengan karakter pertama pada barisan kedua, karakter
kedua pada barisan pertama dipasangkan dengan spasi, karakter kedua
pada barisan kedua dipasangkan dengan spasi, dan seterusnya.
Pada penyejajaran barisan A dengan B, pemasangan antar karakter ai
dengan bj memberikan dua kemungkinan, yaitu
1. terjadi pemasangan karakter yang sama, jika ai = bj,
2. terjadi pemasangan karakter yang berbeda, jika ai ≠ bj.
Contoh 2.1
Diberikan 2 barisan DNA, yaitu
barisan pertama GG dengan panjang karakter 2, dan
barisan kedua CGA dengan panjang karakter 3.
Salah satu penyejajaran yang mungkin adalah sebagai berikut.
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
8
_ G G
C G A
Dari penyejajaran diatas diperoleh 3 pemasangan, yaitu
pemasangan spasi dengan karakter pertama barisan kedua (C),
pemasangan karakter pertama barisan pertama (G) dengan karakter
kedua barisan kedua (G), dan
pemasangan karakter kedua barisan pertama (G) dengan karakter
ketiga barisan kedua (A).
Selain penyejajaran di atas, beberapa penyejajaran yang mungkin terjadi
antara lain sebagai berikut.
2.3
G _ G
G _ G _
C G A
_ C G A
Pemberian Skor pada Penyejajaran Dua Barisan DNA
Telah dijelaskan sebelumnya bahwa penyejajaran DNA dilakukan
untuk melihat seberapa besar tingkat kemiripan antarbarisan. Besar tingkat
kemiripan ini diukur dari skor penyejajaran. Pada subbab ini akan dijelaskan
mengenai pemberian skor pada penyejajaran DNA.
Pada penyejajaran barisan dipasangkan masing-masing karakter
pada suatu barisan dengan karakter atau spasi pada barisan lain. Setiap
pemasangan tersebut akan diberikan skor. Biasanya pemasangan
antarkarakter yang sama akan diberikan skor yang lebih besar daripada
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
9
pemasangan yang lain. Berikut ketentuan pemberian skor pada tugas akhir
ini, yaitu
1. pemasangan antarkarakter yang sama akan diberikan skor 2,
2. pemasangan antarkarakter yang berbeda akan diberikan skor -1, dan
3. pemasangan karakter dengan spasi akan diberikan skor -1.
Pemberian skor untuk penyejajaran pada Gambar 2.1 adalah sebagai
berikut.
Pada pemasangan ai dengan bj
Jika ai = bj, maka pemasangan tersebut diberi skor 2.
Jika ai ≠ bj, maka pemasangan tersebut diberi skor -1.
Pada pemasangan a2 dengan spasi dan pemasangan spasi dengan b2
diberikan skor -1. Begitu pula untuk semua pemasangan karakter
dengan spasi diberikan skor -1.
Contoh 2.2
Diberikan dua barisan, yaitu
barisan pertama AGGT dengan panjang karakter 4, dan
barisan kedua ATA dengan panjang karakter 3.
Salah satu penyejajaran yang mungkin adalah
A G G T
A _
T
A
Skor dari penyejajaran di atas adalah sebagai berikut.
Skor pemasangan karakter A dengan karakter A adalah 2,
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
10
skor pemasangan karakter G dengan spasi adalah -1,
skor pemasangan karakter G dengan karakter T adalah -1,
skor pemasangan karakter T dengan karakter A adalah -1.
Jadi, total skor dari penyejajaran di atas adalah jumlah skor-skor
pemasangan karakter antardua barisan tersebut yaitu 2 + (-1) + (-1) + (-1) =
-1.
2.4
Menentukan Penyejajaran yang Optimum
Penyejajaran yang optimum adalah penyejajaran yang memiliki total
skor penyejajaran paling besar dari semua penyejajaran yang mungkin.
Contoh 2.3
Diberikan dua barisan DNA, yaitu
barisan pertama G G C dengan panjang karakter 3, dan
barisan kedua G A C C dengan panjang karakter 4.
Penyejajaran yang optimum dari kedua barisan tersebut ada 2 yaitu sebagai
berikut.
G G C _
G A C C
Dengan total skor: 2 + (-1) + 2 + (-1) = 2.
G G _ C
G A C C
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
11
Dengan total skor : 2 + (-1) + (-1) + 2 = 2.
Kedua penyejajaran di atas merupakan penyejajaran yang optimum
karena kedua penyejajaran tersebut memberikan total skor yang maksimum
di antara semua kemungkinan penyejajaran barisan G G C dan G A C C
yang lain.
Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008
Download