BAB II KONSEP DASAR PENYEJAJARAN DUA BARISAN DNA DNA merupakan salah satu pembawa informasi genetik dari makhluk hidup. DNA terdiri dari 4 karakter huruf, yaitu G (Guanine), A (Alanine), T (Thymine), dan C (Cytosine). Dari susunan karakter-karakter pada barisan DNA dapat diketahui sifat makhluk hidup. Suatu barisan DNA tidak muncul dengan sendirinya tetapi berasal dari barisan yang telah ada sebelumnya. Jika ditemukan barisan baru yang belum diketahui sebelumnya, maka dengan membandingkan barisan tersebut dengan barisan yang sudah diketahui sebelumnya dapat memberikan informasi genetik dari barisan yang baru. Jika beberapa barisan berasal dari ancestor (nenek moyang) yang sama, maka susunan karakter-karakter pada beberapa barisan tersebut belum tentu sama secara keseluruhan. Hal ini disebabkan adanya proses evolusi. Oleh karena itu dilakukan penyejajaran barisan untuk melihat tingkat kemiripan antar barisan tersebut. Penyejajaran barisan DNA dapat dilakukan antardua barisan (pairwise) dan lebih dari dua barisan (multiple). Dalam tugas akhir ini yang akan dibahas adalah konsep dasar dari penyejajaran dua barisan yang diperlukan untuk memudahkan pemahaman pada bab-bab selanjutnya. Selain itu juga akan dibahas pemberian skor pada penyejajaran dua barisan. 5 FMIPA UI, 2008 Penyejajaran barisan..., Erizkia Melati, 6 2.1 Definisi Penyejajaran Dua Barisan Diberikan dua barisan, yaitu A = a1, a2, …, am dan B = b1, b2, …, bn, ai menyatakan karakter ke-i pada barisan A dan bj menyatakan barisan ke-j pada barisan B. Penyejajaran barisan A dan B dapat didefinisikan sebagai himpunan berurutan dari pasangan karakter (ai, bj) dan dari pasangan karakter dengan gap, yaitu ( _, bj) dan (ai, _ ), dengan kendala jika spasi ( _ ) dihilangkan maka akan diperoleh barisan awal [3]. 2.2 Konsep Penyejajaran Barisan Penyejajaran barisan dimaksudkan untuk memasangkan sebanyak mungkin karakter yang sama antardua barisan tanpa mengubah urutan karakter pada setiap barisan. Penyejajaran dua barisan dilakukan dengan meletakkan salah satu barisan di atas barisan yang lain, kemudian menyisipkan satu atau lebih dari satu spasi di awal, di tengah, atau di belakang barisan. Penyisipan spasi pada salah satu atau kedua barisan tersebut menyebabkan kedua barisan memiliki panjang yang sama. Dari definisi penyejajaran barisan pada subbab sebelumnya, untuk melakukan penyejajaran ada beberapa hal yang harus diperhatikan, yaitu sebagai berikut 1. Urutan karakter pada barisan setelah disejajarkan sama seperti barisan awal yang belum disejajarkan. 2. Tidak ada pemasangan spasi dengan spasi. Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008 7 3. Setiap karakter pada suatu barisan harus dipasangkan dengan karakter pada barisan lain atau dipasangkan dengan spasi. Barisan A : a1 a2 _ a3 …. ai …. Barisan B : b1 _ b2 b3 …. bj …. bn-1 bn _ am Gambar 2.1. Salah satu penyejajaran barisan A dengan barisan B Gambar 2.1 merupakan salah satu penyejajaran barisan A dengan barisan B. Pada penyejajaran tersebut karakter pertama pada barisan pertama dipasangkan dengan karakter pertama pada barisan kedua, karakter kedua pada barisan pertama dipasangkan dengan spasi, karakter kedua pada barisan kedua dipasangkan dengan spasi, dan seterusnya. Pada penyejajaran barisan A dengan B, pemasangan antar karakter ai dengan bj memberikan dua kemungkinan, yaitu 1. terjadi pemasangan karakter yang sama, jika ai = bj, 2. terjadi pemasangan karakter yang berbeda, jika ai ≠ bj. Contoh 2.1 Diberikan 2 barisan DNA, yaitu barisan pertama GG dengan panjang karakter 2, dan barisan kedua CGA dengan panjang karakter 3. Salah satu penyejajaran yang mungkin adalah sebagai berikut. Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008 8 _ G G C G A Dari penyejajaran diatas diperoleh 3 pemasangan, yaitu pemasangan spasi dengan karakter pertama barisan kedua (C), pemasangan karakter pertama barisan pertama (G) dengan karakter kedua barisan kedua (G), dan pemasangan karakter kedua barisan pertama (G) dengan karakter ketiga barisan kedua (A). Selain penyejajaran di atas, beberapa penyejajaran yang mungkin terjadi antara lain sebagai berikut. 2.3 G _ G G _ G _ C G A _ C G A Pemberian Skor pada Penyejajaran Dua Barisan DNA Telah dijelaskan sebelumnya bahwa penyejajaran DNA dilakukan untuk melihat seberapa besar tingkat kemiripan antarbarisan. Besar tingkat kemiripan ini diukur dari skor penyejajaran. Pada subbab ini akan dijelaskan mengenai pemberian skor pada penyejajaran DNA. Pada penyejajaran barisan dipasangkan masing-masing karakter pada suatu barisan dengan karakter atau spasi pada barisan lain. Setiap pemasangan tersebut akan diberikan skor. Biasanya pemasangan antarkarakter yang sama akan diberikan skor yang lebih besar daripada Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008 9 pemasangan yang lain. Berikut ketentuan pemberian skor pada tugas akhir ini, yaitu 1. pemasangan antarkarakter yang sama akan diberikan skor 2, 2. pemasangan antarkarakter yang berbeda akan diberikan skor -1, dan 3. pemasangan karakter dengan spasi akan diberikan skor -1. Pemberian skor untuk penyejajaran pada Gambar 2.1 adalah sebagai berikut. Pada pemasangan ai dengan bj Jika ai = bj, maka pemasangan tersebut diberi skor 2. Jika ai ≠ bj, maka pemasangan tersebut diberi skor -1. Pada pemasangan a2 dengan spasi dan pemasangan spasi dengan b2 diberikan skor -1. Begitu pula untuk semua pemasangan karakter dengan spasi diberikan skor -1. Contoh 2.2 Diberikan dua barisan, yaitu barisan pertama AGGT dengan panjang karakter 4, dan barisan kedua ATA dengan panjang karakter 3. Salah satu penyejajaran yang mungkin adalah A G G T A _ T A Skor dari penyejajaran di atas adalah sebagai berikut. Skor pemasangan karakter A dengan karakter A adalah 2, Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008 10 skor pemasangan karakter G dengan spasi adalah -1, skor pemasangan karakter G dengan karakter T adalah -1, skor pemasangan karakter T dengan karakter A adalah -1. Jadi, total skor dari penyejajaran di atas adalah jumlah skor-skor pemasangan karakter antardua barisan tersebut yaitu 2 + (-1) + (-1) + (-1) = -1. 2.4 Menentukan Penyejajaran yang Optimum Penyejajaran yang optimum adalah penyejajaran yang memiliki total skor penyejajaran paling besar dari semua penyejajaran yang mungkin. Contoh 2.3 Diberikan dua barisan DNA, yaitu barisan pertama G G C dengan panjang karakter 3, dan barisan kedua G A C C dengan panjang karakter 4. Penyejajaran yang optimum dari kedua barisan tersebut ada 2 yaitu sebagai berikut. G G C _ G A C C Dengan total skor: 2 + (-1) + 2 + (-1) = 2. G G _ C G A C C Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008 11 Dengan total skor : 2 + (-1) + (-1) + 2 = 2. Kedua penyejajaran di atas merupakan penyejajaran yang optimum karena kedua penyejajaran tersebut memberikan total skor yang maksimum di antara semua kemungkinan penyejajaran barisan G G C dan G A C C yang lain. Penyejajaran barisan..., Erizkia Melati, FMIPA UI, 2008