- COMPARISON - Multiple Sequences Alignment

advertisement
- COMPARISON Multiple Sequences
Alignment
Multiple Sequence Alignment ?
SEKUEN
STRUKTUR
FUNGSI
• Usaha penjajaran (alignment) lebih dari satu sekuen
• Berhubungan dengan penentuan hipotesis terhadap
beberapa sekuen, yaitu seberapa besar perubahan
(evolusi) dari sekuen tersebut yang terjadi melalui
proses substitusi, delesi, dan insersi pada residuresidu sekuen tersebut.
Program Multiple Alignment
Muscle
K-mer clustering,
Progressive
alignment
Accurate
Fast
T- Coffee
Clustal
Progressive global Progressive global
and local
alignment
alignment
Accurate
Greedy
(Less Accurate)
Slow
Medium
Progressive Sequence Alignment
Input data sekuen
Program multiple Alignment
Clustal X
Input Sekuen yang homolog
 Fasta format
Input data  Sekumpulan sekuen yang homolog (Share a
common ancestor)
Hasil Multiple Alignment
Residu hasil penjajaran
Posisi setiap
residu
Sekuen Input
•
•
•
•
Gap
Subtitusi
Conserve
Non
Conserve
Perbedaan residu menunjukkan adanya subtitusi
Gap “-”  adanya insersi atau delesi residu
Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ”
Tanda “ : ”  berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang
sama
Kriteria dan arti dari
Multiple Sequence Alignment
KRITERIA
ARTINYA
Structure
Similarity
Asam amino yang memiliki peran yang sama di setiap
struktur berada dalam kolom yang sama. Program 
Structure Superposition
Evolutionary
Similarity
Asam amino atau nukleotida yang memiliki sejarah
ancestor yang sama dari setiap sekuen ditempatkan
ditempat yang sama
Functional
Similarity
Asam amino atau nukleotida yang memiliki fungsi yang
sama berada dalam kolom yang sama
Sequence
Similarity
•Asam amino yang berada dalam satu kolom adalah
yang menghasilkan penjajaran dengan kesamaan
(similarity) paling maksimal.
•Ketika sekuen-sekuen berhubungan dekat, kesamaan
struktur, evolusi, dan fungsi sama dengan kesamaan
sekuen
- PREDIKSI Filogenetika molekuler
Filogeni
Ilmu yang mempelajari estimasi atau konstruksi
sejarah evolusi dari suatu organisme atau sekuen
Filogeni yang berdasarkan perbandingan data-data sekuen
biologi molekuler (DNA atau Protein)
TERMINOLOGI
 Gene Tree
 Species Tree
 Root
 Branch (Edges) =
Cabang
 Branch Length =
Tingkat perbedaan
 Node:
o Internal (Last Common Anchestor)
o Terminal = Leafs (OTUs)
 Outgroup
HOMOLOGY
 Homolog = kesamaan yang diperoleh dari anchestor (nenek
moyang) yang sama.
 Ortolog = duplikasi ketika inang membelah, bersamaan
dengan keseluruhan genom (vertically transmitted/ parent
to offspring)  gen X spesies A dengan gen X spesies B
 Paralog =muncul karena duplikasi gen (multigene family) 
Gen X dengan Gen X’  Rentan misinterpretasi (karena
hilangnya gen)
• Filogenetik cenderung tidak bias karena
informasi yang digunakan adalah sekuen
DNA atau protein
• Reason to do phylogenetic :
– menentukan kekerabatan organisme, pada
bateri dengan sekuen 16s rRNA
– menentukan fungsi suatu gen
– menetukan asal usul gen
– melihat persebaran organisme (filogeografi)
30 November 2008
• DNA vs Protein, the hard choice?
– jika organisme/gen berkerabat dekat atau
homologi > 70%  DNA
– Jika organisme/gen berkerabat jauh atau
homologi < 70%  Protein
• Dari mana Anda tahu nilai homologinya?
BLAST
• Pilihan Anda akan berpengaruh pada hasil
Multiple Sequence Alignment
30 November 2008
• Kunci dari filogenetik yang baik  Multiple
Sequence Alignment (MSA) yang baik.
• Jika MSA Anda tidak cukup baik  pohon
filogenetik tidak dapat
dipertanggungjawabkan
• Jika MSA Anda baik  pohon filogenetik
dapat dipertanggungjawabkan.
30 November 2008
• Metode rekonstruksi pohon filogenetik :
– Distance based method :
Mengukur perbedaan basa/asam amino antara dua
sekuen. Semakin kecil perbedaan  berkerabat
dekat. Contoh : Neighbor Joining (NJ)
– Sequence based method :
rekonstruksi filogenetik berdasarkan perbedaan yang
ada padaosisis tertentu dari sekuen DNA/protein.
Contoh : Maximum Parsimony, Maximum Likelihood &
Bayesian
• Semua metode dapat
dipertanggungjawabkan
30 November 2008
METHODS
•Distance Matrix Methods
(Clustering / Algoritmic Methode) 
UPGMA, NJ, Fitch
•Discrete Data Methode
(Tree Searching Methods)
Parsimony, Maximum likelihood, Bayesian
BOOTSTRAPPING (Di Uji Kekokohannya)
• Bagaimana
membaca pohon
filogenetik?
• Clade adalah
pengelompokan utama
pada pohon filogenetik
• Jarak antar Clade dilihat
dengan membandingkan
garis horizontal antar dua
cabang dengan skala
30 November 2008
Pohon filogenetik dengan metode NJ
• Bagaimana
membaca pohon
filogenetik ?
• Spesies akan
memiliki jarak
genetik yang kecil
• Genus bakteri
dengan beberapa
spesies dicirikan
dengan jarak
genetik yang
cukup jauh
30 November 2008
Pohon filogenetik 16s rRNA dengan metode NJ
• Jarak antar genus
dicirikan dengan
jarak genetik yang
jauh
30 November 2008
Pohon filogenetik 16s rRNA dengan metode NJ
BOOTSTRAPPING
• Bootstraping adalah
pengujian terhadap
kestabilan
pengelompokan pada
pohon filogenetik kita
• Semakin tinggi nilai
bootstraping semakin
stabil pengelompokan
dalam pohon
filogenetik kita
30 November 2008
Bootstraping pohon filogenetik 16s rRNA
Download