- COMPARISON Multiple Sequences Alignment Multiple Sequence Alignment ? SEKUEN STRUKTUR FUNGSI • Usaha penjajaran (alignment) lebih dari satu sekuen • Berhubungan dengan penentuan hipotesis terhadap beberapa sekuen, yaitu seberapa besar perubahan (evolusi) dari sekuen tersebut yang terjadi melalui proses substitusi, delesi, dan insersi pada residuresidu sekuen tersebut. Program Multiple Alignment Muscle K-mer clustering, Progressive alignment Accurate Fast T- Coffee Clustal Progressive global Progressive global and local alignment alignment Accurate Greedy (Less Accurate) Slow Medium Progressive Sequence Alignment Input data sekuen Program multiple Alignment Clustal X Input Sekuen yang homolog Fasta format Input data Sekumpulan sekuen yang homolog (Share a common ancestor) Hasil Multiple Alignment Residu hasil penjajaran Posisi setiap residu Sekuen Input • • • • Gap Subtitusi Conserve Non Conserve Perbedaan residu menunjukkan adanya subtitusi Gap “-” adanya insersi atau delesi residu Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ” Tanda “ : ” berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang sama Kriteria dan arti dari Multiple Sequence Alignment KRITERIA ARTINYA Structure Similarity Asam amino yang memiliki peran yang sama di setiap struktur berada dalam kolom yang sama. Program Structure Superposition Evolutionary Similarity Asam amino atau nukleotida yang memiliki sejarah ancestor yang sama dari setiap sekuen ditempatkan ditempat yang sama Functional Similarity Asam amino atau nukleotida yang memiliki fungsi yang sama berada dalam kolom yang sama Sequence Similarity •Asam amino yang berada dalam satu kolom adalah yang menghasilkan penjajaran dengan kesamaan (similarity) paling maksimal. •Ketika sekuen-sekuen berhubungan dekat, kesamaan struktur, evolusi, dan fungsi sama dengan kesamaan sekuen - PREDIKSI Filogenetika molekuler Filogeni Ilmu yang mempelajari estimasi atau konstruksi sejarah evolusi dari suatu organisme atau sekuen Filogeni yang berdasarkan perbandingan data-data sekuen biologi molekuler (DNA atau Protein) TERMINOLOGI Gene Tree Species Tree Root Branch (Edges) = Cabang Branch Length = Tingkat perbedaan Node: o Internal (Last Common Anchestor) o Terminal = Leafs (OTUs) Outgroup HOMOLOGY Homolog = kesamaan yang diperoleh dari anchestor (nenek moyang) yang sama. Ortolog = duplikasi ketika inang membelah, bersamaan dengan keseluruhan genom (vertically transmitted/ parent to offspring) gen X spesies A dengan gen X spesies B Paralog =muncul karena duplikasi gen (multigene family) Gen X dengan Gen X’ Rentan misinterpretasi (karena hilangnya gen) • Filogenetik cenderung tidak bias karena informasi yang digunakan adalah sekuen DNA atau protein • Reason to do phylogenetic : – menentukan kekerabatan organisme, pada bateri dengan sekuen 16s rRNA – menentukan fungsi suatu gen – menetukan asal usul gen – melihat persebaran organisme (filogeografi) 30 November 2008 • DNA vs Protein, the hard choice? – jika organisme/gen berkerabat dekat atau homologi > 70% DNA – Jika organisme/gen berkerabat jauh atau homologi < 70% Protein • Dari mana Anda tahu nilai homologinya? BLAST • Pilihan Anda akan berpengaruh pada hasil Multiple Sequence Alignment 30 November 2008 • Kunci dari filogenetik yang baik Multiple Sequence Alignment (MSA) yang baik. • Jika MSA Anda tidak cukup baik pohon filogenetik tidak dapat dipertanggungjawabkan • Jika MSA Anda baik pohon filogenetik dapat dipertanggungjawabkan. 30 November 2008 • Metode rekonstruksi pohon filogenetik : – Distance based method : Mengukur perbedaan basa/asam amino antara dua sekuen. Semakin kecil perbedaan berkerabat dekat. Contoh : Neighbor Joining (NJ) – Sequence based method : rekonstruksi filogenetik berdasarkan perbedaan yang ada padaosisis tertentu dari sekuen DNA/protein. Contoh : Maximum Parsimony, Maximum Likelihood & Bayesian • Semua metode dapat dipertanggungjawabkan 30 November 2008 METHODS •Distance Matrix Methods (Clustering / Algoritmic Methode) UPGMA, NJ, Fitch •Discrete Data Methode (Tree Searching Methods) Parsimony, Maximum likelihood, Bayesian BOOTSTRAPPING (Di Uji Kekokohannya) • Bagaimana membaca pohon filogenetik? • Clade adalah pengelompokan utama pada pohon filogenetik • Jarak antar Clade dilihat dengan membandingkan garis horizontal antar dua cabang dengan skala 30 November 2008 Pohon filogenetik dengan metode NJ • Bagaimana membaca pohon filogenetik ? • Spesies akan memiliki jarak genetik yang kecil • Genus bakteri dengan beberapa spesies dicirikan dengan jarak genetik yang cukup jauh 30 November 2008 Pohon filogenetik 16s rRNA dengan metode NJ • Jarak antar genus dicirikan dengan jarak genetik yang jauh 30 November 2008 Pohon filogenetik 16s rRNA dengan metode NJ BOOTSTRAPPING • Bootstraping adalah pengujian terhadap kestabilan pengelompokan pada pohon filogenetik kita • Semakin tinggi nilai bootstraping semakin stabil pengelompokan dalam pohon filogenetik kita 30 November 2008 Bootstraping pohon filogenetik 16s rRNA