BIOINFORMATIKA Pengenalan Bioinformatika Contents • Sejarah Bioinformatika • Istilah Biologi • Pangkalan Data • Tools Bioinformatika Definisi • Bioinformatika (bioinformatics) adalah ilmu yang mempelajari penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. • Bidang ini mencakup penerapan metode-metode matematika, statistika, informatika, fisika, biologi, dan ilmu kedokteran untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. • Contoh topik utama bidang ini meliputi basis data untuk • mengelola informasi biologis, • penyejajaran sekuens (sequence alignment), • prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur sekunder RNA, • analisis filogenetik, dan • analisis ekspresi gen. Pendahuluan • Bioinformatika merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi dibidang molekular. • Pembahasan dibidang bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern, salah satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat dalam molekul DNA. Latar Belakang Bioinformatika • Kemajuan bioteknologi dan teknologi informasi • Dilatarbelakangi oleh ledakan data (data explosion) observasi biologi sebagai hasil yang dicapai dari kemajuan bioteknologi. Contohnya adalah pertumbuhan pesat database DNA pada GenBank. Genbank adalah database utama dalam biologi molekuler, yang dikelola oleh NCBI (National Center for Biotechnology Information) di AS. • Kemampuan untuk memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi informasi melalui perkembangan hardware dan software. • Baik pihak pabrikan sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak. • Salah satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa tahun). Peluang Bioinformatika • Ilmu bioinformatika lahir atas insiatif para ahli ilmu • • • • komputer berdasarkan artificial intelligence. Mereka berpikir bahwa semua gejala yang ada di alam ini bisa dibuat secara artificial melalui simulasi dari gejalagejala tersebut. Untuk mewujudkan hal ini diperlukan data-data yang yang menjadi kunci penentu tindak-tanduk gejala alam tersebut, yaitu gen yang meliputi DNA atau RNA. Bioinformatika ini penting untuk manajemen data-data dari dunia biologi dan kedokteran modern. Perangkat utama Bioinformatika adalah program software dan didukung oleh kesediaan internet Teknologi DNA Rekombinan • Perkembangan teknologi DNA rekombinan memainkan peranan penting dalam lahirnya bioinformatika. • Teknologi DNA rekombinan memunculkan suatu pengetahuan baru dalam rekayasa genetika organisme yang dikenal dengan bioteknologi. • Perkembangan bioteknologi dari bioteknologi tradisional ke bioteknologi modern salah satunya ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme, sekuensing DNA dan manipulasi DNA. Sekuensing DNA • Sekuensing DNA satu organisme, misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau molekul DNA atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh pada tahun 1977. • Kemudian sekuen seluruh DNA manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun, walaupun semua ini belum terlalu lengkap. • Saat ini terdapat milyaran data nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan tahun 1982. Sejarah Bioinformatika • 1960an: penerapan bidang-bidang dalam bioinformatika seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi. • 1960an: Pangkalan data sekuens protein mulai dikembangkan di Amerika Serikat. • 1970an: pangkalan data sekuens DNA dikembangkan di Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler Eropa (European Molecular Biology Laboratory). • 1970an: Penemuan teknik sekuensing DNA menjadi landasan terjadinya ledakan jumlah sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an. • Hal ini menjadi salah satu pembuka jalan bagi proyekproyek pengungkapan genom, yang meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika. • 1980an: Bioinformatika pertamakali dikemukakan untuk mengacu kepada penerapan ilmu komputer dalam bidang biologi. Tepatnya, istilah Bioinformatika pertama kali diperkenalkan pada 1979 oleh Paulien Hogeweg. • Perkembangan jaringan internet juga mendukung berkembangnya bioinformatika. • Pangkalan data bioinformatika yang terhubungkan melalui internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke dalam pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan analisis. • Selain itu, penyebaran program-program aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam mengakses program-program tersebut dan kemudian memudahkan pengembangannya. • Kemajuan ilmu Bioinformatika ini lebih didesak lagi oleh genome project yang dilaksanakan di seluruh dunia dan menghasilkan tumpukan informasi gen dari berbagai makhluk hidup, mulai dari makhluk hidup tingkat rendah sampai makhluk hidup tingkat tinggi • Pada tahun 2001, genom manusia yang terdiri dari 2.91 juta bp (base-pare, pasangan basa) telah selesai dibaca [2]. • Baru-baru ini genom mikroba Plasmodium penyebab Malaria dan nyamuk Anopheles yang menjadi vektor mikroba tersebut juga telah berhasil dibaca [3-4]. • Dan masih banyak lagi gen-gen dari makhluk hidup lainnya yang sudah dan sedang dibaca • Pengorganisasian data yang ada sangat berguna untuk analisis yang lebih baik. • Pekerja di bidang bioinformatika memastikan informasi biologis tersedia, melalui pengawasan kualitas, pemeriksaan silang, dan standarisasi, untuk selanjutnya bisa dicari dengan mudah. Istilah Biologi • Biologi molekular • Sel • DNA • RNA • Gen • Molekul • Protein • Genom Biologi molekular • Merupakan salah satu cabang biologi yang merujuk kepada pengkajian mengenai kehidupan pada skala molekul. • Ini termasuk penyelidikan tentang interaksi molekul dalam benda hidup dan kesannya, terutama tentang interaksi berbagai sistem dalam sel, termasuk interaksi DNA, RNA, dan sintesis protein, dan bagaimana interaksi tersebut diatur. Sel • Sel merupakan unit organisasi terkecil yang menjadi dasar kehidupan dalam arti biologis. • Semua fungsi kehidupan diatur dan berlangsung di dalam sel. • Karena itulah, sel dapat berfungsi secara autonom asalkan seluruh kebutuhan hidupnya terpenuhi. Molekul • Molekul didefinisikan sebagai sekelompok atom (paling sedikit dua) yang saling berikatan dengan sangat kuat (kovalen) dalam susunan tertentu dan bermuatan netral serta cukup stabil DNA • Asam deoksiribonukleat, lebih dikenal dengan DNA • • • • (bahasa Inggris: deoxyribonucleic acid), adalah sejenis asam nukleat yang tergolong biomolekul utama penyusun berat kering setiap organisme. Di dalam sel, DNA umumnya terletak di dalam inti sel. Secara garis besar, peran DNA di dalam sebuah sel adalah sebagai materi genetik; artinya, DNA menyimpan cetak biru bagi segala aktivitas sel. Ini berlaku umum bagi setiap organisme. Di antara perkecualian yang menonjol adalah beberapa jenis virus (dan virus tidak termasuk organisme) seperti HIV (Human Immunodeficiency Virus). RNA • Asam ribonukleat (bahasa Inggris:ribonucleic acid, RNA) senyawa yang merupakan bahan genetik dan memainkan peran utama dalam ekspresi genetik. Dalam dogma pokok (central dogma) genetika molekular, RNA menjadi perantara antara informasi yang dibawa DNA dan ekspresi fenotipik yang diwujudkan dalam bentuk protein. Gen • Gen adalah unit pewarisan sifat bagi organisme hidup. • Bentuk fisiknya adalah urutan DNA yang menyandi suatu protein, polipeptida, atau seuntai RNA yang memiliki fungsi bagi organisme yang memilikinya. • Gen adalah bagian DNA yang bertugas untuk menentukan kapan, dimana, seberapa banyak suatu protein diproduksi. • Kelainan yang terjadi pada gen, akan menyebabkan ketidaknormalan pada fungsi protein, dan pada gilirannya berkaitan erat dengan mekanisme timbulnya penyakit pada seseorang. • Karena itu analisa ekspresi gen ini merupakan informasi penting untuk mengetahui mekanisme timbulnya suatu penyakit, dan mendesain terapi medis yang tepat bagi seorang pasien Gen Protein • Protein adalah senyawa organik kompleks berbobot molekul tinggi yang • • • • • • merupakan polimer dari monomer-monomer asam amino yang dihubungkan satu sama lain dengan ikatan peptida. Molekul protein mengandung karbon, hidrogen, oksigen, nitrogen dan kadang kala sulfur serta fosfor. Protein berperan penting dalam struktur dan fungsi semua sel makhluk hidup dan virus. Kebanyakan protein merupakan enzim atau subunit enzim. Jenis protein lain berperan dalam fungsi struktural atau mekanis, seperti misalnya protein yang membentuk batang dan sendi sitoskeleton. Protein terlibat dalam sistem kekebalan (imun) sebagai antibodi, sistem kendali dalam bentuk hormon, sebagai komponen penyimpanan (dalam biji) dan juga dalam transportasi hara. Sebagai salah satu sumber gizi, protein berperan sebagai sumber asam amino bagi organisme yang tidak mampu membentuk asam amino tersebut (heterotrof). Sintesis Protein • Sintesis protein adalah proses pencetakan protein dalam sel. • Sifat enzim (protein) sebagai pengendali dan penumbuh karakter makhluk hidup ditentukan oleh jumlah jenis, dan urutan asam amino yang menyusunnya. • Jenis dan urutan asam amino ditentukan oleh ADN (Asam Dioksiribose Nukleat • Sintesis protein meliputi dua langkah, yaitu transkripsi dan translasi. Genom • Genom (Ing. genome), dalam genetika, adalah keseluruhan bahan • • • • • genetik yang membawa semua informasi pendukung kehidupan pada suatu makhluk hidup, baik yang merupakan gen atau bukan. Pada semua makhluk hidup, genom mencakup semua informasi genetik yang dibawa DNA, baik di inti sel (nukleus), mitokondria, maupun plastida. Virus tertentu memiliki genom dalam bentuk RNA. Setiap spesies makhluk hidup memiliki paket genom yang berbedabeda, yang menjelaskan mengapa perkawinan silang antara dua spesies sering menghasilkan keturunan yang mandul (steril). Istilah ini diperkenalkan oleh Hans Winkler, seorang profesor dari Universitas Hamburg, Jerman pada tahun 1920, sebagai singkatan (portmanteau) dari gene dan chromosome. Kajian yang mempelajari bahan genetik secara keseluruhan ini dikenal sebagai genomika (genomics). Gambar dari 46 macam kromosom yang membentuk Genom seseorang jenis laki-laki Pangkalan data • Pada dasarnya data-data gen yang sudah ada ini bisa menekan banyaknya waktu dan biaya yang diperlukan untuk menyelesaikan sebuah penelitian. • Sebagai contoh, untuk menciptakan obat untuk penyakit tertentu, seorang peneliti bisa memulai dengan melihat karakteristik dan fungsi gen yang sudah ada dalam data, untuk kemudian dibandingkan dan diteliti lebih lanjut. • Daripada memulai dengan ribuan kemungkinan yang ada, akan lebih menghemat waktu dan biaya bila peneliti memulai dengan yang memiliki kemungkinan berhasil paling tinggi. Pangkalan Data • Pangkalan data primer: digunakan untuk menyimpan sekuens primer asam nukleat dan protein. • Pangkalan data sekunder: digunakan untuk menyimpan motif sekuens protein, • Pangkalan data struktur: digunakan untuk menyimpan data struktur protein dan asam nukleat. Pangkalan data primer • Pangkalan data primer untuk sekuens asam nukleat saat ini adalah • GenBank (Amerika Serikat), • EMBL (the European Molecular Biology Laboratory, Eropa), dan • DDBJ (DNA Data Bank of Japan, Jepang). • Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan masing-masing pangkalan data. • Sumber utama data sekuens asam nukleat adalah submisi (pengumpulan) langsung dari • peneliti individual, • proyek sekuensing genom, dan • pendaftaran paten. • Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam nukleat pada umumnya mengandung informasi tentang • jenis asam nukleat (DNA atau RNA), • nama organisme sumber asam nukleat tersebut, dan • segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut. • Selain asam nukleat, beberapa contoh pangkalan data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). • Ketiga pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai terutama oleh Amerika Serikat. • Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut. Pangkalan data primer: Genbank • Genbank, dioperasikan oleh NCBI (National Center for Biotechnology Information) mengakomodasi semua publikasi sequences of DNA, dengan annotations (penjelasan atau catatan), yang secara konstan akan selalu berkembang dan diperbaharui. • Penjelasan meliputi identifikasi suatu gen, produk gen (jika diketahui), link informasi lain yang terkait dengan sumber database lain. • NCBI berisi informasi dari sekuens DNA yang sama dengan sekuens DNA dalam EMBL (European Molecular Biology Laboratory) dan DDBJ (DNA Data Bank of Japan) Pangkalan data primer: OMIM • OMIM, (Online Mendelian Inheritance in Man—woman), adalah insiklopedia gen-gen manusia dan penyakit genetik, merupakan penghubung untuk entry gen pada GenBank dan literatur ilmiah pada PubMed, berisi informasi berbagai gen manusia komplit dan paling baru. Pangkalan data primer: PDB • PDB (Protein Data Bank) berisi semua publisitas yang ada secara eksperimen telah dideterminasi (oleh x-ray crystallography dan NMR) sebagai model structural proteins dan asam nukleat. • Tidak berisi model homologi atau tipe model teoritis lainnya. Pangkalan data primer: PubMed pada Wikipedia sebagai “suatu kebebasan mengakses sititasi database MEDLINE dan abstrak artikel riset biomedik. • Subjek utama adalah riset di bidang kedokteran, dan PubMed juga mempublikasi bidang yang terkait dengan bidang kedokteran, seperti kebidanan dan disipiin kesehatan lainnya. • Hal ini secara menyeIuruh meliputi keilmuan yang berhungan dengan ilmu seperti biokemia dan biologi sel. • Situs ini ditawarkan oleh the United States National Library of Medicine di the National Institutes of Health sebagai bagian dari the Entrez information retrieval system.“ • Diskripsi Pangkalan data primer : UniProt Knowledgebase • UniProt Knowledgebase (Swiss-Prot and TrEMBL), dioperasikan oleh SIB (Swiss Institute of Bioinformatics) dan EBI (European BioinformaticsInstitute), berisi sebagian besar publikasi yang ada berupa sekuens protein (bukan DNA atau RNA). • Sekuens dalam Swiss-Prot dijelaskan secara manual dan menyediakan atau menghubungkan pengguna dengan semua informasi publisitas yang berisi sekuens tersebut. • Sequences pada TrEMBL dikoleksi dan dijabarkan secara otomatis dari sekuens database, dan akan membuat jalannya menuju Swiss-Prot, tetapi tidak hanya setelah mereka secara manual menjabarkan Swiss-Prot standards. Situs Informasi database DNA, RNA dan Protein • • • • • • • NCBI: www.ncbi.nlm.nih.gov EMBL: www.ebi.ac.uk DDBJ: www.ddbj.nig.ac.jp SWISSPROT:www.expasy.ch/sprot/sprot_details.html ENSEMBL: www.ensembl.org Univeristy California Santa Cruz: genome.cse.ucsc.edu MGD the Jackson Lab: www.informatics.jax.org Tools Bioinformatika : BLAST • Perangkat bioinformatika yang berkaitan erat dengan penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment Search Tool). • Penelusuran BLAST (BLAST search) pada pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. • Hal ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil sekuensing atau untuk memeriksa fungsi gen hasil sekuensing. • Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens. Tools Bioinformatika : PDB • PDB (Protein Data Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein atau pun asam nukleat. Peluang Bioinformatika • Masih banyak kendala dalam bioinformatika, di antaranya adalah kesulitan untuk menemukan semua gen dari organisme, mengidentifikasi dan menjelaskan tentang gen-gen tersebut, kesulitan dalam membandingkan kemiripan DNA/protein yang ada, dan seterusnya. • Namun semakin canggihnya komputer membuat bioinformatika patut optimis. • Karena komputer hanya bisa membuat data dan mereka tidak memberikan jawaban, dunia ini masih memerlukan banyak orang yang mau dan mampu memberikan jawaban atas persoalan biologis yang bermanfaat bagi kehidupan di dunia.