Bioinformatika1 Sejarah

advertisement
Bioinformatika
Pengenalan Bioinformatika
Contents
•
•
•
•
Sejarah Bioinformatika
Istilah Biologi
Pangkalan Data
Tools Bioinformatika
Definisi
• Bioinformatika (bioinformatics) adalah ilmu yang
mempelajari penerapan teknik komputasional untuk
mengelola dan menganalisis informasi biologis.
• Bidang ini mencakup penerapan metode-metode
matematika, statistika, informatika, fisika, biologi, dan
ilmu kedokteran untuk memecahkan masalah-masalah
biologis, terutama dengan menggunakan sekuens DNA
dan asam amino serta informasi yang berkaitan
dengannya.
• Contoh topik utama bidang ini meliputi basis data untuk
– mengelola informasi biologis,
– penyejajaran sekuens (sequence alignment),
– prediksi struktur untuk meramalkan bentuk struktur protein
maupun struktur sekunder RNA,
– analisis filogenetik, dan
– analisis ekspresi gen.
Pendahuluan
• Bioinformatika merupakan ilmu terapan
yang lahir dari perkembangan teknologi
informasi dibidang molekular.
• Pembahasan dibidang bioinformatik ini
tidak terlepas dari perkembangan biologi
molekular modern, salah satunya
peningkatan pemahaman manusia dalam
bidang genomic yang terdapat dalam
molekul DNA.
Latar Belakang Bioinformatika
• Kemajuan bioteknologi dan teknologi informasi
• Dilatarbelakangi oleh ledakan data (data
explosion) observasi biologi sebagai hasil yang
dicapai dari kemajuan bioteknologi. Contohnya
adalah pertumbuhan pesat database DNA pada
GenBank. Genbank adalah database utama
dalam biologi molekuler, yang dikelola oleh
NCBI (National Center for Biotechnology
Information) di AS.
• Kemampuan untuk memahami dan memanipulasi kode
genetik DNA ini sangat didukung oleh teknologi
informasi melalui perkembangan hardware dan software.
• Baik pihak pabrikan sofware dan harware maupun pihak
ketiga dalam produksi perangkat lunak.
• Salah satu contohnya dapat dilihat pada upaya Celera
Genomics, perusahaan bioteknologi Amerika Serikat
yang melakukan pembacaan sekuen genom manusia
yang secara maksimal memanfaatkan teknologi
informasi sehingga bisa melakukan pekerjaannya dalam
waktu yang singkat (hanya beberapa tahun).
Peluang Bioinformatika
• Ilmu bioinformatika lahir atas insiatif para ahli ilmu
komputer berdasarkan artificial intelligence.
• Mereka berpikir bahwa semua gejala yang ada di alam
ini bisa dibuat secara artificial melalui simulasi dari
gejala-gejala tersebut.
• Untuk mewujudkan hal ini diperlukan data-data yang
yang menjadi kunci penentu tindak-tanduk gejala alam
tersebut, yaitu gen yang meliputi DNA atau RNA.
• Bioinformatika ini penting untuk manajemen data-data
dari dunia biologi dan kedokteran modern.
• Perangkat utama Bioinformatika adalah program
software dan didukung oleh kesediaan internet
Teknologi DNA Rekombinan
• Perkembangan teknologi DNA rekombinan
memainkan peranan penting dalam lahirnya
bioinformatika.
• Teknologi DNA rekombinan memunculkan suatu
pengetahuan baru dalam rekayasa genetika
organisme yang dikenal dengan bioteknologi.
• Perkembangan bioteknologi dari bioteknologi
tradisional ke bioteknologi modern salah
satunya ditandainya dengan kemampuan
manusia dalam melakukan analisis DNA
organisme, sekuensing DNA dan manipulasi
DNA.
Sekuensing DNA
• Sekuensing DNA satu organisme, misalnya
suatu virus memiliki kurang lebih 5.000
nukleotida atau molekul DNA atau sekitar 11
gen, yang telah berhasil dibaca secara
menyeluruh pada tahun 1977.
• Kemudian sekuen seluruh DNA manusia terdiri
dari 3 milyar nukleotida yang menyusun 100.000
gen dapat dipetakan dalam waktu 3 tahun,
walaupun semua ini belum terlalu lengkap.
• Saat ini terdapat milyaran data nukleotida yang
tersimpan dalam database DNA, GenBank di AS
yang didirikan tahun 1982.
Sejarah Bioinformatika
• 1960an: penerapan bidang-bidang dalam
bioinformatika seperti pembuatan pangkalan
data dan pengembangan algoritma untuk
analisis sekuens biologi.
• 1960an: Pangkalan data sekuens protein mulai
dikembangkan di Amerika Serikat.
• 1970an: pangkalan data sekuens DNA
dikembangkan di Amerika Serikat dan Jerman
pada Laboratorium Biologi Molekuler Eropa
(European Molecular Biology Laboratory).
• 1970an: Penemuan teknik sekuensing DNA menjadi
landasan terjadinya ledakan jumlah sekuens DNA yang
dapat diungkapkan pada 1980an dan 1990an.
• Hal ini menjadi salah satu pembuka jalan bagi proyekproyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan
pada akhirnya menyebabkan lahirnya bioinformatika.
• 1980an: Bioinformatika pertamakali dikemukakan untuk
mengacu kepada penerapan ilmu komputer dalam
bidang biologi. Tepatnya, istilah Bioinformatika pertama
kali diperkenalkan pada 1979 oleh Paulien Hogeweg.
• Perkembangan jaringan internet juga mendukung
berkembangnya bioinformatika.
• Pangkalan data bioinformatika yang terhubungkan
melalui internet memudahkan ilmuwan dalam
mengumpulkan hasil sekuensing ke dalam pangkalan
data tersebut serta memperoleh sekuens biologi sebagai
bahan analisis.
• Selain itu, penyebaran program-program aplikasi
bioinformatika melalui internet memudahkan ilmuwan
dalam mengakses program-program tersebut dan
kemudian memudahkan pengembangannya.
• Kemajuan ilmu Bioinformatika ini lebih
didesak lagi oleh genome project yang
dilaksanakan di seluruh dunia dan
menghasilkan tumpukan informasi gen
dari berbagai makhluk hidup, mulai dari
makhluk hidup tingkat rendah sampai
makhluk hidup tingkat tinggi
• Pada tahun 2001, genom manusia yang terdiri
dari 2.91 juta bp (base-pare, pasangan basa)
telah selesai dibaca [2].
• Baru-baru ini genom mikroba Plasmodium
penyebab Malaria dan nyamuk Anopheles yang
menjadi vektor mikroba tersebut juga telah
berhasil dibaca [3-4].
• Dan masih banyak lagi gen-gen dari makhluk
hidup lainnya yang sudah dan sedang dibaca
• Pengorganisasian data yang ada sangat
berguna untuk analisis yang lebih baik.
• Pekerja di bidang bioinformatika
memastikan informasi biologis tersedia,
melalui pengawasan kualitas,
pemeriksaan silang, dan standarisasi,
untuk selanjutnya bisa dicari dengan
mudah.
Istilah Biologi
•
•
•
•
•
•
•
•
Biologi molekular
Sel
DNA
RNA
Gen
Molekul
Protein
Genom
Biologi molekular
• Merupakan salah satu cabang biologi
yang merujuk kepada pengkajian
mengenai kehidupan pada skala molekul.
• Ini termasuk penyelidikan tentang interaksi
molekul dalam benda hidup dan
kesannya, terutama tentang interaksi
berbagai sistem dalam sel, termasuk
interaksi DNA, RNA, dan sintesis protein,
dan bagaimana interaksi tersebut diatur.
Sel
• Sel merupakan unit
organisasi terkecil yang
menjadi dasar kehidupan
dalam arti biologis.
• Semua fungsi kehidupan
diatur dan berlangsung di
dalam sel.
• Karena itulah, sel dapat
berfungsi secara
autonom asalkan seluruh
kebutuhan hidupnya
terpenuhi.
Molekul
• Molekul didefinisikan sebagai sekelompok
atom (paling sedikit dua) yang saling
berikatan dengan sangat kuat (kovalen)
dalam susunan tertentu dan bermuatan
netral serta cukup stabil
DNA
• Asam deoksiribonukleat, lebih dikenal dengan DNA
(bahasa Inggris: deoxyribonucleic acid), adalah sejenis
asam nukleat yang tergolong biomolekul utama
penyusun berat kering setiap organisme.
• Di dalam sel, DNA umumnya terletak di dalam inti sel.
• Secara garis besar, peran DNA di dalam sebuah sel
adalah sebagai materi genetik; artinya, DNA menyimpan
cetak biru bagi segala aktivitas sel.
• Ini berlaku umum bagi setiap organisme.
• Di antara perkecualian yang menonjol adalah beberapa
jenis virus (dan virus tidak termasuk organisme) seperti
HIV (Human Immunodeficiency Virus).
RNA
• Asam ribonukleat (bahasa
Inggris:ribonucleic acid, RNA)
senyawa yang merupakan
bahan genetik dan memainkan
peran utama dalam ekspresi
genetik. Dalam dogma pokok
(central dogma) genetika
molekular, RNA menjadi
perantara antara informasi
yang dibawa DNA dan ekspresi
fenotipik yang diwujudkan
dalam bentuk protein.
Gen
• Gen adalah unit pewarisan sifat bagi organisme hidup.
• Bentuk fisiknya adalah urutan DNA yang menyandi
suatu protein, polipeptida, atau seuntai RNA yang
memiliki fungsi bagi organisme yang memilikinya.
• Gen adalah bagian DNA yang bertugas untuk
menentukan kapan, dimana, seberapa banyak suatu
protein diproduksi.
• Kelainan yang terjadi pada gen, akan menyebabkan
ketidaknormalan pada fungsi protein, dan pada
gilirannya berkaitan erat dengan mekanisme timbulnya
penyakit pada seseorang.
• Karena itu analisa ekspresi gen ini merupakan informasi
penting untuk mengetahui mekanisme timbulnya suatu
penyakit, dan mendesain terapi medis yang tepat bagi
seorang pasien
Gen
Protein
•
•
•
•
•
•
•
Protein adalah senyawa organik kompleks berbobot molekul tinggi yang
merupakan polimer dari monomer-monomer asam amino yang
dihubungkan satu sama lain dengan ikatan peptida.
Molekul protein mengandung karbon, hidrogen, oksigen, nitrogen dan
kadang kala sulfur serta fosfor.
Protein berperan penting dalam struktur dan fungsi semua sel makhluk
hidup dan virus.
Kebanyakan protein merupakan enzim atau subunit enzim.
Jenis protein lain berperan dalam fungsi struktural atau mekanis, seperti
misalnya protein yang membentuk batang dan sendi sitoskeleton.
Protein terlibat dalam sistem kekebalan (imun) sebagai antibodi, sistem
kendali dalam bentuk hormon, sebagai komponen penyimpanan (dalam biji)
dan juga dalam transportasi hara.
Sebagai salah satu sumber gizi, protein berperan sebagai sumber asam
amino bagi organisme yang tidak mampu membentuk asam amino tersebut
(heterotrof).
Sintesis Protein
• Sintesis protein adalah proses pencetakan
protein dalam sel.
• Sifat enzim (protein) sebagai pengendali dan
penumbuh karakter makhluk hidup ditentukan
oleh jumlah jenis, dan urutan asam amino yang
menyusunnya.
• Jenis dan urutan asam amino ditentukan oleh
ADN (Asam Dioksiribose Nukleat
• Sintesis protein meliputi dua langkah, yaitu
transkripsi dan translasi.
Genom
• Genom (Ing. genome), dalam genetika, adalah keseluruhan bahan
genetik yang membawa semua informasi pendukung kehidupan
pada suatu makhluk hidup, baik yang merupakan gen atau bukan.
• Pada semua makhluk hidup, genom mencakup semua informasi
genetik yang dibawa DNA, baik di inti sel (nukleus), mitokondria,
maupun plastida.
• Virus tertentu memiliki genom dalam bentuk RNA.
• Setiap spesies makhluk hidup memiliki paket genom yang berbedabeda, yang menjelaskan mengapa perkawinan silang antara dua
spesies sering menghasilkan keturunan yang mandul (steril).
• Istilah ini diperkenalkan oleh Hans Winkler, seorang profesor dari
Universitas Hamburg, Jerman pada tahun 1920, sebagai singkatan
(portmanteau) dari gene dan chromosome.
• Kajian yang mempelajari bahan genetik secara keseluruhan ini
dikenal sebagai genomika (genomics).
Gambar dari 46 macam kromosom yang
membentuk Genom seseorang jenis laki-laki
Pangkalan data
• Pada dasarnya data-data gen yang sudah ada ini bisa
menekan banyaknya waktu dan biaya yang diperlukan
untuk menyelesaikan sebuah penelitian.
• Sebagai contoh, untuk menciptakan obat untuk penyakit
tertentu, seorang peneliti bisa memulai dengan melihat
karakteristik dan fungsi gen yang sudah ada dalam data,
untuk kemudian dibandingkan dan diteliti lebih lanjut.
• Daripada memulai dengan ribuan kemungkinan yang
ada, akan lebih menghemat waktu dan biaya bila peneliti
memulai dengan yang memiliki kemungkinan berhasil
paling tinggi.
Pangkalan Data
• Pangkalan data primer: digunakan untuk
menyimpan sekuens primer asam nukleat
dan protein.
• Pangkalan data sekunder: digunakan
untuk menyimpan motif sekuens protein,
• Pangkalan data struktur: digunakan untuk
menyimpan data struktur protein dan
asam nukleat.
Pangkalan data primer
•
Pangkalan data primer untuk sekuens asam nukleat saat ini adalah
– GenBank (Amerika Serikat),
– EMBL (the European Molecular Biology Laboratory, Eropa), dan
– DDBJ (DNA Data Bank of Japan, Jepang).
•
•
Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara
harian untuk menjaga keluasan cakupan masing-masing pangkalan data.
Sumber utama data sekuens asam nukleat adalah submisi (pengumpulan)
langsung dari
– peneliti individual,
– proyek sekuensing genom, dan
– pendaftaran paten.
•
Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens
asam nukleat pada umumnya mengandung informasi tentang
– jenis asam nukleat (DNA atau RNA),
– nama organisme sumber asam nukleat tersebut, dan
– segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
• Selain asam nukleat, beberapa contoh pangkalan data
penting yang menyimpan sekuens primer protein adalah
PIR (Protein Information Resource, Amerika Serikat),
Swiss-Prot (Eropa), dan TrEMBL (Eropa).
• Ketiga pangkalan data tersebut telah digabungkan
dalam UniProt, yang didanai terutama oleh Amerika
Serikat.
• Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein,
pustaka yang berkaitan, dan komentar yang pada
umumnya berisi penjelasan mengenai fungsi protein
tersebut.
Pangkalan data primer: Genbank
• Genbank, dioperasikan oleh NCBI (National Center for
Biotechnology Information) mengakomodasi semua
publikasi sequences of DNA, dengan annotations
(penjelasan atau catatan), yang secara konstan akan
selalu berkembang dan diperbaharui.
• Penjelasan meliputi identifikasi suatu gen, produk gen
(jika diketahui), link informasi lain yang terkait dengan
sumber database lain.
• NCBI berisi informasi dari sekuens DNA yang sama
dengan sekuens DNA dalam EMBL (European
Molecular Biology Laboratory) dan DDBJ (DNA Data
Bank of Japan)
Pangkalan data primer: OMIM
• OMIM, (Online Mendelian Inheritance in
Man—woman), adalah insiklopedia gengen manusia dan penyakit genetik,
merupakan penghubung untuk entry gen
pada GenBank dan literatur ilmiah pada
PubMed, berisi informasi berbagai gen
manusia komplit dan paling baru.
Pangkalan data primer: PDB
• PDB (Protein Data Bank) berisi semua
publisitas yang ada secara eksperimen
telah dideterminasi (oleh x-ray
crystallography dan NMR) sebagai model
structural proteins dan asam nukleat.
• Tidak berisi model homologi atau tipe
model teoritis lainnya.
Pangkalan data primer: PubMed
• Diskripsi pada Wikipedia sebagai “suatu kebebasan
mengakses sititasi database MEDLINE dan abstrak
artikel riset biomedik.
• Subjek utama adalah riset di bidang kedokteran, dan
PubMed juga mempublikasi bidang yang terkait dengan
bidang kedokteran, seperti kebidanan dan disipiin
kesehatan lainnya.
• Hal ini secara menyeIuruh meliputi keilmuan yang
berhungan dengan ilmu seperti biokemia dan biologi sel.
• Situs ini ditawarkan oleh the United States National
Library of Medicine di the National Institutes of Health
sebagai bagian dari the Entrez information retrieval
system.“
Pangkalan data primer : UniProt
Knowledgebase
• UniProt Knowledgebase (Swiss-Prot and TrEMBL),
dioperasikan oleh SIB (Swiss Institute of Bioinformatics)
dan EBI (European BioinformaticsInstitute), berisi
sebagian besar publikasi yang ada berupa sekuens
protein (bukan DNA atau RNA).
• Sekuens dalam Swiss-Prot dijelaskan secara manual
dan menyediakan atau menghubungkan pengguna
dengan semua informasi publisitas yang berisi sekuens
tersebut.
• Sequences pada TrEMBL dikoleksi dan dijabarkan
secara otomatis dari sekuens database, dan akan
membuat jalannya menuju Swiss-Prot, tetapi tidak hanya
setelah mereka secara manual menjabarkan Swiss-Prot
standards.
Situs Informasi database DNA,
RNA dan Protein
•
•
•
•
•
•
•
NCBI: www.ncbi.nlm.nih.gov
EMBL: www.ebi.ac.uk
DDBJ: www.ddbj.nig.ac.jp
SWISSPROT:www.expasy.ch/sprot/sprot_details.html
ENSEMBL: www.ensembl.org
Univeristy California Santa Cruz:
genome.cse.ucsc.edu
MGD the Jackson Lab:
www.informatics.jax.org
Tools Bioinformatika : BLAST
• Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah
BLAST (Basic Local Alignment Search Tool).
• Penelusuran BLAST (BLAST search) pada pangkalan
data sekuens memungkinkan ilmuwan untuk mencari
sekuens baik asam nukleat maupun protein yang mirip
dengan sekuens tertentu yang dimilikinya.
• Hal ini berguna misalnya untuk menemukan gen sejenis
pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing atau untuk memeriksa
fungsi gen hasil sekuensing.
• Algoritma yang mendasari kerja BLAST adalah
penyejajaran sekuens.
Tools Bioinformatika : PDB
• PDB (Protein Data Bank, Bank Data Protein)
ialah pangkalan data tunggal yang menyimpan
model struktur tiga dimensi protein dan asam
nukleat hasil penentuan eksperimental (dengan
kristalografi sinar-X, spektroskopi NMR, dan
mikroskopi elektron). PDB menyimpan data
struktur sebagai koordinat tiga dimensi yang
menggambarkan posisi atom-atom dalam
protein atau pun asam nukleat.
Peluang Bioinformatika
• Masih banyak kendala dalam bioinformatika, di
antaranya adalah kesulitan untuk menemukan semua
gen dari organisme, mengidentifikasi dan menjelaskan
tentang gen-gen tersebut, kesulitan dalam
membandingkan kemiripan DNA/protein yang ada, dan
seterusnya.
• Namun semakin canggihnya komputer membuat
bioinformatika patut optimis.
• Karena komputer hanya bisa membuat data dan mereka
tidak memberikan jawaban, dunia ini masih memerlukan
banyak orang yang mau dan mampu memberikan
jawaban atas persoalan biologis yang bermanfaat bagi
kehidupan di dunia.
Daftar Pustaka
• bioinformatika-q.blogspot.com
• http://www.unpad.ac.id
• http://id.wikipedia.org
Download