bioinformatika - Staffsite STIMATA

advertisement
BIOINFORMATIKA
Pengenalan Bioinformatika
Contents
• Sejarah Bioinformatika
• Istilah Biologi
• Pangkalan Data
• Tools Bioinformatika
Definisi
• Bioinformatika
(bioinformatics) adalah ilmu yang
mempelajari penerapan teknik komputasional untuk
mengelola dan menganalisis informasi biologis.
• Bidang
ini mencakup penerapan metode-metode
matematika, statistika, informatika, fisika, biologi, dan ilmu
kedokteran
untuk memecahkan masalah-masalah
biologis, terutama dengan menggunakan sekuens DNA
dan asam amino serta informasi yang berkaitan
dengannya.
• Contoh topik utama bidang ini meliputi basis data untuk
• mengelola informasi biologis,
• penyejajaran sekuens (sequence alignment),
• prediksi struktur untuk meramalkan bentuk struktur protein maupun
struktur sekunder RNA,
• analisis filogenetik, dan
• analisis ekspresi gen.
Pendahuluan
• Bioinformatika merupakan ilmu terapan yang lahir dari
perkembangan teknologi informasi dibidang molekular.
• Pembahasan dibidang bioinformatik ini tidak terlepas dari
perkembangan biologi molekular modern, salah satunya
peningkatan pemahaman manusia dalam bidang genomic
yang terdapat dalam molekul DNA.
Latar Belakang Bioinformatika
• Kemajuan bioteknologi dan teknologi informasi
• Dilatarbelakangi
oleh ledakan data (data
explosion) observasi biologi sebagai hasil yang
dicapai dari kemajuan bioteknologi. Contohnya
adalah pertumbuhan pesat database DNA pada
GenBank. Genbank adalah database utama
dalam biologi molekuler, yang dikelola oleh NCBI
(National Center for Biotechnology Information) di
AS.
• Kemampuan untuk memahami dan memanipulasi kode
genetik DNA ini sangat didukung oleh teknologi informasi
melalui perkembangan hardware dan software.
• Baik pihak pabrikan sofware dan harware maupun pihak
ketiga dalam produksi perangkat lunak.
• Salah satu contohnya dapat dilihat pada upaya Celera
Genomics, perusahaan bioteknologi Amerika Serikat yang
melakukan pembacaan sekuen genom manusia yang
secara maksimal memanfaatkan teknologi informasi
sehingga bisa melakukan pekerjaannya dalam waktu
yang singkat (hanya beberapa tahun).
Peluang Bioinformatika
• Ilmu bioinformatika lahir atas insiatif para ahli ilmu
•
•
•
•
komputer berdasarkan artificial intelligence.
Mereka berpikir bahwa semua gejala yang ada di alam ini
bisa dibuat secara artificial melalui simulasi dari gejalagejala tersebut.
Untuk mewujudkan hal ini diperlukan data-data yang yang
menjadi kunci penentu tindak-tanduk gejala alam
tersebut, yaitu gen yang meliputi DNA atau RNA.
Bioinformatika ini penting untuk manajemen data-data
dari dunia biologi dan kedokteran modern.
Perangkat utama Bioinformatika adalah program software
dan didukung oleh kesediaan internet
Teknologi DNA Rekombinan
• Perkembangan
teknologi DNA rekombinan
memainkan peranan penting dalam lahirnya
bioinformatika.
• Teknologi DNA rekombinan memunculkan suatu
pengetahuan baru dalam rekayasa genetika
organisme yang dikenal dengan bioteknologi.
• Perkembangan bioteknologi dari bioteknologi
tradisional ke bioteknologi modern salah satunya
ditandainya dengan kemampuan manusia dalam
melakukan analisis DNA organisme, sekuensing
DNA dan manipulasi DNA.
Sekuensing DNA
• Sekuensing DNA satu organisme, misalnya suatu
virus memiliki kurang lebih 5.000 nukleotida atau
molekul DNA atau sekitar 11 gen, yang telah
berhasil dibaca secara menyeluruh pada tahun
1977.
• Kemudian sekuen seluruh DNA manusia terdiri
dari 3 milyar nukleotida yang menyusun 100.000
gen dapat dipetakan dalam waktu 3 tahun,
walaupun semua ini belum terlalu lengkap.
• Saat ini terdapat milyaran data nukleotida yang
tersimpan dalam database DNA, GenBank di AS
yang didirikan tahun 1982.
Sejarah Bioinformatika
• 1960an:
penerapan
bidang-bidang
dalam
bioinformatika seperti pembuatan pangkalan data
dan pengembangan algoritma untuk analisis
sekuens biologi.
• 1960an: Pangkalan data sekuens protein mulai
dikembangkan di Amerika Serikat.
• 1970an:
pangkalan
data
sekuens
DNA
dikembangkan di Amerika Serikat dan Jerman
pada Laboratorium Biologi Molekuler Eropa
(European Molecular Biology Laboratory).
• 1970an: Penemuan teknik sekuensing DNA menjadi
landasan terjadinya ledakan jumlah sekuens DNA yang
dapat diungkapkan pada 1980an dan 1990an.
• Hal ini menjadi salah satu pembuka jalan bagi proyekproyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan
pada akhirnya menyebabkan lahirnya bioinformatika.
• 1980an: Bioinformatika pertamakali dikemukakan untuk
mengacu kepada penerapan ilmu komputer dalam bidang
biologi. Tepatnya, istilah Bioinformatika pertama kali
diperkenalkan pada 1979 oleh Paulien Hogeweg.
• Perkembangan
jaringan internet juga mendukung
berkembangnya bioinformatika.
• Pangkalan data bioinformatika yang terhubungkan melalui
internet memudahkan ilmuwan dalam mengumpulkan
hasil sekuensing ke dalam pangkalan data tersebut serta
memperoleh sekuens biologi sebagai bahan analisis.
• Selain
itu, penyebaran program-program aplikasi
bioinformatika melalui internet memudahkan ilmuwan
dalam mengakses program-program tersebut dan
kemudian memudahkan pengembangannya.
• Kemajuan ilmu Bioinformatika ini lebih didesak lagi oleh
genome project yang dilaksanakan di seluruh dunia dan
menghasilkan tumpukan informasi gen dari berbagai
makhluk hidup, mulai dari makhluk hidup tingkat rendah
sampai makhluk hidup tingkat tinggi
• Pada tahun 2001, genom manusia yang terdiri
dari 2.91 juta bp (base-pare, pasangan basa)
telah selesai dibaca [2].
• Baru-baru ini genom mikroba Plasmodium
penyebab Malaria dan nyamuk Anopheles yang
menjadi vektor mikroba tersebut juga telah
berhasil dibaca [3-4].
• Dan masih banyak lagi gen-gen dari makhluk
hidup lainnya yang sudah dan sedang dibaca
• Pengorganisasian data yang ada sangat berguna untuk
analisis yang lebih baik.
• Pekerja di bidang bioinformatika memastikan informasi
biologis
tersedia,
melalui
pengawasan
kualitas,
pemeriksaan silang, dan standarisasi, untuk selanjutnya
bisa dicari dengan mudah.
Istilah Biologi
• Biologi molekular
• Sel
• DNA
• RNA
• Gen
• Molekul
• Protein
• Genom
Biologi molekular
• Merupakan salah satu cabang biologi yang merujuk
kepada pengkajian mengenai kehidupan pada skala
molekul.
• Ini termasuk penyelidikan tentang interaksi molekul dalam
benda hidup dan kesannya, terutama tentang interaksi
berbagai sistem dalam sel, termasuk interaksi DNA, RNA,
dan sintesis protein, dan bagaimana interaksi tersebut
diatur.
Sel
• Sel
merupakan
unit
organisasi terkecil yang
menjadi dasar kehidupan
dalam arti biologis.
• Semua fungsi kehidupan
diatur dan berlangsung di
dalam sel.
• Karena itulah, sel dapat
berfungsi secara autonom
asalkan seluruh kebutuhan
hidupnya terpenuhi.
Molekul
• Molekul didefinisikan sebagai sekelompok atom (paling
sedikit dua) yang saling berikatan dengan sangat kuat
(kovalen) dalam susunan tertentu dan bermuatan netral
serta cukup stabil
DNA
• Asam deoksiribonukleat, lebih dikenal dengan DNA
•
•
•
•
(bahasa Inggris: deoxyribonucleic acid), adalah sejenis
asam nukleat yang tergolong biomolekul utama penyusun
berat kering setiap organisme.
Di dalam sel, DNA umumnya terletak di dalam inti sel.
Secara garis besar, peran DNA di dalam sebuah sel
adalah sebagai materi genetik; artinya, DNA menyimpan
cetak biru bagi segala aktivitas sel.
Ini berlaku umum bagi setiap organisme.
Di antara perkecualian yang menonjol adalah beberapa
jenis virus (dan virus tidak termasuk organisme) seperti
HIV (Human Immunodeficiency Virus).
RNA
• Asam
ribonukleat
(bahasa
Inggris:ribonucleic acid, RNA)
senyawa
yang
merupakan
bahan genetik dan memainkan
peran utama dalam ekspresi
genetik. Dalam dogma pokok
(central
dogma)
genetika
molekular,
RNA
menjadi
perantara antara informasi yang
dibawa DNA dan ekspresi
fenotipik yang diwujudkan dalam
bentuk protein.
Gen
• Gen adalah unit pewarisan sifat bagi organisme hidup.
• Bentuk fisiknya adalah urutan DNA yang menyandi suatu
protein, polipeptida, atau seuntai RNA yang memiliki
fungsi bagi organisme yang memilikinya.
• Gen adalah bagian DNA yang bertugas untuk
menentukan kapan, dimana, seberapa banyak suatu
protein diproduksi.
• Kelainan yang terjadi pada gen, akan menyebabkan
ketidaknormalan pada fungsi protein, dan pada gilirannya
berkaitan erat dengan mekanisme timbulnya penyakit
pada seseorang.
• Karena itu analisa ekspresi gen ini merupakan informasi
penting untuk mengetahui mekanisme timbulnya suatu
penyakit, dan mendesain terapi medis yang tepat bagi
seorang pasien
Gen
Protein
• Protein adalah senyawa organik kompleks berbobot molekul tinggi yang
•
•
•
•
•
•
merupakan polimer dari monomer-monomer asam amino yang dihubungkan
satu sama lain dengan ikatan peptida.
Molekul protein mengandung karbon, hidrogen, oksigen, nitrogen dan kadang
kala sulfur serta fosfor.
Protein berperan penting dalam struktur dan fungsi semua sel makhluk hidup
dan virus.
Kebanyakan protein merupakan enzim atau subunit enzim.
Jenis protein lain berperan dalam fungsi struktural atau mekanis, seperti
misalnya protein yang membentuk batang dan sendi sitoskeleton.
Protein terlibat dalam sistem kekebalan (imun) sebagai antibodi, sistem
kendali dalam bentuk hormon, sebagai komponen penyimpanan (dalam biji)
dan juga dalam transportasi hara.
Sebagai salah satu sumber gizi, protein berperan sebagai sumber asam
amino bagi organisme yang tidak mampu membentuk asam amino tersebut
(heterotrof).
Sintesis Protein
• Sintesis
protein adalah proses pencetakan
protein dalam sel.
• Sifat enzim (protein) sebagai pengendali dan
penumbuh karakter makhluk hidup ditentukan
oleh jumlah jenis, dan urutan asam amino yang
menyusunnya.
• Jenis dan urutan asam amino ditentukan oleh
ADN (Asam Dioksiribose Nukleat
• Sintesis protein meliputi dua langkah, yaitu
transkripsi dan translasi.
Genom
• Genom (Ing. genome), dalam genetika, adalah keseluruhan bahan
•
•
•
•
•
genetik yang membawa semua informasi pendukung kehidupan pada
suatu makhluk hidup, baik yang merupakan gen atau bukan.
Pada semua makhluk hidup, genom mencakup semua informasi
genetik yang dibawa DNA, baik di inti sel (nukleus), mitokondria,
maupun plastida.
Virus tertentu memiliki genom dalam bentuk RNA.
Setiap spesies makhluk hidup memiliki paket genom yang berbedabeda, yang menjelaskan mengapa perkawinan silang antara dua
spesies sering menghasilkan keturunan yang mandul (steril).
Istilah ini diperkenalkan oleh Hans Winkler, seorang profesor dari
Universitas Hamburg, Jerman pada tahun 1920, sebagai singkatan
(portmanteau) dari gene dan chromosome.
Kajian yang mempelajari bahan genetik secara keseluruhan ini
dikenal sebagai genomika (genomics).
Gambar dari 46 macam kromosom yang
membentuk Genom seseorang jenis laki-laki
Pangkalan data
• Pada dasarnya data-data gen yang sudah ada ini bisa
menekan banyaknya waktu dan biaya yang diperlukan
untuk menyelesaikan sebuah penelitian.
• Sebagai contoh, untuk menciptakan obat untuk penyakit
tertentu, seorang peneliti bisa memulai dengan melihat
karakteristik dan fungsi gen yang sudah ada dalam data,
untuk kemudian dibandingkan dan diteliti lebih lanjut.
• Daripada memulai dengan ribuan kemungkinan yang ada,
akan lebih menghemat waktu dan biaya bila peneliti
memulai dengan yang memiliki kemungkinan berhasil
paling tinggi.
Pangkalan Data
• Pangkalan data primer: digunakan untuk menyimpan
sekuens primer asam nukleat dan protein.
• Pangkalan data sekunder: digunakan untuk menyimpan
motif sekuens protein,
• Pangkalan data struktur: digunakan untuk menyimpan
data struktur protein dan asam nukleat.
Pangkalan data primer
• Pangkalan data primer untuk sekuens asam nukleat saat ini adalah
• GenBank (Amerika Serikat),
• EMBL (the European Molecular Biology Laboratory, Eropa), dan
• DDBJ (DNA Data Bank of Japan, Jepang).
• Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara
harian untuk menjaga keluasan cakupan masing-masing pangkalan data.
• Sumber utama data sekuens asam nukleat adalah submisi (pengumpulan)
langsung dari
• peneliti individual,
• proyek sekuensing genom, dan
• pendaftaran paten.
• Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens
asam nukleat pada umumnya mengandung informasi tentang
• jenis asam nukleat (DNA atau RNA),
• nama organisme sumber asam nukleat tersebut, dan
• segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
• Selain asam nukleat, beberapa contoh pangkalan data
penting yang menyimpan sekuens primer protein adalah
PIR (Protein Information Resource, Amerika Serikat),
Swiss-Prot (Eropa), dan TrEMBL (Eropa).
• Ketiga pangkalan data tersebut telah digabungkan dalam
UniProt, yang didanai terutama oleh Amerika Serikat.
• Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein,
pustaka yang berkaitan, dan komentar yang pada
umumnya berisi penjelasan mengenai fungsi protein
tersebut.
Pangkalan data primer: Genbank
• Genbank, dioperasikan oleh NCBI (National Center for
Biotechnology Information) mengakomodasi semua
publikasi sequences of DNA, dengan annotations
(penjelasan atau catatan), yang secara konstan akan
selalu berkembang dan diperbaharui.
• Penjelasan meliputi identifikasi suatu gen, produk gen
(jika diketahui), link informasi lain yang terkait dengan
sumber database lain.
• NCBI berisi informasi dari sekuens DNA yang sama
dengan sekuens DNA dalam EMBL (European Molecular
Biology Laboratory) dan DDBJ (DNA Data Bank of Japan)
Pangkalan data primer: OMIM
• OMIM, (Online Mendelian Inheritance in Man—woman),
adalah insiklopedia gen-gen manusia dan penyakit
genetik, merupakan penghubung untuk entry gen pada
GenBank dan literatur ilmiah pada PubMed, berisi
informasi berbagai gen manusia komplit dan paling baru.
Pangkalan data primer: PDB
• PDB (Protein Data Bank) berisi semua publisitas yang
ada secara eksperimen telah dideterminasi (oleh x-ray
crystallography dan NMR) sebagai model structural
proteins dan asam nukleat.
• Tidak berisi model homologi atau tipe model teoritis
lainnya.
Pangkalan data primer: PubMed
pada Wikipedia sebagai “suatu kebebasan
mengakses sititasi database MEDLINE dan abstrak artikel
riset biomedik.
• Subjek utama adalah riset di bidang kedokteran, dan
PubMed juga mempublikasi bidang yang terkait dengan
bidang kedokteran, seperti kebidanan dan disipiin
kesehatan lainnya.
• Hal ini secara menyeIuruh meliputi keilmuan yang
berhungan dengan ilmu seperti biokemia dan biologi sel.
• Situs ini ditawarkan oleh the United States National
Library of Medicine di the National Institutes of Health
sebagai bagian dari the Entrez information retrieval
system.“
• Diskripsi
Pangkalan data primer : UniProt
Knowledgebase
• UniProt Knowledgebase (Swiss-Prot and TrEMBL),
dioperasikan oleh SIB (Swiss Institute of Bioinformatics)
dan EBI (European BioinformaticsInstitute), berisi
sebagian besar publikasi yang ada berupa sekuens
protein (bukan DNA atau RNA).
• Sekuens dalam Swiss-Prot dijelaskan secara manual dan
menyediakan atau menghubungkan pengguna dengan
semua informasi publisitas yang berisi sekuens tersebut.
• Sequences pada TrEMBL dikoleksi dan dijabarkan secara
otomatis dari sekuens database, dan akan membuat
jalannya menuju Swiss-Prot, tetapi tidak hanya setelah
mereka secara manual menjabarkan Swiss-Prot
standards.
Situs Informasi database DNA, RNA
dan Protein
•
•
•
•
•
•
•
NCBI: www.ncbi.nlm.nih.gov
EMBL: www.ebi.ac.uk
DDBJ: www.ddbj.nig.ac.jp
SWISSPROT:www.expasy.ch/sprot/sprot_details.html
ENSEMBL: www.ensembl.org
Univeristy California Santa Cruz:
genome.cse.ucsc.edu
MGD the Jackson Lab:
www.informatics.jax.org
Tools Bioinformatika : BLAST
• Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah
BLAST (Basic Local Alignment Search Tool).
• Penelusuran BLAST (BLAST search) pada pangkalan
data sekuens memungkinkan ilmuwan untuk mencari
sekuens baik asam nukleat maupun protein yang mirip
dengan sekuens tertentu yang dimilikinya.
• Hal ini berguna misalnya untuk menemukan gen sejenis
pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing atau untuk memeriksa fungsi
gen hasil sekuensing.
• Algoritma yang mendasari kerja BLAST adalah
penyejajaran sekuens.
Tools Bioinformatika : PDB
• PDB (Protein Data Bank, Bank Data Protein)
ialah pangkalan data tunggal yang menyimpan
model struktur tiga dimensi protein dan asam
nukleat hasil penentuan eksperimental (dengan
kristalografi sinar-X, spektroskopi NMR, dan
mikroskopi elektron). PDB menyimpan data
struktur sebagai koordinat tiga dimensi yang
menggambarkan posisi atom-atom dalam protein
atau pun asam nukleat.
Peluang Bioinformatika
• Masih banyak kendala dalam bioinformatika, di antaranya
adalah kesulitan untuk menemukan semua gen dari
organisme, mengidentifikasi dan menjelaskan tentang
gen-gen tersebut, kesulitan dalam membandingkan
kemiripan DNA/protein yang ada, dan seterusnya.
• Namun
semakin canggihnya komputer membuat
bioinformatika patut optimis.
• Karena komputer hanya bisa membuat data dan mereka
tidak memberikan jawaban, dunia ini masih memerlukan
banyak orang yang mau dan mampu memberikan
jawaban atas persoalan biologis yang bermanfaat bagi
kehidupan di dunia.
Download