BIOINFORMATIKA: Mengawinkan Teknologi - komput@si

advertisement
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
BIOINFORMATIKA: Mengawinkan Teknologi
Informasi dengan Bioteknologi
Trendnya di Dunia dan Prospeknya di Indonesia 1
Dr. Ar ief B. Wit arto, M. Eng.
Labora to rium Rekayasa Pro tein, Pusa t Penelitia n Biotekno lo gi – LI PI
Jl. Raya Bo gor Km .46, Cib inong 16911, Kabu pa ten Bo go r
E -ma il, wita [email protected]
ABSTRAK
Leda kan inform as i dari kemajuan b io teknolog i seperti data
sekuen DNA da ri pemb acaan genom, d ata seku en dan s truktur
pro tein sampai kepada d ata transkrips i RNA berkat tekno logi
DNA chip, telah mendorong lahirnya Bioinformatika yang
diguna kan un tuk mengo rganisas i dan mengana lisa data- data
ters ebut men jadi sebuah info rm asi biologis yang bermakna.
Berm acam da tabas e telah dibuat dan banya k p era ngka t luna k
telah diciptakan yang menunjukka n tr end kepada s pesialisasi
tujuan .
Walaupun
negara
berkemban g
kurang
dapat
berpartisipasi dalam eksperim en bioteknologi yang p adat
info rmasi untuk pengum pulan inform as i da lam databasedatabas e
itu,
peluan g
untuk
memanfaa tkann ya
melalui
Bio info rmatika terbuka lebar karena sifatnya yang terbuka.
PE NDAHULUAN
Ta k disangkal, s aa t in i ada lah jam ann ya Teknolog i Inform as i (TI).
Berba ga i pro duk dan jasa da lam bidang TI mula i da ri komputer pribadi,
In ternet, handphone, dsb s udah dinikmati o leh m asya raka t luas . Dengan
itu s emua, TI tida k ha nya telah m em ba ngkitkan gelomban g new-economy
tap i ju ga m eru ba h pola pikir s am pai kepada ga ya hidup m anus ia m odern
s ehingga s erasa hid up dalam “kampung dunia ”. Kekuatan ino vasi
teknologi yang disepadankan dengan TI d i m asa depan adalah
b io teknologi [1]. Biotekno lo gi modern ditand ai d engan kemampuan
m anusia untuk m ema nipulas i kod e genetik DNA, “ceta k biru kehidupan”.
Berba ga i a plikasinya telah m erambah s ektor kedokteran, pangan,
lingkungan, dsb [2]. Pembacaan sekuen genom manus ia oleh perus ahaan
b io teknologi Am erika Serika t (AS) Celera Geno mics d alam waktu s ing kat
(b ebera pa tahun) d ib andin g usa ha ko nso rs ium lembaga riset pub lik AS,
Eropa, dll (lebih da ri 10 tahun) a.l. berkat kontribusi TI melalui
p era ngka t ko mpu tasinya (peran gkat keras maupun lu nak). Aplikas i TI
d alam bida ng b io lo gi / life sciences yang melahirkan bida ng Bio info rm a tika
akan
men jad i
semakin
penting
di
masa
d epan,
tid ak
hanya
meng akselerasi kemajuan bio teknolog i namun juga menjem bata ni dua
1
Disampaikan dalam Seminar Teknologi Informasi - MIFTA, Bogor, 9 Januari 2003.
- 1 -
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
g elomban g ekono mi b aru tersebut (TI & b io teknolog i). Dalam tulis an ini
d iulas perkem bangan Bioinformatika di dunia dengan didahu lui o leh latar
b elakang “leda kan ” info rm as i dalam bioteknologi, kemudian ditutup
d engan prediksi prospek Bioinformatika di Indon es ia melalui pertanya an
“dari mana kita harus mula i?”
BIOTEKNOLOGI MODERN
Biotekno logi modern lah ir tahun 70-an diawali den gan inovas i ilmuwan AS
m eng em ban gkan tekno lo gi DNA rekombinan. Berkat penemuan ini lahirlah
p erusahaan bioteknologi pertama di dunia, Genentech di AS yang segera
m emp roduksi p ro tein hormon, insulin yang dibutuhka n pend erita diab etes ,
d alam ba kteri. Selama ini insu lin hanya bisa didapatkan da lam jumlah
s angat terba tas dari o rgan pan kreas sa pi. S ebaga imana TI, s aa t ini
p roduk b io teknolog i telah m en gimbas ba hkan kepa da kebutuhan hidup
s eha ri-hari m asyar aka t s eperti pangan, kos metika, ds b.
Ciri da ri b io te knolog i mod ern tadi
adalah kemampuan pada manipulasi
DNA.
Ranta i/s ekuen
DNA
yang
meng kode protein dis ebu t gen. Gen itu
d itra nskrips ikan men jad i mRNA yang
s elan jutnya
m RNA
d itrans las ikan
menjadi protein (Gam bar 1). Protein
s ebaga i produ k akhir adalah yang
bertugas menunjang seluruh proses
kehidupan antara la in s ebaga i katalis
r ea ksi bio kim ia dalam tubuh (p ro tein ini
d is ebu t enzim), iku t s erta da lam s is tem
p ertahanan
tubuh
m ela wan
virus ,
p aras it dll (disebut antibo di), menyus un
s tru ktur tubuh dari ujung kaki (o to t G a m b a r 1 . S e n t r a l d o g m a : A r u s
informasi dalam sel.
terbentuk dari protein ac tin, myosin,
dsb) sampai ujung rambut (ram but
ters us un da ri pro tein keratin), d ll. Arus info rm as i, DNA -> RNA -> Pro tein ,
inilah yang disebut sentral dogma dalam biologi.
Hanya 20-an tahun seja k biotekno lo gi modern lahir, terjadilah ledakan
data biologis yang mencengangkan . Hal ini diseba bkan oleh kemajuan
teknologi biologi molekuler itu sendiri (mis alnya DNA rekombinan, PCR,
dsb) dan d itunjang den gan peralatan yan g memadai membuat wa ktu d an
b iaya lebih pend ek/mu rah. Leda kan awal dimulai dari da ta DNA (Gambar
2 ). Tahun 1977 untuk pertam aka linya s ekuen DNA sa tu or ganism e dibaca
s eca ra men yeluruh ya itu pa da s ejenis virus yang mem iliki kura ng leb ih
5 .000 nukleo tida /mo lekul DNA a tau s ekitar 11 gen. Sekarang s udah a da
m il yar an da ta nukleotida ters imp an d al am d atabas e D NA , Gen Ba nk di AS
yang didirikan tahun 1982 [3]. Sekuen seluruh DN A manusia ya ng terdiri
d ari 3 m ilya r nu kleo tida dirampungkan d alam waktu 3 tahun. Di Indones ia ,
dengan membayar $15, kita bisa membac a sekuen 500- an nukleo tida di
Lem baga Bio logi Molekuler Eijkm an, Jakarta. Trend yang sama juga
nampak pada d atab ase lain seper ti da tabase s ekuen asam amino
penyusun protein, databas e struktur 3D pro tein, ds b. I no vas i teknolo gi
- 2 -
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
DNA ch ip yang dipelopori oleh perusahaan bio teknologi AS, Affym etrix di
Silicon Valley telah mendorong munculnya da tabase baru mengenai RNA.
Denga n ini, ris et tida k dila kuka n la gi sa tu persa tu terhadap mo lekul
(DNA/RNA/pro tein) ya ng dim inati, namun pa da kes eluruhan/s a tu s et
m as ing-m asing moleku l (untuk DNA dari gen ke genom , untuk RNA
d is ebu t transkriptom d an proteo m untuk protein).
Gambar 2. Pertumbuhan data nukleotida/basa DNA dalam GenBank.
TREND BIOINFOR MATIKA DUNIA
Leda kan
da ta/inform asi
bio logi
itu
yang
mendorong
lahirnya
Bioinformatika . Karena Bioinform atika adalah bidang yang relatif b aru,
mas ih banyak kesalahpaham an mengenai definisinya. Ko mputer sudah
lama digunakan untuk menganalisa data biolo gi, m is alnya terhadap datad ata kris talo gr af i s ina r X dan NMR (N uclea r Ma gn etic Res onance) da lam
m elakukan penghitungan tr ansform as i Fo urier, dsb [4]. Bid an g ini disebut
s eb aga i Biolog i Ko mpu tasi. Bioinforma tika muncul a tas desakan
kebutuha n untuk m engumpulkan, m en yimp an da n menganalisa data- data
b io lo gis d ari da tabase DNA, RNA m aup un pro tein tadi. Untuk
m ewa da hinya beb er apa jurna l baru bermunculan (mis aln ya Applied
Bioinformatics ), atau berubah nama seperti Co mputer Applications in the
Bioscienc es (CABIOS) men jadi BIOInformatic ya ng menjadi official journal
d ari I n tern atio na l Society for Computa tio nal Biolog y (ICSB) ( nama
himpunan tidak ikut berubah) [5]. Beberapa to pik utama dalam
Bioinformatika dijelaskan di bawa h ini.
Keberad aan da tabase a dala h s yara t utam a da lam analis a Bioinform a tika .
Da tabas e info rmasi dasa r telah ters ed ia sa a t ini. Untuk data base DNA
ya ng utama adalah GenBan k di AS (Gamba r 3 ) [6]. Sem en tara itu ba gi
p ro tein, da tabas enya dap at ditem ukan di Sw is s-Pro t (Swis s) [7] untuk
s ekuen asam am inonya dan di Protein Data Bank (PDB) (AS) [8] u ntu k
- 3 -
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
s tru ktur 3D-nya. Data yang
b era da
da lam
data bas e
itu
hanya kumpulan/a rs ip data yang
b iasanya
d ikoleksi
s ecar a
s ukar ela oleh para peneliti,
namun s aa t ini banyak jurnal
a tau lembaga pemb eri dan a
p enelitian
mewajibkan
penyimpa na n dalam database.
Trend
yang
ada
dalam
p embu a tan da tabase s aa t ini
adalah
is inya
yang
makin
s pesialis . Misa ln ya untuk pro tein
s tru ktur , a da SCOP [9] da n
CATH
[10]
yang
m eng klasifikasikan
protein
berd as arkan s truktur 3D-nya,
s elain itu ad a pu la PROSITE
[11], Blocks [12], dll yang
b erd as ar pada motif struktur
s ekunder protein.
Ta k ka lah pen ting da ri data
eks perimen
tersebut
adalah
keberad aan
da tabase
paper
ya ng terleta k di Med line [13].
Link
terh adap
publikas i
as li
Gambar 3. Data sekuen DNA dalam GenBank.
b iasanya s ela lu tercantum da lam
d ata as li s ekuen. Per kemb angan Pubm ed tera khir yang penting adalah
ters edianya fungs i mencari pa per denga n to pik sejenis dan lin k kepada
s itus ju rna l o n-line s ehingga da pa t mem ba ca keseluruh an isi pap er
tersebut.
Setelah info rmasi terkumpu l dalam database, langka h berikutnya adalah
m eng analis a da ta . Penca rian da tabas e umum nya berdasa r has il
a lignm ent/p ens ejaja ra n s eku en, ba ik s ekuen DNA m aupun pro tein .
Meto de ini digunakan berd as ar kenyataa n bahwa seku en DNA/protein bisa
b erb ed a sedikit teta pi m em iliki fungs i yang sama. Mis aln ya pro tein
hemo globin da ri manus ia hanya s ed ikit berbeda dengan yang beras al dari
ikan paus. Kegunaan dari pencarian ini ada lah ketika m endapatkan sua tu
s ekuen DNA/protein yang belum diketahui fungsinya maka dengan
memb an dingkannya dengan yang ada d alam databas e bisa dip erkirakan
f ungs i daripada nya. Algo ritma un tuk pattern recognition seper ti Neural
Network, Genetic Algorithm dll telah dipaka i dengan suks es untuk
p encarian da tabase in i. Sa lah s atu pera ngka t lunak pencari data base
ya ng paling berhas il d an bisa dikatakan m enj adi s tanda r sekara ng adalah
BLAST (Basic Lo cal Alignment Sea rch Tool) [14]. Per ang kat luna k ini
telah diadaptasi untuk melakukan alignment terha da p berbagai s ekuen
s eperti DNA (blastn), pro tein (blastp), dsb. Baru-b aru vers i yang fleksibel
untuk da pa t beradaptasi deng an data base yang lebih variatif telah
d ikembangkan dan disebu t Gapped BLAST serta PSI (Position Sp ecific
Iterated)-BLAST [15]. Sementara itu perangkat lunak yang diguna kan
- 4 -
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
untuk mela kukan alignment terhadap seku en terbatas di anta ranya yang
lazim diguna kan a da la h CLUSTAL dan CLUS TAL W [16].
Data
yang
m em erlukan
analisa
b io info rm atik a
dan
cukup
men dapat
b anya k p erhatian saat
ini ada lah da ta has il
DNA chip (Gamba r 4).
Mengg unakan
p era ngka t ini da pat
d iketa hui
kuantitas
m aupun
ku alitas
transkrips i satu gen
s ehingga
bis a
menunjukkan gen -gen
apa saja yang aktif
Gambar 4. DNA chip.
ter hadap
p erla kuan
tertentu,
m isalnya
timbulnya kanker, dll. mRNA yang diiso las i dari sampel dikemba likan dulu
dalam bentuk DNA menggun akan reaksi revers e tr anscription. Selanjutnya
melalui proses hibridis asi, hanya DNA yang komplementer saja yang akan
b erikatan denga n DNA d i a tas chip. DNA ya ng tela h diber i lab el warna
b erb ed a ini akan menun jukkan pa ttern yang unik. Berbag ai a lgo ritma
p attern recog nition telah d iguna kan untuk m engena li gen-gen yang a ktif
d ari eks perim en DNA chip ini, sala h sa tunya ya ng p aling ampuh ad alah
Suppo rt Vecto r Ma chine (S VM) [17].
Bio info rmatika s udah menja di bisnis bes ar sekarang . Perusahaan
b io teknologi yang menghas ilkan data b es ar s ep er ti perus ahaa n s ekuen
geno m, senantiasa mem erlukan ba gian analisa Bioinformatika. P roduk
Bio info rmatika pun s udah dipatenkan b aik di AS, Ero pa ma upun Asia [18 ].
Berdasa r jen is nya pro duk yang dipa tenkan itu bis a diba gi menjadi tiga
ya itu (1 ) pera ngka t lunak Bioinfo rm atika , term as uk dian ta ra nya adalah
p era ngka t lunak penca rian datab as e dsb dengan co ntoh misalnya paten
no. 6,125 ,331 di AS berjud ul “Structura l alignmen t method making us e of
a dou ble dynamic programming a lgor ithm ”, (2) m eto de Bioinformatika, ini
m enggunakan a nalogi meto de bis nis telah dapa t dipa tenkan di AS s ep erti
p ada kasus pematenan Amazon .com, s ebagai contoh adalah paten no.
6 ,125 ,383 di AS tentan g “Res ea rch system us ing multi-platfo rm object
oriented program lan guage for providing objects at runtime for creating
and manipulating biological o r chem ic al data ”, terakhir (3) produk
Bio info rmatika itu s endiri yaitu info rmasi b io lo gis hasil analisanya.
DARI MANA KITA MULAI?
Di Indo nesia Bioinforma tika masih belum dikenal o leh m asyarakat luas . Di
kalangan peneliti s endiri, mung kin hanya para peneliti biologi molekuler
ya ng s edikit banyak mengikuti perkem bangannya kar en a keha rus an
- 5 -
Kuliah Umum IlmuKomputer.Com
Copyright © 2003 IlmuKomputer.Com
m enggunakan pera ngka t- per angkat Bioinfo rm atika un tu k an alis a da ta .
Sementara itu di kalangan TI mas ih kurang mendapat perhatian.
Keters ediaan da tabas e d as ar (DNA, pro tein) yang bersifat terbuka/gratis
m eru pa kan pelu ang bes ar untu k m enggali info rmasi berhar ga daripadanya.
Suda h disepaka ti, da tabase genom manusia misalnya akan bers ifat
terbuka untuk selu ruh kalangan. Da ri padanya bisa diga li kandidatka ndida t g en yang m emiliki po tens i kedokteran/f arm asi. Dari sinilah
In donesia
dapat
ikut
berperan
mengem bangkan
bioinformatika.
Kerjasama an tara peneliti bioteknologi ya ng m emaham i makna biologis
data ters ebut dengan praktisi IT seperti programmer, dsb akan sangat
b erp eran da lam kemajuan Bio info rm a tika In dones ia nantinya.
REFERENS I
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
S. Giesecke (2000) The contrasting role of government in the development of
biotechnology industry in the US and Germany. Research Policy 29, 205-223.
C. Robbins-Roth (2000) From Alchemy to IPO: The business of biotechnology.
Perseus Publishing, New York, USA.
D. Gershon (1997) Bioinformatics in a post-genome age. Nature 389, 417-418.
H. Gavaghan (1997) Running to catch up in Europe. Nature 389, 420-422.
C. Sander (2001) Bioinformatics challenges in 2001. Bioinformatics 17, 1-2.
D. Benson, D.J. Lipman, and J. Ostell (1993) GenBank. Nuclei Acid Research 21,
2963-2965.
A. Bairoch, and R. Apweiler (1998) The SWISS-PROT protein sequence data bank
and its supplement. Nucleic Acid Research 26, 38-42.
J.L. Sussman, et al. (1998) Protein Data Bank (PDB): database of three-dimensional
structural information of biological macromolecules. Acta Crystallogr. D. Biol.
Crystallogr., 54, 1078-1084.
G.J. Barton (1994) SCOP: structural classification of proteins. Trends in
Biochemical Sciences 19, 554-555.
http://www.biochem.ucl.ac.uk/bsm/cath
A. Bairoch, P. Bucher, and K. Hofmann (1997) The PROSITE database, its status in
1997. Nucleic Acid Research 25, 217-221.
S.E. Brenner (1995) BLAST, Blitz, BLOCKS and BEAUTY: sequence comparison on
the net. Trends in Genetics, 11, 330-331.
R.M. Woodsmall, and D.A. Benson (1993) Information resources at the National
Center for Biotechnology Information. Bull. Med. Libr. Assoc. 81, 282-284.
S.F. Altschul, et al. (1990) Basic local alignment search tool. Journal of Molecular
Biology 215, 403-410.
S.F. Altschul, et al. (1997) Gapped-BLAST and PSI-BLAST: a new generation of
protein database search programs. Nucleic Acid Research 25, 3389-3402.
J.D. Thompson, D.G. Higgins, and T.J. Gibson (1994) CLUSTAL W: Improving the
sensitivity of progressive multiple sequence alignment through sequence weighting,
position-specific gap penalties and weight matrix choice. Nucleic Acid Research 22,
4673-4680.
T.S. Furey, et al. (2000) Support vector machine classification and validation of
cancer tissue samples using microarray expression data. Bioinformatics 16, 906-914.
T. Maschio, and T. Kowalski (2001) Bioinformatics – a patenting view. Trends in
Biotechnology 19, 334-339.
MENGENAI PENULIS
Dr. Arief B. Witarto dilahirkan di Lahat (Sumatera Selatan), Mei 1971.
Menyelesaikan pendidikan sampai S-3 di Department of Biotechnology,
Tokyo University of Agriculture and Technology, Jepang tahun 2000.
Setelah itu bekerja sebagai peneliti di Japan Advanced Institute of
Science and Technology, Jepang selama 2 tahun sebelum menempati
posisinya sekarang. Terpilih sebagai Peneliti Muda Indonesia tahun
2002 terbaik untuk bidang Ilmu Pengetahuan Teknik dan Rekayasa.
Spesialisasi pada bidang Rekayasa Protein yang dalam penelitiannya
menggunakan tool-tool bioinformatika. Salah satu topik penelitiannya
saat ini adalah analisa bioinformatika protein folding motif.
- 6 -
Download