Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com BIOINFORMATIKA: Mengawinkan Teknologi Informasi dengan Bioteknologi Trendnya di Dunia dan Prospeknya di Indonesia 1 Dr. Ar ief B. Wit arto, M. Eng. Labora to rium Rekayasa Pro tein, Pusa t Penelitia n Biotekno lo gi – LI PI Jl. Raya Bo gor Km .46, Cib inong 16911, Kabu pa ten Bo go r E -ma il, wita [email protected] ABSTRAK Leda kan inform as i dari kemajuan b io teknolog i seperti data sekuen DNA da ri pemb acaan genom, d ata seku en dan s truktur pro tein sampai kepada d ata transkrips i RNA berkat tekno logi DNA chip, telah mendorong lahirnya Bioinformatika yang diguna kan un tuk mengo rganisas i dan mengana lisa data- data ters ebut men jadi sebuah info rm asi biologis yang bermakna. Berm acam da tabas e telah dibuat dan banya k p era ngka t luna k telah diciptakan yang menunjukka n tr end kepada s pesialisasi tujuan . Walaupun negara berkemban g kurang dapat berpartisipasi dalam eksperim en bioteknologi yang p adat info rmasi untuk pengum pulan inform as i da lam databasedatabas e itu, peluan g untuk memanfaa tkann ya melalui Bio info rmatika terbuka lebar karena sifatnya yang terbuka. PE NDAHULUAN Ta k disangkal, s aa t in i ada lah jam ann ya Teknolog i Inform as i (TI). Berba ga i pro duk dan jasa da lam bidang TI mula i da ri komputer pribadi, In ternet, handphone, dsb s udah dinikmati o leh m asya raka t luas . Dengan itu s emua, TI tida k ha nya telah m em ba ngkitkan gelomban g new-economy tap i ju ga m eru ba h pola pikir s am pai kepada ga ya hidup m anus ia m odern s ehingga s erasa hid up dalam “kampung dunia ”. Kekuatan ino vasi teknologi yang disepadankan dengan TI d i m asa depan adalah b io teknologi [1]. Biotekno lo gi modern ditand ai d engan kemampuan m anusia untuk m ema nipulas i kod e genetik DNA, “ceta k biru kehidupan”. Berba ga i a plikasinya telah m erambah s ektor kedokteran, pangan, lingkungan, dsb [2]. Pembacaan sekuen genom manus ia oleh perus ahaan b io teknologi Am erika Serika t (AS) Celera Geno mics d alam waktu s ing kat (b ebera pa tahun) d ib andin g usa ha ko nso rs ium lembaga riset pub lik AS, Eropa, dll (lebih da ri 10 tahun) a.l. berkat kontribusi TI melalui p era ngka t ko mpu tasinya (peran gkat keras maupun lu nak). Aplikas i TI d alam bida ng b io lo gi / life sciences yang melahirkan bida ng Bio info rm a tika akan men jad i semakin penting di masa d epan, tid ak hanya meng akselerasi kemajuan bio teknolog i namun juga menjem bata ni dua 1 Disampaikan dalam Seminar Teknologi Informasi - MIFTA, Bogor, 9 Januari 2003. - 1 - Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com g elomban g ekono mi b aru tersebut (TI & b io teknolog i). Dalam tulis an ini d iulas perkem bangan Bioinformatika di dunia dengan didahu lui o leh latar b elakang “leda kan ” info rm as i dalam bioteknologi, kemudian ditutup d engan prediksi prospek Bioinformatika di Indon es ia melalui pertanya an “dari mana kita harus mula i?” BIOTEKNOLOGI MODERN Biotekno logi modern lah ir tahun 70-an diawali den gan inovas i ilmuwan AS m eng em ban gkan tekno lo gi DNA rekombinan. Berkat penemuan ini lahirlah p erusahaan bioteknologi pertama di dunia, Genentech di AS yang segera m emp roduksi p ro tein hormon, insulin yang dibutuhka n pend erita diab etes , d alam ba kteri. Selama ini insu lin hanya bisa didapatkan da lam jumlah s angat terba tas dari o rgan pan kreas sa pi. S ebaga imana TI, s aa t ini p roduk b io teknolog i telah m en gimbas ba hkan kepa da kebutuhan hidup s eha ri-hari m asyar aka t s eperti pangan, kos metika, ds b. Ciri da ri b io te knolog i mod ern tadi adalah kemampuan pada manipulasi DNA. Ranta i/s ekuen DNA yang meng kode protein dis ebu t gen. Gen itu d itra nskrips ikan men jad i mRNA yang s elan jutnya m RNA d itrans las ikan menjadi protein (Gam bar 1). Protein s ebaga i produ k akhir adalah yang bertugas menunjang seluruh proses kehidupan antara la in s ebaga i katalis r ea ksi bio kim ia dalam tubuh (p ro tein ini d is ebu t enzim), iku t s erta da lam s is tem p ertahanan tubuh m ela wan virus , p aras it dll (disebut antibo di), menyus un s tru ktur tubuh dari ujung kaki (o to t G a m b a r 1 . S e n t r a l d o g m a : A r u s informasi dalam sel. terbentuk dari protein ac tin, myosin, dsb) sampai ujung rambut (ram but ters us un da ri pro tein keratin), d ll. Arus info rm as i, DNA -> RNA -> Pro tein , inilah yang disebut sentral dogma dalam biologi. Hanya 20-an tahun seja k biotekno lo gi modern lahir, terjadilah ledakan data biologis yang mencengangkan . Hal ini diseba bkan oleh kemajuan teknologi biologi molekuler itu sendiri (mis alnya DNA rekombinan, PCR, dsb) dan d itunjang den gan peralatan yan g memadai membuat wa ktu d an b iaya lebih pend ek/mu rah. Leda kan awal dimulai dari da ta DNA (Gambar 2 ). Tahun 1977 untuk pertam aka linya s ekuen DNA sa tu or ganism e dibaca s eca ra men yeluruh ya itu pa da s ejenis virus yang mem iliki kura ng leb ih 5 .000 nukleo tida /mo lekul DNA a tau s ekitar 11 gen. Sekarang s udah a da m il yar an da ta nukleotida ters imp an d al am d atabas e D NA , Gen Ba nk di AS yang didirikan tahun 1982 [3]. Sekuen seluruh DN A manusia ya ng terdiri d ari 3 m ilya r nu kleo tida dirampungkan d alam waktu 3 tahun. Di Indones ia , dengan membayar $15, kita bisa membac a sekuen 500- an nukleo tida di Lem baga Bio logi Molekuler Eijkm an, Jakarta. Trend yang sama juga nampak pada d atab ase lain seper ti da tabase s ekuen asam amino penyusun protein, databas e struktur 3D pro tein, ds b. I no vas i teknolo gi - 2 - Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com DNA ch ip yang dipelopori oleh perusahaan bio teknologi AS, Affym etrix di Silicon Valley telah mendorong munculnya da tabase baru mengenai RNA. Denga n ini, ris et tida k dila kuka n la gi sa tu persa tu terhadap mo lekul (DNA/RNA/pro tein) ya ng dim inati, namun pa da kes eluruhan/s a tu s et m as ing-m asing moleku l (untuk DNA dari gen ke genom , untuk RNA d is ebu t transkriptom d an proteo m untuk protein). Gambar 2. Pertumbuhan data nukleotida/basa DNA dalam GenBank. TREND BIOINFOR MATIKA DUNIA Leda kan da ta/inform asi bio logi itu yang mendorong lahirnya Bioinformatika . Karena Bioinform atika adalah bidang yang relatif b aru, mas ih banyak kesalahpaham an mengenai definisinya. Ko mputer sudah lama digunakan untuk menganalisa data biolo gi, m is alnya terhadap datad ata kris talo gr af i s ina r X dan NMR (N uclea r Ma gn etic Res onance) da lam m elakukan penghitungan tr ansform as i Fo urier, dsb [4]. Bid an g ini disebut s eb aga i Biolog i Ko mpu tasi. Bioinforma tika muncul a tas desakan kebutuha n untuk m engumpulkan, m en yimp an da n menganalisa data- data b io lo gis d ari da tabase DNA, RNA m aup un pro tein tadi. Untuk m ewa da hinya beb er apa jurna l baru bermunculan (mis aln ya Applied Bioinformatics ), atau berubah nama seperti Co mputer Applications in the Bioscienc es (CABIOS) men jadi BIOInformatic ya ng menjadi official journal d ari I n tern atio na l Society for Computa tio nal Biolog y (ICSB) ( nama himpunan tidak ikut berubah) [5]. Beberapa to pik utama dalam Bioinformatika dijelaskan di bawa h ini. Keberad aan da tabase a dala h s yara t utam a da lam analis a Bioinform a tika . Da tabas e info rmasi dasa r telah ters ed ia sa a t ini. Untuk data base DNA ya ng utama adalah GenBan k di AS (Gamba r 3 ) [6]. Sem en tara itu ba gi p ro tein, da tabas enya dap at ditem ukan di Sw is s-Pro t (Swis s) [7] untuk s ekuen asam am inonya dan di Protein Data Bank (PDB) (AS) [8] u ntu k - 3 - Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com s tru ktur 3D-nya. Data yang b era da da lam data bas e itu hanya kumpulan/a rs ip data yang b iasanya d ikoleksi s ecar a s ukar ela oleh para peneliti, namun s aa t ini banyak jurnal a tau lembaga pemb eri dan a p enelitian mewajibkan penyimpa na n dalam database. Trend yang ada dalam p embu a tan da tabase s aa t ini adalah is inya yang makin s pesialis . Misa ln ya untuk pro tein s tru ktur , a da SCOP [9] da n CATH [10] yang m eng klasifikasikan protein berd as arkan s truktur 3D-nya, s elain itu ad a pu la PROSITE [11], Blocks [12], dll yang b erd as ar pada motif struktur s ekunder protein. Ta k ka lah pen ting da ri data eks perimen tersebut adalah keberad aan da tabase paper ya ng terleta k di Med line [13]. Link terh adap publikas i as li Gambar 3. Data sekuen DNA dalam GenBank. b iasanya s ela lu tercantum da lam d ata as li s ekuen. Per kemb angan Pubm ed tera khir yang penting adalah ters edianya fungs i mencari pa per denga n to pik sejenis dan lin k kepada s itus ju rna l o n-line s ehingga da pa t mem ba ca keseluruh an isi pap er tersebut. Setelah info rmasi terkumpu l dalam database, langka h berikutnya adalah m eng analis a da ta . Penca rian da tabas e umum nya berdasa r has il a lignm ent/p ens ejaja ra n s eku en, ba ik s ekuen DNA m aupun pro tein . Meto de ini digunakan berd as ar kenyataa n bahwa seku en DNA/protein bisa b erb ed a sedikit teta pi m em iliki fungs i yang sama. Mis aln ya pro tein hemo globin da ri manus ia hanya s ed ikit berbeda dengan yang beras al dari ikan paus. Kegunaan dari pencarian ini ada lah ketika m endapatkan sua tu s ekuen DNA/protein yang belum diketahui fungsinya maka dengan memb an dingkannya dengan yang ada d alam databas e bisa dip erkirakan f ungs i daripada nya. Algo ritma un tuk pattern recognition seper ti Neural Network, Genetic Algorithm dll telah dipaka i dengan suks es untuk p encarian da tabase in i. Sa lah s atu pera ngka t lunak pencari data base ya ng paling berhas il d an bisa dikatakan m enj adi s tanda r sekara ng adalah BLAST (Basic Lo cal Alignment Sea rch Tool) [14]. Per ang kat luna k ini telah diadaptasi untuk melakukan alignment terha da p berbagai s ekuen s eperti DNA (blastn), pro tein (blastp), dsb. Baru-b aru vers i yang fleksibel untuk da pa t beradaptasi deng an data base yang lebih variatif telah d ikembangkan dan disebu t Gapped BLAST serta PSI (Position Sp ecific Iterated)-BLAST [15]. Sementara itu perangkat lunak yang diguna kan - 4 - Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com untuk mela kukan alignment terhadap seku en terbatas di anta ranya yang lazim diguna kan a da la h CLUSTAL dan CLUS TAL W [16]. Data yang m em erlukan analisa b io info rm atik a dan cukup men dapat b anya k p erhatian saat ini ada lah da ta has il DNA chip (Gamba r 4). Mengg unakan p era ngka t ini da pat d iketa hui kuantitas m aupun ku alitas transkrips i satu gen s ehingga bis a menunjukkan gen -gen apa saja yang aktif Gambar 4. DNA chip. ter hadap p erla kuan tertentu, m isalnya timbulnya kanker, dll. mRNA yang diiso las i dari sampel dikemba likan dulu dalam bentuk DNA menggun akan reaksi revers e tr anscription. Selanjutnya melalui proses hibridis asi, hanya DNA yang komplementer saja yang akan b erikatan denga n DNA d i a tas chip. DNA ya ng tela h diber i lab el warna b erb ed a ini akan menun jukkan pa ttern yang unik. Berbag ai a lgo ritma p attern recog nition telah d iguna kan untuk m engena li gen-gen yang a ktif d ari eks perim en DNA chip ini, sala h sa tunya ya ng p aling ampuh ad alah Suppo rt Vecto r Ma chine (S VM) [17]. Bio info rmatika s udah menja di bisnis bes ar sekarang . Perusahaan b io teknologi yang menghas ilkan data b es ar s ep er ti perus ahaa n s ekuen geno m, senantiasa mem erlukan ba gian analisa Bioinformatika. P roduk Bio info rmatika pun s udah dipatenkan b aik di AS, Ero pa ma upun Asia [18 ]. Berdasa r jen is nya pro duk yang dipa tenkan itu bis a diba gi menjadi tiga ya itu (1 ) pera ngka t lunak Bioinfo rm atika , term as uk dian ta ra nya adalah p era ngka t lunak penca rian datab as e dsb dengan co ntoh misalnya paten no. 6,125 ,331 di AS berjud ul “Structura l alignmen t method making us e of a dou ble dynamic programming a lgor ithm ”, (2) m eto de Bioinformatika, ini m enggunakan a nalogi meto de bis nis telah dapa t dipa tenkan di AS s ep erti p ada kasus pematenan Amazon .com, s ebagai contoh adalah paten no. 6 ,125 ,383 di AS tentan g “Res ea rch system us ing multi-platfo rm object oriented program lan guage for providing objects at runtime for creating and manipulating biological o r chem ic al data ”, terakhir (3) produk Bio info rmatika itu s endiri yaitu info rmasi b io lo gis hasil analisanya. DARI MANA KITA MULAI? Di Indo nesia Bioinforma tika masih belum dikenal o leh m asyarakat luas . Di kalangan peneliti s endiri, mung kin hanya para peneliti biologi molekuler ya ng s edikit banyak mengikuti perkem bangannya kar en a keha rus an - 5 - Kuliah Umum IlmuKomputer.Com Copyright © 2003 IlmuKomputer.Com m enggunakan pera ngka t- per angkat Bioinfo rm atika un tu k an alis a da ta . Sementara itu di kalangan TI mas ih kurang mendapat perhatian. Keters ediaan da tabas e d as ar (DNA, pro tein) yang bersifat terbuka/gratis m eru pa kan pelu ang bes ar untu k m enggali info rmasi berhar ga daripadanya. Suda h disepaka ti, da tabase genom manusia misalnya akan bers ifat terbuka untuk selu ruh kalangan. Da ri padanya bisa diga li kandidatka ndida t g en yang m emiliki po tens i kedokteran/f arm asi. Dari sinilah In donesia dapat ikut berperan mengem bangkan bioinformatika. Kerjasama an tara peneliti bioteknologi ya ng m emaham i makna biologis data ters ebut dengan praktisi IT seperti programmer, dsb akan sangat b erp eran da lam kemajuan Bio info rm a tika In dones ia nantinya. REFERENS I 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. S. Giesecke (2000) The contrasting role of government in the development of biotechnology industry in the US and Germany. Research Policy 29, 205-223. C. Robbins-Roth (2000) From Alchemy to IPO: The business of biotechnology. Perseus Publishing, New York, USA. D. Gershon (1997) Bioinformatics in a post-genome age. Nature 389, 417-418. H. Gavaghan (1997) Running to catch up in Europe. Nature 389, 420-422. C. Sander (2001) Bioinformatics challenges in 2001. Bioinformatics 17, 1-2. D. Benson, D.J. Lipman, and J. Ostell (1993) GenBank. Nuclei Acid Research 21, 2963-2965. A. Bairoch, and R. Apweiler (1998) The SWISS-PROT protein sequence data bank and its supplement. Nucleic Acid Research 26, 38-42. J.L. Sussman, et al. (1998) Protein Data Bank (PDB): database of three-dimensional structural information of biological macromolecules. Acta Crystallogr. D. Biol. Crystallogr., 54, 1078-1084. G.J. Barton (1994) SCOP: structural classification of proteins. Trends in Biochemical Sciences 19, 554-555. http://www.biochem.ucl.ac.uk/bsm/cath A. Bairoch, P. Bucher, and K. Hofmann (1997) The PROSITE database, its status in 1997. Nucleic Acid Research 25, 217-221. S.E. Brenner (1995) BLAST, Blitz, BLOCKS and BEAUTY: sequence comparison on the net. Trends in Genetics, 11, 330-331. R.M. Woodsmall, and D.A. Benson (1993) Information resources at the National Center for Biotechnology Information. Bull. Med. Libr. Assoc. 81, 282-284. S.F. Altschul, et al. (1990) Basic local alignment search tool. Journal of Molecular Biology 215, 403-410. S.F. Altschul, et al. (1997) Gapped-BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acid Research 25, 3389-3402. J.D. Thompson, D.G. Higgins, and T.J. Gibson (1994) CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acid Research 22, 4673-4680. T.S. Furey, et al. (2000) Support vector machine classification and validation of cancer tissue samples using microarray expression data. Bioinformatics 16, 906-914. T. Maschio, and T. Kowalski (2001) Bioinformatics – a patenting view. Trends in Biotechnology 19, 334-339. MENGENAI PENULIS Dr. Arief B. Witarto dilahirkan di Lahat (Sumatera Selatan), Mei 1971. Menyelesaikan pendidikan sampai S-3 di Department of Biotechnology, Tokyo University of Agriculture and Technology, Jepang tahun 2000. Setelah itu bekerja sebagai peneliti di Japan Advanced Institute of Science and Technology, Jepang selama 2 tahun sebelum menempati posisinya sekarang. Terpilih sebagai Peneliti Muda Indonesia tahun 2002 terbaik untuk bidang Ilmu Pengetahuan Teknik dan Rekayasa. Spesialisasi pada bidang Rekayasa Protein yang dalam penelitiannya menggunakan tool-tool bioinformatika. Salah satu topik penelitiannya saat ini adalah analisa bioinformatika protein folding motif. - 6 -