BAB I PENDAHULUAN Pada bab ini dijelaskan latar belakang pelaksanaan Tesis, rumusan masalah, tujuan pelaksanaan Tesis, dan batasan masalah yang dikaji pada Tesis. Selain itu, dijelaskan pula metodologi pengerjaan Tesis, kontribusi pekerjaan, dan sistematika pembahasan pada laporan Tesis. 1.1 Latar Belakang Regulasi gen merupakan kontrol seluler yang mengatur jumlah produk fungsional dari suatu gen [NIE07]. Produk fungsional ini biasanya berupa protein yang dihasilkan melalui proses ekspresi gen. Dalam biologi molekuler, diketahui bahwa terdapat relasi regulasi antara gen-gen yang terdapat dalam sel. Relasi regulasi menunjukkan bahwa jumlah gen yang terekspresi pada waktu tertentu dapat mengaktifkan atau menghambat ekspresi dari gen lain yang memiliki relasi regulasi dengannya. Relasi-relasi regulasi gen yang ada pada suatu sel menentukan struktur dan fungsi dari sel tersebut. Himpunan relasi regulasi yang ada diantara gen-gen dalam sel digambarkan dalam jaringan regulatori genetik. Jaringan regulatori genetik dapat digambarkan sebagai graf berarah dengan simpul berupa gen dan sisi berarah yang menyatakan relasi regulasi dari gen asal ke gen tujuan seperti terlihat pada Gambar I-1. Gambar I-1 Jaringan Regulatori Genetik Apabila terdapat suatu model jaringan regulatori genetik, kondisi sel dapat disimulasikan untuk mengetahui bagaimana pengaruh kondisi sel tertentu terhadap level ekspresi berbagai gen yang terlibat didalamnya. Melalui model jaringan regulatori genetik, dapat I-1 I-2 dipelajari pula bagaimana suatu sel membentuk fungsinya. Secara umum, pembangunan model jaringan regulatori genetik membantu meningkatkan pemahaman mengenai jaringan regulatori genetik dan dapat mendukung riset selanjutnya di bidang biologi molekuler. Beberapa metode yang digunakan untuk memodelkan jaringan regulatori genetik antara lain coupled ordinary differential equation, Boolean network, Petri net, graphical Gaussian model, dan Bayesian network. Dari berbagai metode yang digunakan untuk melakukan pemodelan dan simulasi jaringan regulatori genetik, salah satu metode yang dianggap menjanjikan adalah Bayesian network. Bayesian network juga merepresentasikan ranah permasalahannya sebagai graf berarah dengan sisi berarah yang menggambarkan pengaruh langsung antar simpulnya, sama seperti relasi regulasi pada jaringan regulatori genetik. Kelebihan dari Bayesian network adalah metode ini dapat merepresentasikan model sebagai model grafis sehingga lebih mudah dipahami. Selain itu, pada saat ini, belum dimungkinkan diketahuinya level ekspresi setiap gen yang ada dalam sel pada saat observasi. Bayesian network dapat mengakomodasi ketidaklengkapan hasil observasi ini sehingga simulasi dapat tetap dilakukan. Pada jaringan regulatori genetik, terdapat pula faktor-faktor minor lain yang terlibat seperti suhu, kelembaban, dan adanya zat lain dalam sel. Bila faktor ini dilibatkan dalam pemodelan dan simulasi, model menjadi sangat rumit. Selain itu, informasi yang dibutuhkan untuk melakukan pemodelan dan simulasi juga sangat banyak. Dengan menggunakan Bayesian network, hal ini dapat diatasi pada saat simulasi dengan tidak menggunakan faktor-faktor minor sebagai parameter yang dipertimbangkan dalam model. Pengaruh dari faktor-faktor minor cukup dinyatakan secara implisit dalam nilai probabilitas variabel pada Bayesian network. Untuk melakukan pemodelan dan simulasi jaringan regulatori genetik, perlu diketahui relasi regulasi yang ada diantara gen-gen dalam sel. Telah terdapat suatu model yang menggambarkan relasi regulasi ini. Model yang ada terdiri dari relasi antar gen dan nilai probabilitas level ekspresi setiap gen berdasarkan relasi-relasi yang terkait. Model ini dapat direkonstruksi menjadi Bayesian network. Pada dasarnya, model dan simulator jaringan regulatori genetik merupakan suatu sistem berbasis pengetahuan. Dengan menggunakan metode Bayesian network, pengetahuan mengenai relasi regulasi yang ada antar gen direpresentasikan dalam bentuk graf. Simulasi yang dilakukan untuk mengetahui bagaimana pengaruh kondisi sel tertentu terhadap level ekspresi berbagai gen yang terlibat didalamnya dilakukan melalui proses inferensi pada sistem berbasis pengetahuan. Inferensi merupakan proses menarik I-3 kesimpulan dari apa yang sudah diketahui sebelumnya. Pada simulator jaringan regulatori genetik yang dibangun dengan Bayesian network, inferensi yang dilakukan adalah probabilistic reasoning. Hasil observasi digunakan untuk memperbaharui nilai probabilitas hipotesis. Saat ini, penelitian mengenai penggunaan Bayesian network untuk jaringan regulatori genetik lebih difokuskan pada penggunaan penalaran induktif (learning) Bayesian network untuk melakukan pembelajaran struktur jaringan regulatori genetik. Hasil dari pembelajaran struktur ini berupa model jaringan regulatori genetik. Namun, model yang dihasilkan belum dapat memberikan manfaat yang maksimal karena belum memiliki kemampuan untuk memprediksi level ekspresi gen untuk mengetahui fungsi sel. Padahal, hal tersebut merupakan tujuan utama penelitian jaringan regulatori genetik. Oleh karena itu, diperlukan suatu sistem yang dapat digunakan untuk mensimulasikan kondisi sel dan memprediksi level ekspresi gen menggunakan pengetahuan dari model yang ada. Sistem ini dapat dikembangkan dengan pendekatan sistem berbasis pengetahuan. Selain itu, dari tinjauan pustaka yang dilakukan, tidak dijumpai penelitian yang membahas secara mendetail mengenai sistem berbasis pengetahuan yang melakukan inferensi Bayesian network untuk memprediksi level ekspresi gen. Padahal, Bayesian network merupakan metode yang sesuai untuk melakukan pemodelan dan simulasi jaringan regulatori genetik. Oleh karena itu, pada Tesis ini dibahas penggunaan inferensi Bayesian network untuk memprediksi level ekspresi gen berdasarkan jaringan regulatori genetik. 1.2 Rumusan Masalah Rumusan masalah dari Tesis ini adalah bagaimana menggunakan inferensi Bayesian network untuk memprediksi level ekspresi gen berdasarkan jaringan regulatori genetik. Permasalahan tersebut dapat dijabarkan menjadi: 1. Merepresentasikan model yang sudah tersedia menjadi Bayesian network. 2. Memilih teknik dan algoritma inferensi Bayesian network yang digunakan untuk melakukan inferensi. 3. Menguji kinerja teknik dan algoritma inferensi Bayesian network untuk ranah permasalahan jaringan regulatori genetik. I-4 1.3 Tujuan Tujuan dari pengerjaan Tesis ini adalah sebagai berikut: 1. Membangun suatu sistem berbasis pengetahuan untuk melakukan prediksi level ekspresi gen dari pengetahuan mengenai jaringan regulatori genetik. 2. Mengetahui kinerja teknik dan algoritma inferensi Bayesian network untuk ranah permasalahan jaringan regulatori genetik melalui pengujian kinerja sistem. 1.4 Batasan Masalah Batasan masalah dalam pengerjaan Tesis ini yaitu: 1. Model yang digunakan sebagai sumber data pemodelan telah dibuat sebelumnya. Model yang digunakan adalah model yang menggambarkan keterkaitan antar gen-gen yang ada pada organisme Saccharomyces cerevisae. 2. Dari faktor-faktor yang terlibat dalam jaringan regulatori genetik, faktor yang dikaji dalam inferensi hanya gen. 1.5 Metodologi Dalam pengerjaan Tesis ini, metodologi yang digunakan adalah sebagai berikut: 1. Studi Literatur Studi literatur dilakukan dengan mempelajari literatur-literatur berupa buku, jurnal ilmiah, artikel, dan halaman web yang berkaitan dengan sistem berbasis pengetahuan, jaringan regulatori genetik, serta Bayesian network dan teknik inferensinya. 2. Analisis Pada tahap ini, dilakukan analisis masalah untuk mengkonstruksi Bayesian network dari model yang ada. Selain itu, dilakukan pula analisis untuk mengetahui teknik dan algoritma inferensi Bayesian network apa yang digunakan pada sistem berbasis pengetahuan yang dibangun. Analisis kebutuhan perangkat lunak sistem berbasis pengetahuan yang dibangun juga dilakukan pada tahap ini. Cara yang digunakan untuk mengevaluasi kinerja sistem berbasis pengetahuan yang dibangun juga dianalisis. I-5 3. Perancangan Tahap ini dilakukan dengan melakukan perancangan perangkat lunak yang dibangun berdasarkan hasil analisis kebutuhan perangkat lunak pada tahap sebelumnya. 4. Implementasi Implementasi sistem berbasis pengetahuan untuk memprediksi level ekspresi gen dilakukan pada tahap ini. 5. Pengujian Pada tahap ini dilakukan pengujian terhadap sistem berbasis pengetahuan yang telah dibangun. 6. Analisis Hasil Dari hasil pengujian, dilakukan analisis hasil untuk penarikan kesimpulan dan saran pengembangan lebih lanjut. 1.6 Kontribusi Kontribusi dari pelaksanaan Tesis ini adalah: 1. Membantu pemahaman mengenai jaringan regulatori genetik melalui sistem berbasis pengetahuan yang dibangun. 2. Dapat digunakan sebagai literatur untuk implementasi lebih lanjut inferensi Bayesian network untuk jaringan regulatori genetik. 1.7 Sistematika Pembahasan Sistematika penulisan Laporan Tesis ini adalah sebagai berikut : 1. Bab I Pendahuluan Bab ini berisi latar belakang, rumusan masalah, tujuan, batasan masalah, dan metodologi pengerjaan Tesis, dan kontribusi pekerjaan yang dilakukan. Pada bab ini, dijelaskan pula sistematika pembahasan dalam laporan Tesis. I-6 2. Bab II Tinjauan Pustaka Pada bab ini dijelaskan mengenai dasar teori yang digunakan dalam pengerjaan Tesis. Dasar teori yang dibahas antara lain berkaitan dengan sistem berbasis pengetahuan, inferensi, jaringan regulatori genetik, serta Bayesian network dan teknik inferensinya. Selain itu, dipaparkan pula hasil tinjauan pustaka yang berupa penelitian yang terkait dengan inferensi Bayesian network untuk jaringan regulatori genetik. 3. Bab III Analisis dan Perancangan Hasil analisis yang dilakukan pada pengerjaan Tesis dijabarkan pada bab ini. Analisis dilakukan untuk melakukan rekonstruksi model menjadi Bayesian network. Selain itu, dilakukan analisis teknik dan algoritma inferensi yang digunakan, serta analisis kebutuhan sistem berbasis pengetahuan yang dibangun. Dilakukan pula analisis cara yang digunakan untuk mengevaluasi kinerja sistem yang dibangun. Setelah tahap analisis selesai, dijabarkan hasil perancangan sistem berdasarkan hasil analisis. 4. Bab IV Implementasi dan Pengujian Proses implementasi prototipe perangkat lunak juga dijelaskan pada bab ini. Selain itu, dijabarkan pula proses pengujian yang dilakukan. Skenario pengujian, hasil pengujian, dan analisis terhadap hasil pengujian dijelaskan juga pada bab ini. 5. Bab VI Penutup Bab ini berisi kesimpulan pelaksanaan Tesis beserta saran untuk pekerjaan Tesis yang dilakukan.