PENGURAIAN MEKANISME KERJA JAMU DENGAN MENGGUNAKAN ANALISIS GRAF TRIPARTIT PADA JEJARING SENYAWA-PROTEIN-PENYAKIT MUCHLISHAH ROSYADAH SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul Penguraian Mekanisme Kerja Jamu dengan Menggunakan Analisis Graf Tripartit pada Jejaring Senyawa-Protein-Penyakit adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, September 2016 Muchlishah Rosyadah NIM G152140031 RINGKASAN MUCHLISHAH ROSYADAH. Penguraian Mekanisme Kerja Jamu dengan Menggunakan Analisis Graf Tripartit pada Jejaring Senyawa-Protein-Penyakit. Dibimbing oleh FARIT MOCHAMAD AFENDI dan WISNU ANANTA KUSUMA. Jamu adalah obat tradisional di Indonesia. Berbeda dengan konsep one drug-one target dalam obat kimia, jamu memiliki konsep multi componentnetwork target. Hal ini disebabkan oleh keterlibatan senyawa aktif pada beberapa tanaman dalam jamu yang menargetkan beberapa protein dalam tubuh manusia. Jejaring yang menghubungkan antara senyawa aktif dengan protein, dan ditambah dengan jejaring penyakit yang berhubungan dengan protein, memberikan dasar yang kuat dalam menjelaskan mekanisme kerja jamu secara komputasi. Jamu yang digunakan terdiri dari 4 tanaman, yaitu: pare (Momordica charantia), sembung (Blumea balsamifera), bratawali (Tinospora crispa), dan jahe (Zingiber officinale). Setiap tanaman memiliki senyawa aktif dan protein yang ditargetkan. Ada 47 senyawa aktif yang diperoleh dari jahe, 4 senyawa aktif dari sembung, 4 senyawa aktif dari pare, dan 3 senyawa aktif dari bratawali. Total terdapat 58 senyawa aktif yang diperoleh dari keempat tanaman. Pada database PubChem diidentifikasi terdapat 3.059 koneksi antara senyawa aktif dengan sasaran proteinnya, dari 3059 koneksi tersebut tereduksi menjadi 396 protein yang unik. Selanjutnya, dengan menggunakan database disgenet, PharmGKB, dan Theurapetic Target Database diperoleh 118 sasaran penyakit yang memiliki koneksi terhadap 396 protein yang unik tersebut. Jejaring senyawa - protein - penyakit aktif telah dianalisis dengan menggunakan analisis graf tripartit menunjukkan bahwa 396 protein yang terdapat pada tanaman jamu memiliki keterkaitan dengan beberapa penyakit. Beberapa di antaranya yaitu penyakit metabolik, kardiovaskular, penyakit mata, neoplasma, stomatognatik, penyakit sistem saraf , dan penyakit saluran pernapasan. Kata kunci: farmakologi, graf tripartit, diabetes tipe 2, fuzzy kluster. SUMMARY MUCHLISHAH ROSYADAH. Tripartite Graph Analysis on Network of Active Compound-Target Protein-Disease in Elucidation of Jamu Working Mechanism. Supervised by FARIT MOCHAMAD AFENDI and WISNU ANANTA KUSUMA. Jamu is traditional medicine in Indonesia. Differs from the concept of one drug-one target in chemical drugs, jamu have a concept of multi componentsnetwork target. It is caused by the involvement of many plant's active compound in jamu that targeted multiple proteins in human body. Network connecting active compound and target protein, added with diseases related to the proteins, provides a solid foundation useful in elucidating computationally the jamu working mechanism. Jamu consist of 4 plants, namely: bitter melon (Momordica charantia), sembung (Blumea balsamifera), bratawali (Tinospora crispa), and ginger (Zingiber officinale). Each plant has an active compounds and all their target proteins. There are 47 active compounds obtained from ginger, 4 active compounds from sembung, 4 active compounds from bitter melon, and 3 active compounds from bratawali. So there are 58 total active compounds obtained from the four plants. PubChem database identified there are 3059 connections between active compounds and its target proteins, from 3059 connections reduced to 396 unique proteins. Furthermore, using disgenet, PharmGKB, and Theurapetic Target Database derived 118 target diseases that have a connection to 396 unique proteins. A Network of active compound-target protein-diseases have been analysed using Tripartite Graph Analysis indicated that 396 proteints from Jamu was related to multiple diseases, most of them have Metabolic diseases, Cardiovascular Diseases, Eye Diseases, neoplasms, Stomatognathic Diseases, Nervous System Diseases, and Respiratory Tract Diseases. Keywords: pharmacology, tripartite graph, type 2 diabeses, fuzzy clustering. © Hak Cipta Milik IPB, Tahun 2016 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB i PENGURAIAN MEKANISME KERJA JAMU DENGAN MENGGUNAKAN ANALISIS GRAF TRIPARTIT PADA JEJARING SENYAWA-PROTEIN-PENYAKIT MUCHLISHAH ROSYADAH Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika Terapan SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016 ii Penguji Luar Komisi pada Ujian Tesis : Dr. Ir. Indahwati, M.Si. Judul Tesis Nama MM Penguraian Mekanisme Kerja Jamu dengan Menggunakan Analisis pada Jejaring Senyawa-protein-peilakit _C-ral Jrigartit : Muchlishah Rosyadah : G152140031 : Disetujui oleh Komisi Pembimbing Jlu Dr. F?rit Mochamad Afendi" M.Si Ketua Diketahui oleh Ketua Program Studi StatistikaTempan ,/ \,t ; I Dr. Ir. Indahwati. M.Si Tanggal Ujian : 15 September 2016 ranggallulus' l? 6 N[y ffflS PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih merupakan bagian dari kajian program riset pertanian pada Program Studi Statistika, yaitu pengembangan data dan analisis jamu di Indonesia. Tesis ini diberi judul Penguraian Mekanisme Kerja Jamu dengan Menggunakan Analisis Graf Tripartit pada Jejaring Senyawa-Protein-Penyakit. Terima kasih penulis ucapkan kepada Bapak Dr. Farit Mochamad Afendi, M.Si dan Bapak Dr. Eng. Wisnu Ananta Kusuma, MT selaku pembimbing atas kesediaannya membagi ilmu kepada penulis serta dorongan semangat yang tak terhingga dalam penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesar-besarnya kepada seluruh Dosen Program Studi Statistika IPB yang telah mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta seluruh staf Program Studi Statistika IPB atas bantuan, pelayanan, dan kerjasamanya selama ini. Ucapan terima kasih yang tulus dan penghargaan setinggi-tingginya kepada orang tua saya Ummi Dra Hj Rodiana Rahman M.Kom.I dan Ayah H Muchlas SMHk untuk do’a dan kasih sayangnya dan senantiasa mendukung di setiap langkah positif yang penulis jalani, juga kepada Musyrifa Rozana, Muslih Rozaqi, Muchtar Rosyadi, Muti’atur Rohmah, Mu’jizatur Romlah, dan Fakhri Nurullah yang selalu menyemangati dan menghibur di sela-sela pengerjaan tesis ini. Tak lupa penulis ucapkan terima kasih kepada teman seperjuangan di riset Vitri Aprilla Handayani atas kebersamaannya menghadapi masa-masa terindah maupun tersulit dalam menyelesaikan penelitian ini. Terakhir penulis sampaikan terima kasih sedalam-dalamnya kepada seluruh mahasiswa Pascasarjana Program Studi Statistika Terapan angkatan 2014 atas kebersamaannya, kenangan bahagia, kenangan sedih, haru, dan pengorbanan yang kita perjuangkan bersama selama menuntut ilmu di bangku kuliah, serta semua pihak yang telah banyak membantu dan tak sempat penulis sebutkan satu per satu. Semoga karya ilmiah ini dapat bermanfaat. Bogor, September 2016 Muchlishah Rosyadah DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi 1 PENDAHULUAN Latar Belakang Tujuan Penelitian 1 1 2 2 TINJAUAN PUSTAKA Jejaring Farmakologi Database Protein-Penyakit Graph Clustering 3 3 3 3 3 METODE Data Metode Analisis 6 6 6 4 HASIL DAN PEMBAHASAN Jejaring Farmakologi Eksplorasi Jumlah Gerombol Optimal Hasil Fuzzy Cluster untuk Senyawa Aktif, Protein, dan Target Penyakit 9 9 11 12 5 SIMPULAN DAN SARAN Simpulan Saran 16 16 16 DAFTAR PUSTAKA 17 LAMPIRAN 18 RIWAYAT HIDUP 24 DAFTAR TABEL 1 2 3 4 Jumlah senyawa aktif dan koneksi terhadap target protein Daftar hasil protein, penyakit dan koneksinya Bobot koneksi antara gerombol senyawa dengan gerombol protein Bobot koneksi antara gerombol penyakit dengan gerombol protein 6 10 13 15 DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 Ilustrasi penggerombolan graf tripartit Graf tripartit senyawa-protein-prnyakit Diagram alir penelitian Jejaring senyawa aktif - target protein Jejaring protein – target penyakit Hasil cost untuk senyawa, protein, dan penyakit Dendogram matriks C1 (senyawa aktif) Dendogram matriks C2 (protein) Dendogram matriks C3 (penyakit) 4 6 8 9 10 11 12 14 15 DAFTAR LAMPIRAN 1 2 3 4 Peluang senyawa untuk menempati suatu gerombol Peluang protein untuk menempati suatu gerombol Peluang penyakit untuk menempati suatu gerombol Daftar target penyakit hasil penelusuran di ketiga database berdasarkan MESH level 5 Daftar protein terkait antidiabetes hasil penelusuran di database OMIM 19 20 21 22 23 1 PENDAHULUAN Latar Belakang Pada permulaan abad ke-20, obat-obat kimia sintetis mulai tampak kemajuannya, dengan ditemukannya obat-obat termasyhur, yaitu Salvarsan dan Aspirin sebagai pelopor, yang kemudian disusul oleh sejumlah obat lain. Penemuan obat kimia sintetis ini pada umumnya mengikuti paradigma one drugone-target yaitu bahwa obat bekerja pada reseptor tertentu untuk satu penyakit. Pendekatan jenis ini memiliki kelemahan, terutama dalam mengobati penyakit yang disebabkan oleh banyak faktor. Kelemahan dari pendekatan one drug-one target ini dapat diatasi dengan konsep keterlibatan beberapa senyawa aktif untuk menargetkan beberapa protein penyebab penyakit (multicomponent-network target) (Li dan Zhang 2013). Jamu merupakan salah satu obat multi komponen yang bekerja secara multi target dan memberikan pengobatan yang bersifat menyeluruh. Selain itu jejaring farmakologi yang fokus terhadap interaksi kompleks beberapa senyawa aktif dengan beberapa reseptor (multitarget) dalam sistem biologis diharapkan menjadi pendekatan yang dapat mengatasi kelemahan paradigma penemuan obat kimia sintetis. Pendekatan jenis ini telah digunakan dalam penemuan obat maupun pembuktian formula obat herbal tradisional asal Cina. Nurishmaya (2014) melakukan penelitian ramuan jamu untuk penyakit diabetes type II yang sedang dikembangkan pada Pusat Studi Biofarmaka di Bogor. Jamu yang digunakan terdiri atas empat tanaman yaitu jahe (Zingiber officinale), pare (Momordica charantia), bratawali (Tinospora crispa), dan sembung (Blumea balsamifera). Jamu tersebut diprediksi dapat mengobati diabetes type II, setelah diujicobakan pada ikan zebra. Menurut penelitian Syahrir (2015) dari empat tanaman yang diprediksi dapat mengobati diabetes type II ditemukan sebanyak 397 protein yang berasal dari 58 bahan aktif yang memiliki target protein. Selanjutnya, dengan menggunakan jejaring farmakologi dan metode penggerombolan akan dianalisis lebih lanjut mengenai target penyakit lainnya dari ramuan jamu. Target penyakit dari protein dapat diperoleh dari beberapa database yang mengkaji hubungan antara gen dengan penyakit, seperti PharmGKB, Therapeutic Target Database, dan Disgenet. Sebagian besar metode penggerombolan yang ada akan mengidentifikasi dan mengelompokkan data hanya tepat ke dalam satu klaster. Pada kasus sistem biologi metode penggerombolan tersebut menjadi tidak realistis, hal ini dikarenakan sistem biologi seperti gen atau protein memiliki keterlibatan dengan beberapa proses. Sistem biologi tersebut bersifat kompleks dan divergen sehingga melibatkan objek dengan berbagai tipe dan akan memungkinkan bahwa data tersebut akan terlibat di dalam beberapa gerombol yang berbeda. Salah satu metode penggerombolan yang sesuai dengan permasalahan data pada sistem biologi yaitu metode fuzzy clustering dengan model NMF (Non-Negative Matrix Factorization) (Hartsperger et al. 2010). Kelebihan dari metode tersebut yaitu dapat mendemonstrasikan struktur graf yang kompleks ke gerombol biologi yang lebih bermakna. Hal ini akan memberikan gambaran yang lebih komprehensif 2 tentang pengelompokan data sistem biologi tersebut seperti koneksi kompleks pada protein-gen-penyakit. Berdasarkan data hasil penelitian terdahulu dan metode penggerombolan yang dikembangkan oleh Hartsperger et al (2010), maka pada penelitian ini akan ditelusuri mekanisme kerja jamu yang berasal dari tanaman anti diabetes. Mekanisme kerja jamu tersebut akan dianalisis berdasarkan jejaring senyawa aktif, protein dan penyakit yang terkait dengan menggunakan algoritma Tri-Partite Graph Clustering. Tujuan Penelitian Tujuan dari penelitian ini yaitu menguraikan mekanisme kerja jamu yang berasal dari tanaman pare (Momordica charantia), sembung (Blumea balsamifera), bratawali (Tinospora crispa), and jahe (Zingiber officinale) dengan menggunakan analisis Tri-Partite Graph Clustering. 3 2 TINJAUAN PUSTAKA Jejaring Farmakologi Farmakologi dikenal sebagai ilmu yang mempelajari pengaruh obat pada sel hidup dan reaksi sel hidup terhadap obat tersebut. Seiring dengan perkembangan dalam bidang biologi kimia dan ilmu jaringan, terbentuklah pendekatan baru khusus untuk penemuan obat yang dikenal dengan jejaring farmakologi. Pendekatan ini melibatkan penerapan analisis jaringan untuk menentukan target protein yang paling penting dalam penyembuhan suatu penyakit, dan mengidentifikasi molekul atau senyawa yang mampu menargetkan protein-protein tersebut. Berbeda dari obat konvensional yang hanya melibatkan satu senyawa kimia tunggal dengan satu target (one drug-one target), jejaring farmakologi ini melibatkan banyak komponen senyawa kimia yang bekerja pada satu atau beberapa target (multicomponent-network target) (Li dan Zhang 2013). Database Protein-Penyakit The Pharmacogenetics and Pharmacogenomics Knowledge Base: PharmGKB, http://www.pharmgkb.org merupakan database yang memberikan informasi tentang data-data farmokogenetik. Website ini dikelola oleh Stanford University yang didanai oleh National Institute of Health, NIH, USA). Dalam situs ini dapat diperoleh informasi tentang hubungan antara struktur gen, respon obat, menifestasi penyakit, data tentang polimorfisme yang diidentifikasi dari berbagai suku dan ras, serta koleksi dari gen target yang erat kaitannya dengan genotip beberapa jenis gen yang sangat penting dalam aspek farmakogenetik, dan pengembangan obat baru (Klein et al. 2001). Therapeutic Target Database (TTD), http://bidd.nus.edu.sg/group/cjttd adalah database yang memberikan informasi tentang protein, penyakit yang ditargetkan, dan obat yang sesuai untuk masing-masing target tersebut. Database ini juga mempunyai link ke database yang relevan yang berisi informasi tentang fungsi target, urutan, struktur 3D, dan struktur obat, DisGeNET Database, http://disgenet.org merupakan database yang mengintegrasikan asosiasi gen-penyakit manusia (GDAs) dari berbagai pakar database yang terkait dan asosiasi yang berasal dari text-mining termasuk Mendelian (Bauer-Mehren et al. 2011). Integrasi ini dilakukan dengan cara pemetaan kosakata gen dan penyakit dengan menggunakan jenis asosiasi ontologi. Graph Clustering Menurut Hartsperger et al (2010), Graf G = (V, E) disebut k – partite graph jika graf G mempunyai himpunan verteks (titik) yang dapat dipartisi ke k subhimpunan yaitu V1, V2, . . . ,Vr, dengan r > 2, tetapi verteks-verteks dalam subhimpunan yang sama tidak memiliki edge (koneksi). Himpunan V1, V2, . . . ,Vr disebut himpunan partisi dari G. Graf terdiri dari himpunan titik tidak kosong dan himpunan garis yang menghubungkan titik-titik pada graf tersebut. Keterhubungan antara titik dan garis pada suatu graf dikenal dengan istilah adjacency. Sedangkan matriks yang menyatakan keterhubungan antara titik dan garis pada suatu graf disebut dengan 4 matriks kedekatan (matrix adjacency). Misalkan G = (V, E) merupakan suatu graf dengan n verteks, n > 1. Maka, matriks adjacency A dari G adalah matriks n n dimana A = [aij], untuk hal ini berlaku [aij] menjadi 1 bila verteks i dan j bertetangga dan [aij] menjadi 0 bila verteks i dan j tidak bertetangga. Analisis gerombol (cluster analysis) merupakan suatu teknik multivariate yang digunakan untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristik yang dimiliki (Mattjik dan Sumertajaya 2011). Sedangkan proses untuk mengindetifikasi kesamaan suatu elemen data disebut dengan clustering. Graph clustering adalah pengelompokan verteks dalam sebuah graf, sehingga verteks tersebut berada dalam satu gerombol yang memiliki kesamaan sifat (Mishra et al. 2011). Beberapa ahli juga berpendapat bahwa graph clustering adalah proses pengelompokan verteks pada sebuah graf, sehingga verteks tersebut memiliki nilai kemiripan yang tinggi terhadap verteks lainnya yang berada dalam gerombol yang sama sedangkan antar gerombol akan memiliki nilai kemiripan yang rendah. Graph clustering biasa digunakan untuk bidang biologi khususnya dalam mempelajari gen, VLSI chip design, social network, dan lainnya (Dhara dan Shukla 2012). G H Gambar 1. Ilustrasi penggerombolan graf tripartit Pada konteks penelitian ini Graf G = (V, E), V merupakan kumpulan vertex (titik) yang didalamnya berisi senyawa, protein dan penyakit, sedangkan E merupakan edge (koneksi) yang menghubungkan tiap-tiap verteks pada graf. Graf H merupakan kemungkinan hasil gerombol dari graf G. Matriks merupakan matriks kedekatan yang menggambarkan koneksi antar verteks pada graf G. Matriks adalah matrik kedekatan yang menggambarkan koneksi antar verteks pada graf gerombol H. Sedangkan matriks , i = 1, …, k merupakan matriks yang menggambarkan peluang verteks akan menempati suatu gerombol. Hubungan antara ketiga matriks tersebut dapat dituliskan kedalam bentuk: 5 ( dengan nilai dari ∑ ) ‖ ( ) ‖ yang minimum. Algoritme yang digunakan pada penelitian ini yaitu algoritme fuzzy kpartite clustering (Hartsperger et al. 2010): Input: matriks kedekatan dari graf G (matriks , i < j) Output: fuzzy clustering (matriks ) dan gerombol graf k-partit H yang ditunjukkan oleh matriks 1. Menyusun matriks kedekatan dari graf G (matriks ) 2. Menginisiasi matriks dan dengan menggunakan matriks acak non-negatif 3. Menentukan jumlah gerombol 4. Memperbaharui nilai matriks (∑ ( ) ) (∑ ) i = 1,…,k 5. Memperbaharui nilai matriks (( ) ) i = 1,…,k-1 dan j = i + 1,…,k | Melakukan pengecekan iterasi, jika : | , maka iterasi berhenti. Jika tidak, mengulangi langkah nomor 3 dan 4 sampai diperoleh hasil yang konvergen. 6 3 METODE Data Data yang digunakan pada penelitian ini merupakan daftar senyawa dan protein yang berasal dari jamu anti diabetes hasil penelitian Syahrir (2015) dan Qomariasih (2015). Jamu ini terdiri atas 4 tanaman yaitu pare (Momordica charantia), sembung (Blumea balsamifera), bratawali (Tinospora crispa), and jahe (Zingiber officinale). Daftar rincian senyawa aktif serta banyaknya koneksi terhadap target proteinnya seperti tertera pada Tabel 1. Tabel 1. Jumlah senyawa aktif dan koneksi terhadap target protein Tanaman Senyawa Sumber Jahe Pare Sembung Brotowali Total 47 4 4 3 58 KNApSAcK KNApSAcK KNApSAcK KNApSAcK Koneksi terhadap protein 2394 47 548 70 3059 Sumber Pubchem Pubchem Pubchem Pubchem Metode Analisis Tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut: I. Mencari target penyakit dari daftar 397 protein unik yang diketahui pada beberapa database. a. Identifikasi pada database PharmGKB (http://pharmgkb.org) dan Disgenet (http://disgenet.org) dilakukan dengan memasukkan simbol dari tiap-tiap protein. b. Sedangkan target penyakit pada Therapeutic Target Database (http://bidd.nus.edu.sg/group/cjttd/) diidentifikasi dengan memasukkan TTD ID yang merupakan hasil konversi dari uniprot ID tiap-tiap protein. II. Menyesuaikan dan mengelompokkan penamaan target penyakit yang diperoleh dari ketiga database tersebut berdasarkan MESH (Medical Subject Headings), kemudian penamaan dan pengelompokan jejaring penyakit menggunakan MESH pada level II. III. Menyusun graf tripartit dari data Senyawa-Protein dan Penyakit yang telah diperoleh. Ilustrasi graf tripartit antara senyawa, potein dan penyakit dapat dilihat pada Gambar 2. Graf Tripartit Gambar 2. Graf tripartit senyawa-protein-penyakit 7 IV. Menganalisis mekanisme kerja jamu menggunakan Tri-Partite Graph Clustering. Diketahui graf G = (V, E), dengan V = {S1, S2, …, S58, P1, P2, …, P397, D1, D2, …,Dn}, dan E merupakan koneksi antar V. Langkah yang dilakukan pada analisis dengan menggunakan Tri-Partite Graph Clustering yaitu: 1. Membentuk matriks kedekatan , jika antar verteks memiliki koneksi maka elemen matriks = 1 dan 0 jika tidak ada koneksi S1 S2 S1 0 0 S2 0 0 … S58 … 0 0 P1 1 0 P2 0 1 … … … P397 0 1 D1 0 0 D2 0 0 … … Dn 0 0 S58 P1 P2 0 1 0 0 0 1 0 … … 0 1 0 1 0 0 0 0 0 … … … 1 0 0 0 1 1 0 0 1 0 … … 0 1 1 P397 D1 D2 0 0 0 1 0 0 … … 1 0 0 0 1 0 1 1 … … … 0 1 0 1 0 0 0 0 0 … … … 0 0 0 Dn 0 0 0 0 1 1 … 0 0 0 … 0 2. Menentukan jumlah gerombol Penentuan jumlah gerombol yang optimum dilakukan dengan cara melakukan 729 kombinasi penggerombolan yaitu mulai dari (2,2,2) sampai (10,10,10) dan setiap kombinasi dilakukan 10 kali pengulangan terhadap senyawa aktif, protein, dan target penyakit. Kriteria gerombol yang optimum yaitu jika nilai cost function pada gerombol tersebut sudah konvergen (nilainya sudah tidak mengalami penurunan yang signifikan). 3. Melakukan iterasi terhadap matriks dan sehingga didapatkan hasil aproksimasi yang terbaik pada ( ) . Penggerombolan yang terbentuk berdasarkan hasil matriks dan akan digunakan untuk menguraikan mekanisme kerja jamu sesuai degan senyawa – protein - penyakit yang terkait. Diagram alir pada penelitian ini dapat dilihat pada Gambar 3. 8 Diagram Alir Penelitian Data Senyawa dan Protein Tanaman jahe, brotowali, sembung, dan pare Preprocessing Data Identifikasi Penyakit Pada database PharmGKB, TTD dan Disgenet Database Penyesuaian dan pengelompokan Penyakit berdasarkan MESH Bahan Aktif – Protein Target – Penyakit Menyusun matriks kedekatan A dari Graf Tripartit Melakukan Inisiasi Matriks B dan C Iterasi Matriks B dan C Metode Fuzzy Clustering Konvergen Hasil & Interpretasi Gambar 3. Diagram alir penelitian 9 4 HASIL DAN PEMBAHASAN Jejaring Farmakologi Prediksi target penyakit diawali dengan tahapan pengumpulan data awal yaitu daftar senyawa aktif dan target protein pada ramuan jamu. Pengumpulan data dilakukan dengan menghimpun informasi tentang daftar senyawa yang dikandung pada ramuan jamu pada database KNApSAcK family. Penyaringan senyawa menghasilkan 58 senyawa aktif dari 595 senyawa yang dikumpulkan dari database. Senyawa aktif tersebut diidentifikasi sebagai senyawa yang mempunyai aktifitas farmakologis. Senyawa aktif yang memilki aktifitas farmakologis tersebut terdiri atas 47 senyawa aktif dari tanaman jahe, 4 senyawa aktif dari tanaman pare, 4 senyawa aktif dari tanaman sembung, dan 3 senyawa aktif dari tanaman bratawali. Masing-masing senyawa aktif kemudian ditelusuri koneksinya terhadap protein target yang telah terdokumentasi pada database PubChem. Hasil penelusuran menghasilkan 3059 koneksi antara senyawa aktif dengan target proteinnya. Koneksi terhadap protein yang berjumlah 3059 menghasilkan 396 target protein unik, hal ini disebabkan oleh adanya protein yang overlapping antara protein target yang berasal dari senyawa aktif pada tanaman yang berbeda. Gambar 4 merupakan koneksi antara senyawa aktif dengan target proteinnya. a. Jejaring keseluruhan senyawa aktif terhadap target protein b. Jejaring senyawa bratawali dan jahe c. Jejaring senyawa pare dan sembung Gambar 4. Jejaring senyawa aktif - target protein 10 Selanjutnya, berdasarkan data target protein unik akan ditelusuri koneksi terhadap target penyakitnya. Pengumpulan data target penyakit dilakukan dengan menelusuri beberapa database yang menghimpun informasi tentang koneksi antara protein dengan target penyakit. Database yang digunakan yaitu Disgenet, Theurapetic Target Database (TTD), dan PharmGKB. Identifikasi pada database PharmGKB (http://pharmgkb.org) dan Disgenet (http://disgenet.org) dilakukan dengan memasukkan simbol dari tiap-tiap protein. Sedangkan target penyakit pada Therapeutic Target Database (http://bidd.nus.edu.sg/group/cjttd/) diidentifikasi dengan memasukkan TTD ID yang merupakan hasil konversi dari uniprot ID tiap-tiap protein. Hasil target penyakit dari ketiga database secara ringkas disajikan pada Tabel 2. Tabel 2. Daftar hasil protein, penyakit dan koneksinya Koneksi Protein Database Protein Penyakit – Penyakit 60 Disgenet 340 341 50 Theurapetic Target Database (TTD) 104 321 50 PharmGKB 74 224 Target penyakit yang diperoleh dari ketiga database tersebut kemudian disesuaikan dengan penamaan dan pengelompokan yang digunakan pada Medical Subject Heading (MESH). Berdasarkan hasil MESH, sebanyak 386 protein dari 396 target protein unik yang memiliki koneksi terhadap penyakit. Protein unik, target penyakit, dan koneksi protein dengan penyakit dapat dideskripsikan dalam bentuk jejaring. Jejaring ini mampu merepresentasikan informasi “hubungan” antar protein dan penyakit. Jejaring terdiri atas dua komponen utama, yaitu node dan edge. Node merupakan individu yang terlibat di dalam sebuah jejaring yang dilambangkan dengan bentuk lingkaran. Edge merupakan hubungan atau interaksi antar masing-masing individu yang dilambangkan dengan garis yang menghubungkan antar dua individu yang saling berhubungan. Gambar 5 Jejaring protein – target penyakit 11 Keterkaitan antara protein dengan penyakit digambarkan dengan jejaring yang terdiri atas 386 node sebagai protein yang terkumpul dalam lingkaran yang besar dan 118 node sebagai target penyakit, sedangkan koneksi antara protein dengan penyakit dapat direpresentasikan sebagai edge pada jejaring. Jumlah koneksi antar protein dengan penyakit yang diperoleh dari dokumentasi database disgenet, TTD, dan PharmGKB sebanyak 886 koneksi (Gambar 5). Target penyakit dominan dapat dilihat dari banyaknya edge yang menghubungkan antara node protein dan node penyakit. Beberapa penyakit yang dominan tersebut yaitu neoplasm dan metabolic disease. Penyakit diabetes mellitus tipe 2 masuk ke dalam kelompok metabolic disease. Berdasarkan jejaring senyawa aktif, protein dan target penyakit yang sudah diketahui akan ditelusuri lebih lajut mengenai mekanisme kerja jamu. Penguraian mekanisme kerja jamu dilakukan dengan analisis graph clustering dengan menggunakan algoritma fuzzy clustering of tripartite graph. Graph clustering yaitu proses pengelompokan node pada sebuah graf, sehingga node tersebut memiliki nilai kemiripan yang tinggi terhadap node lainnya yang berada dalam gerombol yang sama, sedangkan antar gerombol akan memiliki nilai kemiripan yang rendah. Graph clustering biasa digunakan untuk bidang biologi khususnya dalam mempelajari gen, protein dan unsur terkait dengan proses biologi. Keterhubungan antar partisi senyawa aktif, protein dan target penyakit terlebih dahulu dinyatakan dalam bentuk matriks kedekatan. Matriks kedekatan berisi angka 1 jika antara senyawa aktif dengan protein atau protein dengan target penyakit memiliki koneksi, dan angka 0 jika keduanya tidak memiliki koneksi. Eksplorasi Jumlah Gerombol Optimal Penentuan jumlah gerombol yang optimum dilakukan dengan cara melakukan 729 kombinasi penggerombolan yaitu mulai dari (2,2,2) sampai (10,10,10) dan setiap kombinasi dilakukan 10 kali pengulangan terhadap senyawa aktif, protein, dan target penyakit. Berdasarkan nilai cost function yang sudah tidak mengalami penurunan yang signifikan, maka diperoleh jumlah gerombol yang optimum yaitu 4 gerombol untuk senyawa, 6 gerombol untuk protein dan 3 gerombol untuk penyakit. Berikut nilai cost function pada gerombol senyawa aktif, gerombol protein, dan gerombol penyakit. Nilai Cost Function 3400 3200 3000 2800 cost senyawa 2600 cost protein 2400 cost penyakit 2200 2000 0 2 4 6 8 10 12 Jumlah Gerombol Gambar 6 Hasil cost untuk senyawa, protein, dan penyakit 12 Hasil Fuzzy Clustering untuk Senyawa Aktif, Protein, dan Target Penyakit Berdasarkan hasil ekplorasi jumlah gerombol optimum, senyawa aktif yang terdapat pada 4 tanaman obat digerombolkan menjadi 4 gerombol. Dendogram peluang suatu senyawa menempati suatu gerombol (matriks C1) dapat dilihat pada Gambar 7. Gambar 7 Dendogram matriks C1 (senyawa aktif) Menurut Qomariasih (2015), dari keseluruhan senyawa aktif yang berasal dari empat tanaman terdapat 13 senyawa yang memilki kemiripan profil dengan obat sintetis anti diabetes, 2 senyawa utama dari tanaman bratawali dan 11 senyawa dari tanaman jahe. Hasil fuzzy clustering menunjukkan sebagian besar senyawa aktif dari 4 tanaman terdapat pada gerombol 1 dan 3. Gerombol 1 didominasi oleh senyawa aktif yang berasal dari tanaman jahe serta beberapa senyawa aktif dari tanaman pare, bratawali dan sembung. Senyawa aktif yang memiliki kemiripan profil dengan obat sintetis anti diabetes pada gerombol 1 yaitu N-trans-Feruloyltyramine (B015), N-Formylanonaine (B018), Hexahydrocurcumin (J270), 1,7-Bis(3,4-dihydroxyphenyl)-3,5-heptanediol; (3R,5R)-form, 3,5-Diketone, 3',3''-di-Me ether (J135), 1,7-Bis(3,4dihydroxyphenyl)-3,5-heptanediol; (3S,5S)-form, 3',3''-Di-Me ether (J127), dan 4(3,4-Dihydroxyphenyl)-2-butanone; 3-Me ether (J153). Gerombol 3 terdiri 16 senyawa aktif dari tanaman jahe dan 1 senyawa aktif dari tanaman bratawali. Pada gerombol ini, 5 dari 16 senyawa aktif yang berasal dari jahe dan 1 senyawa aktif yang berasal dari tanaman bratawali memiliki kemiripan profil dengan obat sintetis anti diabetes. Senyawa-senyawa tersebut adalah Gingerdiols; [6]Gingerdiol, 3-Epimer (J010), 10-Shogaol (J249), Shogaols; [8]-Shogaol (J091), dan [6]-Shogaol (J206), dan 1,7-Bis(3,4-dihydroxyphenyl)-3,5-heptanediol; (3S,5S)-form, 3',3''-Di-Me ether (J127), dan N-trans-Feruloyltyramine (B015). Selain itu, pada gerombol 4 terdapat juga 1 senyawa aktif dari tanaman jahe yang memiliki kemiripan profil dengan obat sintetis anti diabetes yaitu Safrole (J025). Menurut Syahrir (2015), terdapat 324 pasangan bahan aktif dari tanaman bratawali dan pare terhadap semua bahan aktif pada empat tanaman. Gerombol 1 13 senyawa utama anti diabetes yang berasal dari tanaman bratawali NFormylanonaine (B018) memiliki efek sinergis yang kuat terhadap dua senyawa aktif yang berasal dari tanaman jahe yaitu 1,7-Bis(3,4-dihydroxyphenyl)-3,5heptanediol; (3S,5S)-form, 3',3''-Di-Me ether (J127) dan Hexahydrocurcumin (J270). Efek sinergis yang kuat juga terdapat pada gerombol 3, pada gerombol ini senyawa akif utama dari tanaman bratawali N-trans-Feruloyltyramine (B015) bersinergis dengan dua senyawa aktif dari tanaman jahe yaitu Shogaols; [8]Shogaol (J091) dan 10-Shogaol (J249). Selain itu pada gerombol 4 terdapat efek antara senyawa dari tanaman pare Karaviloside I (P195) dengan senyawa aktif dari tanaman sembung Xanthoxylin (S031). Selanjutnya dilihat keterkaitan antar gerombol senyawa dengan gerombol protein berdasarkan nilai matriks B. Nilai dari matriks B pada kasus ini akan berbanding terbalik dengan jumlah koneksi yang dimiliki oleh node pada dua gerombol. Semakin kecil nilai matriks B menunjukkan semakin banyak koneksi yang dimiliki oleh node pada dua gerombol, sehingga dapat dikatakan kedua gerombol tersebut memiliki keterkaitan yang semakin kuat. Berdasarkan hasil matriks B12 (bobot antara hasil gerombol senyawa dengan gerombol protein), gerombol utama pada senyawa aktif yaitu gerombol S1 dan gerombol S3 memiliki bobot koneksi yang relatif kecil terhadap gerombol protein P3, P5, dan P6. Gerombol S1 memiliki bobot koneksi terkecil terhadap gerombol P3 dan P6 yaitu sebesar 1.64E-07 dan 0.00021. Sedangkan gerombol S3 memiliki bobot koneksi terkecil terhadap gerombol P3 dan P5 sebesar 9.16E-06 dan 7.00E-05. Bobot koneksi keseluruhan antara hasil fuzzy clustering untuk gerombol senyawa aktif dengan gerombol protein dapat dilihat pada Tabel 3. Tabel 3 Bobot koneksi antara gerombol senyawa dengan gerombol protein Gerombol S1 Gerombol S2 Gerombol S3 Gerombol S4 Gerombol P1 0.00723 1.40846 0.00063 0.21455 Gerombol P2 0.62582 0.58519 0.63513 0.13135 Gerombol P3 1.64E-07 0.00012 9.16E-06 0.00743 Gerombol P4 0.00024 0.7316 0.21946 0.80764 Gerombol P5 0.01552 1.14238 7.00E-05 0.01354 Gerombol P6 0.00021 0.35806 0.11979 0.77957 Protein unik hasil target dari senyawa keempat tanaman akan digerombolkan menjadi 6 gerombol. Selanjutnya, berdasarkan hasil matrik C untuk gerombol protein akan ditelusuri lebih lanjut isi gerombol pada ketiga gerombol protein yang memiliki keterkaitan erat terhadap gerombol senyawa aktif yaitu P3, P5, dan P6. Hasil fuzzy clustering untuk gerombol protein dapat dilihat pada Gambar 8. 14 Gambar 8 Dendogram matriks C2 (protein) Seperti terlihat pada gambar, protein yang menjadi target dari senyawa aktif keempat tanaman menyebar secara rata pada keenam gerombol yang ada. Penelusuran lebih lanjut akan dilakukan hanya pada isi dalam gerombol 3, 5 , dan 6. Gerombol 3 terdapat sebelas protein terkait dengan penyakit diabetes tipe 2 versi OMIM database yaitu peroxisome proliferator activated receptor gamma (PPARG), P-selectin (SELP), tumor necrosis factor ligand superfamily member 10 isoform 1 (TNFSF10), UDP-glucuronosyltransferase 1-1 (UGT1A1), C-C chemokine receptor type 5 (CCR5), eukaryotic translation initiation factor 2alpha kinase 3 precursor (EIF2AK3), G-protein coupled receptor 35 isoform a (GPR35), Tyrosine-protein kinase Lck (LCK), interleukin-1 beta proprotein (IL1B), lamin isoform A-delta10 (LMNA), dan tyrosine-protein phosphatase nonreceptor type 22 isoform 1(PTPN22). Gerombol 5 terdapat empat protein terkait dengan penyakit diabetes tipe 2 versi OMIM database yaitu Receptor-type tyrosine-protein phosphatase C (PTPRC), tumor necrosis factor ligand superfamily member 10 isoform 1 (TNFSF10), peroxisome proliferator activated receptor gamma (PPARG), dan G-protein coupled receptor 35 isoform a (GPR35). Sedangkan pada gerombol 6 terdapat enam protein terkait dengan penyakit diabetes tipe 2 versi OMIM database yaitu glycogen synthase kinase-3 beta isoform 1(GSK3B), lamin isoform A-delta10 (LMNA), UDPglucuronosyltransferase 1-1 (UGT1A1), C-C chemokine receptor type 5 (CCR5), tyrosine-protein phosphatase non-receptor type 22 isoform 1(PTPN22), dan Tyrosine-protein kinase Lck (LCK). Selain itu, pada ketiga gerombol tersebut terdapat pula protein-protein yang saling berinteraksi dengan protein yang diprediksi terkait penyakit diabetes tipe 2 hasil penelitian sebelumnya yaitu Protein kinase C alpha type (PRKCA) pada gerombol 5, Smad3 (SMAD3) pada gerombol 3 dan 5, serta peptidyl-prolyl cistrans isomerase FKBP1A isoform a (FKBP1A) pada gerombol 3 dan 6. Ketiga protein tersebut memiliki protein protein interaction (PPI) dengan protein anti diabetes hasil penelitian Qomariasih (2015). Sedangkan Protein yang sudah sangat familiar untuk mengobati diabetes yaitu insulin-degrading enzyme isoform 1 (NRP1) terdapat pada gerombol 5. Tabel nilai koneksi antara gerombol penyakit terhadap gerombol protein disajikan pada Tabel 4. 15 Tabel 4 Bobot koneksi antara gerombol penyakit dengan gerombol protein Gerombol D1 Gerombol D2 Gerombol D3 Gerombol P3 0.09906 0.20113 0.05473 Gerombol P5 0.01872 0.02179 0.00004 Gerombol P6 0.00029 0.04113 0.00236 Target penyakit dari keseluruhan protein unik akan digerombolkan ke dalam 3 gerombol (Gambar 9). Hasil fuzzy clustering untuk gerombol penyakit menunjukkan bahwa penyakit diabetes tipe 2 teridentifikasi masuk ke dalam gerombol 1 dan 2. Penyakit diabetes tipe 2 ini menggerombol dengan beberapa penyakit lainnya seperti Stomatognathic Diseases, Nervous System Diseases, Eye Diseases, Respiratory Tract Diseases, Neoplasms, Metabolic diseases dan Cardiovascular Diseases. Gambar 9 Dendogram matriks C3 (penyakit) 16 5 SIMPULAN DAN SARAN Simpulan Penggerombolan pada senyawa, protein, dan penyakit yang diperoleh dari metode Fuzzy Clustering pada graf tripartit menghasilkan beberapa kesimpulan, yaitu: 1. Senyawa utama dari bratawali dan jahe pada penelitian sebelumnya yang diprediksi memiliki kemiripan profil dengan obat sintetis anti diabetes memiliki aktivitas yang berbeda pada mekanisme kerja jamu T2D. Perbedaan aktivitas ini dikarenakan dua senyawa utama anti diabetes dari tanaman bratawali berada pada dua gerombol yang berbeda, N-Formylanonaine (B018) berada pada gerombol 1 sedangkan N-trans-Feruloyltyramine (B015) ada pada gerombol 3. 2. Terdapat tiga gerombol protein yang memiliki peran yang sama dalam mengatasi penyakit diabetes tipe 2 yaitu gerombol 3, 5 dan 6. Pada gerombol tersebut terdapat protein-protein yang terkait antidiabetes menurut dabase OMIM, serta terdapat protein-protein yang memiliki interaksi terhadap kandidat protein antidiabetes hasil penelitian sebelumnya. Saran Penelitian selanjutnya diharapkan dapat diperoleh data kombinasi tanaman yang lebih akurat dari keempat tanaman. Misal tanaman yang digunakan hanya terdiri dari jahe, bratawali, dan sembung. Hal ini diharapkan dapat menghasilkan efek sinergis yang lebih kuat antar senyawa aktif pada tanaman. Serta dibutuhkan data yang lebih komprehensif dari tanaman-tanaman pembentuk ramuan jamu, sehingga senyawa yang diperoleh tidak hanya senyawa aktif yang terkait dengan penyakit diabetes tipe 2 tetapi juga terkait dengan komplikasi yang kemungkinan terjadi. 17 DAFTAR PUSTAKA Bauer-Mehren A, Bundschus M, Rautschka M, Mayer MA, Sanz F, Furlong LI . 2011. Gene-disease network analysis reveals functional modules in mendelian, complex and environmental diseases. PLoS One, 6, e20284. Dhara M, and Shukla KK. 2012. Characteristic of Restricted Neighbourhood Search Algorithm and Markov Clustering on Modified Power-Law Distributor. India: Departement of Computer Engineering. Hartsperger ML, Blochl F, Stumpflen V, Theis FJ. 2010. Structuring Heterogeneous Biological Information Using Fuzzy Clustering of K-Partite Graphs. BMC Bioinformatics.11:522-537. Klein TE, Chang JT, Cho MK, Easton KL, Fergerson R, Hewett M, Lin Z, Liu Y, Liu S, Oliver DE et al. 2001. PharmGKB: the pharmacogenetics and pharmacogenomics knowledge base. Pharmacogenomics J. 4 (1), 1-1. Li S, and Zhang B. 2013. Traditional Chinese medicine network pharmacology: theory, methodology and application. Chinese Journal of Natural Medicines. 11(2): 0110−0120. Mattjik AA, dan Sumertajaya IM. 2010. Sidik Peubah Ganda. Bogor: IPB. Mishra R, Shukla S, Arora D, Kumar M. 2011. An Effective Comparison of Graph Clustering Algorithms via Random Graphs. India: Department of Computer Science and Engineering Amity University. Nurishmaya MRN. 2014. Pendekatan Bioinformatika Formulasi Jamu Baru Berkhasiat Antidiabetes dengan Ikan Zebra (danio rerio) Sebagai Hewan Model. Skripsi. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Qomariasih N. 2015. Analisis Gerombol Simultan dan Jejaring Farmakologi pada Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2. Tesis. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Syahrir NH. 2015. Uji Permutasi Efek Sinergis Bahan Aktif Tanaman Obat Berdasarkan Jejaring dengan Protein Target. Tesis. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. 18 LAMPIRAN 19 Lampiran 1 Peluang senyawa untuk menempati suatu gerombol No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Senyawa B013 B015 B018 J010 J036 J044 J057 J068 J091 J127 J135 J153 J191 J192 J193 J194 J195 J196 J197 J198 J199 J200 J205 J206 J207 J208 J211 J212 J213 J218 J221 J224 J226 J234 J236 ⁞ ⁞ ⁞ ⁞ 57 S030 58 S031 Gerombol 1 0.295 0.264 0.913 0.001 0.458 0.563 0.982 0.277 0.056 0.312 0.893 0.974 0.370 0.062 0.124 0.974 0.003 0.987 0.665 0.001 0.914 0.983 0.015 0.137 0.972 0.975 0.966 0.091 0.962 0.975 0.088 0.982 0.991 0.021 0.971 ⁞ ⁞ 0.623 0.005 Gerombol 2 0.339 0.000 0.000 0.000 0.542 0.437 0.000 0.432 0.003 0.000 0.000 0.000 0.369 0.092 0.006 0.001 0.007 0.001 0.206 0.024 0.006 0.002 0.026 0.060 0.002 0.002 0.001 0.611 0.000 0.000 0.048 0.001 0.002 0.033 0.001 ⁞ ⁞ 0.298 0.578 Gerombol 3 0.072 0.736 0.087 0.999 0.000 0.000 0.017 0.105 0.941 0.688 0.107 0.026 0.010 0.200 0.699 0.025 0.312 0.012 0.128 0.408 0.080 0.015 0.169 0.788 0.026 0.023 0.032 0.093 0.038 0.024 0.846 0.017 0.007 0.831 0.028 ⁞ ⁞ 0.017 0.106 Gerombol 4 0.294 0.000 0.000 0.000 0.000 0.000 0.000 0.186 0.000 0.000 0.000 0.000 0.251 0.646 0.171 0.000 0.678 0.000 0.000 0.567 0.000 0.000 0.790 0.014 0.000 0.000 0.000 0.204 0.000 0.000 0.018 0.000 0.000 0.116 0.000 ⁞ ⁞ 0.062 0.310 20 Lampiran 2 Peluang protein untuk menempati suatu gerombol No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 ⁞ ⁞ 395 396 Simbol Protein FGB CYP2D6 GSK3B PLA2G7 SENP6 KCNH2 PTGER2 MMP12 NCF1 AVPR1A OXTR CTSL1 MMP13 MMP2 MMP3 AHR APOBEC3A BCL2A1 HSPA5 CASP7 BCL2L11 PREPL MAP4K2 KCNQ1 SHBG UBE2N BCL2L1 LYPLA1 RECQL HDAC3 SLC5A7 APOBEC3G LYPLA2 APLNR MTOR ⁞ ⁞ STK33 TCRA Ger 1 0.555 0.094 0.144 0.109 0.404 0.410 0.086 0.185 0.132 0.595 0.303 0.090 0.048 0.033 0.119 0.472 0.223 0.374 0.049 0.023 0.039 0.583 0.713 0.366 0.520 0.349 0.098 0.099 0.178 0.266 0.309 0.133 0.344 0.419 0.101 ⁞ ⁞ 0.007 0.023 Ger 2 0.051 0.039 0.098 0.132 0.069 0.022 0.015 0.016 0.009 0.032 0.052 0.001 0.021 0.000 0.007 0.013 0.014 0.014 0.000 0.009 0.684 0.015 0.033 0.006 0.029 0.142 0.000 0.007 0.002 0.083 0.057 0.002 0.094 0.021 0.077 ⁞ ⁞ 0.002 0.016 Ger 3 0.047 0.612 0.011 0.252 0.021 0.053 0.191 0.431 0.078 0.297 0.110 0.499 0.728 0.617 0.618 0.260 0.000 0.073 0.521 0.738 0.000 0.280 0.130 0.176 0.103 0.062 0.507 0.053 0.136 0.000 0.071 0.250 0.389 0.000 0.044 ⁞ ⁞ 0.000 0.000 Ger 4 0.079 0.129 0.522 0.298 0.135 0.051 0.085 0.015 0.351 0.021 0.233 0.023 0.001 0.016 0.014 0.034 0.383 0.040 0.003 0.016 0.047 0.026 0.066 0.291 0.013 0.249 0.007 0.200 0.077 0.365 0.157 0.198 0.018 0.171 0.320 ⁞ ⁞ 0.145 0.059 Ger 5 0.183 0.115 0.001 0.109 0.250 0.278 0.574 0.345 0.018 0.014 0.127 0.368 0.200 0.310 0.214 0.183 0.036 0.439 0.417 0.207 0.157 0.092 0.021 0.082 0.239 0.026 0.365 0.369 0.568 0.004 0.057 0.001 0.150 0.288 0.052 ⁞ ⁞ 0.822 0.765 Ger 6 0.085 0.010 0.224 0.100 0.121 0.186 0.048 0.008 0.413 0.042 0.174 0.019 0.000 0.024 0.029 0.037 0.343 0.061 0.009 0.006 0.073 0.003 0.036 0.079 0.095 0.171 0.023 0.271 0.039 0.282 0.349 0.417 0.005 0.101 0.407 ⁞ ⁞ 0.023 0.137 21 Lampiran 3 Peluang penyakit untuk menempati suatu gerombol No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Penyakit D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 D12 D13 D14 D15 D16 D17 D18 D19 D20 D21 D22 D23 D24 D25 D26 D27 D28 D29 D30 D31 D32 D33 D34 D35 ⁞ ⁞ ⁞ ⁞ 117 D117 118 D118 Gerombol 1 0.017 0.490 0.645 0.971 0.003 0.775 0.000 0.519 0.859 0.550 0.000 0.049 0.261 0.987 0.546 0.910 0.000 0.005 0.005 0.972 0.530 0.760 0.601 0.620 0.993 0.102 0.476 0.917 0.000 0.509 0.595 0.088 0.769 0.109 0.775 ⁞ ⁞ 0.826 0.584 Gerombol 2 0.012 0.510 0.335 0.028 0.001 0.006 0.000 0.287 0.140 0.441 0.000 0.009 0.564 0.012 0.423 0.082 0.950 0.071 0.012 0.028 0.426 0.227 0.166 0.310 0.007 0.395 0.177 0.077 0.000 0.172 0.405 0.850 0.094 0.392 0.216 ⁞ ⁞ 0.174 0.281 Gerombol 3 0.970 0.001 0.020 0.000 0.996 0.219 1.000 0.193 0.001 0.009 1.000 0.942 0.175 0.001 0.030 0.008 0.050 0.924 0.983 0.000 0.044 0.013 0.233 0.070 0.000 0.503 0.347 0.006 1.000 0.319 0.000 0.062 0.137 0.499 0.009 ⁞ ⁞ 0.000 0.135 22 Lampiran 4 Daftar target penyakit hasil penelusuran di ketiga database berdasarkan MESH level II No Indeks Penyakit Nama Penyakit 1 D1 Adrenal Gland Diseases 2 D2 Anxiety Disorders 3 D3 Autoimmune Diseases 4 D4 Autoimmune Diseases of the Nervous System 5 D5 Bacterial Infections 6 D6 Behavior 7 D7 Biliary Tract Diseases 8 D8 Bone Diseases 9 D9 Bronchial Diseases 10 D10 Cardiovascular Diseases 11 D11 Cardiovascular Infections 12 D12 Central Nervous System Diseases 13 D13 Congenital Abnormalities 14 D14 Conjunctival Diseases 15 D15 Connective Tissue Diseases 16 D16 Cranial Nerve Diseases 17 D17 Craniocerebral Trauma 18 D18 Cysts 19 D19 Delirium, Dementia, Amnestic, Cognitive Disorders 20 D20 Demyelinating Diseases 21 D21 Diabetes Mellitus 22 D22 Digestive System Neoplasms 23 D23 DNA Virus Infections 24 D24 Drug-Related Side Effects and Adverse Reactions 25 D25 Dwarfism 26 D26 Ear Diseases 27 D27 Eating Disorders 28 D28 Endocrine Gland Neoplasms 29 D29 Eye Abnormalities 30 D30 Eye Diseases, Hereditary 31 D31 Eye Neoplasms 32 D32 Female Urogenital Diseases 33 D33 Gastrointestinal Diseases 34 D34 Genetic Diseases, Inborn 35 D35 Genital Diseases, Male ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ 117 D117 RNA Virus Infections 118 D118 Schizophrenia and Disorders with Psychotic Features 23 Lampiran 5 Daftar protein terkait antidiabetes hasil penelusuran di database OMIM Simbol No Protein 1 CCR5 Nama Protein C-C chemokine receptor type 5 eukaryotic translation initiation factor 2-alpha kinase 3 2 EIF2AK3 precursor 3 GPR35 G-protein coupled receptor 35 isoform a 4 GSK3B glycogen synthase kinase-3 beta isoform 1 5 LCK Tyrosine-protein kinase Lck 6 LMNA lamin isoform A-delta10 7 PPARG peroxisome proliferator activated receptor gamma 8 SELP P-selectin 9 TNFSF10 tumor necrosis factor ligand superfamily member 10 isoform 1 10 UGT1A1 UDP-glucuronosyltransferase 1-1 11 IL1B interleukin-1 beta proprotein 12 PTPN22 tyrosine-protein phosphatase non-receptor type 22 isoform 1 13 PTPRC Receptor-type tyrosine-protein phosphatase C 14 SELE E-selectin precursor 24 RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 5 April 1990 dan merupakan anak pertama dari enam bersaudara pasangan Ayah H Muchlas SMHk dan Umi Dra Hj Rodiana M.Kom.I. Penulis menyelesaikan jenjang pendidikan sekolah menengah atas jurusan Ilmu Pengetahuan Alam (IPA) pada tahun 2008 di SMA Daar El-Qolam (Boarding School) Balaraja, Tangerang. Pada tahun yang sama penulis diterima sebagai mahasiswa di jurusan Matematika, program studi Pendidikan Matematika FMIPA Universitas Negeri Jakarta (UNJ), lulus pada bulan Januari 2013. Penulis sempat bekerja selama sebagai editor buku pelajaran Matematika SMP dan mengajar untuk pendalaman materi UN di SMK Karya Guna. Pada tahun 2014 penulis memutuskan untuk melanjutkan studi di Sekolah Pascasarjana Institut Pertanian Bogor (SPs IPB) pada Program Studi Statistika Terapan. Penulis sedang mengajukan publikasi ilmiah yang merupakan bagian dari tesis pada Jurnal Jamu Indonesia. Karya ilmiah yang sama juga telah dipresentasikan pada seminar internasional The Asian Mathematical Conference (AMC 2016) yang dilaksanakan di Bali.