BAB I PENDAHULUAN 1.1. Latar Belakang Pada tahun 2012, IARC, badan bagian dari WHO untuk riset kanker, mengeluarkan data yang menunjukkan bahwa kanker paru-paru merupakan kanker yang paling sering muncul diantara kanker-kanker lainnya. Tingkat kemunculan kanker paru-paru adalah 16,8% dari keseluruhan kanker yang muncul pada tahun itu. Selain itu kanker paru-paru juga dinilai sebagai kanker yang mematikan karena rasio dari jumlah kematian terhadap jumlah kemunculan kanker paru-paru mencapai 0.87. Salah satu faktor yang menyebabkan tingkat fatality yang cukup tinggi ini adalah kanker paru-paru biasanya tidak ditemukan sampai saat kanker telah mencapai stadium lanjut. Padahal tingkat kesuksesan perawatan seperti kemoterapi, radioterapi, atau operasi akan lebih tinggi jika perawatan dilakukan sedini mungkin. Namun bahkan setelah mendapat perawatan, kanker masih bisa muncul kembali di tubuh penderita. Mengingat bahwa perawatan untuk kanker akan memiliki peluang yang lebih besar untuk sukses apabila dilakukan sedini mungkin, muncul pertanyaan apakah kemunculan kembali kanker pada pasien dapat diketahui sebelumnya. Kanker, pada dasarnya, adalah penyakit yang terjadi karena adanya malfungsi pada gen. Jika ada gen yang tidak bekerja sebagaimana seharusnya, pertumbuhan sel dapat menjadi tidak terkontrol dan menyebabkan pembentukan tumor dan kanker (Genetic Science Learning Center, 2013). Untuk dapat memahami kanker dengan lebih baik, penting untuk mengetahui bagaimana aktivitas gen-gen pada sel kanker. DNA Microarray merupakan teknik yang memungkinkan pengamatan ekspresi gen-gen yang ada pada suatu sampel dalam satu eksprimen. Analisis dari profil 1 2 ekspresi gen ini dapat membantu untuk mengetahui proses biologis yang terjadi pada sampel jaringan dan membantu untuk mengetahui karakteristik dari jaringan sampel tersebut. Kendala pada analisis ekspresi gen microarray adalah variabel pada data ekspresi gen microarray sangatlah banyak. Jumlahnya bisa mencapai puluhan ribu. Karena itu analisis secara manual sangat sulit dilakukan. Namun telah banyak penelitian yang menggunakan machine learning untuk mengatasi masalah tersebut. Machine learning adalah salah satu disiplin dari Artificial Intelligence yang berfokus untuk membuat komputer mampu belajar secara otomatis tanpa harus diprogram secara eksplisit dan berulang kali. Naïve Bayes merupakan salah satu metode machine learning yang paling sederhana dan mudah dipahami. Namun keterbatasan pada Naive Bayes adalah metode ini mengasumsikan keindependenan antar atribut. Karena adanya asumsi ini, Naive Bayes tidak dapat mempelajari hubungan yang mungkin saja terdapat diantara atribut. Telah banyak dilakukan pengembangan metode machine learning untuk menghilangkan asumsi keindependenan antar atribut Naive Bayes. Salah satunya adalah Hidden Naïve Bayes yang dikembangkan oleh Zhang, et al., (2005). Zhang mengatakan bahwa keunggulan Hidden Naive Bayes adalah Hidden Naive Bayes memiliki konsep yang lebih mudah dipahami sehingga pengintepretasian dari hasil dan cara kerja Hidden Naïve Bayes pun menjadi lebih mudah dan membantu pembuatan keputusan. Penelitian ini akan difokuskan pada implementasi Hidden Naïve Bayes untuk memprediksi kemunculan kembali kanker paru-paru berdasarkan data ekspresi gen microarray. 3 1.2. Perumusan Masalah Rumusan masalah dalam penelitian ini adalah: 1. Bagaimana implementasi algoritma Hidden Naïve Bayes dalam memprediksi kemunculan kembali kanker? 2. Bagaimana performa Hidden Naïve Bayes dalam memprediksi kemunculan kembali kanker? 1.3. Batasan Masalah Batasan masalah yang diberikan agar masalah tidak meluas adalah sebagai berikut: 1. Hasil prediksi kemunculan kembali kanker dengan Hidden Naïve Bayes ini adalah prediksi apakah kanker akan kambuh atau tidak, bukan kapan kirakira kanker tersebut akan muncul lagi. 2. Data yang dipakai hanyalah data ekspresi gen microarray tanpa ada tambahan data lain seperti rekam medis pasien. 3. Data yang dipakai untuk penelitian ini adalah data yang dipakai Shedden et al. (2008) untuk penelitiannya yang berjudul Gene Expression–Based Survival Prediction in Lung Adenocarcinoma: A Multi-Site, Blinded Validation Study. 1.4. Tujuan Penelitian Tujuan dari penelitian ini adalah: 1. Mengetahui bagaimana implementasi Hidden Naïve Bayes dalam memprediksi kemunculan kembali kanker. 2. Mengetahui evaluasi performa Hidden Naïve Bayes dalam memprediksi kemunculan kembali kanker. 4 1.5. Manfaat Penelitian Manfaat yang diharapkan dapat diberikan oleh penelitian ini adalah: 1. Penelitian dapat menjadi salah satu rujukan dalam penelitian selanjutnya tentang prediksi kambuhnya kanker dengan data ekspresi gen microarray. 2. Hasil prediksi bisa menjadi pertimbangan tambahan bagi dokter dalam memberikan prognosis kepada penderita kanker. Informasi yang didapat dari penelitian ini tidak memakan waktu yang terlalu lama untuk didapatkan dan didasari oleh data-data terdahulu.