bab i pendahuluan

advertisement
BAB I
PENDAHULUAN
1.1.
Latar Belakang
Pada tahun 2012, IARC, badan bagian dari WHO untuk riset kanker,
mengeluarkan data yang menunjukkan bahwa kanker paru-paru merupakan kanker
yang paling sering muncul diantara kanker-kanker lainnya. Tingkat kemunculan
kanker paru-paru adalah 16,8% dari keseluruhan kanker yang muncul pada tahun itu.
Selain itu kanker paru-paru juga dinilai sebagai kanker yang mematikan karena rasio
dari jumlah kematian terhadap jumlah kemunculan kanker paru-paru mencapai 0.87.
Salah satu faktor yang menyebabkan tingkat fatality yang cukup tinggi ini
adalah kanker paru-paru biasanya tidak ditemukan sampai saat kanker telah
mencapai stadium lanjut. Padahal tingkat kesuksesan perawatan seperti kemoterapi,
radioterapi, atau operasi akan lebih tinggi jika perawatan dilakukan sedini mungkin.
Namun bahkan setelah mendapat perawatan, kanker masih bisa muncul
kembali di tubuh penderita. Mengingat bahwa perawatan untuk kanker akan memiliki
peluang yang lebih besar untuk sukses apabila dilakukan sedini mungkin, muncul
pertanyaan apakah kemunculan kembali kanker pada pasien dapat diketahui
sebelumnya.
Kanker, pada dasarnya, adalah penyakit yang terjadi karena adanya malfungsi
pada gen. Jika ada gen yang tidak bekerja sebagaimana seharusnya, pertumbuhan sel
dapat menjadi tidak terkontrol dan menyebabkan pembentukan tumor dan kanker
(Genetic Science Learning Center, 2013). Untuk dapat memahami kanker dengan
lebih baik, penting untuk mengetahui bagaimana aktivitas gen-gen pada sel kanker.
DNA Microarray merupakan teknik yang memungkinkan pengamatan ekspresi
gen-gen yang ada pada suatu sampel dalam satu eksprimen. Analisis dari profil
1
2
ekspresi gen ini dapat membantu untuk mengetahui proses biologis yang terjadi pada
sampel jaringan dan membantu untuk mengetahui karakteristik dari jaringan sampel
tersebut.
Kendala pada analisis ekspresi gen microarray adalah variabel pada data
ekspresi gen microarray sangatlah banyak. Jumlahnya bisa mencapai puluhan ribu.
Karena itu analisis secara manual sangat sulit dilakukan.
Namun telah banyak penelitian yang menggunakan machine learning untuk
mengatasi masalah tersebut. Machine learning adalah salah satu disiplin dari Artificial
Intelligence yang berfokus untuk membuat komputer mampu belajar secara otomatis
tanpa harus diprogram secara eksplisit dan berulang kali.
Naïve Bayes merupakan salah satu metode machine learning yang paling
sederhana dan mudah dipahami. Namun keterbatasan pada Naive Bayes adalah
metode ini mengasumsikan keindependenan antar atribut. Karena adanya asumsi ini,
Naive Bayes tidak dapat mempelajari hubungan yang mungkin saja terdapat diantara
atribut.
Telah banyak dilakukan pengembangan metode machine learning untuk
menghilangkan asumsi keindependenan antar atribut Naive Bayes. Salah satunya
adalah Hidden Naïve Bayes yang dikembangkan oleh Zhang, et al., (2005). Zhang
mengatakan bahwa keunggulan Hidden Naive Bayes adalah Hidden Naive Bayes
memiliki konsep yang lebih mudah dipahami sehingga pengintepretasian dari hasil
dan cara kerja Hidden Naïve Bayes pun menjadi lebih mudah dan membantu
pembuatan keputusan.
Penelitian ini akan difokuskan pada implementasi Hidden Naïve Bayes untuk
memprediksi kemunculan kembali kanker paru-paru berdasarkan data ekspresi gen
microarray.
3
1.2.
Perumusan Masalah
Rumusan masalah dalam penelitian ini adalah:
1. Bagaimana
implementasi algoritma
Hidden Naïve
Bayes
dalam
memprediksi kemunculan kembali kanker?
2. Bagaimana performa Hidden Naïve Bayes dalam memprediksi kemunculan
kembali kanker?
1.3.
Batasan Masalah
Batasan masalah yang diberikan agar masalah tidak meluas adalah sebagai
berikut:
1. Hasil prediksi kemunculan kembali kanker dengan Hidden Naïve Bayes ini
adalah prediksi apakah kanker akan kambuh atau tidak, bukan kapan kirakira kanker tersebut akan muncul lagi.
2. Data yang dipakai hanyalah data ekspresi gen microarray tanpa ada
tambahan data lain seperti rekam medis pasien.
3. Data yang dipakai untuk penelitian ini adalah data yang dipakai Shedden
et al. (2008) untuk penelitiannya yang berjudul Gene Expression–Based
Survival Prediction in Lung Adenocarcinoma: A Multi-Site, Blinded
Validation Study.
1.4.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengetahui bagaimana implementasi Hidden Naïve Bayes dalam
memprediksi kemunculan kembali kanker.
2. Mengetahui evaluasi performa Hidden Naïve Bayes dalam memprediksi
kemunculan kembali kanker.
4
1.5.
Manfaat Penelitian
Manfaat yang diharapkan dapat diberikan oleh penelitian ini adalah:
1. Penelitian dapat menjadi salah satu rujukan dalam penelitian selanjutnya
tentang prediksi kambuhnya kanker dengan data ekspresi gen microarray.
2. Hasil prediksi bisa menjadi pertimbangan tambahan bagi dokter dalam
memberikan prognosis kepada penderita kanker. Informasi yang didapat
dari penelitian ini tidak memakan waktu yang terlalu lama untuk
didapatkan dan didasari oleh data-data terdahulu.
Download