BAB I PENDAHULUAN 1.1 Latar Belakang Kanker payudara masih merupakan salah satu penyakit yang hingga saat ini masih sulit disembuhkan. Kanker menempati urutan kedua penyebab kematian terbanyak terhadap wanita penderita kanker, dimana urutan pertamanya ditempati oleh kanker paru-paru. Saat ini (2009) di Amerika sendiri, diperkirakan terjadi 192.370 kasus baru dan 40.170 kasus kematian yang disebabkan oleh kanker payudara (menurut data dari American Cancer Society: Breast Cancer Facts & Figures 2009-2010). Diperkirakan di dunia, setiap tahunnya terdapat 1,1 juta kasus baru dan 410.000 kasus kematian karena kanker payudara (berdasarkan data tahun 2004). Cara terbaik untuk melakukan penyembuhan kanker payudara dimulai dengan pendeteksian keberadaan kanker tersebut sejak dini sebelum kanker tersebut menyerang sel-sel lain di sekitarnya dan lebih jauh lagi, menyebar ke organ tubuh lainnya. Pendeteksian ini biasanya diawali dengan si penderita merasakan adanya gumpalan pada payudaranya (selain gumpalan, tanda lainnya dapat saja berupa perubahan ukuran payudara, terdapat tonjolan pada kulit, perubahan puting susu), kemudian langkah paling pertama yang akan dilakukan adalah mengambil mammogram dari payudara si penderita. Mammogram adalah sebuah gambar sinar X yang diambil dari pemfotoan payudara si penderita. Mammogram ini kemudian akan dianalisa lebih lanjut oleh ahli patologi untuk keberadaan tumor, lokasi, dan ukurannya. Sekedar informasi, istilah tumor diberikan kepada gumpalan yang terdapat pada bagian tubuh manusia, yang 1 2 disebabkan karena adanya sel yang tumbuh dan berkembang secara tidak terkendali, dan terus mempengaruhi sel-sel lain yang ada di sekitarnya. Biasanya langkah yang diambil selanjutnya adalah memastikan kebenaran dari analisa tersebut dengan melakukan pengujian-pengujian terhadap penderita, seperti contohnya tes darah. Dari serangkaian kegiatan tersebut, dapat disimpulkan bahwa mammogram memiliki peranan penting dalam melakukan deteksi kanker payudara. Dalam praktiknya, terdapat beberapa kendala yang meliputi pendeteksian kanker dengan menggunakan mammogram. Ukuran kanker akan semakin membesar dan menyerang ke sel-sel lain di sekitarnya apabila tidak segera ditangani. Sebaliknya, kanker yang tergolong masih muda, atau baru mulai bertumbuh, memiliki ukuran yang sangat kecil. Hal ini seringkali memberikan masalah kepada para ahli patologi dalam menentukan keberadaan kanker. Tidak jarang, hasil yang diberikan ternyata keliru disebabkan karena ketidakberhasilan pendeteksian pada tahap ini, sehingga dapat saja mengancam jiwa si penderita lebih jauh lagi. Gumpalan yang terdapat dalam payudara tidak selalu dapat dikatakan sebagai kanker. Ada juga gumpalan yang dapat digolongkan sebagai tumor, namun tidak menyebar ke organ-organ tubuh lainnya. Jenis tumor seperti ini disebut sebagai benign, dan tidak membahayakan jiwa si penderita. Sebaliknya, jenis tumor yang dapat menyebar ke organ-organ tubuh lainnya diistilahkan sebagai malignant, atau yang kita kenal dengan istilah kanker. Umumnya, benign dan malignant ini dapat dibedakan dengan cara melakukan observasi lebih lanjut terhadap gumpalan tumor menggunakan mikroskop, setelah gumpalan tersebut dikeluarkan dari tubuh si penderita. Langkah tersebut juga 3 digunakan untuk menentukan grade, yaitu tingkat abnormalitas dan keganasan dari kanker. Selain itu terdapat juga stage, yaitu tingkat penyebaran kanker dalam tubuh penderita. Kemajuan teknologi memungkinkan adanya mammogram digital, yaitu suatu mammogram yang diambil dengan menggunakan suatu alat yang mampu menterjemahkan sinar X menjadi data digital. Penggunaan mammogram digital tentunya akan menghemat tempat dan mempermudah pengaturan, karena tidak seperti mammogram tradisional, mammogram digital dapat disimpan dalam storage komputer yang tidak memakan banyak ruangan, dan dapat dikelompokkan dengan mudah sesuai kebutuhan. Hal ini juga membuka satu peluang baru dalam melakukan deteksi kanker berdasarkan mammogram, yaitu penggunaan komputer sebagai alat bantu atau yang lebih dikenal dengan nama CAM (Computer-Aided Mammography). Fungsi utama dari CAM adalah membantu para ahli patologi dalam menganalisa keberadaan kanker dalam suatu mammogram dengan cara memberikan hasil pemrosesan dari mammogram tersebut yang outputnya adalah daerah-daerah yang diduga merupakan tumor. Lebih jauh lagi, CAM dapat membantu menggolongkan tumor tersebut sebagai malignant atau benign, serta berapa grade dari kanker tersebut. Penentuan stage mungkin belum dapat dilakukan, karena diperlukan informasi-informasi tambahan yang tidak dimiliki oleh mammogram. Masalah penggolongan ini dapat diperluas pada struktur dari tumor tersebut, yang dapat dibagi dalam enam kelas yaitu architectural distortion, asymmetry, calcification, well-defined/circumscribed masses, other, ill-defined masses, dan spiculated masses. Pengembangan selanjutnya berkaitan dengan CBIR (Content-Based Image Retrieval), yaitu 4 pengambilan gambar berdasarkan pada isinya, dimana biasanya kriteria pencarian ditentukan dengan menggunakan gambar lain. Dalam kasus CAM, konsep CBIR dapat diterapkan untuk mengambil gambar-gambar yang memiliki kasus kanker serupa dengan input yang diberikan. Contohnya, apabila kanker tersebut malignant, berdasarkan dari fitur yang dimiliki dari bagian kanker tersebut, sistem dapat menampilkan gambar-gambar terdahulu yang memiliki kasus yang sama. Dari gambar-gambar tersebut, tentunya dapat diperoleh data mengenai bagaimana para ahli menangani kasus ini sebelumnya, serta hasil akhirnya. Pada akhirnya, diharapkan penggunaan CAM akan membantu mengurangi tingkat kesalahan diagnosa yang dapat saja dilakukan oleh para ahli patologi. Topik utama yang akan diteliti adalah bagaimana metodologi yang tepat digunakan untuk melakukan klasifikasi kanker payudara. Kanker dapat diklasifikasikan berdasarkan pada jenis keabnormalan, yaitu benign dan malignant, dan struktur keabnormalan, yaitu architectural distortion, asymmetry, calcification, well-defined/circumscribed masses, other, ill-defined masses, dan spiculated masses. Ke dalam kelas-kelas inilah nantinya proses klasifikasi akan dilakukan. Klasifikasi kanker payudara, umumnya terdiri atas dua langkah penting. Pertama, ekstraksi fitur akan dilakukan terhadap bagian yang memiliki gumpalan mencurigakan. Hingga saat ini, manusia masih memiliki kemampuan mengklasifikasi gambar terbaik. Dengan menggunakan pemikiran ini, dapat dikatakan bahwa untuk dapat membuat suatu sistem pengklasifikasi gambar terbaik, sistem tersebut harus mampu mereplikasi cara kerja sistem visual manusia. Fungsionalitas ini dapat dicapai dengan menggunakan tranformasi wavelet. Transformasi wavelet yang paling sering digunakan adalah discrete 5 wavelet transform (DWT). Namun, DWT memiliki dua masalah besar yaitu rentan terhadap pergeseran dan memiliki informasi arah yang minim. Kedua masalah ini berhasil dipecahkan oleh dual-tree complex wavelet transform (DT CWT) dan terbukti mampu meningkatkan performa dari proses ekstraksi fitur. Dengan berdasarkan pada informasi ini, metodologi yang diusulkan akan menerapkan DT CWT sebagai teknik ekstraksi fitur. Kedua, fitur yang diperoleh akan digunakan sebagai input untuk sebuah teknik klasifikasi yang telah dikonfigurasi untuk mampu mengklasifikasi jenisjenis gumpalan mencurigakan. Support vector machine (SVM) adalah salah satu teknik klasifikasi terbaik yang ada saat ini. SVM telah diterapkan pada banyak penelitian dan terbukti akurat dan efisien. Sebuah survey mencoba membandingkan teknik-teknik klasifikasi yang ada saat ini dan menarik kesimpulan bahwa SVM memiliki kemampuan klasifikasi yang paling akurat. Lebih jauh lagi, SVM yang merupakan pengklasifikasi biner, dapat diterapkan langsung pada permasalahan utama yang dihadapi, yaitu klasifikasi ke dalam benign atau malignant. Karenanya, SVM akan digunakan sebagai teknik klasifikasi untuk permasalahan yang dihadapi. 1.2 Identifikasi Masalah Suatu sistem CAM memiliki dua fungsi utama yaitu melakukan deteksi dan klasifikasi. Penelitian ini akan terfokus kepada fungsi klasifikasi dari CAM. Pada proses klasifikasi, ada dua langkah penting yang dilakukan yaitu ekstraksi fitur dan klasifikasi kanker. Pada langkah ini proses ekstraksi fitur dilakukan 6 untuk kemudian digunakan sebagai input terhadap proses klasifikasi. Kemudian, proses klasifikasi akan dilakukan dengan menggunakan suatu metode klasifikasi tertentu dengan memanfaatkan fitur yang didapatkan sebelumnya. Klasifikasi ini akan mengelompokkan gumpalan tersebut ke dalam dua kelas keabnormalan, yaitu benign atau malignant, dan lebih jauh lagi ke dalam struktur keabnormalan, yaitu architectural distortion, asymmetry, calcification, well- defined/circumscribed masses, other, ill-defined masses, dan spiculated masses. Pada akhirnya, proses deteksi dan klasifikasi kanker akan sangat bergantung kepada teknik-teknik yang digunakan dalam melakukannya. 1.3 Perumusan Masalah Diperlukan serangkaian teknik yang tepat digunakan untuk melakukan klasifikasi kanker yang terdapat di dalam mammogram untuk diterapkan ke dalam suatu sistem CAM. Rangkaian teknik tersebut minimal terdiri atas ekstraksi fitur dan klasifikasi. Proses klasifikasi bertujuan untuk menentukan ke dalam kelas mana sebuah daerah dalam mammogram dapat dikelompokkan. Fitur yang diperoleh harus unik sehingga mampu mendiskriminasi keabnormalan yang terdapat di dalam sebuah mammogram, ke dalam kelas–kelas keabnormalan yang benar. Dalam penelitian ini, fitur yang digunakan akan diperoleh dengan mengaplikasikan DT CWT pada daerah yang dicurigai. Fitur tersebut kemudian akan digunakan sebagai input oleh pengklasifikasi berbasis SVM untuk dicari kelasnya. Secara umum, pertanyaan penelitian dapat dirumuskan sebagai berikut: bagaimana performa dari kombinasi antara DT CWT, sebagai teknik ekstraksi 7 fitur, dan SVM, sebagai teknik klasifikasi, dalam melakukan klasifikasi keabnormalan terhadap suatu daerah di dalam mammogram? Pertanyaan tersebut kemudian dapat diturunkan menjadi: 1) bagaimana performa dari kombinasi antara DT CWT, sebagai teknik ekstraksi fitur, dan SVM, sebagai teknik klasifikasi, dalam melakukan klasifikasi jenis keabnormalan terhadap suatu daerah di dalam mammogram? dan 2) bagaimana performa dari kombinasi antara DT CWT, sebagai teknik ekstraksi fitur, dan SVM, sebagai teknik klasifikasi, dalam melakukan klasifikasi struktur keabnormalan terhadap suatu daerah di dalam mammogram? Kedua pertanyaan ini yang pada akhirnya akan dijawab oleh penelitian yang dilakukan. 1.4 Ruang Lingkup Karena keterbatasan waktu yang dimiliki dalam melakukan penelitian ini, maka harus ada batasan-batasan yang jelas mengenai ruang lingkup dari penelitian ini. Ada pun batasan-batasan tersebut adalah: 1. Data yang digunakan sebagai sumber informasi dalam mendeteksi keberadaan kanker hanyalah data mammogram saja. Data-data lain seperti gejala-gejala yang dirasakan oleh penderita, hasil pengujian darah, dan lain-lain, tidak akan dijadikan sebagai sumber informasi dalam penelitian ini. 2. Informasi yang akan diekstrak dari mammogram adalah jenis keabnormalan dan struktur keabnormalan. Informasi lainnya seperti 8 grade dan stage tidak akan diteliti, disebabkan karena keterbatasan informasi dan data, terkait dengan poin pertama. 3. Kelas keabnormalan yang akan digunakan sebagai kelas dalam penelitian ini adalah jenis keabnormalan, yaitu benign dan malignant, dan struktur keabnormalan, yaitu architectural distortion, asymmetry, calcification, well-defined/circumscribed masses, other, ill-defined masses, dan spiculated masses. 4. Penerapan CBIR masih belum dilakukan dalam penelitian ini. Hingga saat ini, masalah terbesar yang dihadapi dalam analisa mammogram adalah deteksi dan klasifikasi. Kesulitan tersebut berkaitan dengan karakteristik mammogram payudara yang terdiri atas gambar gambar payudara dimana di dalamnya terdapat jaringan-jaringan yang saling tumpang tindih yang seringkali menyulitkan. Penerapan CBIR sebagai alat bantu pencarian terhadap kasus serupa dari yang pernah ada sebelumnya, dapat dikesampingkan terlebih dahulu. 1.5 Kemanfaatan Penelitian Ada pun, manfaat dari penelitian ini adalah sebagai berikut: 1. Memperkaya literatur mengenai deteksi dan klasifikasi kanker payudara dalam suatu mammogram digital. Meskipun penelitian mengenai masalah deteksi kanker payudara sudah cukup populer, 9 teknologi ini masih tergolong muda sehingga topik ini tetap menarik untuk diteliti lebih lanjut. 2. Salah satu dasar dalam pengembangan suatu aplikasi CAM yang utuh. Deteksi dan klasifikasi terhadap bagian yang diduga sebagai kanker merupakan komponen utama yang harus dimiliki oleh sebuah CAM apabila ingin diimplementasikan ke dalam dunia nyata. 3. Membantu para ahli patologi dalam melakukan analisa mammogram dengan memberikan pertimbangan kedua mengenai keberadaan kanker dalam suatu wilayah tertentu di dalam mammogram.