BAB 2 KAJIAN PUSTAKA 2.1. Teori Umum Teori umum merupakan

advertisement
BAB 2
KAJIAN PUSTAKA
2.1.
Teori Umum
Teori umum merupakan teori pokok yang dijadikan landasan teori-teori lainnya.
2.1.1
Kanker Payudara
Kanker payudara merupakan sebuah tumor ganas yang berkembang dari sel-sel
di dalam payudara. Ciri paling umum dari kanker payudara adalah munculnya gumpalan
baru di sekitar payudara. Ciri fisik lainya yaitu adanya pembengkakan di sekitar bagian
payudara, iritasi kulit, rasa sakit di bagian puting susu, kemerahan pada bagian payudara
ataupun puting susu, serta keluarnya air susu dari payudara secara tiba-tiba.
Pendeteksian dini dari tumor ganas ini, akan jauh lebih baik sebelum gejalanya
muncul. Hal ini sangat penting karena kanker dapat menyebar dengan cepat jika tidak
diobati dari stadium paling awal.
2.1.1.1 Tipe Kanker Payudara
Kanker payudara dapat dibagi menjadi 2 tipe, yaitu :
1.
Kanker payudara non invasive
Yaitu kanker yang terjadi pada kantung susu (penghubung antara alveolus
dengan puting payudara. Dalam bahasa kedokteran disebut ductal carcinoma in
situ (DCIS), yang mana kanker belum menyebar ke bagian luar jaringan kantung
susu.
7 8 2.
Kanker payudara invasive
Yaitu kanker yang telah menyebar keluar bagian kantung susu dan
menyerang jaringan sekitarnya bahkan dapat menyebabkan penyebaran
(metastase) ke bagian tubuh lainnya seperti kelenjar limpa melalui peredaran
darah.
2.1.1.2 Pencegahan
Sampai saat ini, belum ada solusi yang tepat untuk mencegah kanker payudara.
Namun sangat mungkin bagi para wanita untuk menurunkan resiko terkena penyakit ini.
Faktor pola hidup, seperti mengurangi konsumsi alkohol, menyusui, terlibat dalam
aktifitas fisik, dan menjaga berat badan akan sangat menurunkan tingkat resiko terkena
kanker payudara.
Penelitian juga membuktikan bahwa usia, sejarah kesehatan keluarga serta faktor
reproduksi mempengaruhi tingkat resiko untuk terkena penyakit ini. Karena sampai saat
ini masih belum diketahui cara untuk mencegah kanker payudara, maka tindakan yang
terbaik bagi para wanita adalah mengambil inisiatif untuk melakukan pendeteksian
sedari dini.
2.1.1.3 Pendeteksian
Semakin cepat kanker payudara ditemukan, maka akan semakin besar peluang
untuk sembuh. Sebuah citra yang bernama mammogram, sering digunakan untuk
mengidentifikasi keanehan atau keabnormalitasan dari payudara yang mungkin telah
menjadi kanker sebelum gejala fisiknya ditemukan.
9 Bagaimanapun beberapa kanker yang tak tampak pada mammogram, masih bisa
dirasakan oleh para wanita ataupun penyedia jasa kesehatan. Untuk alasan ini, American
Cancer Society merekomendasikan untuk mengikuti petunjuk untuk menemukan kanker
payudara lebih awal, antara lain:
•
Wanita yang berumur 40 tahun atau lebih tua harus melakukan
mammography setiap tahun dan harus terus melakukannya selama mereka
berada dalam kondisi yang sehat.
•
Wanita berumur antara 20 sampai 30 tahun harus menjalankan Clinical
Breast Exam (CBE) oleh para profesional paling sedikit 3 tahun sekali.
Setelah berumur 40, maka CBE harus dilakukan setiap tahun.
Para wanita harus mengetahui bagaimana payudara mereka biasanya terlihat dan
terasa, serta melaporkan setiap perubahan yang terjadi kepada penyedia jasa kesehatan
yang mereka percayai. Breast self-examination (BSE) adalah sebuah cara bagian wanita
untuk memulai pendeteksian di usia mereka yang menginjak 20 tahun.
Screening MRI direkomendasikan untuk wanita dengan resiko terjangkit kanker
payudara sekitar 20% sampai 25%, termasuk wanita dengan sejarah keluarga yang
menderita kanker payudara maupun kanker rahim dan wanita yang diobati karena
penyakit Hodgkin.
2.1.1.4 Pengobatan
Kanker payudara yang belum parah dapat disembuhkan. Pengobatan yang paling
sukses adalah ketika kanker payudara dideteksi lebih awal, sebelum menyebar ke
kelenjar getah bening. Tergantung dari situasi dan pilihan pasien, pengobatan mungkin
10 bisa sampai ke tahap breast conservation surgery (pengangkatan tumor serta jaringan di
sekelilingnya) ataupun mastectomy (operasi untuk menghilangkan payudara). Di kedua
kasus ini, kelenjar getah bening di bawah lengan tentu saja turut dihancurkan.
Pengobatan lainnya yaitu radiasi, terapi, kemoterapi, terapi hormon dan
monoclonan
antibody
therapy.
Seringkali
dua
atau
lebih
metode
tersebut
dikombinasikan. Para pasien tentunya harus mendiskusikan tipe pengobatan ini terhadap
dokter mereka.
2.1.2 Mammography
Mammography merupakan tipe spesifik dari pencitraan yang menggunakan
sistem X-Ray berdosis rendah untuk memeriksa payudara. Bahkan kebanyakan dokter
percaya bahwa mammography mengurangi tingkat kematian akibat dari kanker
payudara. Pemeriksaan menggunakan mammography menghasilkan citra yang disebut
dengan citra mammogram, yang digunakan untuk pendeteksian awal dan untuk
mendiagnosis penyakit payudara pada wanita.
2.1.2.1 Conventional Mammogram
Conventional mammogram atau biasa disebut juga X-Ray Mammography,
seringkali digunakan dalam praktek klinis untuk tujuan diagnosis serta screening.
Bahkan screening mammography telah menjadi metode paling efektif yang
direkomendasikan untuk pendeteksian kanker payudara sedari dini.
Mammogram mempunyai tingkat sensitivitas yang tinggi dalam mengetahui
lemak payudara dan demonstrasi yang luar biasa dalam microcalcification. Walaupun
11 begitu, mammogram sendiri memiliki batasan. Mammogram memiliki kemampuan yang
rendah dalam mendeteksi tingkat kepadatan dari payudara wanita remaja atau wanita
yang baru saja mengalami operasi di bagian payudaranya karena kelenjar dan
jaringannya dideteksi sebagai abnormalitas. Lebih lanjut, mammogram ini hanya
mengeluarkan radiasi X-Ray berdosis rendah saat pemeriksaan.
Mammogram konvensional ini mengeluarkan hasil dari screening-nya berupa
film yang dapat dilihat secara kasat mata oleh dokter. Namun karena metode ini sering
kali menghasilkan kesalahan akibat human error, maka kemudian muncullah
mammogram dijital.
Gambar 2.1.2.1. Convensional Mammogram
2.1.2.2 Mammogram dijital
Sebuah mammogram dijital tercipta ketika mammogram biasa didijitalisasikan
sehingga dapat digunakan oleh komputer. Dijitalisasi dapat didapatkan dari penggunaan
12 specific mammogram digitizer atau pun dari sebuah kamera yang memiliki resolusi
tinggi yang diperlukan untuk menghasilkan high-resolution mammogram dijital tanpa
kehilangan informasi dari original mammogram.
Secara spesifik, mammogram dijital adalah sebuah sistem mammography di
mana X-Ray film digantikan oleh solid-state detector yang mengubah X-Ray menjadi
sinyal elektrik. Detektor ini sama serperti yang terdapat pada kamera dijital. Sinyal
elektrik ini kemudian digunakan untuk menghasilkan citra dari payudara yang dapat
dilihat pada layar komputer atau dicetak pada film khusus yang sama seperti pada
konvensional mammogram. Pada umumnya, kebanyakan mammogram dijital memiliki
4096 grays levels per pixel dari semua area yang terdapat pada mammogram image.
Gambar 2.1.2.2. Mammogram Image
2.1.2.3 Prosedur Untuk Melakukan Mammography
Selama proses mammography, payudara dikompres menggunakan unit
mammography yang telah teruji. Masing-masing bagian payudara dikompres kurang
lebih hanya 20-30 detik. Total waktu yang dihabiskan untuk 1 x pemeriksaan adalah
13 sekitar 30 menit (menurut prosedur pemeriksaan menggunakan mammography yang
berlaku). Pada saat pengkompresian, payudara dapat terasa tidak nyaman.
Pengkompresan ini dilakukan untuk membuat payudara menjadi mengembang
dan rata sehingga lebih mudah untuk mengambil citra di dalam jaringan payudara.
Waktu terbaik untuk melakukan pemeriksaan adalah 1 minggu setelah haid pertama
menstruasi, karena payudara dalam keadaan lebih lunak dan tidak terlalu tegang (tidak
boleh dilakukan pada saat kehamilan).
Gambar 2.1.2.3. Mammogram’s Procedur
2.1.2.4 Computer-Aided Detection (CAD)
CAD merupakan sistem yang mempergunakan mammogram image dari
mammogram dijital untuk mencari area abnormal dari kepadatan maupun klasifikasi
yang mungkin terindikasi adanya kanker.
CAD melakukan pendeteksian terhadap adanya sel kanker yang mungkin
terdapat di dalam payudara. Namun CAD sendiri memiliki keterbatasan yaitu sering
terjadi false-positive maupun false-negative. False-positive yaitu sebuah kesalahan
14 diagnosis di mana tidak terdapat sel kanker, namun dinyatakan terdapat sel kanker.
False-negative merupakan keadaan sebaliknya, yaitu sebuah kesalahan diagnosis di
mana terdapat sel kanker namun tidak dapat ditemukan oleh sistem CAD.
2.2
Teori Khusus
Teori khusus adalah teori yang berhubungan dengan topik yang dibahas dalam
skripsi ini.
2.2.1
Computer Vision
Computer Vision adalah ilmu yang berhubungan dengan modelling serta replika
dari penglihatan manusia menggunakan software dan hardware komputer. Computer
Vision mengkombinasikan pengetahuan dalam computer science, electrical engineering,
matematika, psikologi, biologi, serta cognitive science.
Computer Vision memerlukan pengetahuan dari semua field tersebut dengan
tujuan untuk mengerti dan mensimulasikan operasi dari sistem penglihatan manusia.
Computer Vision juga dapat diartikan sebagai sebuah disiplin ilmu yang mempelajari
bagaimana membangun, menginterprasikan, dan mengerti tentang 3D scene dari citra
2D dalam sebuah struktrur scene yang ditunjukkan. Masalah yang paling sering dihadapi
dalam Computer Vision adalah banyaknya noise sehingga mengganggu proses image
processing, feature extraction, dan lainnya.
Computer vision sulit untuk diwujudkan karena format citra pada dasarnya
adalah many to one mapping. Tugas-tugas seperti mengidentifikasi tanda tangan,
mengidentifikasi tumor di dalam citra resonansi magnetik, mengenal objek yang
diterima dari citra yang dihasilkan oleh satelit, mengidentifikasi wajah, menentukan
15 lokasi sumber mineral dari sebuah citra, dan membangun citra tiga dimensi dari
potongan citra dua dimensi dipertimbangkan sebagai lapangan subjek di Computer
Vision. Tipe sistem Computer Vision terdiri dari tingkatan seperti akuisisi citra (image
acquisition), preprocessing, ekstrasi fitur (feature extraction), menyimpan objek dengan
asosiasi, mengakses basis pengetahuan dan pengenalan.
Gambar 2.2.1 Bagan Sistem Computer Vision
2.2.1.1 Computer Vision Hierarchy
Low-level vision: process image dari ekstraksi fitur
Intermediate-level vision: pengenalan objek dan interpretasi 3D scene
menggunakan fitur yang didapat dari low-level vision
High-level vision: interpretasi dari informasi yang diperoleh dari intermediatelevel vision dan low-level vision harus ditampilkan. Interpretasi tersebut mungkin
termasuk deskripsi konsepsual dari sebuah scene seperti aktivitas, intensi, dan prilaku.
16 Gambar 2.2.1.1 Computer Vision Hierarchy
2.2.1.2 Computer Vision Fields
Computer Vision secara signifikan menghadapi field seperti : image processing,
pattern recognition, dan photogrammetry.
Image processing berfokus pada manipulasi image untuk meningkatkan kualitas
dari
image,
untuk
mengembalikan
originalitas
mengkompres/mengdekompres size dari image.
dari
image
atau
untuk
17 Pattern recognition mempelajari berbagai teknik (seperti teknik statistika, neural
network,
support
vector
machines,
dan
lain-lain)
untuk
mengenali
atau
mengklasifikasikan berbagai pola yang berbeda-beda.
Photogrammetry berhubungan dengan bagaimana cara untuk mendapatkan
pengukuran yang akurat serta terpercaya dari sebuah image. Photogrammetry berfokus
pada pengukuran yang akurat. Kalibrasi kamera dan rekontruksi 3D merupakan 2 area
yang paling diminati dalam penelitian photogrammetry maupun computer vision.
2.2.1.3 Computer Vision Applications
Contoh aplikasi dari computer vision:
•
Proses Controlling -> Industri robot
•
Navigasi -> kendaraan yang dapat berjalan sendiri
•
Deteksi Event -> penghitungan jumlah orang
•
Object Modelling ->medical image
2.2.1.4 Computer Vision Specific Task (Recognition)
Masalah klasik di dalam computer vision yaitu menentukan ada atau tidaknya
spesifik objek, fitur, maupun aktivitas dari data yang terdapat dalam citra atau video.
18 Tahap-tahapnya :
9
Pengenalan Objek
9
Identifikasi
9
Pendeteksian
•
Motion analysis
•
Scene reconstruction
•
Image restoration
•
3D volume recognition
2.2.2 Pre-Processing
Pre-processing merupakan sebuah proses untuk menghilangkan bagian-bagian
yang tidak diperlukan pada citra input untuk proses selanjutnya.
2.2.2.1 Tujuan
Tujuan dari pre-processing, antara lain:
•
Menghilangkan noise
•
Memperjelas fitur data
•
Memperbesar atau memperkecil ukuran data
•
Mengkonversi data asli agar diperoleh data yang sesuai kebutuhan
2.2.2.2 Contoh dari pre-processing
Contoh dari pre-processing adalah:
•
Noise filtering
•
Edge detection
•
Pengubahan citra RGB menjadi gray-scale
19 2.2.2.3 Tahapan
Tahap pre-processing dalam sistem pengenalan mesin dapat menangani persepsi
tingkat kecerahan serta masalah seperti pemulihan citra dan rekonstruksi citra. Sistem
akuisisi citra dalam prakteknya tidak sempurna dan memiliki resolusi terbatas. Metode
restorasi citra berurusan dengan memperkirakan citra asli dari citra yang rusak. Teknik
restorasi mengkompensasi degradasi sistem citra yang mungkin telah mengalami
perubahan, dan baru-baru ini, jaringan syaraf tiruan dibangun untuk restorasi citra.
Tingkat pre-processing berikutnya adalah tingkat menengah. Salah satu teknik
pengolahan terkenal tingkat menengah adalah fitur ekstraksi, yang terdiri dari pemetaan
suatu vektor observasi ke ruang fitur. Tujuan utama dari ekstraksi fitur adalah untuk
mengurangi data dengan mengukur fitur tertentu yang membedakan pola input. Untuk
ekstraksi ciri, orang dapat memilih subset dari vektor input yang diamati, atau salah satu
dapat mengubah vektor input pengamatan menggunakan beberapa aplikasi dasar fungsi.
Di dalam banyak ortogonal, vektor observasi diperoleh dengan sampling sebuah citra
masukan yang mewakili vektor observasi yang dipetakan ke fitur domain ruang. Data
dalam domain diubah, kemudian dapat diurutkan menurut tingkat signifikansi isi dan
kualitas pola diambil.
2.2.2.4 High Pass Filtering
High pass filtering adalah sebuah teknik untuk menajamkan gambar dijital
dengan cara mengkonvolusikan sebuah matriks kernel terhadap gambar dijital tersebut.
Hasil dari proses ini adalah gambar yang sudah ditajamkan kualitasnya. High pass
filtering biasanya menghasilkan noise berupa bintik-bintik pada gambar dijital. Karena
20 hal ini biasanya teknik ini diikuti dengan teknik smoothing untuk mengurangi noise
tersebut.
2.2.2.5 Low Pass Filtering
Low pass filtering adalah sebuah teknik untuk mengurangi tingkat ketajaman
gambar dijital dengan cara mengkonvolusikan sebuah matriks kernel terhadap gambar
dijital tersebut. Low pass filtering biasanya dapat menghilangkan detail-detail yang ada
pada gambar. Karena itu, teknik harus dipakai dengan secukupnya agar detail yang
dibutuhkan pada gambar tidak hilang
2.2.2.6 Histogram Equalization
Metode ini biasanya akan mengangkat tingkat kontras gambar secara signifikan,
terutama apabila gambar tersebut memiliki tingkat variasi intensitas yang kecil. Metode
ini akan menyesuaikan sebaran intensitas pada histogram sehingga gambar dengan
tingkat kontras yang rendah sehingga menjadi gambar dengan tingkat kontras yang
tinggi.
Cara metode ini bekerja adalah dengan menyeimbangkan sebaran intensitas yang
sebelumnya terpusat pada bagian intensitas tertentu saja. Gambar seperti ini biasa
disebut juga sebagai gambar yang mostly dark atau gambar yang memiliki dominasi
pixel bernilai rendah dan juga gambar yang mostly bright atau gambar yang memiliki
dominasi pixel bernilai tinggi.
Dengan mengaplikasikan metode ini, maka gambar akan memiliki tingkat
sebaran intensitas yang tinggi, dan detail yang sebelumnya tidak terlihat akan menjadi
terlihat.
21 2.2.3 Feature Extraction
Feature Extraction adalah proses pengambilan ciri-ciri yang unik dari data atau
image yang akan diolah. Selama 30 tahun terakhir ini, banyak teknik yang telah
dikembangkan untuk ekstraksi fitur, contohnya Fourier transform, moment invariants,
distribusi Wigner, Houghtransform, polymials ortogonal, fungsi gabor, dll.
Banyak model jaringan neural telah diusulkan untuk ekstraksi fitur. Masalah
pengakuan invariant objek sering ditangani pada tahap ekstraksi fitur karena, untuk
mempertimbangkan translasi, rotasi, dan perbedaan skala pada citra, sistem pengenalan
harus melatih lebih dari sejumlah besar sampel pelatihan. Untuk mendapatkan fitur
invariant, sifat-sifat transformasi Fourier sering digunakan.
Fitur tekstur (texture feature) sering digunakan untuk mengenali objek. Tekstur
umumnya diakui sebagai dasar untuk melakukan persepsi. Banyak metode statistik dan
struktural, serta model jaringan syaraf tiruan untuk menganalisis tekstur yang tersedia.
Metode statistik analisis tekstur didasarkan pada hubungan antara nilai piksel abu-abu
dalam citra. Ekstraksi fitur umumnya juga berkaitan dengan ekstraksi fitur tekstur. Di
dalam program yang kami buat, kami menggunakan GLCM (Gray Level Co-Occurrence
Matrix) dalam melakukan ekstraksi fitur.
2.2.3.1 Tujuan
Tujuan dari feature extraction antara lain:
•
Memperkecil jumlah data
•
Mengambil informasi yang penting dari data yang diolah
•
Mempertinggi presisi pengolahan
22 2.2.3.2 Contoh dari Feature Extraction
Berikut adalah beberapa cara ekstraksi fitur:
•
Edge enhancement
•
Separasi atau pemisahan warna
•
Pencarian nilai-nilai ekstrim (tertinggi atau terendah)
•
Penghitungan banyaknya sudut
2.2.4 ROI (Region of Interest)
ROI atau Region of Interest adalah bagian yang dipilih sebagai daerah yang
signifikan di dalam sebuah data yang akan diidentifikasi untuk tujuan tertentu. Konsep
ROI biasanya digunakan dalam pencitraan medis, oleh karena itu di sini kami
menggunakan konsep ini karena kami membahas tentang masalah kanker payudara. ROI
kami pakai untuk mendapatkan daerah yang lebih signifikan dari gambar mammogram
sehingga fitur dapat terlihat lebih jelas dan dapat menghasilkan ekstraksi fitur yang baik.
Tentunya hal ini akan membuat hasil yang lebih efektif dan efisien dibandingkan dengan
mendeteksi keseluruhan gambar mammogram.
2.2.5 GLCM (Gray Level Co-occurrence Matrix)
GLCM adalah matriks yang menjelaskan dan mencitrakan frekuensi level abuabu (grayscale) yang muncul dalam ruang linier tertentu yang mempunyai hubungan
dengan level abu-abu lainnya dalam bidang investigasi. Di sini, co-occurrence matrix
23 dihitung berdasarkan dua parameter, yaitu jarak relatif antara pasangan piksel d yang
diukur dalam angka piksel dan orientasi relatif φ.
GLCM merupakan metode statistik untuk menghitung probabilitas co-occurance
dari fitur tekstural. Misalkan diberikan citra dengan f(x,y) berukuran Lr x Lc dengan set
tingkat keabu-abuan Ng, menetapkan matriks p(i,j,d, φ)sebagai
P(i,j,d, φ) = card { ((x1,y1),(x2,y2)) ∈ (Lr x Lc) x (Lr x Lc)
(x2,y2) =(x1,y1) + (d cos
, d sin )
f(x1,y1) = i, f((x2,y2) = j,,0 ≤i,j < Ng}
dimana d menunjukkan jarak antara piksel (x1,y1) dan (x2,y2) di dalam citra φ
menunjukkan orientasi jajaran (x1,y1) dan (x2,y2), dan card {‫ }ڄ‬menunjukkan nomor dari
elemen-elemen di dalam set.
Gambar 2.2.5 Proses untuk mendapatkan matriks GLCM
Citra I pada citra di atas diubah menjadi matriks GLCM, di mana nilai matriks
GLCM didapat dengan mengkalkulasikan jumlah setiap pasangan nilai piksel
bertetangga pada citra I dengan jarak d. Contoh di atas nilai piksel pada sudut kiri atas
bernilai 1 dan di sampingnya bernilai 1, kemudian dihitung banyaknya pasangan piksel
yang bernilai [1 1]. Dimensi matriks GLCM adalah sebesar n x n, di mana n adalah nilai
24 piksel terbesar citra I. Berdasarkan contoh di atas, pasangan nilai piksel [1 1] berjumlah
1, lalu dibuat matriks GLCM pada titik (1, 1) dengan nilai 1. Demikian pula titik (1,2)
yang berasal dari jumlah pasangan [1 2] bernilai 2.
Untuk mengembangkan deskriptor yang disesuaikan dijelaskan di bagian
selanjutnya, maka diperlukan untuk menganalisis fitur dari mamografi.Dalam studi ini,
matriks GLCM dibangun untuk menghitung ROI di masing-masing arah 0°, 45°, 90°,
dan 135°.
Fitur tekstur yang dapat diekstraksi dari gray level co-occurrence matrices antara
lain adalah angular second moment, contrast, correlation, variance, inverse difference
moment, sum average, sum variance, sum entropy, entropy, different variant, dan
different entropy.
25 2.2.6 Support Vector Machines (SVM)
Support Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik pada
tahun 1992 sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang pattern
recognition (pengenalan pola). Sebagai salah satu metode pengenalan pola, usia SVM
terbilang masih relatif muda. Walaupun demikian, evaluasi kemampuannya dalam
berbagai aplikasi menempatkannya sebagai sebuah karya terbaik dalam pengenalan pola.
SVM adalah metode learning machine yang bekerja atas prinsip Structural Risk
Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan
dua buah class pada input space.
Konsep dasar SVM sebenarnya merupakan kombinasi harmonis dari teori-teori
komputasi yang telah ada puluhan tahun sebelumnya, seperti margin hyperplane, kernel
diperkenalkan oleh Aronszajn tahun 1950 dan demikian juga dengan konsep-konsep
pendukung yang lain. Akan tetapi hingga tahun 1992, belum pernah ada upaya
merangkaikan komponen-komponen tersebut.
Berbeda dengan strategi neural network yang berusaha mencari hyperplane
pemisah antar kelas, SVM berusaha menemukan hyperplane yang terbaik pada input
space. Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar
dapat bekerja pada problem non-linear, dengan memasukkan konsep kernel trick pada
ruang kerja berdimensi tinggi. Perkembangan ini memberikan rangsangan minat
penelitian di bidang pengenalan pola untuk investigasi potensi kemampuan SVM secara
teoritis maupun dari segi aplikasi. Dewasa ini SVM telah berhasil diaplikasikan dalam
aplikasi di dunia nyata dan secara umum memberikan solusi yang lebih baik
dibandingkan dengan metode konvensional seperti misalnya artificial neural network.
26 Support Vector Machines (SVM) telah terbukti sukses diaplikasikan dalam
menyelesaikan masalah klasifikasi dan estimasi fungsi setelah pengenalan yang
dilakukan oleh Vapnik dalam konteks teori statistical learning dan structure risk
minimization. Vapnik mengkonstruksikan SVM standar untuk memisahkan data-data
pelatihan menjadi dua kelas.
2.2.6.1 Karakteristik SVM
Karakteristik SVM yaitu:
•
Secara prinsip SVM adalah linear classifier
•
Pattern recognition dilakukan dengan mentransformasikan data pada
input space ke ruang yang berdimensi lebih tinggi, dan optimisasi
dilakukan pada ruang vector yang baru tersebut. Hal ini membedakan
SVM dari solusi pattern recognition pada umumnya, yang melakukan
optimisasi parameter pada ruang \ hasil transformasi yang berdimensi
lebih rendah daripada dimensi input space.
•
Menerapkan strategi Structural Risk Minimization (SRM)
•
Prinsip kerja SVM pada dasarnya hanya mampu menangani klasifikasi
dua class.
27 2.2.6.2 Kelebihan dan kekurangan SVM
Kelebihan SVM:
1.
Generalisasi
Generalisasi didefinisikan sebagai kemampuan suatu metode untuk mengklasifikasikan
suatu pattern, yang tidak termasuk data yang dipakai dalam fase pembelajaran metode
tersebut.
Generalization error dipengaruhi oleh dua faktor: error terhadap training set dan
dimensi VC (Vapnik–Chervonenkis dimension). Jadi, SVM dapat meminimalkan error
pada training-set, juga meminimalkan dimensi VC.
2.
Curse of dimensionality
Curse of dimensionality didefinisikan sebagai masalah yang dihadapi suatu metode
pattern recognition dalam mengestimasikan parameter (misalnya jumlah hidden neuron
pada neural network, stopping criteria dalam proses pembelajaran, dsb) dikarenakan
jumlah sampel data yang relatif sedikit dibandingkan dimensional ruang vektor data
tersebut. Semakin tinggi dimensi dari ruang vector informasi yang diolah, membawa
konsekuensi dibutuhkannya jumlah data dalam proses pembelajaran.
3.
Feasibility
SVM dapat diimplementasikan relatif mudah, karena proses penentuan support vector
dapat dirumuskan dalam QP problem (Quadratic programming). Dengan demikian, jika
kita memiliki library untuk menyelesaikan QP problem, dengan sendirinya SVM dapat
diimplementasikan dengan mudah.
28 Kekurangan SVM:
1.
Sulit dipakai dalam problem berskala besar.
Skala besar dalam hal ini dimaksudkan dengan jumlah sample yang diolah.
2.
SVM secara teoritik dikembangkan untuk problem klasifikasi dengan dua class
atau lebih. Namun demikian, masing-masing strategi ini memiliki kelemahan,
sehingga dapat dikatakan penelitian dan pengembangan SVM pada multiclassproblem masih merupakan tema penelitian yang masih terbuka.
2.2.6.3 Tujuan SVM
Tujuan dari pelatihan pada SVM adalah untuk menemukan fungsi pemisah
(classifier) f (x) = ω . x + b sehingga kita dapat menggunakan classifier tersebut untuk
mengklasifikasi data. Training set yang digunakan :
berperan sebagai input dan
, di mana
menjadi output, mengindikasikan kelas.
Formulasi SVM dimulai dari asumsi bahwa kasus yang dapat dipisahkan secara linear
adalah:
Untuk kasus yang tidak dapat dipisahkan
Dimana
menunjukkan sebuah pemetaan dari input menjadi sesuatu yang
disebut ruang fitur berdimensi tinggi. Dalam metode kernel suatu data x di input space
dipetakan ke kernel feature space yang lebih tinggi melalui map □ sebagai berikut :
29 □ : x → □ (x). Karena itu data x di input space, menjadi □ (x) di kernel space. Dalam
kernel space ini, dot product dua vektor <x, x’> menjadi <□(x), □(x)’>. Suatu fungsi
kernel, K(x, x’), bisa digunakan untuk menggantikan dot product <□(x), □(x)’>. Untuk
setiap fungsi yang continuous dan positive definite, akan ada suatu pemetaan □, sehingga
K(x,y) = (□(x), □(y)) untuk semua x,y
dimana
adalah input space (Mercer’s
Theorem).
Dalam ruang ini, permukaan keputusan linear dibangun dengan property unik
yang menjamin kemampuan generalisasi yang tinggi dalam jaringan. Ditunjukkan dalam
citra diagram di bawah ini, bahwa fungsi kernel non-linear memungkinkan untuk
menghitung hyperplane pemisah dengan margin maksimum di feature space.
Gambar 2.2.6.3 Pemetaan ruang fitur menggunakan fungsi kernel
Kita harus menemukan, di antara semua hyperplane yang memisahkan data-data
sebuah jarak maksimum
di antara kedua kelas. Masalah yang ada ditransformasikan
ke dalam bentuk Quadratic Programming (QP) problem.
s.t
dimana C adalah parameter yang ditransaksikan antara error dengan margin.
30 Quadratic Programming adalah suatu teknik optimisasi yang meminimalisasi
sejumlah n dalam notasi matriks. Masalah Quadratic Programming dapat dipecahkan
dengan menggunkan lagrangian multipliers
kondisi Karush-Kuhn-Tucker (KKT).
Dimana
bukan nol dan
Solusi yang dihasilkan memenuhi
dapat dicari dengan menggunakan
adalah support vector. Decision boundary hanya ditentukan
oleh support vector. Diketahui
menjadi titik-titik dari s support vector.
Maka kita dapat menuliskan kembali fungsi yang ada menjadi:
Masalah Quadratic Programming dipecahkan dengan menambahkan Dual Problem
Dengan kernel trick (Mercer’s Theorem)
2.2.6.4 Pengenalan Pola dalam Support Vector Machines
Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari
hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas pada input space.
Gambar di bawah memperlihatkan beberapa pola yang merupakan anggota dari dua
buah kelas: +1 dan -1. Pola yang tergabung pada kelas -1, disimbolkan dengan warna
31 biru (lingkaran). Masalah klasifikasi dapat diterjemahkan sebagai usaha menemukan
garis (hyperplane) yang memisahkan antara kedua kelompok tersebut. Berbagai
alternative garis pemisah (discrimination boundaries) ditunjukkan pada gambar (a).
Gambar 2.2.6.4a Garis-garis yang merupakan discrimination boundaries
Gambar 2.2.6.4b Pemisah antar class
32 2.2.6.5 Pelatihan dengan Support Vector Machine
Penggunaan SVM baik dalam bentuk supervised pada prinsipnya dipakai untuk
menyelesaikan sebuah permasalahan quadratic programming. Oleh karena itu, proses
pelatihannya hampir sama dan tahapannya dapat dilihat pada gambar di bawah ini, akan
tetapi untuk unsupervised learning dengan SVM, data pelatihan dan data pengujian
adalah data yang sama. Selain itu, untuk proses pelatihannya dapat juga hanya
menggunakan sebagian data dari data pengujian sehingga proses waktu pelatihan
menjadi lebih singkat, tetapi hal ini mungkin menurunkan akurasi pada tahap pengujian.
Sedangkan untuk supervised learning justru sebaliknya, dapat meningkatkan akurasi
pada tahap pengujiannya.
Gambar 2.2.6.5 Pelatihan dengan SVM
Batas kemampuan komputasi fungsi linear dibahas pada tahun 1960-an oleh
Minsky dan Papert. Secara umum, pada kasus dunia nyata, pengklasifikasian domain
permasalahan memerlukan ekspresi yang lebih kompleks dibanding fungsi linear
(misalnya fungsi polynomial, eksponensial, atau fungsi periodik). Trik kernel
33 menawarkan solusi dengan memproyeksikan data ke dalam ruang dimensi yang lebih
tinggi (disebut juga dengan feature space) untuk meningkatkan kemampuan komputasi
fungsi linear. Yang dimaksud dengan dimensi di sini adalah ruang dimensi vektor w
berada, yang akan mempengaruhi besar nilai n.
Adapun pemetaan ke ruang dimensi yang lebih tinggi dilakukan untuk
memetakan input ke ruang dimensi yang baru, di mana diharapkan bahwa pada ruang
dimensi yang baru, domain input dapat dipisahkan oleh suatu vektor sederhana, yang
tidak dapat dilakukan sebelumnya pada ruang dimensi awal. Adapun salah satu
pemetaan ulang data, dapat dicapai dengan memetakan
Sehingga fungsi penentu berubah menjadi:
1.
Kernel Linear
Gambar 2.2.6.5a Pemetaan Kernel Linear
34 2.
Kernel Polynomial
Gambar 2.2.6.5b Pemetaan Kernel Polynomial
X= Support Vector
X’= Besarnya Vector
Fungsi Kernel polynomial bersifat directional, yaitu output tergantung pada arah
2 vector dalam ruang dimensi rendah. Hal ini disebabkan produksi titik di dalam kernel
yang menunjukkan bentuk dua dimensi yang jumlahnya banyak. Semua vektor dengan
arah yang sama akan lebih tinggi dari output kernelnya, yang besar dari outputnya juga
tergantung pada besarnya vektor.
3.
Kernel Radial Basis Function
Gambar 2.2.6.5c1 Pemetaan Kernel RBF
35 Gambar 2.2.6.5c2 Kiri : Original space, Kanan : Feature Space
Fungsi radial basis yang sering digunakan adalah fungsi gaussian karena
mempunyai sifat lokal, yaitu bila input dekat dengan rata–rata (pusat), maka fungsi akan
menghasilkan nilai satu, sedangkan bila input jauh dari rata–rata, maka fungsi
memberikan nilai nol.
4.
Kernel Sigmoid
Gambar 2.2.6.5d Pemetaan Kernel Sigmoid
Download