KLASIFIKASI BERBASIS GRAVITASI DATA DAN

advertisement
KLASIFIKASI BERBASIS GRAVITASI DATA DAN PROBABILITAS
POSTERIOR
Nama Mahasiswa
NRP
Pembimbing
: Muhamad Arief Hidayat
: 5108.201.001
: Prof. Ir. Arif Djunaidy, M.Sc., Ph.D.
Abstrak
Klasifikasi berbasis gravitasi data atau data gravitation-based classification
(DGC) merupakan salah satu teknik klasifikasi baru yang menggunakan gravitasi data
sebagai kriteria klasifikasi. Dalam DGC, sebuah obyek akan diklasifikasikan sebagai
suatu kelas yang menghasilkan gravitasi data terbesar pada obyek tersebut. Metode
DGC memberikan hasil yang buruk jika data pelatihan yang digunakan mengalami
permasalahan ketidakseimbangan kelas. Hal ini dikarenakan, jika terdapat sebuah
kelas pada data pelatihan yang massanya sangat besar, maka sebuah obyek akan
cenderung diklasifikasikan sebagai anggota kelas tersebut karena gravitasi datanya
sangat besar, dan demikian pula sebaliknya.
Dalam penelitian ini diajukan metode DGC yang dimodifikasi, yaitu metode
klasifikasi berbasis gravitasi data dan probabilitas posterior (DGCPP). Dalam metode
DGCPP, konsep massa dalam metode DGC yang diinterpretasikan sebagai
probabilitas prior. diganti dengan probabilitas posterior. Dengan cara ini, proses
perhitungan gravitasi data diharapkan akan mampu memberikan hasil yang lebih
akurat dibandingkan dengan metode DGC. Dengan meningkatnya akurasi perhitungan
gravitasi data, akurasi hasil klasifikasi dengan metode DGCPP diharapkan akan lebih
baik dibandingkan dengan metode DGC, baik untuk set data normal maupun untuk set
data yang mengalami permasalahan ketidakseimbangan kelas.
Hasil uji coba menggunakan metode ten-fold crossvValidation pada empat
set data normal dan empat set data yang mengalami permasalahan ketidakseimbangan
kelas menunjukkan bahwa metode DGCPP memiliki rata-rata selisih akurasi positif
dibandingkan dengan metode DGC. Untuk seluruh set data normal yang diujicobakan,
selisih akurasi yang dihasilkan signifikan secara statistik pada tingkat kepercayaan
95%. Dari empat set data uji coba yang mengalami permasalahan ketidakseimbangan
kelas, dua di antaranya menghasilkan rata-rata selisih akurasi yang signifikan secara
statistik pada tingkat kepercayaan 95%. Hasil uji coba juga menunjukkan bahwa
walaupun kecepatan proses klasifikasi yang dibutuhkan oleh metode DGCPP lebih
lambat dibandingkan dengan metode DGC untuk semua data yang diujicobakan,
tetapi perbedaannya sangat kecil dan sangat tidak signifikan.
Kata kunci: klasifikasi berbasis gravitasi data, permasalahan ketidakseimbangan
kelas, probabilitas posterior
Download