KLASIFIKASI BERBASIS GRAVITASI DATA DAN PROBABILITAS POSTERIOR Nama Mahasiswa NRP Pembimbing : Muhamad Arief Hidayat : 5108.201.001 : Prof. Ir. Arif Djunaidy, M.Sc., Ph.D. Abstrak Klasifikasi berbasis gravitasi data atau data gravitation-based classification (DGC) merupakan salah satu teknik klasifikasi baru yang menggunakan gravitasi data sebagai kriteria klasifikasi. Dalam DGC, sebuah obyek akan diklasifikasikan sebagai suatu kelas yang menghasilkan gravitasi data terbesar pada obyek tersebut. Metode DGC memberikan hasil yang buruk jika data pelatihan yang digunakan mengalami permasalahan ketidakseimbangan kelas. Hal ini dikarenakan, jika terdapat sebuah kelas pada data pelatihan yang massanya sangat besar, maka sebuah obyek akan cenderung diklasifikasikan sebagai anggota kelas tersebut karena gravitasi datanya sangat besar, dan demikian pula sebaliknya. Dalam penelitian ini diajukan metode DGC yang dimodifikasi, yaitu metode klasifikasi berbasis gravitasi data dan probabilitas posterior (DGCPP). Dalam metode DGCPP, konsep massa dalam metode DGC yang diinterpretasikan sebagai probabilitas prior. diganti dengan probabilitas posterior. Dengan cara ini, proses perhitungan gravitasi data diharapkan akan mampu memberikan hasil yang lebih akurat dibandingkan dengan metode DGC. Dengan meningkatnya akurasi perhitungan gravitasi data, akurasi hasil klasifikasi dengan metode DGCPP diharapkan akan lebih baik dibandingkan dengan metode DGC, baik untuk set data normal maupun untuk set data yang mengalami permasalahan ketidakseimbangan kelas. Hasil uji coba menggunakan metode ten-fold crossvValidation pada empat set data normal dan empat set data yang mengalami permasalahan ketidakseimbangan kelas menunjukkan bahwa metode DGCPP memiliki rata-rata selisih akurasi positif dibandingkan dengan metode DGC. Untuk seluruh set data normal yang diujicobakan, selisih akurasi yang dihasilkan signifikan secara statistik pada tingkat kepercayaan 95%. Dari empat set data uji coba yang mengalami permasalahan ketidakseimbangan kelas, dua di antaranya menghasilkan rata-rata selisih akurasi yang signifikan secara statistik pada tingkat kepercayaan 95%. Hasil uji coba juga menunjukkan bahwa walaupun kecepatan proses klasifikasi yang dibutuhkan oleh metode DGCPP lebih lambat dibandingkan dengan metode DGC untuk semua data yang diujicobakan, tetapi perbedaannya sangat kecil dan sangat tidak signifikan. Kata kunci: klasifikasi berbasis gravitasi data, permasalahan ketidakseimbangan kelas, probabilitas posterior