PREDIKSI NILAI MATA KULIAH BERDASARKAN NILAI PRASYARAT MENGGUNAKAN METODE SUPPORT VECTOR REGRESSION M RIZAL SYAH KARIM (NRP : 5110100138) DOSEN PEMBIMBING : DR. TECH. IR. R. V. HARI GINARDI, M.SC DR. CHASTINE FATICHAH S.KOM., M.KOM LATAR BELAKANG Database pendidikan meningkat dengan pesat dan mengandung informasi penting untuk peningkatan performa siswa/mahasiswa. Mengusulkan metode Support Vector Regression (SVR) untuk mengetahui informasi penting dari data nilai prasyarat mahasiswa. Prediksi ini membantu dosen maupun mahasiswa untuk mendapatkan nilai yang lebih baik. TUJUAN Menerapkan metode Support Vector Regression untuk memprediksi Nilai mata kuliah berdasarkan Nilai mata kuliah prasyarat Analisa hubungan antara nilai mata kuliah prasyarat dengan nilai mata kuliah yang diprasyarati Metodologi Pengumpulan dataset Preposesing Data Penerapan algoritma Evaluasi MATA KULIAH PRASYARAT Mata kuliah prasyarat adalah mata kuliah yang merupakan persyaratan untuk suatu mata kuliah yang diprasyarati Contoh Mata Kuliah Prasyarat SUPPORT VECTOR REGRESSION (SVR) SVR merupakan pengembangan dari SVM untuk melakukan regresi untuk memprediksi nilai keluaran dari suatu masukan Tujuan SVR adalah mencari fungsi regresi f(x) = <w , x> + b Yang memiliki deviasi yang besar pada rentang Ɛ sedemikian hingga mampu memprediksi nilai aktual y untuk semua data latih. Selain deviasi, SVR mencari persamaan regresi yang sedatar mungkin, fungsi regresi yang mendekati nilai sebenarnya KONSEP SUPPORT VECTOR REGRESSION Konsep Support Vector Regression KORELASI Analisis korelasi dimaksudkan untuk mengetahui seberapa kuatkah hubungan antara satu atau beberapa variabel dengan suatu variabel lain. Nilai korelasi (r ) diukur dari korelasi Pearson untuk 2 buah variabel X dan Y dengan jumlah data sebesar N dirumuskan pada persamaan sebagai berikut INTERPRETASI KORELASI Tabel Interpretasi korelasi Nilai Korelasi Sampel Interpretasinya 0,00 – 0,20 Hubungan korelasinya diabaikan 0,20 – 0,40 Hubungan korelasinya rendah 0,40 – 0,70 Hubungan korelasinya sedang 0,70 – 0,90 Hubungan korelasinya kuat > 0,90 Hubungan korelasinya sangat kuat 9 DATA Data didapatkan dari sim akademik (integra) nilai mahasiswa Teknik Informatika angkatan 2009 – 2012 Data berupa data nilai persiswa dengan skala huruf E – A. Nilai ini akan diubah skalanya menjadi 1 – 7 untuk memudahkan perhitungan Error. Akan digunakan prasyarat. beberapa kombinasi pohon DATA YANG DIGUNAKAN Tabel data yang digunakan Nama Dataset Prasyarat Prediksi Jumlah record Dataset 1 STI, Basdat, BDL, PAAL, Data Mining Data Warehouse 69 Dataset 2 Sisdig, Orkom, Sisop, Jarkom PMJ 48 Dataset 3 ASD, Grafkom, Jarkom Jarmul 106 Dataset 4 Sisdig, Orkom Sisop 620 Dataset 5 RPL APS 441 11 SEBARAN DATA BOXPLOT (DATASET 2) 7 6 5 4 3 2 1 Sisdig Orkom Sisop Jarkom PMJ DATA REAL (DATASET 2) SKENARIO UJICOBA Dari masing-masing dataset, digunakan 70% sebagai data latih dan 30% sebagai data uji. Algoritma Latih yang digunakan adalah support vector regression diuji pada semua kernel dan parameter latih c = 1 dan Ɛ = 0,001 Pengukuran error : MSE (Mean Square Error) : HASIL UJICOBA HASIL UJICOBA 1 (1) Tabel hasil ujicoba dataset mahasiswa pada semua kernel Nama Dataset Linier Polynomial RBF Sigmoid Dataset 1 0.205 0.8 0.212 0.37 Dataset 2 0.5 1.24 0.32 0.45 Dataset 3 0.35 1.24 0.36 0.6 Dataset 4 0.92 0.91 0.98 1.04 Dataset 5 1.12 1.09 1.069 1.05 Rata-rata 0.61 1.05 0.58 0.70 16 HASIL UJICOBA 1 (2) Tabel hasil ujicoba dataset mahasiswa dengan nilai MSE terbaik Nama Dataset Jumlah feature Jumlah record MSE terbaik Dataset 1 5 76 0.205 Dataset 2 4 64 0.32 Dataset 3 3 110 0.35 Dataset 4 2 674 0.91 Dataset 5 1 441 1.05 17 ANALISIS HASIL UJICOBA Grafik hubungan antara jumlah MK Prasyarat dengan nilai MSE HASIL UJICOBA 2 Tabel hasil ujicoba korelasi Nama Dataset MSE terbaik Nilai Korelasi Dataset 1 0.205 0.53 Dataset 2 0.32 0.36 Dataset 3 0.35 0.32 Dataset 4 0.91 0.26 Dataset 5 1.05 0.22 19 Rata-rata 0.56 0.34 ANALISIS HASIL UJICOBA (2) Grafik hubungan antara korelasi dengan nilai MSE KESIMPULAN Kernel RBF menghasilkan rata-rata nilai MSE terbaik dari semua kernel yaitu 0,58 Dari hasil ujicoba, hubungan antara nilai prasyarat dengan nilai yang diprasyarati adalah mempunyai korelasi meskipun rendah yakni sebesar 0,34 Semakin besar nilai korelasi, maka semakin kecil nilai MSE pada hasil prediksi. Jumlah atribut prediktor (dalam hal ini jumlah mata kuliah prasyarat) yang lebih banyak menghasilkan hasil prediksi yang lebih baik Persebaran data yang kurang baik dapat menyebabkan kesalahan hasil prediksi yang cukup tinggi TERIMA KASIH