BAB I PENDAHULUAN 1.1 Latar Belakang Sebuah perguruan tinggi saat ini umumnya telah memiliki data akademik siswa dalam sebuah sistem informasi. Data akademik umumnya juga memiliki data bawaan yang dibawa sebelum siswa masuk dalam perguruan tinggi. Data bawaan merupakan data yang ada sejak registrasi pertama ke perguruan tinggi. Data ini bisa berupa identitas dan juga kinerja pada sekolah sebelumnya. Data akademik ini merekam kinerja siswa dalam menempuh mata kuliah dari awal hingga selesai menempuh proses perkuliahan. Data akademik umumnya hanya digunakan selama siswa aktif selama dia menempuh kuliah untuk keperluan administratif saja. Setelah siswa selesai menempuh kuliah umumnya data masih ada namun belum dimanfaatkan dengan baik. Siswa, orang tua dan perguruan tinggi mengharapkan siswa bisa lulus tepat waktu dan mendapatkan predikat yang terbaik. Dari kekayaan data yang dimiliki bisa dilakukan penambangan data atau Data Mining (DM) untuk berbagai kebutuhan institusi yang bersangkutan. Data yang ada dan jumlah data yang terus bertambah bisa bermanfaat salah-satunya untuk melakukan prediksi. Sistem informasi pendidikan dapat menyimpan sejumlah besar data potensial dari berbagai sumber yang datang dalam format yang berbeda dan pada tingkat yang berbeda [1]. 1 Sebuah penelitian menggunakan proses clustering dan klasifikasi yang berkelanjutan menggunakan Weka [2]. Data yang digunakan diambil dari partisipasi siswa dalam forum diskusi online yang disediakan di kampus. Data daimbil saat semester awal kuliah akan digunakan sebagai prediktor nilai sebuah mata kuliah diakhir semester. Dari penelitian ini diperoleh hasil bahwa partisipasi siswa dalam forum online bisa digunakan untuk memprediksi nilai yang diperoleh diakhir semester. Melihat potensi yang cukup besar terhadap data akademik dan kebutuhan institusi pendidikan untuk meningkatkan kualitas pendidikan maka dilakukan penelitian ini. Secara umum penelitian ini bertujuan untuk mempelajari karakteristik kelompok siswa yang ada dengan menggunakan data akademik. Untuk melihat jumlah dan kelompok siswa yang terbentuk akan digunakan teknik DM. Kenyataan yang ada dan yang diakui bahwa pada umumnya kemampuan siswa yang tercermin dalam nilai akhir serta lama studi. Namun untuk pengikatan kualitas akademik terutama kualitas lulusan sebuah Institusi juga memiliki keinginan bisa mengetahui prediksi lebih awal bagaimana kinerja sebenarnya selama siswa menempuh kuliah. Dari kinerja lulusan siswa secara umum ada kelompok siswa yang berhasil lulus dan tidak berhasil (gagal). Mereka yang masuk dalam kelompok yang berhasil lulus nantinya bisa dikelompokan lagi dalam tingkatan berdasarkan prestasi lulus dan ketepatan masa studi. Sebagai gambaran dari sebuah data yang diperoleh dari data mahasiswa psikologi yang masuk kuliah pada tahun 2000 hingga 2006 dengan rekam data 2 terakhir diambil pada tahun 2013. Dari data akademik siswa yang berhasil menyelesaikan studi terdapat data lama skripsi siswa tepat waktu dengan maksimal 3 semester dengan jumlah 627 siswa atau sebanyak 68% tepat waktu dan 32% menyelesaikan masa skripsi lebih dari 3 semester hingga bisa menyelesaikan studi (lulus skripsi). Indeks Prestasi Kumulatif (IPK) diambil dari seluruh nilai mata yang telah diambil diakhir masa kuliah. Dari data lulusan yang dambil rata-rata nilai IPK siswa yang sudah lulus sebesar 2,9. Jumlah SKS yang ditempuh siswa pada data yang diambil ini relatif banyak yaitu sebesar 170 SKS namun jumlah SKS yang digunakan oleh siswa sebagai syarat kelulusan minimal 144 dan maksimal 160 SKS sesuai dengan peratuaran yang ada. Dari data yang diperoleh rata-rata lama mengerjakan skripsi untuk mahasiswa S1 di program studi tersebut masih cukup tinggi selama 3 semester, bahkan masih banyak yang menyelesaikan skripsi lebih dari 4 semester. Dari data prestasi kelompok siswa yang bisa cepat atau lama dalam menyelesaikan skripsi dimungkinkan siswa-siswa tersebut mengelompok dalam beberapa cluster. Selain itu masih cukup banyak juga siswa yang sudah mengerjakan skripsi namun berhenti dan tidak melajutkan lagi. Dari 1076 data yang sudah skripsi diperoleh bahwa terdapat ada 14,4% yang skripsinya berhenti atau tertunda. Hal ini berakibat pada tertundanya kelulusan siswa. Di saat akhir kuliah siswa yang lulus akan diklasifikasikan dengan menggunakan peringkat kelulusan ditinjau dari lama studi dan Indeks Prestasi Kumulatif (IPK) sebagai siswa lulus dengan pujian, sangat memuaskan atau memuaskan. 3 Predikat kelulusan baru bisa diketahui pada akhir masa kuliah atau setelah siswa lulus kuliah. Siswa akan lulus dengan predikat tertentu yang dipengaruhi pada nilai dan lama studi. Masalah dihadapi adalah bagaimana siswa-siswa bisa lulus dengan tingkatan yang terbaik. Masalah yang lain yang dihadapi adalah bagaimana memprediksi siswa yang dimungkinkan terhambat untuk lulus karena kompetensi untuk menempuh skripsi kurang terpenuhi. Masalah ini terjadi secara umum di Universitas Mercu Buana Yogyakarta yang menjadi objek penelitian. 1.2 Perumusan Masalah Dari hasil pengamatan terhadap kondisi tersebut di atas dapat dirumuskan beberapa permasalahan utama sebagai berikut : 1. Nilai dan prestasi siswa dalam kuliah hanya dicatat dan belum dilakukan pemantauan perkembangan prestasi siswa dari waktu ke waktu. 2. Lama skripsi atau lama studi siswa kurang bisa terpantau. 3. Prestasi kelulusan siswa juga tidak/belum hanya bisa dketahui saat siswa sudah mau menyelesaikan studi dan belum bisa dipantau dari awal. 1.3 Keaslian penelitian Salah satu fakta yang signifikan dalam institusi pendidikan tinggi adalah pertumbuhan data yang semakin besar. Pertumbuhan data ini meningkat dengan 4 cepat tanpa manfaat lebih untuk manajemen. Tujuan utama dari setiap lembaga pendidikan tinggi adalah untuk meningkatkan kualitas keputusan manajerial dan untuk memberikan kualitas pendidikan. Prediksi keberhasilan siswa dalam institusi pendidikan tinggi adalah salah satu cara untuk mencapai tingkat tertinggi kualitas dalam sistem pendidikan tinggi [2]. Ada banyak metode prediksi tersedia dengan pendekatan perbedaan kinerja siswa dilaporkan oleh peneliti, tetapi tidak ada kepastian apakah ada prediksi yang akurat menentukan apakah mahasiswa akan menjadi lebih pintar dalam akademik, menurun, atau rata-rata. Dengan teknik data mining dapat digunakan secara efektif sebagai alat untuk menilai kinerja siswa. Ini menunjukkan bagaimana data bisa bermanfaat di pendidikan tinggi pada khususnya untuk memprediksi kinerja akhir siswa [3]. Sebuah penelitian lain dengan menggunakan fasilitas teknologi informasi berupa system informasi bisa mendukung proses belajar mengajar siswa. Fasilitas internet-studentsite merupakan media komunikasi dan informasi akademik yang diperuntukan bagi mahasiswa, bertujuan membantu kelancaran studi dan menunjang proses belajar mengajar. Hasil penelitian mengidentifikasi hanya variabel Perceived ease of use (PEOU) dan variabel Perceived usefulness yang memenuhi derajat signifikansi tertentu. Jumlah mahasiswa yang meyakini manfaat studentsite bagi keberhasilan studi cukup membesarkan hati mengingat hasil deskriptif mencapai 83 orang (59,7%) yang setuju manfaat studentsite. Uji independent sample test mengarah pada variable PEOU sebagai penentu keyakinan responden dalam memanfaatkan studentsite berbasis web [4]. 5 Sebuah penelitian lain melakukan prediksi dari aktfitas siswa menggunakan Moodle. Penelitain ini membandingkan beberapa algoritme data mining untuk melakukan klasifikasi pada sebuah dataset. Data diperoleh secara langsung dari sistem pembelajaran online menggunakan Moodle. Data dari sistem e-learning digunakan untuk memprediksi nilai akhir ujian Dengan Moodle dibuat tugas dan penilaian hasil tugas kerja siswa. Data dibuat dengan berbagai tipe data : numerik, kategori dan data rebalanced [5]. Sebuah data akademik dan juga data online dari siswa dapat digunakan sebagai dataset untuk data maning. Dalam penelitian ini memberikan banyak gambaran dan peluang bahwa data akademik sangat bermanfaat untuk digali pengetahuannya. Dataset diambil dari aktivitas siswa yang menggunakan fasilitas ini. Dengan menggunakan metode pembelajaran online (e-learning) Moodle dilakukan pengumpuan data, preproses dan proses data mining menggunakan Weka [6]. Dari penelitian sebelumnya menggunakan data dari luar seperti keaktifan di forum dan elearning. Penelitian yang dilakukan ini menggunakan basis data masa lampau yang terekam dalam sistem akademik perguruan tinggi. Untuk melihat kelompok data dilakukan clustering dan evaluasi. Sementara untuk melihat prediksi dilakukan klasifikasi dan clustering dengan menggunakan 3 motode clustering dengan pendekatan yang berbeda yaitu : teknik pendekatan hirarkis, verktor dan kerapatan (densitas). 6 Berikut ini adalah rangkuman beberapa metode dan hasil dari penelitian terdahulu dapat dilihat pada Tabel 1.1 Tabel 1.1 Rangkuman Penelitian terkait dengan data mining No Peneliti Judul Metode Hasil 1 B Kumar Baradwaj, Saurabh Pal [7] Mining Educational Data to Analyze Students' Performance ID3 Mengekstrak pengetahuan yang menggambarkan kinerja siswa dalam ujian semester akhir untuk membantu sebelumnya dalam mengidentifikasi putus kuliah dan siswa yang membutuhkan perhatian khusus dan memungkinkan untuk memberikan nasihat / konseling yang tepat. 3 Sajidin [3] Prediction of Student Academic Performance By An Application of Data Mining Techniques SVM Dengan data kuisioner pada semester 3 bisa dilakukan prediksi performa kualitas lulusan. 4 C Romero [5] Data Mining Algorithms to Classify Students C 4.5, KNN Membandingkan beberapa algoritme data mining untuk berbagai tipe data : Numerical data, Categorical data dan Rebalanced data. Data dari sistem elearning digunakan untuk meprediksi nilai akhir ujian. 7 No Peneliti Judul Metode Hasil 5 M. Abu Tair, Alaa M. ElHalees [8] Mining K-Mean Educational Data to Improve Students’ Performance: A Case Study Dari data akademik selamat 15 tahun (1993-2007) dilakukan Klasifikasi dengan Rule Induction and Naïve Bayesian classifier. Sementara clustering dilakukan dengan K-Mean 6 M.I. López, J.M Luna, C. Romero, S. Ventura [9] Classification via clustering for predicting final marks based on student participation in forums EM, XMean Dengan menggunakan data aktivitas siswa dalam mengikuti forum online digunakan sebagai prediksi nilai akhir siswa. Akurasi hasil terbaik didapatkan dengan menggunakan algoritme EM 7 Gerben W. Dekker1 [10] Predicting Students Drop Out: A Case Study Decision trees Prediksi siswa yang drop out pada akhir semester pertama didapatkan tingkat skurasi menggunakan decision trees sebesar 80 %. 8 No Peneliti Judul Metode Hasil 8 Shezad Shaikh, Ashphak P. Khan, Vinod S. Mahajan [8] Implementation of DBSCAN Algorithm for Internet Traffic Classification DBSCAN Dalam penelitian ini menggunakan data trafik internet untuk di kelompokan menjadi 5 cluster antara lain trafik normal dan tidak normal (serangan). Tingkat akurasi bisa mencapai hingga 97%. 9 T. Alfina, B. Santosa, dan AR. Barakbah [12] Analisa Perbandingan Metode Hierarchical clustering, Kmeans dan Gabungan Keduanya dalam Cluster Data Single Linkage clustering, K-means Dua metode ini memiliki kelebihan dan kekurangan masing-masing, dan dengan menggabungkan keduanya dapat diperoleh hasil cluster yang lebih baik. Dalam studi kasus Problem Kerja Praktek Jurusan Teknik Industri ITS, dari kombinasi hierarchical clustering dan K-means yang ada, kombinasi single linkage clustering dan K-means menghasilkan pengelompokan data yang terbaik dibandingkan dengan metode hierarki yang lainnya 10 C Romero, S. Ventura, E. García [7] Data mining in course management systems: Moodle case study and tutorial Data mining Dalam penelitian ini memberikan banyak gambaran dan peluang bahwa data akademik sangat bermanfaat untuk digali pengetahuannya. Dengan menggunakan metode pembelajaran online (e-learning) Moodle dilakukan pengumpuan data, pre proses dan proses datamining menggunakan tool Weka 1.4 Tujuan Penelitian Penelitian ini memiliki tujuan mempelajari dan mengolah data dari masing-masing data akademik siswa dalam sebuah perguruan tinggi. Secara umum penelitian ini dilakukan dengan tujuan sebagai berikut. 9 1. Melakukan seleksi awal data dari data akademik untuk data lampau pada siswa dengan kriteria utama awal adalah siswa yang sudah mengambil skripsi baik yang sudah lulus atau belum/tidak lulus. 2. Melakukan olah data dan pra-pengolahan data akademik yang berasal dari basis data akademik siswa untuk melihat data secara menyeluruh dan memilih atribut yang sesuai untuk proses data mining. 3. Melakukan clustering dari data akademik dan evaluasi clustering untuk melihat cluster yang terbentuk dari dataset yang digunakan. 4. Melakukan clustering yang dilanjutkan dengan proses klasifikasi untuk klasifikasi tingkat kelulusan siswa dan peringkat prestasi yang didapatkan. Ini dilakukan sebagai data siswa yang diperoleh dari semester 1 hingga semester 3. Hasil ini akan dievaluasi untuk memperoleh hasil yang terbaik. 1.5 Manfaat Penelitian Penelitian yang akan dilakukan ini diharapkan dapat memberikan manfaat antara lain bagi : 1. Bagi diri penulis sebagai bahan pembelajaran untuk bisa lebih memahami karakteristik terukur dari masing-masing siswa. 2. Bagi Institusi dimungkinkan mengembangkan sistem informasi untuk prediksi keberhasilan siswa. 10