BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah suatu konsep yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang tersimpan di dalam database besar. (Turban et al, 2005 ). Data mining adalah bagian dari proses KDD ( Knowledge Discovery in Databases) yang terdiri dari beberapa tahapan seperti pemilihan data, pra pengolahan, transformasi, data mining, dan evaluasi hasil (Maimon dan Last, 2000). KDD secara umum juga dikenal sebagai pangkalan data. Teknik data mining secara garis besar dapat dibagi dalam dua kelompok: verifikasi dan discovery. Metode verifikasi umumnya meliputi teknik-teknik statistik seperti goodness of fit, dan analisis variansi. Metode discovery lebih lanjut dapat dibagi atas model prediktif dan model deskriptif. Teknik prediktif melakukan prediksi terhadap data dengan menggunakan hasil-hasil yang telah diketahui dari data yang berbeda. Model ini dapat dibuat berdasarkan penggunaan data historis lain. Sementara itu, model deskriptif bertujuan mengidentifikasi pola-pola atau hubungan antar data dan memberikan cara untuk mengeksplorasi karakteristik data yang diselidiki (Dunham, 2003). Masih menjadi isu sentral di dunia pendidikan tinggi khususnya program diploma dalam hal faktor prediktor dan teknik yang digunakan untuk memprediksi keinginan mahasiswa diploma dalam melanjutkan studinya ke jenjang sarjana setelah menyelesaikan studi pada tingkat diploma. Hingga saat ini masih jarang ditemukan prediktor-prediktor serta teknik yang cukup handal dan akurat dalam memprediksi tingkat keinginan mahasiswa diploma untuk melanjutkan studinya ke jenjang sarjana, apakah mereka akan melanjutkan studinya pada bidang ilmu Universitas Sumatera Utara yang sama atau melanjukan studinya tapi kebidang ilmu yang berbeda atau tidak malanjutkan studinya. Dewasa ini kemajuan teknologi informasi dan komputer menyediakan fasilitas penyimpanan data dalam format elektronik telah sehingga penyimpanan data bukan lagi menjadi satu pekerjaan yang sulit. Sebagai konsekuensinya jumlah data yang disimpan mengalami peningkatan yang sangat cepat dari segi kuantitas dan kualitas. Pada institusi pendidikan tinggi data dapat diperoleh dari data historis dan data kegiatan operasional sebuah perguruan tinggi, dimana data ini akan bertambah secara terus menerus, sehingga proses eksplorasi data dalam menentukan hubungan antar variabel didalam data menjadi sangat lambat dan memiliki proses yang subjektif. Salah satu Solusi yang mungkin digunakan untuk menangani masalah ini adalah konsep menemukan pengetahuan di dalam pangkalan data. Beberapa tahun belakangan ini telah terjadi peningkatan penelitian di area pendidikan dengan menggunakan teknik-teknik penambangan data. Aplikasi dari teknik penambangan data ini difokuskan untuk membangun metode-metode untuk mengungkapkan pengetahuan yang tersimpan didalam data dan digunakan untuk membuka informasi yang tersembunyi didalam data yang tidak nampak dipermukaan tetapi potensial untuk digunakan. Pengungkapan pengetahuan ini juga dapat digunakan untuk lebih mengetahui bagaimana prilaku belajar seorang mahasiswa di tingkat diploma, sehingga dapat membantu para dosen untuk lebih mengenal situasi para mahasiswanya, dapat dijadikan sebagai pengetahuan dini untuk mengambil tindakan preventif dalam hal mengantisipasi mahasiswa dropout, untuk memicu meningkatkan prestasi mahasiswa, untuk meningkatkan kurikulum, termasuk juga untuk memprediksi keinginan mahasiswa dalam melanjutkan studinya kejenjang yang lebih tinggi dan banyak lagi keuntungan lain yang bisa diperoleh dari hasil penambangan data. Dalam beberapa penelitian yang telah dilakukan oleh peneliti yang dituliskan dalam jurnal atau karya ilmiah tentang penggunaan data mining pada perguruan tinggi adalah : Romero dan Ventura, (2007), telah melakukan survey Universitas Sumatera Utara data mining dalam bidang pendidikan antara tahun 1995 sampai 2005, hasil penelitian yang dilakukan menyimpulkan bahwa data mining yang berhubungan dengan pendidikan sangat baik untuk diteliti terutama di bidang e-learning, multimedia, artificial intelligent dan web database. Merceron dan Yacep, (2005) melakukan penelitian menggunakan data mining untuk mengidentifikasi perilaku mahasiswa yang cenderung gagal pada prestasi akademik sebelum ujian akhir. Waiyamai, (2003) menggunakan data mining untuk membantu dalam pengembangan kurikulum baru. Ogor, (2007) menggunakan teknik data mining yang digunakan untuk membangun prototipe Penilaian Kinerja Monitoring System (PAMS) untuk mengevaluasi kinerja mahasiswa. Sembiring, et al., (2009) menggunakan teknik data mining dalam pemantauan dan memprediksi peningkatan prestasi mahasiswa berdasarkan minat, prilaku belajar, pemanfaatan waktu dan dukungan orang tua di perguruan tinggi. Dalam penelitian ini akan di teliti tentang perilaku mahasiswa diploma untuk melanjutkan studi ke jenjang sarjana akan digunakan teknik decision tree (C 4.5) untuk menganalisis dan membangun sebuah model prediksi berdasarkan perilaku belajar mahasiswa diploma dan menggunakan teknik Support Vector Machine untuk mengklasifikasi mahasiwa tersebut berdasarkan model prediksi yang diperoleh oleh decision tree. Kedua metode ini dipilih karena metode decision tree ini cukup sederhana dan banyak dipergunakan oleh peneliti lain dalam mengembangkan sebuah model. Metode Support Vector Machine (SVM) merupakan teknik yang relative baru dalam pattern recognition dan merupakan state of art dalam pattern recognition dan machine learning karena kehandalannya dalam memproses data berdimensi banyak. Penelitian ini mengambil area pendidikan tinggi sebagai sebagai salah satu domain penelitian dalam bidang penambangan data dengan sumber data dari database akademik AMIK Tunas Bangsa Pematang Siantar dan melakukan survey terhadap 1300 orang mahasiswa D3 Manajemen Informatika AMIK Tunas Bangsa Angkatan 2009/2010 . Universitas Sumatera Utara Penelitian ini diharapkan dapat memberikan kontribusi bagi perguruan tinggi swasta khususnya Akademi Manajemen Informatika dan Komputer (AMIK) Tunas Bangsa Pematangsiantar. 1.2 Perumusan Masalah Berdasar pada latar belakang di atas, maka dapat dirumuskan masalah dalam tesis ini sebagai berikut: 1. Bagaimana membangun model yang dapat digunakan untuk memprediksi keinginan para alumni diploma untuk melanjutkan studinya ke jenjang sarjana ? 2. Bagaimana menggunakan model untuk memprediksi keinginan para alumni diploma unutk melanjutkan studinya ke jenjang sarjana ? 1.3 Batasan Masalah Mengingat luasnya ruang lingkup penelitian dalam implemantasi teknik teknik data mining di area pendidikan , khususnya pada pendidikan tinggi, maka penelitian ini dibatasi pada: 1. Sumber data untuk penelitian ini, diperoleh dari database akademik dan hasil survey secara acak yang dilakukan terhadap mahasiswa program diploma tiga bidang informatika dan komputer di AMIK Tunas Bangsa Pematang Siantar. 2. Pendekatan dalam analisis data dalam penelitian ini akan menggunakan teknik Multi variant analisis untuk menguji tingkat korelasi faktor-faktor prediktor yang akan diusulkan dan Decision tree (Algoritma C.4.5) untuk membangun model prediksi serta teknik SVM untuk memprediksi keinginan mahasiswa program diploma tiga yang akan melanjutkan studinya ke jenjang sarjana. 3. Untuk mendukung analisis data dalam penelitian ini akan menggunakan bantuan perangkat lunak data mining yang berbasis open source seperti WEKA atau Rapid Miner versi 5.0 Universitas Sumatera Utara 1.4 Tujuan Penelitian Beranjak dari latarbelakang permasalahan, tujuan penelitian ini adalah sebagai berikut: 1. Untuk mendapatkan apa saja factor-faktor yang berpengaruh terhadap keinginan mahasiswa program diploma 3 bidang informatika dan komputer untuk melanjutkan pendidikannya ke jenjang yang lebih tinggi. 2. Untuk membangun sebuah model prediksi mahasiswa program diploma 3 bidang informatika dan komputer yang akan melanjutkan studinya ke jenjang sarjana. 1.5 Manfaat Penelitian Penelitian ini secara teoritis diharapkan akan bermanfaat bagi menambah khasanah dan variasi penelitian dalam penerapan teknik-teknik data mining pada area pendidikan. Hasil dari penelitian ini diharapkan dapat dijadikan sebagai perbandingan bagi peneliti lain yang tertarik dalam penerapan teknik-teknik data mining pada area pendidikan. Secara praktis hasil penelitian ini juga dapat bermanfaat bagi institusi pendidikan tinggi sebagai referensi dan sebagai informasi pendukung dalam mengambil kebijakan strategis. Model prediksi yang diperoleh dari penelitian ini juga dapat dipergunakan oleh institusi-institusi pendidikan tinggi yang memiliki program sarjana, sebagai sistem informasi pendukung untuk promosi dengan sasaran mahasiswa yang sedang mengikuti program diploma tiga. Universitas Sumatera Utara