BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang
Data mining adalah suatu konsep yang digunakan untuk menemukan pengetahuan
yang tersembunyi di dalam database. Data mining merupakan proses semi
otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan
machine
learning
untuk
mengekstraksi
dan
mengidentifikasi
informasi
pengetahuan potensial dan berguna yang tersimpan di dalam database besar.
(Turban et al, 2005 ). Data mining adalah bagian dari proses KDD ( Knowledge
Discovery in Databases) yang terdiri dari beberapa tahapan seperti pemilihan
data, pra pengolahan, transformasi, data mining, dan evaluasi hasil (Maimon dan
Last, 2000). KDD secara umum juga dikenal sebagai pangkalan data.
Teknik data mining secara garis besar dapat dibagi dalam dua kelompok:
verifikasi dan discovery. Metode verifikasi umumnya meliputi teknik-teknik
statistik seperti goodness of fit, dan analisis variansi. Metode discovery lebih
lanjut dapat dibagi atas model prediktif dan model deskriptif. Teknik prediktif
melakukan prediksi terhadap data dengan menggunakan hasil-hasil yang telah
diketahui dari data yang berbeda. Model ini dapat dibuat berdasarkan penggunaan
data historis lain. Sementara itu, model deskriptif bertujuan mengidentifikasi
pola-pola atau hubungan antar data dan memberikan cara untuk mengeksplorasi
karakteristik data yang diselidiki (Dunham, 2003).
Masih menjadi isu sentral di dunia pendidikan tinggi khususnya program
diploma dalam hal faktor prediktor dan teknik yang digunakan untuk memprediksi
keinginan mahasiswa diploma dalam melanjutkan studinya ke jenjang sarjana
setelah menyelesaikan studi pada tingkat diploma. Hingga saat ini masih jarang
ditemukan prediktor-prediktor serta teknik yang cukup handal dan akurat dalam
memprediksi tingkat keinginan mahasiswa diploma untuk melanjutkan studinya
ke jenjang sarjana, apakah mereka akan melanjutkan studinya pada bidang ilmu
Universitas Sumatera Utara
yang sama atau melanjukan studinya tapi kebidang ilmu yang berbeda atau tidak
malanjutkan studinya.
Dewasa
ini
kemajuan
teknologi
informasi
dan
komputer
menyediakan fasilitas penyimpanan data dalam format elektronik
telah
sehingga
penyimpanan data bukan lagi menjadi satu pekerjaan yang sulit. Sebagai
konsekuensinya jumlah data yang disimpan mengalami peningkatan yang sangat
cepat dari segi kuantitas dan kualitas. Pada institusi pendidikan tinggi data dapat
diperoleh dari data historis dan data kegiatan operasional
sebuah perguruan
tinggi, dimana data ini akan bertambah secara terus menerus, sehingga proses
eksplorasi data dalam menentukan hubungan antar variabel didalam data menjadi
sangat lambat dan memiliki proses yang subjektif. Salah satu Solusi yang
mungkin digunakan untuk menangani masalah ini adalah konsep menemukan
pengetahuan di dalam pangkalan data.
Beberapa tahun belakangan ini telah terjadi peningkatan penelitian di area
pendidikan dengan menggunakan teknik-teknik penambangan data. Aplikasi dari
teknik penambangan data ini difokuskan untuk membangun metode-metode untuk
mengungkapkan pengetahuan yang tersimpan didalam data dan digunakan untuk
membuka informasi yang tersembunyi didalam data yang tidak nampak
dipermukaan tetapi potensial untuk digunakan. Pengungkapan pengetahuan ini
juga dapat digunakan untuk lebih mengetahui bagaimana prilaku belajar seorang
mahasiswa di tingkat diploma, sehingga dapat membantu para dosen untuk lebih
mengenal situasi para mahasiswanya, dapat dijadikan sebagai pengetahuan dini
untuk mengambil tindakan preventif dalam hal mengantisipasi mahasiswa dropout, untuk memicu meningkatkan prestasi mahasiswa, untuk meningkatkan
kurikulum, termasuk juga untuk memprediksi keinginan mahasiswa dalam
melanjutkan studinya kejenjang yang lebih tinggi dan banyak lagi keuntungan lain
yang bisa diperoleh dari hasil penambangan data.
Dalam beberapa penelitian yang telah dilakukan oleh peneliti yang
dituliskan dalam jurnal atau karya ilmiah tentang penggunaan data mining pada
perguruan tinggi adalah : Romero dan Ventura, (2007), telah melakukan survey
Universitas Sumatera Utara
data mining dalam bidang pendidikan antara tahun 1995 sampai 2005, hasil
penelitian yang dilakukan menyimpulkan bahwa data mining yang berhubungan
dengan pendidikan sangat baik untuk diteliti terutama di bidang e-learning,
multimedia, artificial intelligent dan web database. Merceron dan Yacep, (2005)
melakukan penelitian menggunakan data mining untuk mengidentifikasi perilaku
mahasiswa yang cenderung gagal pada prestasi akademik sebelum ujian akhir.
Waiyamai, (2003) menggunakan data mining untuk membantu dalam
pengembangan kurikulum baru. Ogor, (2007) menggunakan teknik data mining
yang digunakan untuk membangun prototipe Penilaian Kinerja Monitoring System
(PAMS) untuk mengevaluasi kinerja mahasiswa. Sembiring, et al., (2009)
menggunakan teknik data mining dalam pemantauan dan memprediksi
peningkatan prestasi mahasiswa berdasarkan minat, prilaku belajar, pemanfaatan
waktu dan dukungan orang tua di perguruan tinggi.
Dalam penelitian ini akan di teliti tentang perilaku mahasiswa diploma
untuk melanjutkan studi ke jenjang sarjana akan digunakan teknik decision tree
(C 4.5) untuk menganalisis dan membangun sebuah model prediksi berdasarkan
perilaku belajar mahasiswa diploma dan menggunakan teknik Support Vector
Machine untuk mengklasifikasi mahasiwa tersebut berdasarkan model prediksi
yang diperoleh oleh decision tree. Kedua metode ini dipilih karena metode
decision tree ini cukup sederhana dan banyak dipergunakan oleh peneliti lain
dalam mengembangkan sebuah model. Metode Support Vector Machine (SVM)
merupakan teknik yang relative baru dalam pattern recognition dan merupakan
state of art dalam pattern recognition dan machine learning karena
kehandalannya dalam memproses data berdimensi banyak.
Penelitian ini mengambil area pendidikan tinggi sebagai sebagai salah satu
domain penelitian dalam bidang penambangan data dengan sumber data dari
database
akademik
AMIK Tunas Bangsa Pematang Siantar dan melakukan
survey terhadap 1300 orang mahasiswa D3 Manajemen Informatika AMIK Tunas
Bangsa Angkatan 2009/2010 .
Universitas Sumatera Utara
Penelitian ini diharapkan dapat memberikan kontribusi bagi perguruan
tinggi swasta khususnya Akademi Manajemen Informatika dan Komputer
(AMIK) Tunas Bangsa Pematangsiantar.
1.2
Perumusan Masalah
Berdasar pada latar belakang di atas, maka dapat dirumuskan masalah dalam tesis
ini sebagai berikut:
1. Bagaimana membangun model yang dapat digunakan untuk memprediksi
keinginan para alumni diploma untuk melanjutkan studinya ke jenjang
sarjana ?
2. Bagaimana menggunakan model untuk memprediksi keinginan para
alumni diploma unutk melanjutkan studinya ke jenjang sarjana ?
1.3
Batasan Masalah
Mengingat luasnya ruang lingkup penelitian dalam implemantasi teknik teknik data mining di area pendidikan , khususnya pada pendidikan tinggi,
maka penelitian ini dibatasi pada:
1. Sumber data untuk penelitian ini, diperoleh dari database akademik dan
hasil survey secara acak yang dilakukan terhadap mahasiswa program
diploma tiga bidang informatika dan komputer di AMIK Tunas Bangsa
Pematang Siantar.
2. Pendekatan dalam analisis data dalam penelitian ini akan menggunakan
teknik Multi variant analisis untuk menguji tingkat korelasi faktor-faktor
prediktor yang akan diusulkan dan Decision tree (Algoritma C.4.5) untuk
membangun model prediksi serta teknik SVM untuk memprediksi
keinginan mahasiswa program diploma tiga yang akan melanjutkan
studinya ke jenjang sarjana.
3. Untuk mendukung analisis data dalam penelitian ini akan menggunakan
bantuan perangkat lunak data mining yang berbasis open source seperti
WEKA atau Rapid Miner versi 5.0
Universitas Sumatera Utara
1.4
Tujuan Penelitian
Beranjak dari latarbelakang permasalahan, tujuan penelitian ini adalah sebagai
berikut:
1. Untuk mendapatkan apa saja factor-faktor yang berpengaruh terhadap
keinginan mahasiswa program diploma 3 bidang informatika dan
komputer untuk melanjutkan pendidikannya ke jenjang yang lebih tinggi.
2. Untuk membangun sebuah model prediksi mahasiswa program diploma 3
bidang informatika dan komputer yang akan melanjutkan studinya ke
jenjang sarjana.
1.5
Manfaat Penelitian
Penelitian ini secara teoritis diharapkan akan bermanfaat bagi menambah
khasanah dan variasi penelitian dalam penerapan teknik-teknik data mining pada
area pendidikan. Hasil dari penelitian ini diharapkan dapat dijadikan sebagai
perbandingan bagi peneliti lain yang tertarik dalam penerapan teknik-teknik data
mining pada area pendidikan.
Secara praktis hasil penelitian ini juga dapat bermanfaat bagi institusi pendidikan
tinggi sebagai referensi dan sebagai informasi pendukung dalam mengambil
kebijakan strategis.
Model prediksi yang diperoleh dari penelitian ini juga dapat dipergunakan oleh
institusi-institusi pendidikan tinggi yang memiliki program sarjana, sebagai sistem
informasi pendukung untuk promosi dengan sasaran mahasiswa yang sedang
mengikuti program diploma tiga.
Universitas Sumatera Utara
Download