judul tesis untuk s2 teknik elektro (s2 te) ft ugm

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang
Sebuah perguruan tinggi saat ini umumnya telah memiliki data akademik
siswa dalam sebuah sistem informasi. Data akademik umumnya juga memiliki
data bawaan yang dibawa sebelum siswa masuk dalam perguruan tinggi. Data
bawaan merupakan data yang ada sejak registrasi pertama ke perguruan tinggi.
Data ini bisa berupa identitas dan juga kinerja pada sekolah sebelumnya. Data
akademik ini merekam kinerja siswa dalam menempuh mata kuliah dari awal
hingga selesai menempuh proses perkuliahan.
Data akademik umumnya hanya digunakan selama siswa aktif selama dia
menempuh kuliah untuk keperluan administratif saja. Setelah siswa selesai
menempuh kuliah umumnya data masih ada namun belum dimanfaatkan dengan
baik. Siswa, orang tua dan perguruan tinggi mengharapkan siswa bisa lulus tepat
waktu dan mendapatkan predikat yang terbaik. Dari kekayaan data yang dimiliki
bisa dilakukan penambangan data atau Data Mining (DM) untuk berbagai
kebutuhan institusi yang bersangkutan.
Data yang ada dan jumlah data yang terus bertambah bisa bermanfaat
salah-satunya untuk melakukan prediksi. Sistem informasi pendidikan dapat
menyimpan sejumlah besar data potensial dari berbagai sumber yang datang
dalam format yang berbeda dan pada tingkat yang berbeda [1].
1
Sebuah penelitian menggunakan proses clustering dan klasifikasi yang
berkelanjutan menggunakan Weka [2]. Data yang digunakan diambil dari
partisipasi siswa dalam forum diskusi online yang disediakan di kampus. Data
daimbil saat semester awal kuliah akan digunakan sebagai prediktor nilai sebuah
mata kuliah diakhir semester. Dari penelitian ini diperoleh hasil bahwa partisipasi
siswa dalam forum online bisa digunakan untuk
memprediksi nilai yang
diperoleh diakhir semester.
Melihat potensi yang cukup besar terhadap data akademik dan kebutuhan
institusi pendidikan untuk meningkatkan kualitas pendidikan maka dilakukan
penelitian ini. Secara umum penelitian ini bertujuan untuk mempelajari
karakteristik kelompok siswa yang ada dengan menggunakan data akademik.
Untuk melihat jumlah dan kelompok siswa yang terbentuk akan digunakan teknik
DM.
Kenyataan yang ada dan yang diakui bahwa pada umumnya kemampuan
siswa yang tercermin dalam nilai akhir serta lama studi. Namun untuk pengikatan
kualitas akademik terutama kualitas lulusan sebuah Institusi juga memiliki
keinginan bisa mengetahui prediksi lebih awal bagaimana kinerja sebenarnya
selama siswa menempuh kuliah. Dari kinerja lulusan siswa secara umum ada
kelompok siswa yang berhasil lulus dan tidak berhasil (gagal). Mereka yang
masuk dalam kelompok yang berhasil lulus nantinya bisa dikelompokan lagi
dalam tingkatan berdasarkan prestasi lulus dan ketepatan masa studi.
Sebagai gambaran dari sebuah data yang diperoleh dari data mahasiswa
psikologi yang masuk kuliah pada tahun 2000 hingga 2006 dengan rekam data
2
terakhir diambil pada tahun 2013. Dari data akademik siswa yang berhasil
menyelesaikan studi terdapat data lama skripsi siswa tepat waktu dengan
maksimal 3 semester dengan jumlah 627 siswa atau sebanyak 68% tepat waktu
dan 32% menyelesaikan masa skripsi lebih dari 3 semester hingga bisa
menyelesaikan studi (lulus skripsi). Indeks Prestasi Kumulatif (IPK) diambil dari
seluruh nilai mata yang telah diambil diakhir masa kuliah. Dari data lulusan yang
dambil rata-rata nilai IPK siswa yang sudah lulus sebesar 2,9.
Jumlah SKS yang ditempuh siswa pada data yang diambil ini relatif
banyak yaitu sebesar 170 SKS namun jumlah SKS yang digunakan oleh siswa
sebagai syarat kelulusan minimal 144 dan maksimal 160 SKS sesuai dengan
peratuaran yang ada. Dari data yang diperoleh rata-rata lama mengerjakan skripsi
untuk mahasiswa S1 di program studi tersebut masih cukup tinggi selama 3
semester, bahkan masih banyak yang menyelesaikan skripsi lebih dari 4 semester.
Dari data prestasi kelompok siswa yang bisa cepat atau lama dalam
menyelesaikan skripsi dimungkinkan siswa-siswa tersebut mengelompok dalam
beberapa cluster.
Selain itu masih cukup banyak juga siswa yang sudah mengerjakan skripsi
namun berhenti dan tidak melajutkan lagi. Dari 1076 data yang sudah skripsi
diperoleh bahwa terdapat ada 14,4% yang skripsinya berhenti atau tertunda. Hal
ini berakibat pada tertundanya kelulusan siswa. Di saat akhir kuliah siswa yang
lulus akan diklasifikasikan dengan menggunakan peringkat kelulusan ditinjau dari
lama studi dan Indeks Prestasi Kumulatif (IPK) sebagai siswa lulus dengan pujian,
sangat memuaskan atau memuaskan.
3
Predikat kelulusan baru bisa diketahui pada akhir masa kuliah atau setelah
siswa lulus kuliah. Siswa akan lulus dengan predikat tertentu yang dipengaruhi
pada nilai dan lama studi. Masalah dihadapi adalah bagaimana siswa-siswa bisa
lulus dengan tingkatan yang terbaik. Masalah yang lain yang dihadapi adalah
bagaimana memprediksi siswa yang dimungkinkan terhambat untuk lulus karena
kompetensi untuk menempuh skripsi kurang terpenuhi. Masalah ini terjadi secara
umum di Universitas Mercu Buana Yogyakarta yang menjadi objek penelitian.
1.2
Perumusan Masalah
Dari hasil pengamatan terhadap kondisi tersebut di atas dapat dirumuskan
beberapa permasalahan utama sebagai berikut :
1.
Nilai dan prestasi siswa dalam kuliah hanya dicatat dan belum
dilakukan pemantauan perkembangan prestasi siswa dari waktu ke
waktu.
2.
Lama skripsi atau lama studi siswa kurang bisa terpantau.
3.
Prestasi kelulusan siswa juga tidak/belum hanya bisa dketahui saat
siswa sudah mau menyelesaikan studi dan belum bisa dipantau dari
awal.
1.3
Keaslian penelitian
Salah satu fakta yang signifikan dalam institusi pendidikan tinggi adalah
pertumbuhan data yang semakin besar. Pertumbuhan data ini meningkat dengan
4
cepat tanpa manfaat lebih untuk manajemen. Tujuan utama dari setiap lembaga
pendidikan tinggi adalah untuk meningkatkan kualitas keputusan manajerial dan
untuk memberikan kualitas pendidikan. Prediksi keberhasilan siswa dalam
institusi pendidikan tinggi adalah salah satu cara untuk mencapai tingkat tertinggi
kualitas dalam sistem pendidikan tinggi [2].
Ada banyak metode prediksi tersedia dengan pendekatan perbedaan
kinerja siswa dilaporkan oleh peneliti, tetapi tidak ada kepastian apakah ada
prediksi yang akurat menentukan apakah mahasiswa akan menjadi lebih pintar
dalam akademik, menurun, atau rata-rata. Dengan teknik data mining dapat
digunakan secara efektif sebagai alat untuk menilai kinerja siswa. Ini
menunjukkan bagaimana data bisa bermanfaat di pendidikan tinggi pada
khususnya untuk memprediksi kinerja akhir siswa [3].
Sebuah penelitian lain dengan menggunakan fasilitas teknologi informasi
berupa system informasi bisa mendukung proses belajar mengajar siswa. Fasilitas
internet-studentsite merupakan media komunikasi dan informasi akademik yang
diperuntukan bagi mahasiswa, bertujuan membantu kelancaran studi dan
menunjang proses belajar mengajar. Hasil penelitian mengidentifikasi hanya
variabel Perceived ease of use (PEOU) dan variabel Perceived usefulness yang
memenuhi derajat signifikansi tertentu. Jumlah mahasiswa yang meyakini
manfaat studentsite bagi keberhasilan studi cukup membesarkan hati mengingat
hasil deskriptif mencapai 83 orang (59,7%) yang setuju manfaat studentsite. Uji
independent sample test mengarah pada variable PEOU sebagai penentu
keyakinan responden dalam memanfaatkan studentsite berbasis web [4].
5
Sebuah
penelitian
lain
melakukan
prediksi
dari
aktfitas
siswa
menggunakan Moodle. Penelitain ini membandingkan beberapa algoritme data
mining untuk melakukan klasifikasi pada sebuah dataset. Data diperoleh secara
langsung dari sistem pembelajaran online menggunakan Moodle. Data dari sistem
e-learning digunakan untuk memprediksi nilai akhir ujian Dengan Moodle dibuat
tugas dan penilaian hasil tugas kerja siswa. Data dibuat dengan berbagai tipe data
: numerik, kategori dan data rebalanced [5].
Sebuah data akademik dan juga data online dari siswa dapat digunakan
sebagai dataset untuk data maning. Dalam penelitian ini memberikan banyak
gambaran dan peluang bahwa data akademik sangat bermanfaat untuk digali
pengetahuannya. Dataset diambil dari aktivitas siswa yang menggunakan fasilitas
ini. Dengan menggunakan metode pembelajaran online (e-learning) Moodle
dilakukan pengumpuan data, preproses dan proses data mining menggunakan
Weka [6].
Dari penelitian sebelumnya menggunakan data dari luar seperti keaktifan
di forum dan elearning. Penelitian yang dilakukan ini menggunakan basis data
masa lampau yang terekam dalam sistem akademik perguruan tinggi. Untuk
melihat kelompok data dilakukan clustering dan evaluasi. Sementara untuk
melihat prediksi dilakukan klasifikasi dan clustering dengan menggunakan 3
motode clustering dengan pendekatan yang berbeda yaitu : teknik pendekatan
hirarkis, verktor dan kerapatan (densitas).
6
Berikut ini adalah rangkuman beberapa metode dan hasil dari penelitian
terdahulu dapat dilihat pada Tabel 1.1
Tabel 1.1 Rangkuman Penelitian terkait dengan data mining
No
Peneliti
Judul
Metode
Hasil
1
B Kumar
Baradwaj,
Saurabh Pal
[7]
Mining
Educational
Data to Analyze
Students'
Performance
ID3
Mengekstrak pengetahuan yang
menggambarkan kinerja siswa dalam
ujian semester akhir untuk
membantu sebelumnya dalam
mengidentifikasi putus kuliah dan
siswa yang membutuhkan perhatian
khusus dan memungkinkan untuk
memberikan nasihat / konseling
yang tepat.
3
Sajidin [3]
Prediction of
Student
Academic
Performance By
An Application
of Data Mining
Techniques
SVM
Dengan data kuisioner pada semester
3 bisa dilakukan prediksi performa
kualitas lulusan.
4
C Romero
[5]
Data Mining
Algorithms to
Classify
Students
C 4.5,
KNN
Membandingkan beberapa algoritme
data mining untuk berbagai tipe data
: Numerical data, Categorical data
dan Rebalanced data. Data dari
sistem elearning digunakan untuk
meprediksi nilai akhir ujian.
7
No
Peneliti
Judul
Metode
Hasil
5
M. Abu
Tair, Alaa
M. ElHalees [8]
Mining
K-Mean
Educational
Data to Improve
Students’
Performance: A
Case Study
Dari data akademik selamat 15 tahun
(1993-2007) dilakukan Klasifikasi
dengan Rule Induction and Naïve
Bayesian classifier. Sementara
clustering dilakukan dengan K-Mean
6
M.I. López,
J.M Luna,
C. Romero,
S. Ventura
[9]
Classification
via clustering
for predicting
final marks
based on
student
participation in
forums
EM,
XMean
Dengan menggunakan data aktivitas
siswa dalam mengikuti forum online
digunakan sebagai prediksi nilai
akhir siswa. Akurasi hasil terbaik
didapatkan dengan menggunakan
algoritme EM
7
Gerben W.
Dekker1
[10]
Predicting
Students Drop
Out: A Case
Study
Decision
trees
Prediksi siswa yang drop out pada
akhir semester pertama didapatkan
tingkat skurasi menggunakan
decision trees sebesar 80 %.
8
No
Peneliti
Judul
Metode
Hasil
8
Shezad
Shaikh,
Ashphak P.
Khan,
Vinod S.
Mahajan
[8]
Implementation
of DBSCAN
Algorithm for
Internet Traffic
Classification
DBSCAN
Dalam penelitian ini menggunakan
data trafik internet untuk di
kelompokan menjadi 5 cluster
antara lain trafik normal dan tidak
normal (serangan). Tingkat akurasi
bisa mencapai hingga 97%.
9
T. Alfina,
B. Santosa,
dan AR.
Barakbah
[12]
Analisa
Perbandingan
Metode
Hierarchical
clustering, Kmeans dan
Gabungan
Keduanya
dalam Cluster
Data
Single
Linkage
clustering,
K-means
Dua metode ini memiliki kelebihan
dan kekurangan masing-masing, dan
dengan menggabungkan keduanya
dapat diperoleh hasil cluster yang
lebih baik. Dalam studi kasus
Problem Kerja Praktek Jurusan
Teknik Industri ITS, dari kombinasi
hierarchical clustering dan K-means
yang ada, kombinasi single linkage
clustering dan K-means
menghasilkan pengelompokan data
yang terbaik dibandingkan dengan
metode hierarki yang lainnya
10
C Romero,
S. Ventura,
E. García
[7]
Data mining in
course
management
systems:
Moodle case
study and
tutorial
Data
mining
Dalam penelitian ini memberikan
banyak gambaran dan peluang
bahwa data akademik sangat
bermanfaat untuk digali
pengetahuannya. Dengan
menggunakan metode pembelajaran
online (e-learning) Moodle
dilakukan pengumpuan data, pre
proses dan proses datamining
menggunakan tool Weka
1.4
Tujuan Penelitian
Penelitian ini memiliki tujuan mempelajari dan mengolah data dari
masing-masing data akademik siswa dalam sebuah perguruan tinggi. Secara
umum penelitian ini dilakukan dengan tujuan sebagai berikut.
9
1. Melakukan seleksi awal data dari data akademik untuk data lampau pada
siswa dengan kriteria utama awal adalah siswa yang sudah mengambil
skripsi baik yang sudah lulus atau belum/tidak lulus.
2. Melakukan olah data dan pra-pengolahan data akademik yang berasal dari
basis data akademik siswa untuk melihat data secara menyeluruh dan
memilih atribut yang sesuai untuk proses data mining.
3. Melakukan clustering dari data akademik dan evaluasi clustering untuk
melihat cluster yang terbentuk dari dataset yang digunakan.
4. Melakukan clustering yang dilanjutkan dengan proses klasifikasi untuk
klasifikasi tingkat kelulusan siswa dan peringkat prestasi yang didapatkan.
Ini dilakukan sebagai data siswa yang diperoleh dari semester 1 hingga
semester 3. Hasil ini akan dievaluasi untuk memperoleh hasil yang terbaik.
1.5
Manfaat Penelitian
Penelitian yang akan dilakukan ini diharapkan dapat memberikan
manfaat antara lain bagi :
1. Bagi diri penulis sebagai bahan pembelajaran untuk bisa lebih memahami
karakteristik terukur dari masing-masing siswa.
2. Bagi Institusi dimungkinkan mengembangkan sistem informasi untuk
prediksi keberhasilan siswa.
10
Download