- Repository Unsada

advertisement
DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA
TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN
TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN
MUTU PERGURUAN TINGGI
Timor Setiyaningsih, Nur Syamsiah
Teknik Informatika Universitas Darma Persada
Abstrak
Perguruan tinggi sebagai salah satu pilar pendidikan tinggi memiliki kontribusi yang sangat besar
dalam mendidik dan mengembangkan mahasiswa untuk siap terjun ke dunia kerja secara nyata.
Tes masuk mahasiswa merupakan tahapan awal yang harus dilalui setiap mahasiswa untuk dapat
menimba ilmu diperguruan tinggi yang diinginkan. Dari data nilai tes masuk ini sebenarnya
dapat digali data mengenai kemampuan dan potensi mahasiswa yang dapat lebih dikembangkan.
Penggalian data ini perlu dikaji dan diteliti lebih mendalam untuk kebutuhan perguruan tinggi
dalam mengambil kebijakan dalam rangka meningkatkan kualitas pendidikan pada perguruan
tinggi.Penelitian ini dimaksudkan untuk menggali korelasi antara data yang diperoleh pada
tahapan penerimaan mahasiswa dengan menggunakan pendekatan asosiasi data mining dan
algoritma apriori untuk menemukan korelasi dan pola dengan tingkat nilai kelulusan mahasiswa.
Hasil penelitian dapat dipergunakan untuk memberikan arahan terhadap perguruan tinggi dalam
menentukan kebijakan-kebijakan yang diambil dalam meningkatkan kualitas mutu pendidikan
tinggi.
Keyword: algoritma apriori, Tes Masuk, Penerimaan Mahasiswa, Kebijakan, Mutu Pendidikan
1. PENDAHULUAN
Perguruan tinggi sebagai salah satu pilar pendidikan tinggi memiliki kontribusi yang sangat
besar dalam mendidik dan mengembangkan mahasiswa untuk siap terjun ke dunia kerja secara
nyata. Dalam menjalankan fungsinya perguruan tinggi memiliki tahapan – tahapan yang perlu
dijalankan mulai dari menjaring, menyeleksi hingga menjalankan fase pendidikan, termasuk
dalam menentukan kebijakan – kebijakan dalam meningkatkan kualitas mahasiswa.
Dukungan data sering kali dibutuhkan sebagai panduan untuk menentukan arah ketika hendak
menentukan program pendidikan atau kurikulum , baik yang bersifat jangka pendek ataupun
jangka panjang. Sehingga dibutuhkan analisa data yang tepat untuk memastikan ketepatan
kebijakan
program pendidikan atau kurikulum terhadap sasaran mahasiswa didik dalam
peningkatan kualitas menyelesaikan masa pendidikannya. Terkadang data-data tersebut
tersembunyi atau kurang terungkap karena terlalu banyaknya data, dan hal ini perlu digali
dengan menggunakan data mining.
Tes masuk mahasiswa merupakan tahapan awal yang harus dilalui setiap mahasiswa untuk
dapat menimba ilmu diperguruan tinggi yang diinginkan. Dari data tes masuk ini sebenarnya
dapat digali data mengenai kemampuan dan potensi yang dapat lebih dikembangkan. Penggalian
data ini dilalukan untuk melihat adanya korelasi antara data saat tes masuk perguruan tinggi
dengan tingkat kelulusan diperguruan tinggi. Proses penggalian data untuk melihat korelasi data
tes masuk dengan data kelulursan mahasiswa menggunakan pendekatan asosiasi datamining
dengan algoritma apriori. Hasil penelitian diharapkan dapat memberikan data acuan bagi
program studi-program studi di Universitas Darma Persada menentukan kebijakan penerimaan
mahasiswa baru.
2. TINJAUAN PUSTAKA
1.1 Data Mining
Data mining adalah suatu konsep yang digunakan untuk menemukan pengetahuan yang
tersembunyi di dalam database. Data mining merupakan proses semi otomatik yang
menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang
tersimpan di dalam database besar.
Data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan
kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam
penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan
matematika (Kusrini, 2009). Data mining didefinisikan sebagai proses menemukan pola-pola
dalam data.
Karakteristik data mining sebagai berikut :
a. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu
yang tidak diketahui sebelumnya.
b. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan
untuk membuat hasil lebih dipercaya.
c. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.
1.2 Algoritma Apriori
Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian frequent itemset
dengan menggunakan teknik association rule. Algoritma Apriori menggunakan pengetahuan
frekuensi atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Pada
algoritma Apriori menentukan kandidat yang mungkin muncul dengan cara memperhatikan
minimum support dan minimum confidence. Support adalah nilai pengunjung atau persentase
kombinasi sebuah item dalam database. Rumus support adalah sebagai berikut:
Support (A,B) = P (A∩B)
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴, 𝐵) =
Sedangkan confidence
∑Transaksi mengandung A dan B
𝑋 100%
∑Total Transaksi
adalah nilai kepercayaan
yaitu kuatnya hubungan
antar item dalam sebuah
Apriori.
dapat dicari setelah pola
Confidence
frekuensi munculnya sebuah item ditemukan. Berikut rumus confidence :
Secara garis besar cara kerja algoritma apriori adalah:
1. Pembentukan kandidat itemset, Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset
yang didapat dari iterasi sebelumnya. Satu ciri dari algoritma Apriori adalah adanya
pemangkasan kandidat k-itemset yang subset-nya yang berisi k-1 item tidak termasuk dalam
pola frekuensi tinggi dengan panjang k-1.
2. Penghitungan support dari tiap kandidat k-itemset. Support dari tiap kandidat k-itemset
didapat dengan men-scan database untuk menghitung jumlah transaksi yang memuat semua
item di dalam kandidat k-itemset tsb. Ini adalah juga ciri dari algoritme Apriori dimana
diperlukan penghitungan dengan scan seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau k-itemset
ditetapkan dari kandidat k-itemset yang support-nya lebih besar dari minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan. Bila tidak, maka
k ditambah satu dan kembali ke bagian 1.
3. METODOLOGI PENELITIAN
Metodologi yang digunakan dalam penelitian ini mengikuti proses tahap-tahap knowledge
discovery in databases (KDD) dalam datamining, yaitu sebagai berikut:
1. Seleksi Data (data selection)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data
yang sesuai untuk dianalisis yang akan diambil dari database.
Data hasil seleksi akan digunakan untuk proses datamining, disimpan dalam satu berkas,
terpisah dari basis data operasional.
2. Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau
data tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan
maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang,
data yang tidak valid atau juga hanya sekedar salah ketik.Selain itu, ada juga atribut-atribut
data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data-data yang tidak
relevan itu juga dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik
data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya.
3. Transformasi data (data transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining.
Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa
diaplikasikan. Metode asosiasi hanya bisa menerima input data kategorikal. Karenanya data
berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini
sering disebut transformasi data.
4. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan
berharga dan tersembunyi dari data. Teknik, metode atau algoritma dalam datamining sangat
bervriasi. Pemilihan metode atau algoritma yang tepat sangat tergantung pada tujuan dan
proses KDD secara keseluruhan.
5. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan.Dalam
tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi
dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang
diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti
menjadikannya umpan balik untuk memperbaiki proses data mining,mencoba metode data
mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatuhasil yang di luar dugaan
yang mungkin bermanfaat.
4. IMPLEMENTASI
Data yang akan digunakan dalam membentuk suatu pengetahuan berupa pola kombinasi
untuk memprediksi apakah calon mahasiswa lulus tepat waktu atau tidak adalah data mahasiswa
dari awal masuk sampai dengan lulus yang sudah tersimpan dalam database.
Dari penelitian yang dilakukan, beberpa variable yang dapat diambil sebagai penentu
keputusan dari data – data yang ada antara lain sebagai berikut:
1.
2.
3.
4.
5.
6.
Nama Mahasiswa
Data Nilai
Jenis Kelamin
Jurusan Sekolah
Jurusan Kuliah
Kelulusan
Setelah ditentukan data data yang dibutuhkan dan data tersedia di dalam database mahasiswa
UNSADA, maka dibuat tabel-tabel untuk database aplikasi data mining sebagai berikut:
1.
Tabel mahasiswa
2.
Tabel Kombinasi
3.
Tabel Minimum Confidence
4.
Tabel Perhitungan
Karena satu data mempunyai rentang nilai yang luas, maka dibuat definisi nilai baru untuk
menggelompokkan data data tersebut. Adapn definisi tersebut sebagai berikut:
Definisi :
A : Nilai STTB
1: Grade A 80<= n <=100
2: Grade B 60<= n <80
3: Grade C 40<= n <60
4: Grade D 20<= n <40
5: Grade E 10<= n <20
B : Jenis Kelamin
1: Pria
2: Wanita
C : Jenis Sekolah
1: IPA
2: IPS
3: STM
4: SMK
D : Jurusan Kuliah
1: Fakultas Teknik
2: Fakultas Ekonomi
3: Fakultas Sastra
4: Fakultas Kelautan
E : Status Kelulusan
1: Cepat
2: Lambat
5. HASIL
Pada aplikasi pada inputan dimasukkan nilai support 20 dan nilai confident 80, dengan
tampilan sebagai berikut:
Setalah diproses didapatkan hasil sebagai berikut:
Perhitungan utuk kombinasi 1 itemset diperoleh hasil sebagai berikut:
Hasil perhitungan untuk kombinasi 2 itemset:
Hasil perhitungan untuk kombinasi 3 itemset:
Aturan asosiasi yang dihasilkan adalah sebagai berikut:
Dengan melihat hasil asosiasi diatas dapat dijelaskan beberapa hasil sebagai berikut:
Seorang mahasiswa dengan
nilai STTB
diatas 80 yang
kuliahnya
lulus tepat waktu
kemungkinan 85,714% berjenis kelamin laki-laki, hal ini cukup signifikan karena mewakili
42,857 % dari seluruh data mahasiswa yang tercatat. Seorang mahasiswa dengan nilai STTB
diatas 80 yang kuliahnya lulus tepat waktu kemungkinan 85,714% jurusan teknik, hal ini
cukup signifikan karena mewakili 42,857 % dari seluruh data mahasiswa yang tercatat.
6. SIMPULAN
Berdasarkan hasil uji coba dari aplikasi datamining dengan algoritma apriori, dapat diambil
beberapa kesimpulan sebagai berikut :
a.
Pendekatan datamining dengan algoritma apriori dapat memperlihatkan pola dari data tes
masuk mahasiswa terhadap kelulusan mahasiswa.
b.
Ketepatan pola hasil data mining yang didapatkan sangat tergantung dari banyaknya data
valid yang dapat dimasukkan kedalam proses mining. Semakin banyak data valid semakin
tepat pola yang dihasilkan.
DAFTAR PUSTAKA
Hermawati, Fajar Astuti (2013). Data Mining, Yogyakarta: Penerbit Andi.
Kusrini, Emha Taufiq Luthfi (2009). Algoritma Data Mining,Yogyakarta : Penerbit Andi.
Ning Tan, Pang, Michael Steinbach, Vipin Kumar (2006). Introduction to Data Mining, Boston:
Pearson Education
Prasetyo, Eko (2014). Data Mining Mengolah Data Menjadi Informasi, Yogyakarta: Penerbit
Andi
Santosa, Budi (2007). Data Mining Teknik Pemanfaaatan Data untuk Keperluan Bisnis,
Yogyakarta: Graha Ilmu
Yin, Yong, Ikou Kaku, Jiafu Tang, JianMing Zhu (2011). Data Mining Concepts, Methods and
Applications in Management and Engineering Design,London: Springer.
Download