DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada Abstrak Perguruan tinggi sebagai salah satu pilar pendidikan tinggi memiliki kontribusi yang sangat besar dalam mendidik dan mengembangkan mahasiswa untuk siap terjun ke dunia kerja secara nyata. Tes masuk mahasiswa merupakan tahapan awal yang harus dilalui setiap mahasiswa untuk dapat menimba ilmu diperguruan tinggi yang diinginkan. Dari data nilai tes masuk ini sebenarnya dapat digali data mengenai kemampuan dan potensi mahasiswa yang dapat lebih dikembangkan. Penggalian data ini perlu dikaji dan diteliti lebih mendalam untuk kebutuhan perguruan tinggi dalam mengambil kebijakan dalam rangka meningkatkan kualitas pendidikan pada perguruan tinggi.Penelitian ini dimaksudkan untuk menggali korelasi antara data yang diperoleh pada tahapan penerimaan mahasiswa dengan menggunakan pendekatan asosiasi data mining dan algoritma apriori untuk menemukan korelasi dan pola dengan tingkat nilai kelulusan mahasiswa. Hasil penelitian dapat dipergunakan untuk memberikan arahan terhadap perguruan tinggi dalam menentukan kebijakan-kebijakan yang diambil dalam meningkatkan kualitas mutu pendidikan tinggi. Keyword: algoritma apriori, Tes Masuk, Penerimaan Mahasiswa, Kebijakan, Mutu Pendidikan 1. PENDAHULUAN Perguruan tinggi sebagai salah satu pilar pendidikan tinggi memiliki kontribusi yang sangat besar dalam mendidik dan mengembangkan mahasiswa untuk siap terjun ke dunia kerja secara nyata. Dalam menjalankan fungsinya perguruan tinggi memiliki tahapan – tahapan yang perlu dijalankan mulai dari menjaring, menyeleksi hingga menjalankan fase pendidikan, termasuk dalam menentukan kebijakan – kebijakan dalam meningkatkan kualitas mahasiswa. Dukungan data sering kali dibutuhkan sebagai panduan untuk menentukan arah ketika hendak menentukan program pendidikan atau kurikulum , baik yang bersifat jangka pendek ataupun jangka panjang. Sehingga dibutuhkan analisa data yang tepat untuk memastikan ketepatan kebijakan program pendidikan atau kurikulum terhadap sasaran mahasiswa didik dalam peningkatan kualitas menyelesaikan masa pendidikannya. Terkadang data-data tersebut tersembunyi atau kurang terungkap karena terlalu banyaknya data, dan hal ini perlu digali dengan menggunakan data mining. Tes masuk mahasiswa merupakan tahapan awal yang harus dilalui setiap mahasiswa untuk dapat menimba ilmu diperguruan tinggi yang diinginkan. Dari data tes masuk ini sebenarnya dapat digali data mengenai kemampuan dan potensi yang dapat lebih dikembangkan. Penggalian data ini dilalukan untuk melihat adanya korelasi antara data saat tes masuk perguruan tinggi dengan tingkat kelulusan diperguruan tinggi. Proses penggalian data untuk melihat korelasi data tes masuk dengan data kelulursan mahasiswa menggunakan pendekatan asosiasi datamining dengan algoritma apriori. Hasil penelitian diharapkan dapat memberikan data acuan bagi program studi-program studi di Universitas Darma Persada menentukan kebijakan penerimaan mahasiswa baru. 2. TINJAUAN PUSTAKA 1.1 Data Mining Data mining adalah suatu konsep yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang tersimpan di dalam database besar. Data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika (Kusrini, 2009). Data mining didefinisikan sebagai proses menemukan pola-pola dalam data. Karakteristik data mining sebagai berikut : a. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya. b. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya. c. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi. 1.2 Algoritma Apriori Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian frequent itemset dengan menggunakan teknik association rule. Algoritma Apriori menggunakan pengetahuan frekuensi atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Pada algoritma Apriori menentukan kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum confidence. Support adalah nilai pengunjung atau persentase kombinasi sebuah item dalam database. Rumus support adalah sebagai berikut: Support (A,B) = P (A∩B) 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴, 𝐵) = Sedangkan confidence ∑Transaksi mengandung A dan B 𝑋 100% ∑Total Transaksi adalah nilai kepercayaan yaitu kuatnya hubungan antar item dalam sebuah Apriori. dapat dicari setelah pola Confidence frekuensi munculnya sebuah item ditemukan. Berikut rumus confidence : Secara garis besar cara kerja algoritma apriori adalah: 1. Pembentukan kandidat itemset, Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri dari algoritma Apriori adalah adanya pemangkasan kandidat k-itemset yang subset-nya yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1. 2. Penghitungan support dari tiap kandidat k-itemset. Support dari tiap kandidat k-itemset didapat dengan men-scan database untuk menghitung jumlah transaksi yang memuat semua item di dalam kandidat k-itemset tsb. Ini adalah juga ciri dari algoritme Apriori dimana diperlukan penghitungan dengan scan seluruh database sebanyak k-itemset terpanjang. 3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari kandidat k-itemset yang support-nya lebih besar dari minimum support. 4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan. Bila tidak, maka k ditambah satu dan kembali ke bagian 1. 3. METODOLOGI PENELITIAN Metodologi yang digunakan dalam penelitian ini mengikuti proses tahap-tahap knowledge discovery in databases (KDD) dalam datamining, yaitu sebagai berikut: 1. Seleksi Data (data selection) Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Data hasil seleksi akan digunakan untuk proses datamining, disimpan dalam satu berkas, terpisah dari basis data operasional. 2. Pembersihan data (data cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik.Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data-data yang tidak relevan itu juga dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. 3. Transformasi data (data transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Metode asosiasi hanya bisa menerima input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut transformasi data. 4. Proses mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Teknik, metode atau algoritma dalam datamining sangat bervriasi. Pemilihan metode atau algoritma yang tepat sangat tergantung pada tujuan dan proses KDD secara keseluruhan. 5. Evaluasi pola (pattern evaluation) Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan.Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining,mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatuhasil yang di luar dugaan yang mungkin bermanfaat. 4. IMPLEMENTASI Data yang akan digunakan dalam membentuk suatu pengetahuan berupa pola kombinasi untuk memprediksi apakah calon mahasiswa lulus tepat waktu atau tidak adalah data mahasiswa dari awal masuk sampai dengan lulus yang sudah tersimpan dalam database. Dari penelitian yang dilakukan, beberpa variable yang dapat diambil sebagai penentu keputusan dari data – data yang ada antara lain sebagai berikut: 1. 2. 3. 4. 5. 6. Nama Mahasiswa Data Nilai Jenis Kelamin Jurusan Sekolah Jurusan Kuliah Kelulusan Setelah ditentukan data data yang dibutuhkan dan data tersedia di dalam database mahasiswa UNSADA, maka dibuat tabel-tabel untuk database aplikasi data mining sebagai berikut: 1. Tabel mahasiswa 2. Tabel Kombinasi 3. Tabel Minimum Confidence 4. Tabel Perhitungan Karena satu data mempunyai rentang nilai yang luas, maka dibuat definisi nilai baru untuk menggelompokkan data data tersebut. Adapn definisi tersebut sebagai berikut: Definisi : A : Nilai STTB 1: Grade A 80<= n <=100 2: Grade B 60<= n <80 3: Grade C 40<= n <60 4: Grade D 20<= n <40 5: Grade E 10<= n <20 B : Jenis Kelamin 1: Pria 2: Wanita C : Jenis Sekolah 1: IPA 2: IPS 3: STM 4: SMK D : Jurusan Kuliah 1: Fakultas Teknik 2: Fakultas Ekonomi 3: Fakultas Sastra 4: Fakultas Kelautan E : Status Kelulusan 1: Cepat 2: Lambat 5. HASIL Pada aplikasi pada inputan dimasukkan nilai support 20 dan nilai confident 80, dengan tampilan sebagai berikut: Setalah diproses didapatkan hasil sebagai berikut: Perhitungan utuk kombinasi 1 itemset diperoleh hasil sebagai berikut: Hasil perhitungan untuk kombinasi 2 itemset: Hasil perhitungan untuk kombinasi 3 itemset: Aturan asosiasi yang dihasilkan adalah sebagai berikut: Dengan melihat hasil asosiasi diatas dapat dijelaskan beberapa hasil sebagai berikut: Seorang mahasiswa dengan nilai STTB diatas 80 yang kuliahnya lulus tepat waktu kemungkinan 85,714% berjenis kelamin laki-laki, hal ini cukup signifikan karena mewakili 42,857 % dari seluruh data mahasiswa yang tercatat. Seorang mahasiswa dengan nilai STTB diatas 80 yang kuliahnya lulus tepat waktu kemungkinan 85,714% jurusan teknik, hal ini cukup signifikan karena mewakili 42,857 % dari seluruh data mahasiswa yang tercatat. 6. SIMPULAN Berdasarkan hasil uji coba dari aplikasi datamining dengan algoritma apriori, dapat diambil beberapa kesimpulan sebagai berikut : a. Pendekatan datamining dengan algoritma apriori dapat memperlihatkan pola dari data tes masuk mahasiswa terhadap kelulusan mahasiswa. b. Ketepatan pola hasil data mining yang didapatkan sangat tergantung dari banyaknya data valid yang dapat dimasukkan kedalam proses mining. Semakin banyak data valid semakin tepat pola yang dihasilkan. DAFTAR PUSTAKA Hermawati, Fajar Astuti (2013). Data Mining, Yogyakarta: Penerbit Andi. Kusrini, Emha Taufiq Luthfi (2009). Algoritma Data Mining,Yogyakarta : Penerbit Andi. Ning Tan, Pang, Michael Steinbach, Vipin Kumar (2006). Introduction to Data Mining, Boston: Pearson Education Prasetyo, Eko (2014). Data Mining Mengolah Data Menjadi Informasi, Yogyakarta: Penerbit Andi Santosa, Budi (2007). Data Mining Teknik Pemanfaaatan Data untuk Keperluan Bisnis, Yogyakarta: Graha Ilmu Yin, Yong, Ikou Kaku, Jiafu Tang, JianMing Zhu (2011). Data Mining Concepts, Methods and Applications in Management and Engineering Design,London: Springer.