Prediksi Mata Kuliah Pilihan dengan Aturan Asosiasi Widodo Jurusan Teknik Elektro – Fakultas Teknik Universitas Negeri Jakarta [email protected] Abstraksi Mata kuliah pilihan biasanya terdapat pada bidang peminatan tertentu pada program studi atau jurusan di sebuah institusi perguruan tinggi. Sebuah mata kuliah pilihan bisa menjadi favorit bagi mahasiswa sehingga akan banyak peminat yang memilih mata kuliah tersebut, atau bisa juga peminat yang memilih mata kuliah tersebut kurang dari jumlah minimal. Jika terjadi hal seperti ini maka mata kuliah tersebut akan ditutup ada semester yang bersangkutan. Keadaan seperti ini sebenarnya dapat diprediksi dari awal dengan menggunakan data mining. Banyak teknik yang dapat digunakan untuk melakukan prediksi tersebut. Makalah ini akan memaparkan prediksi untuk mata kuliah pilihan apakah dapat dibuka atau sebaiknya ditutup saja berdasarkan data-data pada tahun-tahun sebelumnya. Teknik yang digunakan dalam melakukan prediksi ini adalah dengan aturan Asosiasi (Association Rule). Aturan ini dipilih karena cukup sederhana, sehingga proses prediksi tidak memakan waktu terlalu lama. Hasil yang diharapkan adalah adanya data yang relevan sebagai saran apakah sebuah mata kuliah layak dibuka pada semester yang bersangkutan ataukah tidak. Data tersebut hanya digunakan sebagai saran saja karena keputusan akhir tetap berada pada pihak manajemen pengambil keputusan dengan berbagai pertimbangan. Kata Kunci : Data Mining, Association Rule, Mata Kuliah Pilihan 1. PENDAHULUAN Kurikulum perguruan tinggi mencakup berbagai jenis mata kuliah. Sebuah jurusan atau program studi tertentu memiliki struktur kurikulum yang disun sesuai dengan aturan yang telah ditetapkan. Pada sebuah jurusan atau program studi tersebut kurikulum untuk mata kuliah biasanya terdapat mata kuliah yang wajib untuk diambil dan mata kuliah pilihan. Mata kuliah pilihan biasanya diambil berdasarkan bidang peminatan seorang mahasiswa pada jurusan tersebut. Namun tidak semua mata kuliah pilihan tersebut akan diambil oleh seorang mahasiswa. Bisa terjadi pada sebuah peminatan, mata kuliah pilihan yang tersedia ada sepuluh, namun yang diambil hanya tujuh. Banyak faktor yang menyebabkan mahasiswa memilih mata kuliah pilihan tertentu. Faktor kepentingan dan ketertarikan mahasiswa terhadap sebuah mata kuliah pilihan, atau bahkan mungkin faktor pengajarnya. Sebuah tools dalam area data mining dapat digunakan untuk memprediksi mata kuliah pilihan yang kemungkinan dapat diambil atau tidak diambil oleh mahasiswa. Penggunaan Association Rule (aturan asosiasi) sebagai tools untuk memprediksi mata kuliah pilihan yang dapat dibuka atau ditutup tidak menjamin untuk mendapatkan tingkat kebenaran 100%. Hasil yang diperoleh hanya dapat digunakan sebagai saran, sebab untuk membuka dan menutup mata kuliah pilihan perlu juga mempertimbangkan faktor-faktor lain. Seperti misalnya seorang mahasiswa pada tahun sebelumnya tidak lulus pada sebuah mata kuliah pilihan, maka sebaiknya mata kuliah pilihan tersebut tetap dibuka meskipun mahasiswa yang mengambil jumlahnya di bawah jumlah minimal. Terlepas dari berbagai faktor non teknis tersebut association rule sebagai salah satu teknik data mining dapat membantu untuk memprediksi mata kuliah pilihan dapat dibuka atau ditutup berdasarkan data pada semestersemester sebelumnya. 2. PEMBAHASAN 2.1 Data Mining Data mining merupakan proses penemuan pola yang merupakan salah satu tahap dalam Knowledge Discovery in Database (KDD). Dalam KDD tersebut secara garis besar terdapat tiga tahap yaitu pre processing, process (data mining), dan post processing. Jadi data mining sebenarnya merupakan proses utama dalam KDD. Istilah data mining menurut Jiawei Han [...] sebenarnya salah istilah. Mengacu pada gold mining (menambang emas) bukan rock mining (menambang batu), data mining seharusnya lebih tepat disebut sebagai information mining. Data mining merupakan proses penemuan pola-pola tertentu yang terdapat dalam sebuah data atau basis data yang sangat besar yang bisa diperoleh informasi yang sangat berguna. Jenis atau teknik data mining diterapkan setidaknya dalam 3 hal yaitu association, classification, e-Indonesia Initiative 2008 (eII2008) Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia 21-23 Mei 2008, Jakarta dan clustering. Association mencari pola hubungan yang terdapat pada data atau basis data, classification dan clustering lebih cenderung menemukan pola-pola untuk pengelompokkan. Pada makalah ini akan difokuskan teknik association terutama dalam hubungannya untuk memprediksi mata kuliah pillihan yang mungkin dapat dibuka atau tidak dibuka. berjumlah 2 yaitu pada trans 8 dan 9, jumlah keseluruhan trans adalah 9. Sedangkan 2 pada confidence sama seperti pada support, 4 diperoleh dari jumlah A,B yaitu pada trans 1,4,8, dan 9. Dari perolehan tersebut, kita dapat membuat aturan persentasi yang diinginkan untuk menentukan kepastian asosiasinya. Paling baik adalah apabila nilai support maupun confidence tinggi. 2.2 Association Rule 2.3 Prediksi Mata Kuliah Pilihan Association Rule merupakan teknik data mining untuk mencari pola hubungan dalam data atau basis data. Yang paling populer adalah market basket analysis (MBA). Teknik MBA ini digunakan untuk mencari pelanggan pada sebuah toko yang biasanya membeli barang X, akan membeli barang Y dan seterusnya. Mata kuliah pilihan dalam sebuah perguruan tinggi adalah pilihan bagi seorang mahasiswa, apakah akan diambil atau tidak. Hal ini karena mata kuliah pilihan tersebut tidak wajib untuk diambil, sehingga dapat terjadi satu mata kuliah pilihan diambil oleh mahasiswa yang jumlahnya di bawah jumlah minimum. Apabila hal tersebut terjadi, maka mata kuliah pilihan tersebut akan ditutup kembali. Aturan asosiasi (association rule) dapat melakukan prediksi untuk hal tersebut, tentu dengan data selama beberapa tahun yang dapat dicari kecenderungannya atau pola pada setiap tahunnya. Jika ini dilakukan mungkin akan dapat ditawarkan pada awal semester, mata kuliah mana yang dapat dibuka dan mata kuliah mana yang tidak perlu dibuka. Tabel 1: Contoh tabel transaksi untuk association analysis. Trans 1 2 3 4 5 6 7 8 9 Itemset A,B,E B,D B,C A,B,D A,C B,C A,C A,B,C,E A,B,C Dalam association analysis itemset merupakan kumpulan nol atau lebih item [...]. Pada contoh tabel di atas diumpamakan itemset adalah barang yang dibeli pada toko tersebut, trans adalah kode transaksi. Pada tabel tersebut dapat dilihat pada transaksi 1 yang dibeli adalah barang A,B, dan E. Transaksi 2 yang dibeli adalah B dan D, demikian seterusnya. Asociation analysis akan melakukan analisis hubungan dengan aturan tertentu sering disebut sebagai association rule. Sebagai contoh pada tabel tersebut, pembeli yang biasanya membeli barang A dan B akan membeli barang C. Aturan ini dapat ditulis {A,B} Æ {C}. Untuk memperoleh kuantifikasinya terminologi support dan confidence perlu diperhatikan. Support dan confidence dapat dihitung sebagai berikut: σ (X U Y) Support, s(X Æ Y) = N σ (X U Y) Confidence, c(X Æ Y) = σ (X) Apabila ditarik pada contoh di atas, maka trans dapat digantikan dengan nama mahasiswa, sedangkan itemsetnya adalah matakuliah pilihan. Jadi data tersebut diambil dari mahasiswa angkatan tertentu yang mengambil sejumlah mata kuliah pilihan selama beberapa semester. Dari itemset tersebut akan terlihat kecenderungan mahasiswa-mahasiswa tersebut dalam mengambil mata kuliah pilihan tersebut. Pengambilan data-data tersebut dapat dilakukan untuk mahasiswa dalam beberapa angkatan, kemudian dari datadata tersebut dihitung untuk setiap angkatannya, berapa support dan confidence untuk sejumlah aturan asosiasi yang dibuat. Dari hal tersebut kita dapat memperoleh data-data hubungan kecenderungannya. Untuk pengambilan keputusan, dapat dibuat aturan sesuai yang diinginkan pleh pihak manajemen. Misal yang diinginkan adalah jika support yang diperoleh di atas 50% dan confidence di atas 75%, maka mata kuliah X akan dibuka. Data yang terdiri dari mahasiswa berbagai angkatan tersebut dapat digeneralisasi dengan membuat rataratanya. Dengan demikian maka mata kuliah pilihan tertentu dapat diprediksi akan ditawarkan pada mahasiswa untuk dibuka atau tidak dibuka. Meskipun keputusan untuk membuka atau tidak membuka mata kuliah pilihan tertentu sangat tergantung pada hal-hal lain yang mungkin bersifat non-teknis, namun prediksi ini paling tidak dapat membantu menentukan keputusannya. 3. PENUTUP Dengan rumus tersebut maka support yang di dapat dari hubungan s(A,B Æ C) adalah: 2/9 = 0,22. Sedangkan nilai confidence yang diperoleh adalah c(A,B Æ C) 2/4 = 0,5. Nilai 2 pada support diperoleh dari itemset A,B,C Melalui tahap seperti telah disebutkan pada bagian sebelumnya, kita dapat memanfaatkan salah satu teknik dalam data mining untuk memprediksi mata kuliah pilijhan yang akan dibuka atau tidak dibuka. Data mining e-Indonesia Initiative 2008 (eII2008) Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia 21-23 Mei 2008, Jakarta yang merupakan bidang ilmu yang memiliki interseksi berbagai bidang ilmu seperti basis data, statistik, maupun artificial intelligence memiliki kemampuan yang cukup baik untuk melakukannya. Teknik association rule (aturan asosiasi) dengan penghitungan support dan confidencenya dapat memprediksi mata kuliah pilihan yang ditawarkan untuk dibuka atau tidak dibuka. Nilai support dan confidence ditentukan oleh penentu kebijakan untuk memastikan prediksinya. Semakin besar nilai support dan coinfidence-nya, maka semakin besar kemungkinan sebuah mata kuliah pilihan dapat dibuka. Terlepas dari semua hal tersebut, untuk membuka atau tidak mata kuliah pilihan tergantung pula dengan berbagai variabel lain yang sifatnya non-teknnis. Karena itu, hasil dari prediksi tersebut hanya merupakan masukan dan pertimbangan apakah sebaiknya mata kuliah pilihan tersebut dibuka atau tidak. 4. Daftar Pustaka [1].C.Gyorodi, R. Gyorodi, and S. Holban,”A Comparative Study of Association Rules Mining Algorithms”. [2].J. Han and M. Kamber, "Data Mining: Concept and Techniques", 2nd edition, Morgan Kaufmann Publisher, 2005. [3].S. Kotsiantis and D. Kanellopoulos, “Association Rules Mining: A Recent Overview”, GESTS International Transaction on Computer Science and Engineering, Vol.32(1), 2006, pp.71-82 [4].P.N Tan, M. Steinbach and V. Kumar, “Introduction to Data Mining”, Morgan Kaufman, 2006 e-Indonesia Initiative 2008 (eII2008) Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia 21-23 Mei 2008, Jakarta