Prediksi Mata Kuliah Pilihan dengan Aturan Asosiasi

advertisement
Prediksi Mata Kuliah Pilihan dengan Aturan Asosiasi
Widodo
Jurusan Teknik Elektro – Fakultas Teknik
Universitas Negeri Jakarta
[email protected]
Abstraksi
Mata kuliah pilihan biasanya terdapat pada bidang peminatan tertentu pada program studi atau jurusan di sebuah
institusi perguruan tinggi. Sebuah mata kuliah pilihan bisa menjadi favorit bagi mahasiswa sehingga akan banyak
peminat yang memilih mata kuliah tersebut, atau bisa juga peminat yang memilih mata kuliah tersebut kurang dari jumlah
minimal. Jika terjadi hal seperti ini maka mata kuliah tersebut akan ditutup ada semester yang bersangkutan. Keadaan
seperti ini sebenarnya dapat diprediksi dari awal dengan menggunakan data mining. Banyak teknik yang dapat digunakan
untuk melakukan prediksi tersebut. Makalah ini akan memaparkan prediksi untuk mata kuliah pilihan apakah dapat
dibuka atau sebaiknya ditutup saja berdasarkan data-data pada tahun-tahun sebelumnya. Teknik yang digunakan dalam
melakukan prediksi ini adalah dengan aturan Asosiasi (Association Rule). Aturan ini dipilih karena cukup sederhana,
sehingga proses prediksi tidak memakan waktu terlalu lama. Hasil yang diharapkan adalah adanya data yang relevan
sebagai saran apakah sebuah mata kuliah layak dibuka pada semester yang bersangkutan ataukah tidak. Data tersebut
hanya digunakan sebagai saran saja karena keputusan akhir tetap berada pada pihak manajemen pengambil keputusan
dengan berbagai pertimbangan.
Kata Kunci : Data Mining, Association Rule, Mata Kuliah Pilihan
1. PENDAHULUAN
Kurikulum perguruan tinggi mencakup berbagai jenis
mata kuliah. Sebuah jurusan atau program studi tertentu
memiliki struktur kurikulum yang disun sesuai dengan
aturan yang telah ditetapkan. Pada sebuah jurusan atau
program studi tersebut kurikulum untuk mata kuliah
biasanya terdapat mata kuliah yang wajib untuk diambil
dan mata kuliah pilihan. Mata kuliah pilihan biasanya
diambil berdasarkan bidang peminatan seorang
mahasiswa pada jurusan tersebut. Namun tidak semua
mata kuliah pilihan tersebut akan diambil oleh seorang
mahasiswa. Bisa terjadi pada sebuah peminatan, mata
kuliah pilihan yang tersedia ada sepuluh, namun yang
diambil hanya tujuh. Banyak faktor yang menyebabkan
mahasiswa memilih mata kuliah pilihan tertentu. Faktor
kepentingan dan ketertarikan mahasiswa terhadap sebuah
mata kuliah pilihan, atau bahkan mungkin faktor
pengajarnya. Sebuah tools dalam area data mining dapat
digunakan untuk memprediksi mata kuliah pilihan yang
kemungkinan dapat diambil atau tidak diambil oleh
mahasiswa.
Penggunaan Association Rule (aturan asosiasi) sebagai
tools untuk memprediksi mata kuliah pilihan yang dapat
dibuka atau ditutup tidak menjamin untuk mendapatkan
tingkat kebenaran 100%. Hasil yang diperoleh hanya
dapat digunakan sebagai saran, sebab untuk membuka dan
menutup
mata
kuliah
pilihan
perlu
juga
mempertimbangkan faktor-faktor lain. Seperti misalnya
seorang mahasiswa pada tahun sebelumnya tidak lulus
pada sebuah mata kuliah pilihan, maka sebaiknya mata
kuliah pilihan tersebut tetap dibuka meskipun mahasiswa
yang mengambil jumlahnya di bawah jumlah minimal.
Terlepas dari berbagai faktor non teknis tersebut
association rule sebagai salah satu teknik data mining
dapat membantu untuk memprediksi mata kuliah pilihan
dapat dibuka atau ditutup berdasarkan data pada semestersemester sebelumnya.
2. PEMBAHASAN
2.1 Data Mining
Data mining merupakan proses penemuan pola yang
merupakan salah satu tahap dalam Knowledge Discovery
in Database (KDD). Dalam KDD tersebut secara garis
besar terdapat tiga tahap yaitu pre processing, process
(data mining), dan post processing. Jadi data mining
sebenarnya merupakan proses utama dalam KDD. Istilah
data mining menurut Jiawei Han [...] sebenarnya salah
istilah. Mengacu pada gold mining (menambang emas)
bukan rock mining (menambang batu), data mining
seharusnya lebih tepat disebut sebagai information
mining.
Data mining merupakan proses penemuan pola-pola
tertentu yang terdapat dalam sebuah data atau basis data
yang sangat besar yang bisa diperoleh informasi yang
sangat berguna. Jenis atau teknik data mining diterapkan
setidaknya dalam 3 hal yaitu association, classification,
e-Indonesia Initiative 2008 (eII2008)
Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta
dan clustering. Association mencari pola hubungan yang
terdapat pada data atau basis data, classification dan
clustering lebih cenderung menemukan pola-pola untuk
pengelompokkan. Pada makalah ini akan difokuskan
teknik association terutama dalam hubungannya untuk
memprediksi mata kuliah pillihan yang mungkin dapat
dibuka atau tidak dibuka.
berjumlah 2 yaitu pada trans 8 dan 9, jumlah keseluruhan
trans adalah 9. Sedangkan 2 pada confidence sama seperti
pada support, 4 diperoleh dari jumlah A,B yaitu pada
trans 1,4,8, dan 9. Dari perolehan tersebut, kita dapat
membuat aturan persentasi yang diinginkan untuk
menentukan kepastian asosiasinya. Paling baik adalah
apabila nilai support maupun confidence tinggi.
2.2 Association Rule
2.3 Prediksi Mata Kuliah Pilihan
Association Rule merupakan teknik data mining untuk
mencari pola hubungan dalam data atau basis data. Yang
paling populer adalah market basket analysis (MBA).
Teknik MBA ini digunakan untuk mencari pelanggan
pada sebuah toko yang biasanya membeli barang X, akan
membeli barang Y dan seterusnya.
Mata kuliah pilihan dalam sebuah perguruan tinggi
adalah pilihan bagi seorang mahasiswa, apakah akan
diambil atau tidak. Hal ini karena mata kuliah pilihan
tersebut tidak wajib untuk diambil, sehingga dapat terjadi
satu mata kuliah pilihan diambil oleh mahasiswa yang
jumlahnya di bawah jumlah minimum. Apabila hal
tersebut terjadi, maka mata kuliah pilihan tersebut akan
ditutup kembali. Aturan asosiasi (association rule) dapat
melakukan prediksi untuk hal tersebut, tentu dengan data
selama
beberapa
tahun
yang
dapat
dicari
kecenderungannya atau pola pada setiap tahunnya. Jika ini
dilakukan mungkin akan dapat ditawarkan pada awal
semester, mata kuliah mana yang dapat dibuka dan mata
kuliah mana yang tidak perlu dibuka.
Tabel 1: Contoh tabel transaksi untuk association
analysis.
Trans
1
2
3
4
5
6
7
8
9
Itemset
A,B,E
B,D
B,C
A,B,D
A,C
B,C
A,C
A,B,C,E
A,B,C
Dalam association analysis itemset merupakan kumpulan
nol atau lebih item [...]. Pada contoh tabel di atas
diumpamakan itemset adalah barang yang dibeli pada
toko tersebut, trans adalah kode transaksi. Pada tabel
tersebut dapat dilihat pada transaksi 1 yang dibeli adalah
barang A,B, dan E. Transaksi 2 yang dibeli adalah B dan
D, demikian seterusnya. Asociation analysis akan
melakukan analisis hubungan dengan aturan tertentu
sering disebut sebagai association rule.
Sebagai contoh pada tabel tersebut, pembeli yang
biasanya membeli barang A dan B akan membeli barang
C. Aturan ini dapat ditulis {A,B} Æ {C}. Untuk
memperoleh kuantifikasinya terminologi support dan
confidence perlu diperhatikan. Support dan confidence
dapat dihitung sebagai berikut:
σ (X U Y)
Support, s(X Æ Y) =
N
σ (X U Y)
Confidence, c(X Æ Y) =
σ (X)
Apabila ditarik pada contoh di atas, maka trans dapat
digantikan dengan nama mahasiswa, sedangkan
itemsetnya adalah matakuliah pilihan. Jadi data tersebut
diambil dari mahasiswa angkatan tertentu yang
mengambil sejumlah mata kuliah pilihan selama beberapa
semester. Dari itemset tersebut akan terlihat
kecenderungan mahasiswa-mahasiswa tersebut dalam
mengambil mata kuliah pilihan tersebut.
Pengambilan data-data tersebut dapat dilakukan untuk
mahasiswa dalam beberapa angkatan, kemudian dari datadata tersebut dihitung untuk setiap angkatannya, berapa
support dan confidence untuk sejumlah aturan asosiasi
yang dibuat. Dari hal tersebut kita dapat memperoleh
data-data
hubungan
kecenderungannya.
Untuk
pengambilan keputusan, dapat dibuat aturan sesuai yang
diinginkan pleh pihak manajemen. Misal yang diinginkan
adalah jika support yang diperoleh di atas 50% dan
confidence di atas 75%, maka mata kuliah X akan dibuka.
Data yang terdiri dari mahasiswa berbagai angkatan
tersebut dapat digeneralisasi dengan membuat rataratanya. Dengan demikian maka mata kuliah pilihan
tertentu dapat diprediksi akan ditawarkan pada mahasiswa
untuk dibuka atau tidak dibuka. Meskipun keputusan
untuk membuka atau tidak membuka mata kuliah pilihan
tertentu sangat tergantung pada hal-hal lain yang mungkin
bersifat non-teknis, namun prediksi ini paling tidak dapat
membantu menentukan keputusannya.
3. PENUTUP
Dengan rumus tersebut maka support yang di dapat dari
hubungan s(A,B Æ C) adalah: 2/9 = 0,22. Sedangkan
nilai confidence yang diperoleh adalah c(A,B Æ C) 2/4
= 0,5. Nilai 2 pada support diperoleh dari itemset A,B,C
Melalui tahap seperti telah disebutkan pada bagian
sebelumnya, kita dapat memanfaatkan salah satu teknik
dalam data mining untuk memprediksi mata kuliah
pilijhan yang akan dibuka atau tidak dibuka. Data mining
e-Indonesia Initiative 2008 (eII2008)
Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta
yang merupakan bidang ilmu yang memiliki interseksi
berbagai bidang ilmu seperti basis data, statistik, maupun
artificial intelligence memiliki kemampuan yang cukup
baik untuk melakukannya. Teknik association rule (aturan
asosiasi) dengan penghitungan support dan confidencenya dapat memprediksi mata kuliah pilihan yang
ditawarkan untuk dibuka atau tidak dibuka.
Nilai support dan confidence ditentukan oleh penentu
kebijakan untuk memastikan prediksinya. Semakin besar
nilai support dan coinfidence-nya, maka semakin besar
kemungkinan sebuah mata kuliah pilihan dapat dibuka.
Terlepas dari semua hal tersebut, untuk membuka atau
tidak mata kuliah pilihan tergantung pula dengan berbagai
variabel lain yang sifatnya non-teknnis. Karena itu, hasil
dari prediksi tersebut hanya merupakan masukan dan
pertimbangan apakah sebaiknya mata kuliah pilihan
tersebut dibuka atau tidak.
4. Daftar Pustaka
[1].C.Gyorodi, R. Gyorodi, and S. Holban,”A
Comparative Study of Association Rules Mining
Algorithms”.
[2].J. Han and M. Kamber, "Data Mining: Concept and
Techniques", 2nd edition, Morgan Kaufmann
Publisher, 2005.
[3].S. Kotsiantis and D. Kanellopoulos, “Association
Rules Mining: A Recent Overview”, GESTS
International Transaction on Computer Science and
Engineering, Vol.32(1), 2006, pp.71-82
[4].P.N Tan, M. Steinbach and V. Kumar, “Introduction to
Data Mining”, Morgan Kaufman, 2006
e-Indonesia Initiative 2008 (eII2008)
Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia
21-23 Mei 2008, Jakarta
Download