jurnal_0710960004

advertisement
PENERAPAN DATA MINING UNTUK MENGETAHUI
POLA ASOSIASI ANTARA DATA MAHASISWA DAN TINGKAT KELULUSAN
MENGGUNAKAN ALGORITMA FOLD-GROWTH
Betha Nurina Sari1, Drs.Muh. Arif Rahman M.Kom2, Yusi Tyroni Mursityo,S.Kom,M.S.3
Program Studi Ilmu Komputer, Jurusan Matematika,
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Brawijaya
Email : [email protected], [email protected], [email protected]
Abstrak
Setiap tahun Universitas Brawijaya mengadakan penerimaan mahasiswa baru, masingmasing mahasiswa mengumpulkan data lengkap untuk pendataan pendaftaran mahasiswa. Selain itu,
pendataan mahasiswa juga dilakukan untuk yang sudah lulus dari Universitas Brawijaya. Dewasa ini
belum diketahui tentang pola asosiasi antara data mahasiswa dan data kelulusan mahasiswa. Pola
asosiasi ini bisa digunakan untuk memprediksi tingkat kelulusan mahasiswa berdasarkan parameter
data mahasiswa yang diteliti.
Dalam penelitian ini, pencarian pola asosiasi antara data mahasiswa dan data tingkat
kelulusan dilakukan berdasarkan jalur masuk dan program studi dengan menerapkan algoritma
FOLD – Growth. Sistem akan mencari aturan asosiasi dengan tahap awal adalah mencari frequent
itemset. Pada tahap akhir, association rule akan diuji dalam 3 jenis,yaitu uji pengaruh nilai minimum
support dan confidence terhadap jumlah rule, uji lift ratio dan uji akurasi association rule.
Perbandingan antara minimum support dan minimum confidence dengan jumlah rule
berbanding terbalik. Nilai lift ratio tertinggi adalah 1,657 dari PSB,A2 pada program studi Statistika
dan nilai lift ratio terendah sebesar 0,531 dari PSB,B2 pada program studi Ilmu Komputer.Hasil
pengujian akurasi assosiation rule menunjukkan tingginya prosentase association rule yang
diterapkan pada data uji, sehingga dapat digunakan untuk memprediksi tingkat kelulusan mahasiswa
di waktu yang akan datang.
Kata kunci: mahasiswa,tingkat kelulusan, pola asosiasi, FOLD-growth, association rule, lift ratio
I. PENDAHULUAN
Setiap tahun, setiap Universitas
mengadakan penerimaan mahasiswa baru,
termasuk salah satunya adalah Universitas
Brawijaya. Setiap mahasiswa mengumpulkan
data lengkap untuk proses registrasi seperti
NIM, nama, fakultas, jurusan, program studi,
jalur masuk, tempat tanggal lahir, asal
sekolah, alamat. Selain pendataan mahasiswa
saat registrasi, ada pula pendataan mahasiswa
yang sudah lulus dari Universitas Brawijaya,
yang dilakukan setelah mahasiswa tersebut
menyelesaikan studinya.
Dewasa ini belum diketahui tentang
pola asosiasi antara data mahasiswa dan data
kelulusan mahasiswa. Pola asosiasi antara dua
jenis data tersebut dapat menunjukkan apakah
ada keterkaitan antara variabel data
mahasiswa yang terdiri dari jalur masuk dan
program studi, dengan tingkat kelulusan
mahasiswa yang bisa dilihat dari lama studi
dan IPK. Pola asosiasi ini bisa digunakan
sebagai dasar untuk memprediksi tingkat
kelulusan mahasiswa.
Pencarian pola dari data tersebut sangat
erat kaitannya dengan data mining. Data
mining adalah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan
data berupa pengetahuan yang selama ini
tidak diketahui secara manual[1].
Ada
sejumlah
algoritma
untuk
menyelesaikan association rule, diantaranya
adalah algoritma FOLD-Growth. Algoritma
FOLD-Growth merupakan hasil gabungan
dari algoritma FOLDARM (Fast Online
Dynamic Association Rule Mining) dan FPGrowth (Frequent Pattern Growth) dalam
proses penggalian itemset yang frequent
[2]
.Menurut penelitian yang telah dilakukan
sebelumnya, durasi eksekusi, skalabilitas,
reliabilitas, dan utilisasi memori dari
penerapaan algoritma FOLD-Growth lebih
baik daripada FP-Growth[3]. FOLD-Growth
menunjukkan performa seratus kali lebih baik
daripada FP-Growt [4].
1
II. TINJAUAN PUSTAKA
2.1 Data
Data merupakan representasi dari fakta
atau gambaran mengenai suatu objek atau
kejadian. Contohnya fakta mengenai biodata
mahasiswa yang meliputi nama, alamat, jenis
kelamin, agama, dan lain-lain. Data dapat
dinyatakan dengan nilai yang berbentuk
angka, deretan karakter, atau symbol[5].
2.1.1 Data Mahasiswa
Data mahasiswa yang harus diisi dalam
formulir registrasi administrasi meliputi data
pribadi mahasiswa, data asal sekolah, data
keluarga,dan
lain-lain.
Data
pribadi
mahasiswa terdiri dari nama lengkap, tempat
lahir, tanggal lahir, jenis kelamin, agama,
golongan darah, warga negara, status
pernikahan, hobi, alamat asal, alamat di
malang, kode pos, nomor telepon, nomor hp,
email, jumlah saudara, anak-ke. Data asal
sekolah terdiri dari propinsi, kota, sekolah
jurusan, tahun lulus, nilai UAN, prestasi
akademik dan prestasi non akademik. Data
keluarga terdiri dari nama ayah, nama ibu,
alamat orangtua, pekerjaan ayah, pekerjaan
ibu.
2.1.2 Data Kelulusan
Seorang
mahasiswa
harus
mengumpulkan
jumlah
kredit
untuk
menyelesaikan studi program sarjana
mencapai 144-160 sks, termasuk skripsi.
Predikat kelulusan mahasiswa dikategorikan
menjadi tiga berdasarkan nilai indeks predikat
kelulusan mahasiswa yang diatur dalam
pedoman pendidikan,yaitu dapat dilihat pada
Tabel 2.1.
Tabel 2.1 Predikat Kelulusan Mahasiswa
IPK
Predikat
2,00 - 2,75
Memuaskan
2,76 - 3,50
Sangat memuaskan
3,51 - 4,00
Dengan pujian (cumlaude)
Predikat kelulusan dengan pujian
ditentukan juga dengan memperhatikan masa
studi maksimum, untuk program sarjana
maksimum 5 tahun[6].
2.2. Data Mining
Data mining adalah serangkaian proses
untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang
selama ini tidak diketahui secara manual [1].
2.3
Association Rule
Association rule adalah suatu prosedur
untuk mencari hubungan antar item dalam
suatu data set yang ditentukan. Dalam
menentukan suatu association rule, terdapat
suatu ukuran kepercayaan yang didapatkan
dari hasil pengolahan data dengan
perhitungan tertentu. Association rule
memberikan informasi dalam bentuk ”if –
then” atau ”jika – maka”.
Biasanya
digunakan istilah antecedent untuk mewakili
bagian ”jika” dan consequent untuk mewakili
bagian ”maka”[7].
Support adalah suatu ukuran yang
menunjukkan seberapa besar tingkat dominasi
suatu itemset dari keseluruhan transaksi[8].
Nilai support 1-itemset dapat diperoleh dari
persamaan 2.2 dan nilai 2-itemset dapat
diperoleh dari persamaan 2.3.
π‘†π‘’π‘π‘π‘œπ‘Ÿπ‘‘ 𝐴 =
Jumlah Transaksi yang Mengandung A
Total Transaksi
(2.2)
π‘†π‘’π‘π‘π‘œπ‘Ÿπ‘‘ 𝐴, 𝐡 =
Jumlah Transaksi yang Mengandung A dan B
Total Transaksi
(2.3)
Confidence adalah suatu ukuran yang
menunjukkan hubungan antara dua atau lebih
item secara conditional[8].
πΆπ‘œπ‘›π‘“π‘–π‘‘π‘’π‘›π‘π‘’ 𝐴 → 𝐡 =
Jumlah Transaksi yang Mengandung A dan B
Jumlah Transaksi yang Mengandung A
2.4 Algoritma FOLD-Growth
Algoritma FOLD-Growth merupakan
hasil gabungan dari algoritma FOLDARM dan
FP-Growth. Pada algoritma FOLD-growth
ini, diharapkan dapat menggabungkan
keuntungan dari algoritma FOLDARM yang
memiliki kinerja cepat pada saat ukuran
itemset frequent maksimum (kmax) kecil atau
kmax ≤ 10 dengan keuntungan dari algoritma
FP-Growth yang memiliki kinerja yang cepat
pada saat kmax > 10. Pseudocode dari
algoritma FOLD-growth ditunjukkan pada
Pseudocode 2.4[3].
Tahapan algoritma FOLD-Growth
dibagi menjadi empat tahapan utama[9] yaitu :
2
(2.4)
a. Penggalian 1 dan 2-itemset dengan
menggunakan SOTrieIT
Pada tahap ini, dilakukan pembacaan
basis data sebanyak satu kali untuk
membaca transaksi-transaksi yang ada
dalam basis data. Untuk setiap transaksi
akan dibangkitkan semua kemungkinankemungkinan 1-itemset dan 2-itemset yang
kemudian dicatat dalam SOTrieIT.
b. Pemangkasan item-item yang tidak
frequent
Dalam tahap ini, akan dilakukan
pemangkasan pada setiap transaksi yang
ada dalam basis data dengan menggunakan
1-itemset dan 2-itemset. Untuk setiap
transaksi T, pada itemset L yang terdapat
k
dalam transaksi tersebut dimana panjang k
lebih dari 2, akan dilakukan pengecekan
dengan menggunakan 1-itemset dan 2itemset. Sehingga, untuk item-item yang
dianggap tidak frequent akan dilakukan
pemangkasan. Sebuah item dikatakan
tidak frequent apabila nilai support countnya kurang dari batas minimum support
yang telah ditentukan oleh pengguna.
Setelah dilakukan pemangkasan terhadap
transaksi T, dengan menggunakan 1itemset dan 2-itemset yang didapatkan
melalui SOTrieIT, maka akan dihasilkan
Ordered Frequent Items yang telah
dipangkas.
c. Pembangunan FP-tree menggunakan
transaksi-transaksi yang telah dipangkas
Pada tahapan ini, akan dilakukan
pembangunan
FP-Tree
dengan
menggunakan data transaksi T yang telah
dipangkas dan diurutkan berdasarkan nilai
support count. Dengan perolehan Frequent
Items setelah dipangkas dan diurutkan,
maka akan dibangun FP-Tree.
d. Penggalian itemset frequent dengan
algoritma FP-growth.
Setelah tahap pembangunan FP-tree
selesai,
dilanjutkan
dengan
tahap
penggalian itemset frequent dengan
menggunakan algoritma FP-growth pada
FP-tree tersebut.
Himpunan pola asosiasi yang
ditemukan berdasarkan basis data transaksi
pada tabel 2.1 dan dengan minimum support
dan minimum confidence adalah 50% dalam
proses penggalian rekursif di atas, dapat
dilihat pada Tabel 2.3[3].
2.8 Lift Ratio
Lift
ratio
digunakan
untuk
mengevaluasi kuat tidaknya sebuah aturan
asosiasi. Lift ratio adalah perbandingan antara
confidence sebuah aturan dengan nilai
benchmark
confidence.
Benchmark
confidence adalah perbandingan antara
jumlah semua item consequent terhadap total
jumlah transaksi [7].
Rumus benchmark confidence dan lift
ratio dapat dilihat pada persamaan berikut.
𝑁𝑐
π΅π‘’π‘›π‘β„Žπ‘šπ‘Žπ‘Ÿπ‘˜ πΆπ‘œπ‘›π‘“π‘–π‘‘π‘’π‘›π‘π‘’ =
(2.6)
𝑁
Nc = jumlah transaksi dengan item dalam
consequent
N = jumlah transaksi database
𝐿𝑖𝑓𝑑 π‘…π‘Žπ‘‘π‘–π‘œ =
πΆπ‘œπ‘›π‘“π‘–π‘‘π‘’π‘›π‘π‘’ (𝐴, 𝐢)
π΅π‘’π‘›π‘β„Žπ‘šπ‘Žπ‘Ÿπ‘˜ πΆπ‘œπ‘›π‘“π‘–π‘‘π‘’π‘›π‘π‘’ (𝐴, 𝐢)
(2.7)
Apabila nilai lift ratio lebih besar dari
1, maka menunjukkan adanya manfaat dari
aturan tersebut. Lebih tinggi nilai lift ratio
maka lebih besar kekuatan asosiasinya[7].
Pengujian akurasi association rule yang
terbentuk yaitu dengan
membandingkan
association rule hasil proses data mining pada
data latih dengan data hasil pada data uji.
Penghitungan akurasi association rule
dilakukan dengan menggunakan persamaan
2.8.
Error =
|π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘‘π‘Žπ‘‘π‘Ž 𝑒𝑗𝑖 −π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘‘π‘Žπ‘‘π‘Žπ‘™π‘Žπ‘‘π‘– β„Ž |
π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘‘π‘Žπ‘‘π‘Ž π‘™π‘Žπ‘‘π‘– β„Ž
π‘₯ 100%
π‘Žπ‘˜π‘’π‘Ÿπ‘Žπ‘ π‘– = 100% − π‘’π‘Ÿπ‘Ÿπ‘œπ‘Ÿ
III. ANALISIS DAN PERANCANGAN
SISTEM
Sistem ini merupakan sistem yang
dikembangkan untuk melakukan analisa
terhadap data registrasi dan kelulusan
mahasiswa untuk mengetahui pola dan
hubungan
keterkaitan
antar
data.
Parameter yang digunakan dalam analisa
adalah jalur masuk, program studi, lama
studi dan IPK mahasiswa. Dari pola yang
dihasilkan
kita
dapat
mengetahui
keterkaitan antara data mahasiswa dengan
tingkat kelulusannya. Selain itu, dari pola
yang dihasilkan tersebut diharapkan dapat
memberikan
informasi
mengenai
hubungan data mahasiswa berupa jalur
3
masuk, program studi dengan tingkat
kelulusannya.
Transformasi data dilakukan pada
data tingkat kelulusan mahasiswa. Tingkat
kelulusan mahasiswa dapat dilihat dari
lama studi dan IPK.Dari dua kategori
tersebut dapat dibentuk kategori tingkat
kelulusan menjadi enam berdasarkan
kombinasi keduanya (Huda, 2010), seperti
pada tabel 3.1.
start
min_sup,min_conf,
data mahasiswa
dan kelulusan
Association Rule
(AR)
Rule yang dihasilkan
Tabel 3.1 Kategori tingkat kelulusan
mahasiswa
No Kategori Keterangan
1
A1
lama studi kurang dari 4
tahun atau tepat 4 tahun
dan IPK 3,51 – 4,00
2
A2
lama studi kurang dari 4
tahun atau tepat 4 tahun
dan IPK 2,76 – 3,50
3
A3
lama studi kurang dari 4
tahun atau tepat 4 tahun
dan IPK 2,00 – 2,75
4
B1
lama studi lebih dari 4
tahun dan IPK 3,51 – 4,00
5
B2
lama studi lebih dari 4
tahun dan IPK 2,76 – 3,50
6
B3
lama studi lebih dari 4
tahun dan IPK 2,00 – 2,75
Pengujian Rule
Rule dan hasil
pengujian rule
end
Proses yang ada di dalam algotima
FOLD-Growth ini akan dibagi menjadi 4,
yaitu penggalian 1-2 itemset dengan
menggunakan struktur data SOTrieIT,
pemangkasan item yang tidak frequent,
pembangunan FP Tree, dan penggalian
itemset frequent. Diagram alir proses dari
FOLD-Growth ini dapat dilihat pada
Gambar 3.2.
Sistem menerima inputan berupa
minimun support, minimum confidence,
data mahasiswa, dan data kelulusan yang
telah disimpan dalam database. Kemudian
sistem akan melakukan proses association
rule yang menghasilkan aturan asosiasi
pada data inputan dan selanjutnya
dilakukan pengujian rule. Proses ini
merupakan gambaran secara umum sistem,
dapat dilihat pada Gambar 3.1.
Perhitungan manual dilakukan pada
sampel data yang diambil sebanyak 20
data mahasiswa dengan minimum support
4
20% dan minimum confidence 50%.
Sampel data yang telah melalui tahap
preprocessing data dapat dilihat pada
Tabel 3.2 yang menunjukkan sampel data
mahasiswa dan data kelulusan.
Tabel 3.2 Sampel Data Mahasiswa
NIM
Jalur
Kategori
0410920001 SPMB
B2
0410920002 PSB
A1
0410920003 SPMB
B2
0410920004 PSB
B2
0410920006 PSB
B2
0410920007 SPMB
A2
0410920010 SPMB
A1
0410920011 SPMB
A2
0410920013 SPMB
A2
0410920020 PSB
B2
0410920023 SPMB
A2
0410920026 PSB
B2
0410922001 SAP
B3
0410922002 SAP
A2
0410923002 SPMK
B2
0410923004 SPMK
B2
0410923005 SPMK
B2
0410923006 SPMK
B2
0410923043 SPMK
A1
0410923048 SPMK
B3
Selanjutnya adalah tahap penggalian
1-2 itemset dengan menggunakan struktur
data SOTrieIT. Proses penggalian 1-2
itemset dengan menggunakan struktur data
SOTrieIT dapat dilihat pada Gambar 3.3.
Itemset
SPMB
SPMK
PSB
SAP
B2
A2
A1
B3
Count
7
6
5
2
10
5
3
2
Tabel 3.4 Penghitungan support 2-itemset
Itemset
Count Support
0.2
SPMB,A2 4
0.1
SPMB,B2 2
0.05
SPMB,A1 1
0.2
SPMK,B2 4
0.05
SPMK,A1 1
0.05
SPMK,B3 1
0.2
PSB, B2
4
0.05
PSB,A1
1
0.05
SAP,A2
1
0.05
SAP,B3
1
Tahap
selanjutnya
adalah
pemangkasan item-item yang tidak
frequent. Minimum support yang telah
ditentukan adalah 20 % atau 0.2, jadi
apabila nilai support count-nya kurang
dari batas minimum support yang telah
ditentukan maka dilakukan pemangkasan.
ROOT
B2(8)
SPMB (4)
A2 (4)
Setelah membangun SOTrieIT yang
utuh, dilakukan penghitungan support
count pada 1-itemset dan 2-itemset ,pada
Tabel 3.12 untuk hasil penghitungan
support 1-itemset dan pada Tabel 3.13
untuk hasil penghitungan support 2itemset.
Tabel 3.3 Penghitungan Support 1-itemset
Support
0.35
0.3
0.25
0.1
0.5
0.25
0.15
0.1
SPMK (4)
B2 (4)
A2 (4)
PSB (4)
B2 (4)
Selanjutnya adalah perhitungan nilai
confidence pada frequent itemset. Pada Tabel
3.5 dapat dilihat hasil perhitungan nilai
confidence frequent itemset.
Tabel 3.5 Confidence Frequent Itemset
Frequent Support Support Confidence
Itemset
(A,B)
(A)
5
Pengaruh Nilai Minimum Support
dan Nilai Minimum Confidence
terhadap Jumlah Rule (Kimia)
Jumlah Rule
SPMB → 0.2
0.35
0.57
A2
PSB → 0.2
0.25
0.8
B2
SPMK → 0.2
0.3
0.67
B2
Berdasarkan minimum confidence
yang telah ditentukan yaitu sebesar 50 %,
maka apabila nilai confidence dari frequent
itemset ο‚³ minimum confidence maka akan
dibangkitkan menjadi rule. Rule yang
terbentuk dapat dilihat pada Tabel 3.6.
6
min
support
1%
4
2
0
40%
50%
60%
Minimum Confidence
Tabel 3.7 Lift Ratio Rules
Rules
Conf Frek Benchmark
SPMB
→A2
PSB
→B2
SPMK
→ B2
0.63
5
0.25
Lift
Ratio
2.28
0.57
10
0.5
1.6
0.2
10
0.5
1.14
Berdasarkan hasil perhitungan lift
ratio pada Tabel 3.7, semua rule yang
terbentuk memiliki kekuatan yang bagus
karena nilai lift ratio rule tersebut lebih besar
dari 1.
IV. HASIL PEMBAHASAN
Berdasarkan hasil pengujian pengaruh
nilai minimum support dan nilai minimum
confidence didapatkan bahwa jumlah rule
yang dihasilkan berbanding terbalik. Hal ini
digambarkan pada Gambar 4.1 untuk
parameter program studi Kimia.
Berbanding
terbaliknya
nilai
minimum support dan nilai minimum
confidence terhadap jumlah rule tersebut
dikarenakan semakin tinggi nilai minimum
support maka semakin tinggi nilai batas
support /prosentase ketersediaan kombinasi
data yang harus dicapai sehingga semakin
sedikit yang dapat mencapai batasan untuk
menjadi frequent itemset.
Nilai lift ratio yang didapatkan setelah
dilakukan perbandingan antara confidence
untuk suatu rule dibagi dengan benchmark
confidence,yaitu bisa disebut juga support
dari consequence (maka). Penghitungan nilai
lift ratio didasarkan pada asumsi bahwa
consequent dan antecedent saling independen.
Nilai lift ratio lebih besar dari 1 menunjukkan
bahwa keterikatan antara dua item,
consequent dan antecedent yang kuat, karena
nilai kepercayaan atau confidence rule yang
melebihi minimum confidence diuji lagi pada
prosentase dengan kombinasi antecedent
(maka). Hal ini digambarkan pada Gambar
4.2 untuk parameter program studi Kimia.
Grafik Lift Rasio Association Rule yang Terbentuk
1,60
1,40
1,20
Lift Ratio
Tabel 3.6 Rule yang terbentuk
Rules
Keterangan
SPMB → A2 Jika jalur masuk SPMB maka
kategori kelulusannya A2
PSB → B2
Jika jalur masuk PSB maka
kategori kelulusannya B2
SPMK → B2 Jika jalur masuk SPMK maka
kategori kelulusannya B2
Keterangan :
A2 = lama studi kurang dari 4 tahun atau
tepat 4 tahun dengan IPK 2,76– 3,50
B2 = lama studi lebih dari 4 tahun dengan
IPK 2,76-3,50
Selanjutnya rule yang terdapat pada
Tabel 3.20 dilakukan uji kekuatan rule
dengan menggunakan lift ratio. Hasil
perhitungan nilai lift ratio dapat dilihat pada
Tabel 3.7
min
support
5%
1,00
0,80
0,60
Lift Ratio
0,40
0,20
0,00
PSB,B2
SAP,A2 SPMB,A2 SPMB,B2
Association Rule
6
1.
a.
b.
c.
d.
e.
f.
2.
3.
V. KESIMPULAN
Berdasarkan hasil analisa uji coba
dapat diambil kesimpulan:
Berdasarkan hasil penerapan algoritma
FOLD-Growth untuk didapatkan pola asosiasi
data mahasiswa dan tingkat kelulusan
mahasiswa berdasarkan paramater jalur
masuk dan program studi yaitu sebagai
berikut :
Jika jalur masuk PSB maka lama lulusnya
lebih dari 4 tahun dan IPK diantara 2,76
sampai dengan 3,5 atau kategori tingkat
kelulusan
B2
untuk
biologi,
kimia,fisika,matematika,dan ilkom
Jika jalur masuk SPMB maka lama lulusnya
lebih dari 4 tahun dan IPK diantara 2,76
sampai dengan 3,5 atau kategori tingkat
kelulusan B2 untuk semua bidang studi
Jika jalur masuk SPMB maka lama lulusnya
kurang atau tepat dari 4 tahun dan IPK
diantara 2,76 sampai dengan 3,5 atau kategori
tingkat kelulusan A2 untuk program studi
Kimia
Jika jalur masuk SPMK maka lama lulusnya
lebih dari 4 tahun dan IPK diantara 2,76
sampai dengan 3,5 atau kategori tingkat
kelulusan B2 untuk semua bidang studi Ilmu
Komputer
Jika jalur masuk SAP maka lama lulusnya
lebih dari 4 tahun dan IPK diantara 2,76
sampai dengan 3,5 atau kategori tingkat
kelulusan B2 untuk semua bidang studi Kimia
Jika jalur masuk PSB maka lama lulusnya
kurang atau tepat dari 4 tahun dan IPK
diantara 2,76 sampai dengan 3,5 atau kategori
tingkat kelulusan A2 untuk program studi
Statistika
Nilai lift ratio yang bisa menunjukkan
kekuatan
rule
didapatkan
setelah
membandingkan confidence rule dengan nilai
benchmark confidence, dimana didapatkan
nilai tertinggi lift ratio adalah 1,657 dari
PSB,A2 pada program studi Statistika dan
nilai lift ratio terendah sebesar 0,531 dari
PSB,B2 pada program studi Ilmu Komputer.
Hasil pengujian akurasi assosiation rule
menunjukkan
tingginya
penerapan
association rule yang terbentuk pada data
latih pada data uji dan memberikan informasi
terkait tingat akurasi rule yang dihasilkan,
yang bisa digunakan untuk bahan dasar
prediksi tingkat kelulusan mahasiswa di
waktu yang akan datang.
DAFTAR REFERENSI
1. Pramudiono, Iko. 2003. Pengantar Data
Mining
:
Menambang
Permata
Pengetahuan di Gudang Data. http://
www.ilmukomputer.com, tanggal akses
22 Maret 2011.
2. Zhao,Qiankun and Sourav S. Bhowmick.
2003. Association Rule Mining : A
Survey.
Nanyang
Technological
University. Singapura
3. Soelaiman, Rully dan Ni Made Arini WP.
2006. Analisis Kinerja Algoritma Fold –
Growth dan FP – Growth pada
Penggalian Pola Asosiasi. Seminar
Nasional Aplikasi Teknologi Informasi
(SNATI) Institut Teknologi Sepuluh
Nopember (ITS). Surabaya.
4. Woon, Yew – Kwong., Keong ,Wee
Ng.,Lim, E.P. 2004. A Support – Ordered
Trie for Fast Frequent Itemset Discovery.
IEEE Transaction onKnowledge and Data
Engineering, Volume 16, No. 7, halaman
875 – 879.
5. Kusrini, M.Kom. 2007. Konsep dan
Aplikasi Sistem Pendukung Keputusan.
CV Andi Offset. Yogyakarta.
6. Suharto,Bambang, dkk. 2010. Pedoman
Pendidikan Tahun Akademik 2010/2011
Universitas
Brawijaya.
Universitas
Brawijaya. Malang
7. Santosa, Budi. 2007. Data Mining Teknik
Pemanfaatan Data untuk Keperluan
Bisnis. Graha Ilmu. Yogyakarta.
8. Han, Jiawei dan Micheline Kamber.
2006. Data Mining : Concepts and
Techniques
2nd
Edition.
Morgan
Kaufmann, California
9. Prastowo, Deni. 2008. Penggunaan
Struktur
Data
SoTrieIT
Untuk
Pemangkasan
Transaksi
dengan
Algoritma Data Mining Fold – Growth.
Institut Pertanian Bogor (IPB). Bogor.
7
Download