Title of Paper (14 pt Bold, Times, Title case)

advertisement
Jurnal Komputer Terapan Vol.2, No. 2, November 2016, 69-82
69
Jurnal Politeknik Caltex Riau
http://jurnal.pcr.ac.id
Rancang Bangun Aplikasi Data Mining untuk
Memprediksi Hasil Belajar Siswa Sekolah Menengah Atas
Berbasis Web dengan Algoritma K-NN
(Studi Kasus: SMKN 2 Pekanbaru)
Okta Riveranda1, Maksum Rois Adin Saf2 dan Muhammad Ihsan Zul3
1Politeknik
Caltex Riau, email: [email protected]
Caltex Riau, email: [email protected]
3Politeknik Caltex Riau, email: [email protected]
2Politeknik
Abstrak
Kurikulum 2013 (K-13) pertama kali diumumkan pada tahun 2014 dengan penerapan ke
beberapa sekolah percobaan. Penyusunan kurikulum baru ini oleh pemerintah ditujukan agar
pendidikan di Indonesia tidak hanya menitikberatkan pada aspek kognitif atau keterampilan
yang dimiliki saja, melainkan juga melihat minat dan motivasi belajar siswa. Namun dibalik
tujuan tersebut, terdapat kendala yang dialami oleh sekolah selama penerapan K-13. Salah
satunya adalah proses input dan konversi nilai yang membutuhkan waktu yang relatif lama. Hal
itu dikarenakan standar dan skala penilaian yang berbeda daripada kurikulum sebelumnya.
Sementara itu, sistem akademik yang berjalan di sekolah-sekolah percobaan tersebut masih
relatif konvensional. Maka dibangunlah sebuah model aplikasi yang mampu menangani
masalah tersebut. Di samping tambahan yang ada, aplikasi ini dibangun dalam rangka
menerapkan data mining dengan algoritma k-NN untuk pemprediksian hasil belajar siswa
berdasarkan mata pelajaran tertentu. Pemilihan algoritma k-NN didasari pada karakteristik
data latih yang sesuai untuk diterapkannya algoritma tersebut. Sumber data yang digunakan
berjumlah 500 sumber data latih yang mencakup semua label yang ada, yang atribut-atributnya
adalah nilai harian 1, nilai harian 2, nilai harian 3, nilai harian 4, dan nilai ujian tengah
semester. Metode yang digunakan dalam pengujian ini adalah black box testing dan confusion
matrix. Ada 3 teknik black box testing yang diterapkan untuk menguji fungsionalitas aplikasi
berdasarkan nilai inputnya. Teknik-teknik tersebut ialah equivalence class partitioning,
boundary value analysis dan decision table based testing. Sementara confusion matrix, telah
dilakukan 3 kali pengujian berdasarkan nilai k. Dengan k-5 diperoleh persentase akurasi
sebesar 79.34%, k-10 dengan persentase akurasi sebesar 62.67% dan dengan k-15 diperoleh
sebesar 64%. Sehingga kesimpulan yang bisa diambil dari pengujian tersebut ialah bahwa
dengan menerapkan k-5 untuk algoritma k-NN, persentase akurasi lebih akurat.
Kata kunci: Aplikasi Web, Data Mining, k-NN, Klasifikasi, Prediksi, Prestasi Akademik.
Abstract
Curriculum 2013 (K-13) was first announced in 2014 which has been applied to number of
schools. Preparation of this new curriculum by the government aimed at making education in
Indonesia is not only focused on cognitive aspects or skills possessed, but also at students'
interest and motivation. Unfortunately, behind the goal, there are issues occured in the school
during the application of K-13. Those are input process and values conversion that takes
relatively much time. The things are caused by the dissimilarity of the standards and the
Dokumen diterima pada 21 Juni, 2016
Dipublikasikan pada 25 Novermber, 2016
70
Okta Riveranda
assessment scale between current curriculum with the previous one. Meanwhile, the academic
system running in schools is still pretty conventional. Therefore, this research will construct an
application which have capability to handle the things. Beside those additional features, this
research is build an application in order to apply the data mining with k-NN algorithm to
predict students learning outcomes based on certain subjects. Reason why choose the k-NN
algorithm is according to the suitability of the characteristics of training data with the
implementation of the algorithm. Data source that used in this research are consisted into 500
data training that covered up all classes or labels, whose attributes are daily assigment 1, daily
assignment 2, daily assignment 3, daily assesment 4, and a mid term test assignment. Testing
methods which have been applied are black box testing and confusion matrix. There are 3
techniques of black box testing that applied in order to test the system functionality according to
its input values. Those are equivalence class partitioning, boundary value analysis and decision
table based testing. Meanwhile in confusion matrix, it has been done 3 times testing according
by variety of k value in k-NN algorithm. With k-5 acquired accurate rate 79.34%, k-10 with
accurate rate 62.67%, then k-15 with accurate rate 64%. Therefore, information that can
conluded from those testing methods is the algorithm with k-5 is more accurate than any others.
Keywords: Web Application, Data Mining, k-NN, Classification, Prediction, Academic
Achievement
1. Pendahuluan
Teknik-teknik data mining telah banyak diaplikasikan dalam berbagai bidang penerapan,
seperti dalam perbankan, militer, kesehatan, keuangan, kedokteran, pendidikan, dan lain
sebagainya. Tujuan dari masing-masing penerapan tersebut ialah untuk memperoleh informasi
yang berguna dalam rangka meningkatkan kualitas yang lebih baik di bidang terapan itu.
Salah satu tujuan penerapan data mining dalam bidang pendidikan adalah untuk
meningkatkan performa akademik suatu institusi pendidikan, seperti membantu untuk
memrediksi hasil belajar siswa berdasarkan mata pelajaran tertentu. Hasil belajar adalah hasil
yang telah dicapai seseorang setelah mengikuti suatu program pendidikan dan pelatihan [1].
Sehingga dapat disimpulkan bahwa hasil belajar merupakan suatu capaian dari hasil kerja keras
peserta didik selama proses pembelajaran yang ia ikuti untuk masing-masing mata pelajaran
yang ada.
Kurikulum 2013 pertama kali diterapkan di berbagai sekolah percobaan pada tahun 2014.
Kurikulum ini memiliki standar dan skala penilaian yang berbeda dibanding kurikulum
sebelumnya [2]. Hal itu menimbulkan dampak tersendiri dalam proses input dan konversi nilai
bagi sekolah yang masih menggunakan file excel dalam pengoperasiannya. Penerapan aplikasi
berbasis web yang akan dibangun dalam penelitian ini diharapkan mampu untuk menangani
kendala tersebut. Selain itu, aplikasi ini memiliki tujuan utama dalam implementasi data mining
dengan memrediksi hasil belajar siswa pada mata pelajaran tertentu.
Algoritma yang digunakan dalam penelitian ini ialah k-NN, salah satu algoritma dalam
data mining yang dapat digunakan untuk proses prediksi. Algoritma k-NN termasuk ke dalam
golongan algoritma supervised learning. Dimana tiap data dalam data latihnya sudah memiliki
label masing-masing yang merujuk pada baris data tersebut. Cara kerja algoritma ini adalah
dengan menghitung jarak kedekatan antara data uji dengan masing-masing data latih dan
memilih sejumlah k data latih terdekat, untuk kemudian menentukan label untuk data uji
berdasarkan label terbanyak yang muncul dari data latih terdekat yang telah dipilih [3].
Berdasarkan standar penilaian K-13, predikat suatu nilai mata pelajaran dibagi menjadi 4,
sangat baik (SB), baik (B), cukup (C) dan kurang (K). Hasil yang diharapkan dari penerapan ini
berupa prediksi nilai akhir suatu mata pelajaran yang disesuaikan dengan standar penilaian K-13
tersebut.
Sumber data yang digunakan dalam penelitian ini berjumlah 500 baris data. Terdiri dari
208 baris data nilai siswa SMKN 2 Pekanbaru dan 292 baris data yang ditambahkan karena
Rancang Bangun Aplikasi Data Mining
71
label yang ada dari data nilai siswa tidak menampung semua label yang dibutuhkan dalam
proses prediksi. Berdasarkan total data tersebut, diharapkan aplikasi data mining yang dibangun
dapat digunakan untuk memprediksi hasil belajar siswa dengan baik, dan membantu para wali
kelas maupun guru dalam proses input dan konversi nilai siswa serta membantu dalam memberi
peringatan bagi siswa yang diprediksi mendapat nilai dengan predikat kurang.
2. Penelitian Terdahulu
Penelitian mengenai data mining di bidang pendidikan (educational data mining) sudah
banyak diterapkan oleh para akademisi di berbagai institusi perguruan tinggi di dunia. Salah
satu dari penelitian tersebut ialah penelitian yang dilakukan dalam penelitian [4]. Penelitian
tersebut berfokus pada pemrediksian performa akademik para mahasiswa dengan menggunakan
tiga algoritma data mining, k-Means, Artificial Neural Network dan Decision Tree. Algoritma
k-Means digunakan untuk clustering data mahasiswa, membaginya ke dalam dua cluster atau
kelompok berdasarkan tingkat kemiripan antar data tersebut. Sementara itu, dua algoritma
klasifikasi yang digunakan dalam penelitian itu diterapkan untuk mengklasifikasikan data yang
sudah di-cluster.
Sumber data yang digunakan dalam penelitian [4] berasal dari data mahasiswa yang
disediakan oleh National Defence University of Malaysia (NDUM). Terdapat 85 data
mahasiswa untuk satu semester dalam periode 2008/2009 yang menjadi fokus dalam penelitian
tersebut. Sumber data tersebut dibagi menjadi dua bagian, data primer dan data sekunder.
Penelitian lain yang juga menerapkan data mining dalam bidang pendidikan ialah penelitian
yang telah dilakukan dalam penelitian [5]. Sumber data yang digunakan dalam penelitian
tersebut ialah data akademik di kampus Science and Technology Khanyounis yang menampung
data dalam periode lima belas tahun (1993-2007). Sumber data tersebut diolah untuk
mendapatkan jenis-jenis knowledge yang mungkin bisa dihasilkan dari teknik-teknik data
mining. Beberapa dari teknik tersebut yang difokuskan pada penelitian itu ialah association
rules, classification, clustering, dan outlier detection. Tujuan dari penelitian itu ialah untuk
memberikan bantuan kepada pihak manajemen akademik pada kampus tersebut untuk
mengatasi masalah pada mahasiswa yang memiliki nilai akademik yang rendah, dan juga untuk
meningkatkan performa akademik para mahasiswa.
Penelitian lain yang juga menerapkan educational data mining ialah yang dilakukan dalam
penelitian [6]. Para peneliti tersebut menerapkan teknik classification untuk memrediksi
performa mahasiswa. Sumber data dikumpulkan dari berbagai program studi yang ada di
kampus Dr. R. M. L. Awadh University periode 2009-2010. Jumlah data yang digunakan
mencapai 300 baris data yang terdiri dari 226 laki-laki dan 74 perempuan. Sementara itu,
algoritma yang digunakan dalam penelitian tersebut ialah Naive Bayes. Tujuan dari penelitian
tersebut ialah untuk meningkatkan performa mahasiswa tiap divisi dengan mengidentifikasi
mahasiswa mana yang harus diberi perhatian lebih untuk mengurangi rasio kegagalan dan
mengambil langkah tepat di waktu yang tepat.
72
Okta Riveranda
Tabel 1. Penelitian Terdahulu
Peneliti
Wook
(2009)
Tair (2012)
Teknik Data
Mining
Algoritma
Clustering
k-Means, Artificial
dan
Neural Network,
Classification dan Decision Tree.
Sumber data yang
digunakan
85 data mahasiswa
untuk satu semester
dalam periode
2008/2009
Keluaran
Kesimpulan terkait kemampuan
akademik mahasiswa
Association Rule Inducition, k3360 baris dan 18 Pembagian kelompok mahasiswa
Rules,
NN, k-Means,
atribut (kolom) untuk
berdasarkan kemampuan
Classification, Distance-based
24 program studi
akdemisnya
Clustering
Approach dan
komputer
dan Outlier
Density-based
Detection
Approach.
Baradwaj
dan Pal
(2011)
Classification
Naive Bayes
300 baris data yang
terdiri dari 226 lakilaki dan 74
perempuan
Peningkatan performa akademis
mahasiswa tiap divisi
Okta
Riveranda
(2015)
Classification
k-NN
Rincian nilai tiap
mata pelajaran
dengan jumlah 208
siswa SMKN 2
Pekanbaru dengan
tambahan 292 data
latih baru
Prediksi nilai akhir dalam bentuk
angka dan huruf pada masingmasing mata pelajaran
3. Metodologi Penelitian
Penelitian proyek akhir ini diawali dengan mengumpulkan sumber data untuk dijadikan
sebagai data latih sistem aplikasi. Data latih yang diperoleh tidak langsung diimport ke dalam
database, melainkan dilakukan tahap preprocessing dimana variabel-variabel yang tidak
digunakan dalam proses data mining dihilangkan. Setelah data latih siap diimport ke dalam
database, sistem aplikasi dikembangkan sedemikian rupa agar algoritma k-NN dapat berjalan
dengan semestinya. Tahap implementasi memungkinkan guru untuk melihat prediksi hasil
belajar siswa dengan variabel-variabel yang telah disiapkan untuk data uji. Adapun pada tahap
pengujian, dilakukan cross validation dengan mengambil beberapa sampel dari data latih untuk
dijadikan data uji dalam perhitungan akurasi algoritma dengan confusion matrix. Gambaran
umum dari deskripsi yang telah dijelaskan dapat dilihat pada Gambar 1.
Rancang Bangun Aplikasi Data Mining
73
Gambar 1. Gambaran Metodologi Penelitian Proyek Akhir
3.1
Pengumpulan Sumber Data
Sumber data diperoleh dari bagian akademik SMKN 2 Pekanbaru dalam bentuk flat file
yang terdiri dari hasil rekapitulasi nilai sejumlah 6 kelas pada jurusan Teknik Informatika. Tipe
data adalah numerik, sehingga tepat untuk menggunakan algoritma k-NN dalam rangka prediksi
hasil belajar para siswa.
Tabel 2. Sumber Data
No.
Kelas
Jumlah
1
X RPL
36 baris data
2
X TKJ 1
37 baris data
3
X TKJ 2
36 baris data
4
XI RPL
31 baris data
5
XI TKJ 1
33 baris data
6
XI TKJ 2
35 baris data
7
Data latih baru
292 baris data
Jumlah Total
500 baris data
74
Okta Riveranda
Penambahan data latih baru disebabkan karena data latih yang didapatkan dari pihak
SMKN 2 Pekanbaru tidak mampu memenuhi kebutuhan akan label yang ada. Terdapat 10 label
yang diambil berdasarkan variasi yang ada di dalam standar penilaian Kurikulum 2013. Labellabel tersebut ialah nilai ‘A’, ‘A-‘, ‘B+’, ‘B’, ‘B-‘, ‘C+’, ‘C’, ‘C-‘, ‘D+’, ‘D’. Sementara label
yang diperoleh hanya untuk nilai ‘A-‘, ‘B+’, dan ‘B’ saja. Oleh karena itu, diputuskanlah untuk
menambah data latih sebanyak 292 baris data yang menampung semua label tersebut.
3.2
Implementasi Algoritma K-NN
Algoritma k-NN adalah algoritma data mining yang digunakan untuk
mengklasifikasikan suatu data uji berdasarkan data latih yang ada untuk diketahui label atau
kelas dari data uji tersebut. Untuk mendapatkan label atau kelas yang dimaksud, algoritma ini
menggunakan euclidean distance untuk menghitung jarak dengan data latih atau tetangga
terdekat sejumlah k yang ditentukan [3]. Berikut ini adalah flowchart algoritma k-NN yang
menjelaskan bagaimana itu bekerja.
Gambar 2. Flowchart k-NN
3.3
Pengujian Confusion Matrix
Setelah dilakukan implementasi algoritma k-NN, penelitian dilanjutkan dengan menguji
tingkat akurasi algoritma berdasarkan recognition dengan tabel confusion matrix. Pengujian
dilakukan untuk mengetahui variansi akurasi algoritma berdasarkan perubahan pada nilai k
yaitu, dengan k-5, k-10 dan k-15. Oleh karena itu, pengujian ini melibatkan teknik cross
validation, dimana dari 500 data latih yang tersedia, diambil sebesar 30% atau 150 data untuk
dijadikan sebagai data uji. Setelah dilakukan pengujian tersebut, maka akan diperoleh hasil
akurasi dan kesimpulan berdasarkan variansi nilai akurasi yang didapat.
4. Hasil Perancangan dan Pengujian
4.1
Hasil Perancangan
4.1.1
Dasbor Kelas
Dasbor kelas adalah chart yang menampilkan informasi kelas yang diampu oleh
seorang guru berdasarkan mata pelajaran yang diampunya.
Rancang Bangun Aplikasi Data Mining
75
Gambar 3. Dasbor Detil Kelas
4.1.2
Dasbor Nilai
Dasbor nilai adalah sebuah chart yang di dalamnya terdapat informasi rata-rata nilai
harian, UTS, dan UAS pada masing-masing kelas untuk tiap mata pelajaran yang diampu oleh
seorang guru.
Gambar 4. Dasbor Nilai
4.1.3
Tabel Nilai Siswa
Tabel nilai menampilan data nilai siswa per kelas pada satu mata pelajaran tertentu.
Tabel ini bisa dilihat oleh guru mata pelajaran maupun wali kelas. Di tabel ini juga guru dapat
melihat hasil prediksi nilai akhir per siswa atau per kelas.
76
Okta Riveranda
Gambar 5. Tabel Nilai Siswa
4.1.4
Form Input Nilai Siswa
Form ini digunakan untuk mengisi nilai tiap siswa atau per kelas. Di form ini juga
ditampilkan hasil prediksi nilai akhir per siswa. Sementara untuk mendapatkan hasil prediksi
per kelas, terdapat tombol di atas di halaman guru mata pelajaran dan wali kelas untuk generate
hasilnya ke dalam bentuk excel file.
Gambar 6. Form Input Nilai Siswa
4.1.5
Hasil Prediksi Nilai Akhir
Tujuan utama dari proyek akhir ini adalah untuk melakukan prediksi nilai akhir siswa
berdasarkan variabel nilai yang telah ditentukan. Berikut ini adalah gambar dari hasil
perancangan sistem aplikasi berdasarkan tujuan dari proyek akhir ini dengan mengambil satu
contoh data siswa.
Rancang Bangun Aplikasi Data Mining
77
Gambar 7. Hasil Prediksi Nilai Akhir Per Siswa
4.2
Pengujian
4.2.1
Black Box Testing
Berikut ini adalah hasil pengujian dengan menggunakan teknik-teknik dalam metode
pengujian black box testing [7]:
1. Equivalence Class Partitioning
Objek yang diuji adalah form input nilai pada masing-masing siswa yang ada di
halaman guru di menu Akademik. Berikut ini adalah partisi-partisi kelas valid dan
invalid dari pilihan jenis input yang ada.
Tabel 3. Partisi Kelas
No.
1
2
3
4
5
6
7
8
9
10
Nama Kelas/Partisi
Angka I
Angka II
Angka III
Huruf I
Huruf II
Alpanumerik I
Alpanumerik II
Karakter Spesial
Angka dengan koma
Angka dengan titik
Validitas
Valid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Valid
Item
0, 1, 2 ... 100
-1, -2, -3 ...
101, 102, ...
a, b, c ... z
A, B, C ... Z
a1, a2, a3 ...
A1, A2, A3 ...
&, ^, * ...
80,5;90,7;...
90.5; 95.8; ...
Dengan menggunakan teknik ini, pengujian input akan jauh lebih mudah dan
menghemat cost (waktu dan tenaga). Hal ini dikarenakan adanya ekivalensi nilai intra
partisi. Hanya dengan mengambil salah satu dari item di masing-masing partisi, hasil
dari pengujian akan selalu sama untuk tiap item yang ada pada kelas/partisi tersebut.
Berikut ini adalah contoh tes input yang mewakili masing-masing kelas/partisi.
78
Okta Riveranda
Tabel 4. Tes Input Nilai
No
1
2
3
4
5
6
7
8
9
10
Tes Input
85
-85
850
a
A
a85
A85
85*/
85,5
85.5
Hasil
T
F
F
F
F
F
F
F
F
T
Kelas/Partisi
1
2
3
4
5
6
7
8
9
10
2. Boundary Value Analysis
Berdasarkan kelas partisi yang telah dibuat di atas, didapatlah nilai batas atas dan
batas bawah dari tiap partisi sebagai berikut:
Tabel 5. Boundary Value Analysis
No.
Nama Kelas/Partisi
Tes input batas bawah
1
2
3
4
5
6
7
8
9
10
Angka I
Angka II
Angka III
Huruf I
Huruf II
Alpanumerik I
Alpanumerik II
Karakter Spesial
Angka dengan koma
Angka dengan titik
0
Tak terhingga
101
a
A
a1
A1
Tak ada batasan
0,0
0.0
Tes input batas
atas
100
-1
Tak Terhingga
z
Z
z[tak terhingga]
Z[tak terhingga]
Tak ada batasan
100,0
100.0
Validitas
Valid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Invalid
Valid
3. Decision Table Based-Testing
Di bawah ini adalah isi dari tabel yang dihasilkan oleh pengujian decision table
based-testing yang objek ujinya adalah form nilai di halaman guru dan
pengembangan aplikasi di halaman admin:
Rancang Bangun Aplikasi Data Mining
79
Tabel 6. Decision Table Based-Testing
Kondisi
Nilai harian 1 sudah
diinput
Nilai harian 2 sudah
diinput
Nilai harian 3 sudah
diinput
Nilai harian 4 sudah
diinput
Nilai mid sudah
diinput
Nilai UAS sudah
diinput
Hasil/Aksi yang
diharapkan
Prediksi hasil belajar
(Guru dan Wali
Kelas)
Upload nilai UAS
(Guru Mata
Pelajaran)
4.3
1
2
3
4
5
6
Rule
7
8
9
10
11
12
T
T
T
T
T
T
F
F
F
F
F
F
T
T
T
T
T
F
T
F
F
F
F
F
T
T
T
T
F
F
T
T
F
F
F
F
T
T
T
F
F
F
T
T
T
F
F
F
T
T
F
F
F
F
T
T
T
T
F
F
T
F
F
F
F
F
T
T
T
T
T
F
F
T
F
F
F
F
F
F
F
F
F
F
F
T
F
F
F
F
F
F
F
F
F
F
Confusion Matrix
Berikut ini adalah hasil pengujian akurasi algoritma k-NN dengan menggunakan
metode confusion matrix dengan nilai k = 5.
Tabel 7. Confusion Matrix dengan k = 5
true
B
true
B-
true
B+
true
A-
true
A
true
C+
true
C
true
C-
true
D+
true
D
class
precision
pred. B
110
20
23
0
0
0
0
0
0
0
70.51%
pred. B-
4
11
0
0
0
0
0
0
0
0
73.33%
pred. B+
11
0
25
0
0
0
0
0
0
0
69.44%
pred. A-
0
0
0
26
7
0
0
0
0
0
78.79%
pred. A
0
0
0
14
26
0
0
0
0
0
65%
pred. C+
0
5
0
0
0
44
2
0
0
0
86.27%
pred. C
0
0
0
0
0
0
22
8
0
0
73.33%
pred. C-
0
0
0
0
0
0
10
19
4
1
55.88%
pred. D+
0
0
0
0
0
0
2
10
52
17
64.20%
pred. D
0
0
0
0
0
0
0
0
6
18
Average Precision
75%
71.175%
Dari Tabel 7 di atas, dapat disimpulkan bahwa label dengan akurasi tertinggi adalah
label untuk nilai huruf C+ dengan akurasi mencapai 86.27%. Sementara label dengan akurasi
terendah adalah label untuk nilai huruf C- dengan persentase 55.88%. Rata – rata presisi label
dengan pengujian k = 5 adalah sebesar 71.175%. Pengujian dilanjutkan dengan menguji akurasi
algoritma k-NN dengan nilai k = 10. Berikut penjelasannya pada Tabel 8.
80
Okta Riveranda
Tabel 8. Confusion Matrix dengan k = 10
true
B
true
B-
true
B+
true
A-
true
A
true
C+
true
C
true
C-
true
D+
true
D
class
precision
pred. B
107
21
4
3
0
0
0
0
0
0
64.85%
pred. B-
2
10
0
0
0
0
0
0
0
0
83.33%
pred. B+
16
0
14
0
0
0
0
0
0
0
46.67%
pred. A-
0
0
0
28
6
0
0
0
0
0
82.35%
pred. A
0
0
0
2
27
0
0
0
0
0
69.23%
pred. C+
0
5
0
0
0
44
3
0
0
0
84.62%
pred. C
0
0
0
0
0
0
23
7
0
0
76.67%
pred. C-
0
0
0
0
0
0
8
20
3
0
64.52%
pred. D+
0
0
0
0
0
0
2
10
55
23
61.11%
pred. D
0
0
0
0
0
0
0
0
4
13
Average Precision
76.47%
70.982%
Berdasarkan hasil dari pengujian pada Tabel 8, diketahui bahwa akurasi tertinggi
dicapai oleh label untuk nilai huruf C+ dengan persentase 84.62%. Sementara label dengan
akurasi terendah didapat oleh label untuk nilai huruf B+ dengan persentase 46.67%. Rata – rata
presisi label dengan k = 10 adalah sebesar 70.982%. Pengujian dilanjutkan lagi dengan
menggunakan nilai k = 15. Berikut ini adalah hasil dari pengujian ketiga.
Tabel 9. Confusion Matrix dengan k =15
true
B
true
B-
true
B+
true
A-
true
A
true
C+
true
C
true
C-
true
D+
true
D
class
precision
pred. B
107
1
5
2
0
0
0
0
0
0
64.85%
pred. B-
6
10
0
0
0
0
0
0
0
0
62.50%
pred. B+
12
0
12
1
0
0
0
0
0
0
48.00%
pred. A-
0
0
1
29
4
0
0
0
0
0
85.29%
pred. A
0
0
0
11
29
0
0
0
0
0
72.50%
pred. C+
0
5
0
0
0
44
4
0
0
0
83.02%
pred. C
0
0
0
0
0
0
20
7
0
0
74.07%
pred. C-
0
0
0
0
0
0
10
19
4
0
57.58%
pred. D+
0
0
0
0
0
0
2
11
53
20
61.63%
pred. D
0
0
0
0
0
0
0
0
5
16
76.19%
Average Precision
68.563%
Melihat hasil pengujian pada Tabel 9 diperoleh informasi sebagai berikut. Akurasi
tertinggi dimiliki oleh label untuk nilai huruf A- dengan akurasi mencapai 85.29%. Sementara
itu, akurasi terendah dimiliki oleh label untuk nilai huruf B+ dengan akurasi 48%. Rata – rata
presisi label dengan k = 15 adalah sebesar 68.563%.
5. Kesimpulan
Berdasarkan hasil pengujian yang telah dilakukan, didapatlah kesimpulan bahwa dengan
jumlah data latih sebanyak 500 baris data, penentuan nilai k = 5 adalah pilihan yang tepat untuk
Rancang Bangun Aplikasi Data Mining
81
memperoleh akurasi yang lebih tinggi dengan rata – rata presisi label sebesar 71.175%. Selain
itu, pengujian dengan menggunakan teknik black box testing juga dapat membantu para
pengembang dalam menganalisis kesalahan yang mungkin muncul dari sistem aplikasi yang
dibangun. Kemudian, setelah dilakukan pengisian kuesioner kepada 10 responden, diperoleh
hasil berdasarkan rating scale sebesar 82%, dimana nilai tersebut berada diantara skala setuju
dan sangat setuju. Sehingga dapat disimpulkan bahwa aplikasi yang telah dibangun dapat
mempermudah guru maupun wali kelas dalam proses input dan konversi nilai.
Daftar Pustaka
[1]. I.L. Pasaribu dan B. Simandjuntak. 1983. Metode Belajar dan Kesulitan Belajar.
Bandung. Tarsito.
[2]. Kementerian Pendidikan dan Kebudayaan R.I Bidang Pendidikan Periode 2009-2014.
2013. Konsep dan Implementasi Kurikulum 2013. Jakarta.
[3]. Han, Jiawei & Kamber, Micheline. 2006. Data Mining: Concepts and Techniques
Second Edition. San Fransisco. Morgan Kauffman Publisher.
[4]. Wook dkk. 2009. Predicting NDUM Student's Academic Performance Using Data
Mining Techniques. IEEE Computer Society Journal
[5]. M. Abu Tair, Mohammed & M. El-Halees Alaa. 2012. Mining Educational Data to
Improve Student's Performance. International Journal of Information and
Communication Technology Research, Vol. 2 No. 2.
[6]. K. Baradwaj, Brijesh & Pal, Saurabh. 2011. Mining Educational Data to Analyze
Students' Performance. International Journal of Advanced Computer Science and
Applications, Vol 2, No. 6.Tabel 0.1.1
[7]. Burnstein, Ilene. 2002. Practical Software Testing. New York. Springer.
82
Okta Riveranda
Download