aplikasi data mining untuk memprediksi kelulusan

advertisement
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
APLIKASI DATA MINING UNTUK MEMPREDIKSI
KELULUSAN SISWA JURUSAN IPA MAN 3 PADANG
Eka Praja Wiyata Mandala, S.Kom, M.Kom, Rahmatino, S.Kom
Teknik Informatika,Fakultas Ilmu Komputer Universitas Putra Indonesia “YPTK” Padang
email:[email protected], email:[email protected]
Abstract –This study aims to prediction the graduate of Student IPA in the MAN 3 Padang by using a
decision tree method be represented using PHP dan MySQL programming. Theory used in this study
is the theory associated with the data Mining. The steps are data collection techniques used to
interview and students data on 2012/2013 years.
On this analysis method describes the UML Unified Modelling Language (UML) is a "language"
that has become standard in the industry to specify, visualize, design and document the artifacts of
software systems, to model the business and non-software systems MySQL is an application or other
system to manage the database or data management. PHP programming language is used, and also
describes a method of decision tree by C4.5 algorithm.
Keywords: Data Mining, UML, Decision tree, C4.5 Algorithm
PENDAHULUAN
Pemanfaatan data yang ada di dalam
sistem informasi untuk menunjang kegiatan
pengambilan keputusan, tidak cukup hanya
mengandalkan
data
operasional
saja,
diperlukan
suatu analisis
data
untuk
menggali potensi-potensi informasi yang
ada.
Sistem
mengenai
kelulusan
yang
diterapkan pemerintah saat ini menyebabkan
ketidakpastian akan kelulusan siswa yang
menyebabkan kegelisahan bagi para siswa
maupun guru. Dengan adanya sistem baru
yang diterapkan oleh pemerintah ini
menyebabkan masyarakat khususnya pihak
sekolah kesulitan dalam memprediksi
kelulusan siswa/i mereka.
Pada penelitian ini, dirumuskan beberapa
permasalahan sebagai berikut :
1. Bagaimana merancang aplikasi data
mining dapat memprediksi kelulusan siswa
jurusan IPA di MAN 3 Padang ?
2. Bagaimana membuat sebuah aplikasi data
mining yang dapat menyajikan data secara
cepat?
3. Bagaimana aplikasi data mining dapat
dijadikan sebagai penunjang keputusan
yang akurat?
4. Bagaimana aplikasi data mining mampu
menghasilkan pengetahuan-pengetahuan
yang baru berupa informasi yang
bermanfaat?
Tujuan yang ingin dicapai dari
pelaksanaan
dan penulisan penelitian ini adalah
Aplikasi Data Mining Untuk . . .
menghasilkan aplikasi untuk mendapatkan
informasi yang berguna untuk memprediksi
kelulusan siswa jurusan IPA di MAN 3
Padang
dengan teknik data mining dan algoritma
c.45.
LANDASAN TEORI
Perangkat lunak (Software) adalah
program komputer yang terasosiasi dengan
dokumentasi
perangakt
lunak
seperti
dokumentasi kebutuhan, model design dan
cara penggunaaan (user manual). Sebuah
program komputer tanpa terasosiasi dengan
dokumentasinya maka belum dapat dikatakan
perangkat lunak (Softwawe). sebuah perangkat
lunak juga disebut dengan sistem perangkat
lunak. Sistem berarti kumpulan komponen
yang saling terkait dan mempunyai satu tujuan
yang ingin dicapai (Rosa dan Shalahuddin,
2011).
Karakter perankat lunak dalah sebagai
berikut (Rosa dan Shalahuddin, 2011):
a. Perangkat
lunak
dibangun dengan
rekayasa (software engineering) bukan
diproduksi secara manufaktur atau
pabrikan.
b. Perangkat lunak tidak pernah usang ("wear
over") karena kecacatan dalam perangkat
lunak dapat diperbaiki.
c. Barang produksi pabrikan biasanya
komponen barunya akan terus diproduksi,
sedangkan perangkat lunak biasanya terus
diperbaiki
seiring
bertambahnya
kebutuhan.
22
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
Model Software Development Life Cicle
(SDLC) air terjun (waterfall) sering juga
disebut model sekuensial linear(sequential
linear) atau alur hidup klasik. model air terjun
menyediakan pendekatan alur hidup perangkat
lunak secara sekuensial atau berturut-turut
dimuli dari analisis , desain, pengodean,
pengujian, dan tahap pendukung (support)
(Rosa dan Shalahuddin, 2011).
Berikut adalah gambar model air terjun :
Sumber : Rosa dan Shalahuddin, 2011
Gambar 1 Ilustrasi Model Waterfall
Unified Modelling Language(UML)
merupakan bahasa visual untuk pemodelan
dan komunikasi mengenai sebuah sistem
dengan menggunakan diagram dan teks-teks
pendukung. UML hanya berfungsi untuk
melakukan pmodelan. Jadi penggunaan UML
tidak terbatas pada metodologi tertentu,
meskipun pada kenyataannya UML paling
banyak
digunakan
pada
metodologi
berorientasi objek (Rosa dan Shalahuddin,
2011).
Use case diagram atau diagram use case
merupakan pemodelan untuk kelakuan
(behavior) sistem informasi yang akan
dibuat.Use case merupakan mendeskripsikan
sebuah interaksi antara satu atau lebih actor
dengan sistem informasi yang akan dibuat.
Secara kasar, use case digunakan untuk
mengetahui fungsi apa saja yang ada dalam
sebuah sistem informasi dan siapa saja yang
berhak menggunakan fungsi-fungsi itu (Rosa
dan Shalahuddin, 2011).
Diagram kelas atau class diagram
menggambarkan struktur sistem dari segi
pendefenisisan kelas-kelas yang akan dibuat
untuk membangun sistem (Rosa dan
Shalahuddin, 2011).
State machine diagram atau dalam bahasa
Indonesia disebut diagram status digunakan
untuk menggambarkan prubahan status atau
transisi status dari sebuah sistem atau mesin.
Perubahan tersebut digambarkan dalam suatu
graf berarah. State machine diagram
merupakan pengembangan dari diagrm finite
state automata dengan penambahan beberapa
fitur dan konsep baru (Rosa dan Shalahuddin,
2011).
Aplikasi Data Mining Untuk . . .
ISSN :1412-5854
Activity diagram adalah teknik untuk
mendiskripsikan logika procedural, proses
bisnis dan aliran kerja dalam banyak kasus.
Activity diagram mempunyai peran seperti
halnya flowchart, akan tetapi perbedaannya
dengan flowchart adalah activitas diagram
bias mendukung perilk parallel sedangkan
flowchart tidak bias (Munawar, 2005)
Sequence diagram digunakan untuk
menggambarkan perilaku pada sebuah
scenario. Diagram ini menunjukkan sejumlah
contoh objek dalam message (pesan) yang
diletakkan diantara objek-objek ini didalam
use case (Munawar, 2005).
Collabrationdiagram adalah perluasan
dari objek diagram. (Objek diagram
menentukan objek-objek dan hubungnnya satu
sama
lain).
Collaboration
diagram
menunjukkan message-message objek yang
dikirimkan satu sama lain (Munawar, 2005)
Deployement diagrammenunjukkan tata
letak
sebuah
sistem
secara
fisik,
menampakkan bagian-bagian software yang
berjalan pada bagian-bagian hardware
(Munawar, 2005).
Data mining juga disebut sebagai
serangkaian proses untuk menggali nilai
tambah berupa pengetahuan yang selama ini
tidak diketahui secara manual dari suatu
kumpulan data (Pramudiono, 2006 / Kusrini
dan Luthfi, 2009).
Data mining sering juga disebut sebagai
knowledge discovery in database (KDD).
KDD adalah kegiatan yang meliputi
pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan
dalam set data berukuran besar (Santosa,
2007).
Dalam klasifikasi, keluaran dari dari
setiap data adalah bilangan bulat atau disktrit.
Dalam contoh pengambilan keputusan untuk
main bola atau tidak maka keuaran tersebut
bias diubah ke bilangan bulat 1 atau -1.
Dengan melihat keluaran yang berupa
bilangan bulat kita bias menerapkan metod
klasifikasi (Santosa, 2007).
Dalam decision tree tidak menggunakan
vector jarak untuk mengklasifikasikan obyek.
Seringkali data observasi mempunyai atributatribut yang bernilai nominal. Seperti yang
diilustrasikan, misalkan obyeknya adalah
sekumpulan buah-buahan yang bisa dibedakan
berdasarkan atribut bentuk, warna, ukuran dan
23
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
rasa. Bentuk, warna, ukuran dan rasa adalah
besaran nominal, yaitu bersifat kategoris dan
tiap nilai tidak bisa dijumlahkan atau
dikurangkan. Dalam atribut warna ada
beberapa nilai yang mungkin yaitu hijau,
kuning, merah. Dalam atribut ukuran ada nilai
besar, sedang dan kecil. Dengan nilai-nilai
atribut ini, kemudian dibuat decision tree
untuk menentukan suatu obyek termasuk jenis
buah apa jika nilai tiap-tiap atribut diberikan
(Santosa, 2007).
Decision tree sesuai digunakan untuk
kasus-kasus yang keluarannya bernilai diskrit.
Walaupun banyak variasi model decision tree
dengan tingkat kemampuan dan syarat yang
berbeda, pada umumnya beberapa ciri yang
cocok untuk diterapkannya decision tree
adalah sebagai berikut(Santosa, 2007).
Algoritma c4.5 merupakan algoritma
yang dignakan untuk membentuk pohon
keputusan (Kusrini dan Luthfi, 2009).
Pohon keputusan merupakan metode
klasifikasi dan metode prediksi yang sangat
kuat dan terkenal. Metode pohon keputusan
mengubah fakta yng sangat besar menjadi
pohonkeputusanyng sangat dapat dengan
mudah dipahami dengan bahasa alami. Dan
mereka juga dapat diekspreikan dalam bentuk
bahasa basis data seperti structured query
language untuk mencarirecord pada kategori
tertentu (Kusrini dan Luthfi, 2009).
Secara umum algoritma C4.5 untuk
membangun pohon keputusan adalah sebagai
berikut:
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Bagi kasus dalam cabang
4. Ulangi proses untuk masing-masing
cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
Untuk perhitungan nilai entrophy dapat
dilihat pada persamaan sebagai berikut:
Entropy(S)
𝑛
𝑖=1 −𝑝𝑖
ISSN :1412-5854
gain digunakan rumus seperti tertera dalam
persamaan berikut:
𝑛
Gain(S,A)=Entropy(S)-
│𝑆𝑖│
𝑖=1 │𝑆│
∗ πΈπ‘›π‘‘π‘Ÿπ‘œπ‘π‘¦(𝑆𝑖)
Keterangan :
S : himpunan kasus
A : atribut
n : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus dalam S
Menurut permendikbud (2011), Siswa
dinyatakan lulus dari Sekolah setelah:
a. menyelesaikan
seluruh
program
pembelajaran;
b. memperoleh nilai minimal baik pada
penilaian akhir untuk seluruh mata
pelajaran yang terdiri atas kelompok
mata pelajaran
a) agama dan akhlak mulia;
b) kelompok
mata
pelajaran
kewarganegaraan
dan
kepribadian;
c) kelompok mata pelajaran estetika,
dan
d) kelompok mata pelajaran jasmani,
olah raga, dan kesehatan;
c. lulus US/M untuk kelompok mata
pelajaran
ilmu
pengetahuan
dan
teknologi; dan
d. lulus UN.
PHP adalah singkatan dari personal home
page yang merupakan bahasa standaryang
digunakandalamduniawebsite.PHPadalahbahas
apemrogramanyang berbentuk script yang
diletakkan didalam web server. Ada beberapa
pengertian tentangPHP, akan tetapi PHP dapat
diartikan sebagai hypertext preeprocessor. Ini
merupakan bahasa yang hanya dapat berjalan
pada server yang hasilnya dapat ditampilkan
pada
klien.
Interpreter
PHP
dalam
mengeksekusi kode PHP pada sisi server
disebut serverside, berbeda dengan mesin
maya java yang mengeksekusi program pada
sisi
klien(client-server).(Kasiman
Peranginangin, 2009).
∗ π‘™π‘œπ‘”2 𝑝𝑖
Keterangan :
S : himpunan kasus
A : fitur
n : jumlah partisi S
pi : proporsi dari Si terhadap S
Untuk memilih atribut sebagai akar,
didasarkan pada nilai gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung
Aplikasi Data Mining Untuk . . .
MySQL
merupakan
softwaresystem
manajemen
database
Database
ManagementSystem–
DBMS)yangsangatpopulardikalanganpemrogra
manweb, terutama di lingkunganLinux dengan
menggunakan
skrip
dan
ped.
FungsiMySQLdapatdikatakansebagaiinterprete
rquery,karenasetiapkita
menggunakanquerySQL
kitaharusmeletakkannyadidalamfungsiini.Deng
ankata lain, SQL tidak dapat dijadikan tanpa
24
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
adanya fungsi MySQL. MySQL termasuk jenis
relational database management system
(RDBMS). Sehingga istilah seperti tabel, baris
dan kolom tetap digunakan dalam MySQL.
Pada MySQL sebuah database mengandung
beberapa tabel, tabel terdiri dari sejumlah baris
dan kolom.
Gambar 2 Tampilan Login
HASILDANPEMBAHASAN
Setelah
dilakukan
analisa
seperti
penjelaskan sebelumnya, maka sampailah
pada langkah selanjutnya yaitu tahap
implementasi. Implementasi ini merupakan
tahap penerapan atau tahap daur hidup
pengembangan sistem
yang telah dibuat
apakah sistem sudah berjalan dengan benar
serta juga merupakan uji coba langsung cara
menjalankan sistem bagi Waka Kurikulum.
Dalam tahap ini, implementasi
dilakukan untuk menentukan bagaimana cara
menganalisa kepuasan Pengguna terhadap
tingkat system yang telah dirancang. Setelah
itu akan ditentukan rule-rule yang akan
mendukung proses pengujian dari data yang
akan diproses serta dengan uji coba langsung
bagaimana cara menjalankan sistem bagi
Waka Kurikulum. Dalam tahap ini
berlangsung beberapa aktivitas secara
berurutan yaitu mulai dari menerapkan
rencana implementasi, melakukan kegiatan
implementasi, dan tindak lanjut implementasi.
Pengujian data akan dilakukan dengan
menggunakan PHP dan MySql.
Implementasi bisa diartikan pelaksanaan
atau penerapan atau juga dapat disebut sebagai
proses untuk melaksanakan ide, program atau
seperangkat aktivitas baru dengan harapan
orang lain dapat menerima atau melakukan
perubahan.
Maka
dalam
melakukan
implementasi
diperlukan
tempat
atau
lingkungan implementasi.
Tampilan program yaitu merupakan yang
menjelaskan tentang proses dimulainya
sampai program ini selesai di eksekusi, pointpoint pada sub bab ini akan menjelaskan
tentang bagaimana sebuah form dijalankan
dan apa saja fungsi yang terdapat pada form
tersebut.
1.
Login
LoginMerupakan halaman yang pertama
kali ditampilkan ketika mengakses sistem.
Pada halaman utama terdapat terdapat
beberapa tombol, diantaranya adanya tombol
login untuk akses masuk. Halaman utama
dapat digambarkan sebagai berikut :
Aplikasi Data Mining Untuk . . .
2.
Menu Utama
Menu utamaMerupakan halaman yang
pertama kali ditampilkan ketika Waka
Kurikulum telah berhasil login. Pada halaman
utama terdapat 6 menu, diantaranya adanya
menu Home, Data Siswa, Proses Mining,
Perhitungan Mining, Pohon Keputusan,dan
Log Out.
Halaman utama dapat digambarkan
seperti gambar berikut :
Gambar 3 Tampilan Menu Utama
3.
Data Siswa
Pada form ini, Waka Kurikulum dapat
melihat data siswa yang telah ada, serta Waka
Kurikulum Dapat melakukan Print Pohon
Hapus semua data, Browse, data, Import Data,
dan Input Data.
Gambar 4 Tampilan Data Siswa
4.
Input Data
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
input data siswa.
25
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
menu Decision perhitungan C4.5. Halaman ini
digunakan untuk melihat proses data mining
Gambar 5 Input Data
Form Browse Data
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
browse data.
Gambar9 Perhitungan C4.5
5.
Gambar 6 Browse Data
Form Impor Data
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
import data.
9.
Form Pohon Keputusan
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
menu Decision Tree. Halaman ini digunakan
untuk melakukan pengujian terhadap data
yang telah di proses.
6.
Gambar 10 Pohon Keputusan
10. Form Print Data Siswa
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
print data siswa.
Gambar 7 Import Data
7.
Form Proses Mining
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
menu Proses Mining.
Gambar 11 Print Data Siswa
11. Form Print Pohon Keputusan
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
print pohon Keputusan.
Gambar 8 Proses Mining
8.
Form Perhitungan C4.5
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum memilih
Aplikasi Data Mining Untuk . . .
Gambar 12 Print Pohon
Keputusan
26
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
12. Form Laporan Data Siswa
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum melihat
hasil dari print data siswa.
Keterbatasan Sistem
Dari penjelasan sebelumnya terlihat
bahwa aplikasi ini tidak sempurna. Pada
aplikasi data mining untuk mencari keputusan
dengan menggunakan metode algoritma C.45
ini memiliki beberapa keterbatasan sistem
yang juga merupakan keterbatasan bagi
penulis sebagai berikut:.
1.
Gambar 13 Laporan Data Siswa
13. Form Laporan Print Pohon Keputusan
Halaman ini merupakan halaman yang
akan muncul saat Waka Kurikulum melihat
hasil print Pohon Keputusan.
ISSN :1412-5854
2.
3.
Aplikasi data mining untuk mencari
keputusanmenggunakan
metode
algoritma C.45 ini hanya bisa digunakan
untuk memprediksi jurusan IPA saja.
Aplikasi data mining ini tidak bisa
mevisualisasikan pohon keputusan ke
dalam bentuk gambar.
Aplikasi data mining ini tidak bisa
mengambil data selain dalam format.xls
Saran
Dari penelitian yang telah dilakukan dan
sebagai akhir dari penulisan
ini, dapat
memberikan saran-saran dengan harapan akan
berguna
bagi
pihak
sekolah
guna
meningkatkan prestasi siswa. Saran-saran
yang dikemukakan adalah sebagai berikut :
Gambar 14 Laporan Pohon
Keputusan
KESIMPULAN
Kesimpulan
Dari uraian bab-bab sebelumnya maka
dapat ditarik suatu kesimpulan mengenai
perancangan dan implementasi aplikasi data
mining
untuk
mencari
keputusan
menggunakan metode algoritma C.45 sebagai
berikut :
1.
2.
3.
4.
Pihak sekolah dapat memprediksikan
kelulusan seorang siswa dengan metode
decision tree menggunakan algoritma
C4.5
dengan
atribut-atibut
yang
digunakan antara lain, nilai mid, nilai pra
un, nilai afektif, nilai psikomotor..
Pihak sekolah dapat memprediksi
kelulusan siswa dengan lebih cepat dan
efisien karena data siswa telah tersistem.
Membantu pihak sekolah menghindari
kesalahan dalam pengisian data karena
data dapat diambil dalam file yang
berformat.xls.
Menghasilkan pengetahuan-pengetahuan
yang baru berupa informasi yang
bermanfaat bagi pihak sekolah bahwa
kelulusan seorang siswa dapat diprediksi
melalui
aplikasi
data
mining
menggunakan metode decision tree serta
algoritma C4.5.
Aplikasi Data Mining Untuk . . .
1. Diharapkan adanya penelitian lebih lanjut,
karena ada beberapa bagian yang tidak
dibahas karena batasan waktu dan batasan
dari permasalahan yang telah diterapkan
sebelumnya.
2. Diharapkan
pada
pengembangan
selanjutnya aplikasi data mining ini dapat
menampilkan visualisasi berupa graph
pada pohon keputusan.
3. Diperlukan maintenance terhadap program
aplikasi yang telah dibuat, supaya dapat di
gunakan secara berkelanjutan selama
kebutuhan terhadap informasi.
DAFTARREFERENSI
[1] Haviluddin.
2011.
Memahami
Penggunaan UML (Unified Modelling
Language). Samarinda.
[2] Jalote, Pankaj. 2008. A Concise
Introduction to Software Engineering.
Springer. New Delhi
[3] Kusnawi. 2007. Pengantar Solusi Data
Mining.Yogyakarta
[4] Kusrini dan Emha Taufiq Luthfi. 2009.
Algoritma Data Mining. Penerbit Andi
Offset, Yogyakarta.
[5] Mulyanto, Aunur R. 2009. Rekayasa
Perangkat Lunak Jilid I. Departemen
Pendidikan Nasional, Jakarta.
[6] Munawar. 2005. Pemodelan Visual
dengan UML. Graha Ilmu, Yogyakarta.
27
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
[7] Pressman, Roger S. 2001. Software
Engineering. McGraw-Hill. New York.
[8] Rosa Ariani dan M. Shalahuddin. 2011.
Modul
Pembelajaran
Rekayasa
Perangkat lunak. Modula. Bandung
[9] Santosa, Budi. 2007. Data Mining :
Teknik Pemanfaatan Data untuk
keperluan
Bisnis.
Graha
Ilmu.
Yogyakarta.
[10] Sulistyorini, Prastuti. 2009.Pemodelan
Visual dengan Menggunakan UML dan
Rational Rose. Jurnal Teknologi
Informasi XIV, 23 – 29.
Aplikasi Data Mining Untuk . . .
28
Download