BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang
Pendidikan adalah salah satu bagian paling penting dikehidupan
manusia, yang dapat membedakan perilaku dan tata cara sikap manusia
dengan makhluk hidup lainnya. Pendidikan juga dapat mengembangkan pola
fikir dan potensi manusia melalui proses pembelajaran [1]. Pendidikan
memilik beberapa tahapan salah satunya yaitu Sekolah Menengah Atas
(SMA).
Sekolah Menengah Atas (SMA) merupakan salah satu tahapan
pendidikan setelah menyelesaikan Sekaloh Menengah Pertama (SMP) atau
Madrasah Tsanawiyah (MTs) selama 3 tahun. Ada pula beberapa jurusan
yang di miliki oleh Sekolah Menengah Atas (SMA) yaitu Ilmu Pengetahuan
Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Di era kurikulum baru 2013
sekarang penjurusan dilakukan saat memasuki kelas X atau bisa dibilang juga
saat pendaftaran SMA, berbeda dengan kurikulum 2003 yang dilakukan
diwaktu di kelas X. Guru pun belum bisa mengukur kemampuan siswa dari
segi bakat dan akademik. Kadang kala guru hanya mengukur dari segi nilai
rapor atau ranking di kelas, serta dengan mengisi angket penjurusan. Dengan
itulah para guru dapat menyimpulkan pengelompokan siswa. Hal ini tentunya
menyulitkan siswa untuk masuk ke jurusan sesuai dengan bakatnya [1],
begitu sulit dalam menentukan siswa mana yang memenuhi kriteria untuk
menempati jurusan tertentu, yang akan dipilih siswa-siswi sesuai dengan
kemampuannya untuk menentukan masa depan [2]. Dengan begitu siswasiswi membutuhkan keputusan dalam menentukan jurusan yang akan
diambilnya kelak [3]. Dengan keputusan yang akan diambil siswa-siswi harus
melakukan proses mengolah data-data yang dapat menghasilkan hasil
akhirnya, dan kesalahan dalam penjurusan adalah rendahnya prestasi belajar
1
siswa atau dapat menyebabkan terjadinya ketidakcocokan dengan jurusan
yang sudah dipilih oleh siswa atau siswi sebelumnya [4].
Di SMA Negeri 3 Pati memiliki beberapa persyaratan untuk peminatan
penjurusan. Pertama dengan mengumpulkan hasil rapot SMP atau MTs dari
kelas 7 sampai kelas 9. Kedua mengumpulkan hasil Ujian Nasional SMP atau
MTs. Dan yang ketiga mengumpulkan angket peminatan yang telah diberikan
SMA Negeri 3 Pati kepada calon siwa SMA. Tapi di tahun sebelumnya para
siswa merasakan bahwa para siswa salah peminatan dikarenakan salah
presepsi atau karena ikut-ikutan dengan temannya, menuruti kehendak atau
disuruh orang tua atau tidak sesuai dengan kesesuaian para siswa.
Di proses penjurusan pasti mempunyai data yang lebih dari 500 data,
jadi selama ini para gurulah yang menyatakan keputusan akan diletakakan
dimanakah siswa tersebut. Sebab guru yang mengetahui para siswanya dari
sisi bakat, kemampuan dan minta siswanya. Jadi dengan adanya
permasalahan yang mencakup diatas maka dibutuhkan suatu implementasi
yang dapat meminimalisirkan keputusan secara cepat, tepat dan efisien serta
menghemat tenaga, waku dan biaya.
Dalam proses penilaian dapat dibantu dengan teknik data mining agar
mempermudah pihak sekolah untuk mengetahui kemampuan pada siswasiswinya. Oleh karena itu sangat dibutuhkan sistem informasi yang berbasis
destop yang akan memberi solusi untuk masalah pengelompokan penjurusan
IPA ataupun IPS. Data mining itu sendiri sangat membantu dalam
mengelolah sejumlah data yang begitu banyak untuk menghasilkan hasil yang
akurat. Teknik data mining yang akan digunakan dalam pengelompokan
penjurusan dengan metode algoritma K-Means.
Algoritma K-Means itu sendiri adalah pengelompokan suatu data dari
sejumlah kelompok data yang memiliki batas-batasan nilai pengelompokan.
Manfaat dari menggunakan algoritma K-Means adalah mempermudah
pengambilan keputusan yang sangat kompleks terlebih menjadi lebih akurat,
sehingga pengambilan keputusan pun tidak menjadi masalah. Seperti yang
pernah dilakukan peneliti sebelumnya oleh Silvi Agustina, Dhimas Yhudo,
2
hadi Santoso, Nofiadi Marnasusanto, Arif Tirtana dan Fakhris Khusnu
“Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan Metode KMeans”[5].
Dalam
penelitian
tersebut
K-Means
didukung
hasil
perbandingannya yang lebih akurat.
Dengan menggunakan metode algoritma K-Means dapat menarik judul
“IMPLEMENTASI
DATA
MINING
UNTUK
PENENTUAN
PEMINATAN JURUSAN DENGAN ALGORITMA K-MEANS PADA
SISWA SMA NEGERI 3 PATI”.
1.2
Rumusan Masalah
Berdasarkan uraian latar belakang maka dapat mengambil rumusan
masalah sebagai berikut :
Bagaimana
menerapkan
metode
algoritma
K-Means
dalam
pengelompokan siswa-siswi berdasarkan nilai rapot mata pelajaran yang
mempersyaratkan sebagai pemilihan jurusan yang sesuai dengan nilai
kemampuan siswa-siswi.
1.3
Batasan Masalah
Batasan-batasan masalah yang dimiliki anatara lain :
1. Penelitian dilakukan untuk para siswa-siswi SMA Negeri 3 Pati.
2. Penelitian menggunakan nilai rapot SMP/MTs dan hasil nilai UN.
3. Penelitian menggunakan data pengisian angket peminatan penjurusan.
4. Penelitian menggunakan aplikasi matlab 2013.
1.4
Tujuan Masalah
Berdasarkan rumusan masalah maka dapat mengambil tujuan masalah
yaitu :
3
Mengimplementasikan metode algoritma K-Means kedalam kasus
pengklastering siswa-siswi berdasarkan nilai rapot mata pelajaran untuk
pemilihan jurusan.
1.5
Manfaat Penelitian
Manfaat penelitian dapat diambil sebagai berikut :
1. Bagi penulis, penelitian ini dapat berguna untuk menambahkan
wawasan mengenai data mining menggunakan metode algoritma KMeans dan penerapannya.
2. Bagi SMA Negeri 3 Pati, penelitian ini merupakan salah satu upaya
untuk dapat membantu siswa-siswinya dalam memilh jurusan yang
tepat.
3. Hasil dari penelitian ini juga dapat dimanfaatkan sebagai referensi
untuk penelitian selanjutnya.
4
BAB II
TINJAUAN PUSTAKA DAN LANDASAN TEORI
2.1
Tinjauan Penelitian
Dalam penelitian pengelompokan yang betujuan untuk pemilihan
jurusan bukan untuk yang pertama melainkan telah dilakukan pada
sebelumnya. Beberapa penelitian yang telah dilakukan sebelumnya :
1. “Implementasi Algoritma K-Means Clustering Untuk Menentukan
Strategi Marketing Presindent University” [6] yang menyimpulkan
bahwa tim marketing melakukan promosi dengan pengiriman sesuai
dengantujuan yang paling banyak diminati, serta berdasarkan titik
kemampuan akademik mahasiswa yang akan diadakan promosi ke
kota-kota Indonesia.
2. “Clutering
Lulusan
Mahasiswa
Matematika
FMIPA
UNTAN
Pontianak Menggunakan Algoritma Fuzzy K-Means” [7] yang
menyimpulkan kelulusan mahasiswa dengan 33 lulusan kisaran lama
studi 5,91, yang menunjukan mahasiswa FMIPA UNTAN Pontianak
dapat menempuh waktu studi selama lebih dari 10 semester atau 5
tahun. Hasil akhir dapat menjadikan bahan pertimbangan jurusan
dalam meningkatkan IPK mahasiswa yang menyelesaikan studi pada
tepat waktu.
3. “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan
Metode K-Means” [5] yang menyimpulkan bahwa dari 20 data uji
menghasilkan 3 cluster yaitu beras kualitas buruk yang memiliki titik
pusat (5,8933;2,05), beras kualitas sedang yang memiliki titik pusat
(6,28199;2,546), dan beras denga kualitas baik dengan titik pusat
(6,96583;2,999167) yang hasil validasinya sebesar 92,82% bualitas
beras.
5
4. “Pengelompokan Mahasiswa Berdasarkan Nilai Ujian Nasional Dan
IPK menggunakan K-Means” [9] dengan simpulan bahwa hasil
pengelompokan jaraknya relatif sangatlah berbeda. Yang diperoleh
setiap hasil akhir ujian nasional tidah menjamin setiap mahasiswa
mempunyai nilai IPK yang baik di akhir.
5. “Penggolongan Suara Berdasarkan Usia Dengan Menggunakan
Metode K-Means” [10] dengan hasil penyimpulan terdapatnya suara
anak dan suara dewasa dengan nilai formant untuk dewasa lebih dari
2500 dibandingkan denngan nilai formant yang dibawah 2500. Dengan
tingkat keberhasilan sistem 100% dengan 10 data yang di ujikan 5
dewasa dan 5 anak-anak secara offline.
Tabel 2.1 Tabel Penelitian
No
Peneliti
Judul
Metode
Hasil
1.
Johan Oscar
Implementasi
K-Means
Tim marketing
Ong
Algoritma K-
akan dikirim
Means
dengan jurusan
Clustering
yang diminatin
Untuk
dengan
Menentukan
kemampuan
Strategi
akademik diari
Marketing
calon mahasiswa
President
pada koat-kota di
University
Indonesia.
2013
2.
Cary Lineker
Clutering
Fuzzy K-Means
Simbolon,
Lulusan
bahwa masih
Nilamsari
Matematika
banyak mahasiswa
Kusumastuti,
FMIPA
jurusan
Beni Irawan
UNTAN
matematikan yang
Pontianak
menempuh
6
Menunjukan
2013
Menggunakan
studinya lebih dari
Fuzzy K-Means
10 semester atau 5
tahun.
3.
Silvi Agustina,
Clustering
K-Means
Dhimas Yhudo,
Kualitas Beras
bahwa mampu
Hadi Santoso,
Berdasarkan
mentranslasi
Nofiadi
Ciri Fisik
persamaan yang
Marnasusanto,
Menggunakan
intuitif menjadi
Arif Tirtana, dan Metode KFakhris Khusnu
Menunjukan
ukuran kuantitatif.
Means
2014
4.
Hartatik
2014
Pengelompokan
K-Means
Pengelompakan
Mahasiswa
tian nilai ujian
Berdasarkan
nasional dan IPK
Nilai Ujian
sangat jauh
Nasional Dan
jaraknya antara
IPK
titik pusat satu
Menggunakan
dengan yang
Metode K-
lainnya, karena itu
Means
nilai ujian nasional
tidak dapat
menjadi seorang
mahasiswa
memperoleh IPK
yang baik.
5.
Prabowo Hadi
Penggolongan
Putra Sutiknyo
Suara
menggolongkan
Berdasarkan
menjadi 2 bagian
Usia Dengan
yaitu suara dewasa
2013
K-Means
7
Analisis dapat
Menggunakan
dan anak, yang
Metode K-
memiliki formant
Means
niali untuk dewasa
2500 untuk anak
dibawah 2500.
2.2
Landasan Teori
2.2.1 Siswa
Siswa dapat disebut juga dengan anak didik yang sedang menempatkan
diri di suatu tempang yang didalamnya ada suatu proses belajar mengajar
[11]. Pengertian siswa menurut pasal 1 ayat 4 UU RI No. 20 Tahun 2003
adalah anggota masyarakat yang berusalah mengembangkan dirinya melalui
proses pendidikan pada jalur jenjang dan jenis pendidikan tertentu. Dan
didalan proses tersebut siswa memiliki pemikiran atau impian atau sering
disebut dengan cita-cita untuk bertujuan di kemuadian hari. Siswa dapat
menjadi fakto penentu untuk mendapatkan motifasi diri sendiri untuk giat
dalam belajar.
Setiap siswa memiliki keunikan masing-masing, seperti potensi dalam
berkembang. Proses berkembang itu sendiri membutuhkan sifat kepercayana
diri yang tidak ditentukan oleh pengajar. Hal pertama kali dimana proses
belajar mengajar yang diperhatikan adalah bagaimana keadaan dan
kemampuannya. Faktor dan fasilitas yang cocok untuk mendukung
pembentukan karekteristik siswa.
Dalam proses belajar siswa dididik menjadi sekelompok manusia yang
berpotensi an memiliki kemampuan yang sehat akan rohani dan jasmani.
Yang mengenal kedewasaan pandangan dan melaksanakan tugas sebagai
makhluk ciptaan Tuhan Yang Maha Esa, warga dan negara di sekitar. Siswa
juga memiliki kewajiaban yang tertulis di UU RI No. 20 Tahun 2003 yaitu :
(1) menjaga norma-norma pendidikan untuk menjamin keberlangsungan
8
proses dan keberhasilan pendidikan, (2) ikut menanggung biaya pendidikan
kecuali bagi yang dibebaskan dari kewajiban tersebut.
2.2.2 Sekolah
Sekolah adalah sebuah lembaga yang dirancang untuk pengajaran siswa
/ murid dibawah pengawasan guru [11] adalah suatu tempat dimana caloncalon siswa baru yang akan mengawali proses belajar mengajar. Yang akan
mengisi waktu luang dengan bermain dan belajar menikmati masa anak-anak
dan remaja. Dan belajar mengenal huruf dan angka, dapat membaca dan
berhitung serta dapat mengenal moral atau budi pekerti dan seni.
Kegiatan sekolah didampingi oleh beberapa orang ahli dan orang yang
mengerti psikologi, sehingga anak didik dapat menciptakan dunianya sendiri
dalam berbagai pelajaran. Sekolah adalah bangunan atau lembaga yang
menerima dan memberi didikan atau pelejaran kepada anak didiknya. Sekolah
juga memiliki seorang yang pemimpin dan yang orang-orang yang membantu
dalam melakukan kebutuhan anak didiknya tersebut, misalnya seperti kepala
sekolah, wakil kepala sekolah, guru-guru yang mengajar serta pengurus
sekolah. Sekolah juga harus memiliki sarana dan prasarana untuk memenuhi
dan membantu proses belajar mengajar anak didik. Berikut ini adalah sana
dan prasarana sekolah :
1. Ruang Belajar
Ruang belajar aja tempat dimana proses belajar mengajar berlangsung
yang dapat bertatap muka langsung antara siswa dan guru. Ruang
belajar bukan hanya dalam pembagian kelas saja melainkan ruang
praktik, ruang laboratorium, ruang komputer, ruang keterampilan dan
masih banyak yang lain.
2. Ruang Kantor
Ruang kantor adalah tempat dimana para guru-guru melakukan proses
atau rapat mengenai administrasi pembangunan agar gedung sekolah
dapat berkembang dengan baik.
9
3. Perpustakaan
Perputakaan adalah salah satu fasilitas yang sangat penting bagi siswa
untuk membaca dan mencari ilmu serta dapat meminjam buku yang
belum anak didik ketahui.
4. Halaman atau Lapangan
Halaman ataupun lapangan adalah area dimana terjadi kegitan seperti :
upacara bendera, olahraga, kegiatan belajar mengajar diluar kelas,
berlatihan anak didik (ekstrakulikuler), dan bermainnya dan istirahat
siswa.
5. Lain-Lain
Sekolahpun memiliki ruang lainnya yang dapat mengembangkan bakat
dan potensi seperti : ruang organisasi peserta didik (OSIS, Pramuka,
senat siswa, dll). Disisi lain sekolah memiliki ruang seprti : ruang
komite, kantin, ruang keamanan, ruang Unit Kesehatan Sekolah (UKS)
serta gudang dll.
2.2.3 Nilai Hasil Belajar
Nilai hasil belajar secara umum menjadi patokan yang dianggap baik
tidaknya, nilai dapat disebut juga hasil dimana seorang siswa telah melakukan
hak dan kewajibannya satelah melakukan atau berlangsungnya proses belajar
mengajar di sekolah saat siswa berada.
Beberapa pengertian nilai hasil belajar dari para ahli :
1. Hamali (2008) nilai hasil belajar adalah sebagai terjadinya perubahan
tingkah laku pada diri seseorang yang dapat diamatin dan diukur
bentuk pengetahuan, sikap
2. dan keterampilan
3. Dimyati dan Mudjiono (2006) nilai hasil belajar adalah hasil yang
dicapai dalam bentuk angka-angka atau skor setelah diberikan tes hasil
belajar pada setiap akhir pembelajaran
4. Suprijono (2009) nilai hasil belajar adalah pola-pola perbuatan, nilainilai, pengertian-pengertian, sikap-sikap, aspirasi dan keterampilan.
10
2.2.4 Sekolah Menengah Atas (SMA)
Sekolah Menengah Atas (SMA) merupakan salah satu tahapan
pendidikan setelah menyelasaikan Sekalah Menengah Pertama (SMP) atau
Madrasah Tsanawiyah (MTs) selama 3 tahun. Ada pula beberapa jurusan
yang di miliki oleh Sekolah Menengah Atas (SMA) yaitu Ilmu Pengetahuan
Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS).
Sekolah Menengah Atas (SMA) pun memilik beberapa tujuan, yaitu :
1. Memberikan pengetahuan kepada siswa agar dapat melanjutkan
pendidikan ke jenjeng lebih tinggi dan dapat mengembangkan potensi
diri dengan berkembangnya ilmu dan teknologi.
2. Mengembangkan
kempuan
siswa
terhadap
masyarakat
dalam
berhubungan timbal balik dengan lingkungan sosial, budaya dan alam
sekitarnya.
Mata pelajaran wajib Ilmu Pengetahuan Alam (IPA) :
1. Biologi
2. Fisika
3. Kimia
4. Matematika
Mata pelajaran wajib Ilmu Pengetahuan Sosial (IPS) :
1. Geografi
2. Sosiologi dan Anthropologi
3. Ekonomi
4. Sejarah
2.3
Penjuruan Kurikulum Tahun 2013
Penjuran di era kurikulum 2013 sangat cepat dikarenakan para calon
siswa SMA belum sepenuhnya mengetahui dan mengerti mata pelajaran di
tingkat SMA. [1]. Penjurusan yang dilakuan yang awalannya dimulai dari
11
kelas X yang akan naik ke kelas XI, tapi sebaliknya sekarang penjurusan itu
sendiri dilakukuan di awal kelas X atay bisa dibilang dimulai awal
pendaftaran SMA, penjurusan tersebut dikelompokkan menjadi 2 yaitu : Ilmu
Pengetahuan Alam dan Ilmu Pengetahuan Sosial. Dalam Permendikbud 69
tahun 2013 kurikulum baru persyaratan yang diambil untuk keputusan
penjurusan dengan menggunakan nilai rapot SMP/MTs, hasil nilai UN
SMP/MTs, hasil tes yang diselenggarakan di SMA itu sendiri, hasil tes
psikolog serta rekomendasi yang diajukan dari guru BK.
Siswa kelas X diharapkan dengan adanya penjurusan yang dimulai dari
awal pendaftar SMA tidak terkejuat dengan perubahan yang begitu pesat
dibandingkan dengan jaman siswa masih duduk dikelas SMP/MTs. Yang
sebelumnya di SMP/MTs sudah mengenal pelajaran IPA atau IPS yang belum
menjurus kespesifikasinya akan memulai mempelajaran atau meminatan
pelajaran tersebut. Tetapi walaupun siswa memilih kelas IPA maupun IPS
bukan berarti siwa hanya mempelajarin mata pelajaran yang sesuai dengan
jurusannya masing-masing, tetapi masih bisa menerima mata pelajaran seperti
: PKN, Bahasa Indonesia, seni budaya, pendidikan agama dan olah raga.
2.4
Data Mining
Data mining merupakan proses mengalisis data dan menyimpulkan
hasilnya
menjadi
sebuah
informasi-informasi
penting
meningkatkan dan juga menurunkan jumlah yang ada.
Gambar 2.1 Tahap-Tahap Data Mining
12
yang
dapat
Tahap-tahap data mining :
1. Pembersihan data adalah proses dimana dilakukannya penghapusan
data yang tidak konsisten.
2. Integrasi data adalah proses penggabungan data-data yang terdapat dari
beberapa sumber.
3. Seleksi data adalah proses dimana dari penggabungan data hanya
dipilih yang akan sering dipakai.
4. Transformasi
data
adalah
dimana
data-data
tersebut
akan
ditranformasikan dan diproses dalam data mining.
5. Proses mining adalah proses yang penting yang melibatkan metode
untuk dapta smenghasilkan pola data.
6. Evaluasi data adalah proses dimana pola-pola data akan diuji untuk
nilai kebenarannya yang ada didalam data itu sendiri.
7. Presntasi pengetahuan adalah proses penyajian atau menampilkan hasil
dari proses mining kepada user.
Dari diagram diatas maka dapat dijelaskan bahwa terdapat alur
pengolahan data, yang pertama terdapat data yang akan dipilih untuk di
proses, setelah selesai dalam pemilihan maka data yang sudah dipilih tadi
akan dilanjutkan dalam untuk di transmisikan atau dijabarkan sesuai tabel
untuk mudah membedakannya, setelah hasil tersebut maka didapat hasil yang
disebut data mining, dari data mining tersebut maka bisa didapat knowlage
atau sumber informasi dari hasil data mining tersebut.
Dengan upaya penggunaan data mining di sekolah dapat membantu
untuk mendapatkan pola-pola keputusan yang dapat digunakan dalam
mengambil keputusan untuk menentukan tindakan. Walaupun data mining
memiliki banya aplikasi populer yang mudah dipahami dalam menjalankan
data mining, namun campur tangan manusia masih sangat dibutuhkan dalam
mengambil keputusan.
Adapun para pakar yang mendefinisikan pengertian data mining,
sebagai berikut [11]:
13
1. Gartner mendefinisikan data mining adalah suatu proses pencarian
pola dari data-data dengan jumlah yang sangat banyak yang tersimpan
dalam suatu tempat penyimpanan dengan menggunakan teknologi
pengenalan pola, teknik statistik, dan matematik.
2. Hand et al mendefinisikan data mining adalah analisis dari
sekumpulan data yang diamati (sangat besar) untuk menemukan
hubungan yang tidak terduga dan merangkum data dengan cara yang
baru yang dapat dipahami dan berguna bagi pemilik data.
3. Berry mendefinisikan data mining merupakan proses ekplorasi dan
analisis data yang berjumlah sangat besar untuk menemukan pola dan
aturan yang berarti.
Faktor yang mendukung perkembangan data mining adalah peningkatan
jumlah data dalam sekala besar, dengan adanya data mining yang dapat
dikomputerisasikan. Ada beberapa foktor pendorong data mininng dalam
kemajuan :
1. Pertumbuhan data yang berskala besar
2. Bertipe data warehouse, sehingga menjasi pengguna dalam
luang lingkup sekolah agar dapat mengakses seluruh data yang
dimiliki sekolah yang telah tersimpan didalam database.
3. Pertumbuhan teknologi seperti meningkatkan akases dengan
menggunakan navigasi web ataupun internet.
4. Dari tekanan pihak luar prediksi meningkatkan pengambilan
keputusan untuk memilih jurusan guna meyakinkan diri dalam
menempati jurusan tertentu.
5. Berkembangnya pengembang teknologi perangkat lunak
(software) dalam data mining.
6. Berkembangnya kemampuan dalan berkapasitas penyimpanan
data.
Hubungan yang dihasilkan dari data mining antara sekolah dengan
siswa-siswi akan menghasilkan pola yang dapat meningkkatkan semangat
14
belajar dalam memilih penjurusan. Dari hasil pola tersebut sekolah akan
mengetahui anak didiknya yang berminat ingin memilih jurusan Ilmu
Pengetahuan Alan (IPA) ataupun Ilmu Pengetahuan Sosial (IPS).
2.4.1 Konsep Klasifikasi
Beberapa model konsep klasifikasi, sebagai berikut :
1. Model pelatihan (data latih)
Model pelatihan merupakan kumpulan dari suatu data yang memiliki
pengelompokan atau kelas yang sudah ditetapkan. Kumpulan data latih
tersebut dapat digunakan juga untuk membentuk model klasifikasi.
2. Model pengujian (data uji)
Jika di dalam model klasifikasi terbentuk kelasnya maka akan diuji dengan
data yang berbeda agar dapat mengetahui asil akurat dari model klasifikasi
tersebut. Hasil dari model klasifikasi dapat digunakan untuk menentukan
kelas dari data yang baru.
2.4.2 K-Means Clustering
K-Means Clustering merupakan metode untuk mengklasifikasikan atau
mengelompokkandata ke dalam cluster berdasarkan artibut tertentu.
Pengelompokan data dilakukan dengan menghitung jarak terdekat antara data
observasi dengan pusat cluster. Prinsip utama dari metode ini adalah
menyusun K sebuah centroid atau rata-rata dari sekumpulan data berdimensi
N, dimana metode ini mensyaratkan nilai K sudah diketahui sebelumnya.
Algoritma K-Means dimulai dengan pembentukan prototipe cluster diawal
kemudian secara iteratif prototipe cluster tersebut diperbaiki sehingga
tercapai kondisi konvergen, yaitu kondisidimana tidak terjadi perubahan yang
signitifikan
pada
prototipe
cluster.
Perubahan
ini
diukur
dengan
menggunakan fungsi objektif D yang umumnya didefinisikan sebagai jumlah
atau rata-rata jarak tiap item data dengan centroid groupnya.
15
2.4.3 Algoritma Metode K-Means Clustering
Algoritma K-Means Clustering merupakan metode clustering berbasis
jarang yang membagi data-data ke dalam sejumalah cluster dimana proses
clustering tersebut dilakukan dengan memperhatikan kumpulan dari data-data
yang akan dikelompokkan. Pada algoritma ini, pusat cluster dipilih pada
tahap awal secara acak dari sekumpulan data. Kemudian K-Means menguji
masing-masing komponen didalam kumpulan data dan menandai komponen
tersebut ke salah satu centroid yang telah didefinisikan sebelumnya
berdasarkan jarak minimun anatar komponen data dengan masing-masing
centroid. Posisi centroid akan dihitung kembali sampai semua komponen data
dikelompokkan disetiap centroid dan terakhir akan terbentuk posisi centroid
baru. Iterasi ini akan terus dilakukan sampai tercipta kondisi konvergen.
Gambar 2.1 Algoritma Metode K-Means Clustering
16
Tahapan interasi algoritma K-Means Clustering :
1. Jumlah K-Cluster
Jumlah cluster adalah sama dengan k, jika ada dua cluster maka ada 2
centroid.
2. Set awal iterasi atau iterasi 0
3. Iterasi 0dengan jarak data ke centroid
Hitung jarak centroid dengan menggunakan Euclidean Distance,
sehingga seperti sebagai berikut :
4. Iterasi 0 clustering objek data
Melakukan pengelompokan menjadi satu ataupun dua group yang
berdekatan dengan centroid
5. Iterasi 1 enentukan centroid baru
Menghitung kembali centroid baru, untuk setiap group yang ada, group
stu hanya mempunyai satu anggota yaitu centroid baru
6. Iterasi 1 jarak objek ke centroid
Proses hitung jarak pada setiap objek ke centroid baru dengan formula
step 3
17
7. Iterasi 1 melakukan pengelompokan
Pengelompokan kembali centroid baru
8. Iterasi 2 menentukan centroid baru
Ulangi step 5
9. Iterasi 2 jarak objek ke centroid
Ulangi step 3
10. Iterasi 2 clustering objek data
Melakukan pengelompokan data dari cluster group 1 atau group 2
berdasarkan jarak centroid dengan iterasi 2
Dari hasil yang ditunjukkan G2, maka terlihat ada perubahan antara
group 1 dengan group 2 serta proses iterasi tidak perlu diulangi lagi.
18
2.5
Kerangka Pemikiran
Masalah
Penentu jurusan siswa siswi untuk
mengambil keputusan guna memilih
penjurusan Ilmu Pengetahuan Alam (IPA)
atau Ilmu Pengetahuan Sosial (IPS).
Tindakan
Menemukan pola data dengan K-Means
Eksperimen
Tool = Rapidminer
Data = nilai rapot dan hasil UN SMP/MTs
metode = K-Means
Hasil
Dengan hasil yang dihasilkan penelitian ini,
maka akan memudahkan siswa untuk
mengambil penjurusan sesuai dengan nilai
dari data yang siswa miliki dalam data rekap
nilai siswa
Gambar 2.3 Kerangka Pemikiran
19
2.6
Matlab 2013
Matlab adalah sebuah program yang berfungsi untuk menganalisis dan
mengkomputasi numerik yang berdasarkan pemikiran dari suatu matematika
lanjut yang berbentuk matriks. Matlab merupakan salah satu bahasa
pemograman yang berkempang menjadi suatu bahasa pemograman yang
canggih. Kegunaan matlab :
1. Matematika dan komputansi
2. Pengembangan dan algoritma
3. Pemograman modeling, simulasi, dan pembuatan prototipe
4. Analisis data, eksplorasi dan visualisasi
5. Analisis numerik dan statistik
6. Pengembangan aplikasi teknik
Disisi lain matlab memiliki beberapa jenis window matlab, yakni ;
a. Matlab Command Window / Editor
b. Matlab Editor / Debugger (Editor M-File / Pencarian Kesalahan)
c. Figure Windows
d. Matlab Help Window
20
BAB III
METODE PENELITIAN
3.1
Instrumen Penelitian
Sebagai instrumen penelitian akan dibuat dengan menggunakan
beberapa perlengkapan, yaitu :
3.1.1 Perangkat Keras (Hardware)
Perangkat keras berperan penting untuk melakukan penelitian ini.
Berikut ini perangkat keras yang akan digunakan :
a. Laptop Thosiba Satelite Pro C640
b. Processor Intel Prosesor
c. RAM 2gb
d. Printer
e. Flash Disk
3.1.2 Perangkat Lunak (Software)
Tak kalah pentingnya perangkat lunak dengan perangkat keras,
perangkat lunak merupakan kebutuhan penting agar penelitian ini dapat
berjalan dengan baik. Perangkat lunak yang dibutuhkan sebagai berikut :
a. Sistem operasi : windows 7 32 bit
b. Microsoft Excel 2013
c. Microsoft Word 2013
3.2
Jenis Penelitian
Penelitian ini akan dilakukan di SMA Negeri 3 Pati, yang beralamat
Jalan Panglima Sudirman No 1A, Desa Puri, Kec. Pati, Jawa Tengah.
Penelitian ini juga disebut penelitian eksperimen yang ingin menerepankan
21
implemtasi alogoritma k-means yang berdasarkan nilai-nilai persyartan yang
berhubungan dengan penjurusan diakhir semester kelas X. Atribut yang
digunakan untuk penjurusan dengan :
1. Nilai rapot SMP/MTs.
2. Hasil nilai UN SMP/MTs.
3. Rekomendasi dari guru BK.
4. Hasil tes yang diadakan oleh calon SMA yang baru.
5. Hasil psikolog
3.3
Metode Pengumpulan Data
Pengumpulan data ini dapat menggunakan beberapa metode, sebagai
berikut :
1. Studi Kasus
Studi kasus menurut Bimo Walgitu (2010 : 92) adalah suatu
metode untuk mempelajari atau menyelidiki suatu kejadian mengenai
perorangan.
Studi kasus menurut W.S Winkel dan Sri Hastuti (2006 : 311)
adalah metode untuk mempelajari keadaan dan perkembangan siswa
secara lengkap dan mendalam, dengan tujuan memahami individualitas
siswa dengan baik dan membantunya dalam perkembangan selanjutnya.
Jadi dari metode kasus dapat menyimpulkan pengumpulan data
dapat diperoleh dari wawancara serta mendapatkan data mengenai potensi
dan masalah siswa-siwi dalam memilih penjurusan.
2. Dokumentasi
Dokumentasi diperoleh saat penulis telah melakukan wawancara,
dokumen yang dapat memperoleh informasi masa lalu atau informasi
sebelumnya. Untuk memperlengkap data-data yang lain.
22
3. Studi Pustaka
Studi pustaka dapat disebut dengan literature yang merupakan
metode pengumpulan data dan informasi dari beberapa buku, jurnal, tesis,
internet dan dari pustaka lainnya yang berhungngan dengan penjurusan
siswa-siswi SMA, data mining dan metode k-means yang dapat membantu
melaksanakan penelitian.
3.4
Jenis Data dan Sumber Data
Peneliti menggunakan jenis data yang berbentuk kuantitatif. Data
kuantitatif berbentuk angka atau pun nilai-nilai hasil akhir . Penelitian ini
menggunakan data nilai rapot, hasil UN, hasil tes yang diadakan
dipendaftaran SMA, serta hail psikolog dan digunakan sebagai bahan uji yang
akan di olah dan akan menghasilkan hasil outputnya penjurusan Ilmu
Pengetahuan Alan (IPA) ataupun Ilmu Pengetahuan Sosial (IPS).
3.4.1 Sumber Data
a. Data Primer
Untuk pengambilan data primer, akan dilakukan dengan cara
mewawancarai kepala cabang tata usaha yang memegang tentang data
siswa-siswi SMA Negeri 3 Pati yang diperlukan (interview). Pengumpulan
data siswa-siswi yang dilakukan diperlukan meliputin : nama siswa-siswi,
nilai rapot SMP/MTS, dan hasil UN SMP/MTS,
b. Data Sekunder
Guna mendapatkan kelengkapan data secara tidak langsung yang
selengkap-lengkapnya penelitian ini juga menggunakan referensi dari
beberapa jurnal, buku teks, paper, karya ilmiah, tesis, dan situ-situs
penunjang diinternet, sebagai landasan teori guna memperkuat dasar
penelitian ini.
23
3.5
Metode Penelitian
Peneliti
menggunakan
metode
penerapan
penentuan
sebagai
pengelompokan. Data yang digunakan dalam penelitian ini adalah data
berdasarkan , yang meliputi :
1. Nama siswa
2. Nilai rapot SMP/MTs.
3. Hasil nilai UN SMP/MTs.
4. Rekomendasi dari guru BK.
5. Hasil tes yang diadakan oleh calon SMA yang baru.
6. Hasil psikolog
Untuk menarik kesimpulan di hasil akhir dengan metode K-Means yaitu
dengan memperbarui tingkat kepercayaan diri dalam memilih pilihan yang
pasti. Adapun proses penelitian atau gambaran untuk terlaksananya penelitian
sebagai berikut ini :
Data Siswa calon kelas X SMA Negeri
3 Pati, yang mengambil penjurusan IPA
atau IPS
Penerapan metode klastering
Penerapan K-Means
Perhitungan nilai preferensi untuk setiap
data calon siswa kelas X
Hasil akan menunjukan pengolongan pemilihan jurusan siswa
mengambil jurusan IPA atau IPS
Gambar 3.1 Alur yang Disusulkan (Proses Penelitian)
24
Berdasarkan proses penelitian seperti gambar yang diatas
dapat
dijelaskan, sebagai berikut ini :
1. Data set adalah data-data siswa calon kelas X pada yang mengenai
persyaratan untuk memilih jurusan yang sudah ditentukan, serta
menentukan artibut data yang akan digunakan dalam penelitian ini
untuk melakukan perhitungan.
2. Kemudian data-data tersebut akan diproses dengan penerapan metode
klastering dan k-means, untuk pengelompokan agar dapat mengetahui
perbandingan apakah siswa masuk kedalam jurusan Ilmu Pengetahuan
Alam (IPA) ataukah masuk kedalam jurusan Ilmu Pengetahuan Sosial
(IPS) dengan syarat-syarat yang sudah ditentukan.
3. Setelah melakukan proses klastering dan k-means akan menghasilkan
hasil akhir yang menyatakan keputusan siswa yang akan memilih
jurusan Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial
(IPS).
Berdasarkan pada data-data penelitian ini memerlukan permasalahan
dan tujuan yang telah dibahas dalam bab yang sebelumnya. Adapun metode
yang digunakan untuk menyusun tugas akhir ini dengan :
3.5.1 Perencanaan
Dalam tahap perencanaan ini peneliti membutuhkan kebutuhankebutuhkan dengan memberikan data primer dan data sekunder yang
dilakukan dengan mengambil data hasil belajar dengan tujuan untuk penentu
jurusan.
3.5.2 Analisis Kebutuhan Perangkat Keras dan Perangkat Lunak
Dengan tahap ini peneliti menganalisa kebuthan yang diperlukan untuk
melakukan penelitian tugas akhir seperti data-data yang telah dikumpulkan,
data analisis, perangkat keras serta perangkat lunak yang dapat menlancarka
proses penelitian
Perangkat keras (hardware) yang dibutuhkan adalah :
25
a. Komputer atau leptop dengan spesifikasi :
Processor : Core 3
Sistem operasi : Windows 7
RAM : 2gb
b. Printer yang digunakan untuk hasil peneliti dengan bentuk hardcopy.
Perangkat lunak (software) yang dibuttuhkan adalah :
a. Sistem operasi yang akan digunakan dalam penelitian ini adalah windows
7.
b. Microsotf word adalah salah satu perangkat lunak yang dapat mencatat
penelitian dan akan menjadi sebuah laporan penelitian.
3.6
Teknik Analisis Data
Proses data mining model CRISP-DM (Cross Industry Standard
Process) inilah yang digunakan di penelitian ini memiliki beberapa tahap,
sebagai berikut :
1. Tahap Pemahaman Bisnis
a. Sebuah penelitian mempunyai tujuan bisnis dalam menentukan jurusan
siswa-siswi SMA Negeri 3 Pati sehingga siswa-siswi dapat belajar
maksimal sesuai dengan jurusan yang telah disediakan.
b. Strategi awal yang digunakan adalah mencari database yang
dibutuhkan.
2. Tahap Pemahaman Data
Pengumpulan data primer dilakukan dengan mengambil data hasil belajar
siswa-siswi saat mengakhiri penyelesaian SMP/MTS.
3. Tahap Pengolahan Data
Pengumpulan data-data awal diperoleh sebanyak 500 data, dan tidak
semuanya yang digunakan. Beberapa teknik yang akan dilakukan adalah :
a. Data Validation
26
Penghapusan data yang tidak lengkap atau missing value. Pada
penilitian ini tidak ada data yang missing value jadi semua data
digunakan yaitu 500 data.
b. Data integration dan transformasi, meningkatkan akurasi dan efisiensi
algoritma. Algoritma k-means dapat memproses data yang bertipe
nominal
maupun
ordinal,
sehingga
data
tidak
perlu
untuk
ditransformasi.
c. Data size reduction
Memperoleh data dengan record dan jumlah atribut sedikit tetapi
bersifat informatif. Beberapa atribut dihilangkan dan hanya atribut inti
saja yang digunakan adalah :
1. Tahap Pemodelan
Dataset yang dimodelkan dengan algoritma k-means sehingga
menghasilkan perhitungan dan digunkan untuk menentukan label
dari inputan baru.
2. Tahap Evaluasi
Perhitungan akurasi dari model yag telah dibentuk oleh algoritma
k-means.
3. Tahap Implementasi
Tahap yang mengimplementasi dimana model yang sudah
dievaluasi diimplementasikan sehingga dapat digunakan untuk
menentukan penjurusan pada SMA Negeri 3 Pati.
3.7
Model yang Diusulkan
Penelitian membuat model yang diusulan agar dapat penerapan atau
implementasi algoritma k-means sebagai berikut :
27
Penentuan Atribut
Pengambilan Data
Data Training
Data Testing
Hasil
Gambar 3.2 Model Penelitian yang Diusulkan
Berdasarkan analisis diatas :
1. Pengumpulan data dari nilai rapot SMP/MTs, dan hasil UN
SMP/MTs.
2. Menentukan atribut data yang akan digunakan dalam penelitian
ini untuk melakukan perhitungan.
3. Data testing siswa dihitung untuk dilakukan perbandingan
dengan data training.
28
4. Perbandingan
yang
dihasilkan
akan
dapat
mrngrtahui
pengolongan apakan siswa masuk dalam penjurusan IPA atau
IPS.
5. Dengan hasil yang demikian maka dapat di ambil keputusan
siswa masuk ke dalam golongan IPA atau IPS tanpa kesulitan
mengambil keputusan.
3.8
Eksperimen dan Pengujian Model
Hasil
dari
model
algoritma
k-means
peneliti
akan
mengimplementasikan klastering penjurusan ke dalam program matlab dan
menghitung hasil akhir k-means sehingga menghasilkan penjurusan Ilmu
Pengetahuan Alam (IPA) atau Ilmu Pengetahuan Sosial (IPS).
29
BAB IV
ANALISIS HASIL PENELITIAN DAN PEMBAHASAN
4.1
Persiapan Data
Dalam melakukan implementasi data mining guna klasifikasi
penjurusan pada SMA Negeri 3 PATI menggunakan metode K-Means
diperlukan data training yaitu berupa data nilai dan jurusan para siswa SMA
Negeri 3 PATI. Adapun data 500 ini dari tahun 2013-2015 digunakan sebagai
data training yang nantinya diolah menggunakan algoritma K-Means
sehingga membentuk centroid cluster yang dapat mengelompokan jurusan
para siswa. Berikut data yang diperoleh dari SMA Negeri 3 Pati :
Gambar 4.1a Data Asli
30
Gambar 4.1b Data Asli
Berikut adalah beberapa sampel data asli dari beberapa siswa, dan
beberapa artibut pada data penelitian :
a. No. Pendaftaran : nomer data dari sebuah pendaftaran di SMA
Negeri 3 Pati
b. Nama : nama dari beberapa calon siswa SMA Negeri 3 Pati
c. Jenis Kelamin : jenis kelamin dari para calon siswa SMA Negeri 3
Pati
d. Asal Sekolah : asal SMP/MTs clon siswa
e. Rapot Matematika : rata-rata nilai matematika dari kelas 7 sampai
kelas 9
f. Rapot IPA : rata-rata nilai IPA dari kelas 7 sampai kelas 9
g. Rapot IPS : rata-rata nilai IPS dari kelas 7 sampai kelas 9
h. UN Matematika : hasil dari ujian nasional siswa SMP?MTs
31
i. UN IPA : hasil dari ujian nasional siswa SMP/MTs
j. UN IPS : hasil dari ujian nasional siswa SMP/MTs
k. Rata-rata : rata-rata nilai seorang siswa dari rapot matematika, rapot
IPA, rapot IPS, UN matematika, UN IPA, UN IPS
l. Peminatan : angket peminatan siswa SMP/MTs yang diberikan
kepada siswa dari guru BK SMP/MTs
Setelah dari beberapa artibut diatas maka selanjutnya akan dilakukan
teknik pengolahan data awal. Dari tahap ini akan menjadi lebih spesifikasi
dan berkualitas dalam melakukan proses data mining yang bisa disebut juga
pembersihan data ata transformasi data.
4.1.1
Pembersihan Data
Dalam proses pembersihan data akan dilakuan penghapusan record
yang terdapat pada atribut yang tidak diperlukan,tidak lengkap atau kosong,
sebagai berikut :
Gambar 4.2a Pembersihan Data yang Kosong
32
Gambar 4.2b Pembersihan Data yang Kosong
Seperti gambar diatas ada pembersihan data yang kosong tersebut
terletak pada kolom atribut peminatan penjurusan. Data tersebut agar proses
dimana pengelompokan penjurusan tadik rancu saat pengelolahan data. Selain
penghapusan data akan dilakukan penghapusan atribut atau babak penyisian
data yang tidah berfungsi pasa saat proses pengekelompokkan dihilangkan
atau dihapus. Atribut yang akan dihapus adalah no. Pendaftaran, jenes
kelamin, dan asal sekolah.
Dan setelah penghapusan data yang kosong yang semula pada awalnya
data terdapata 500 data menjadi 411 data. Dan penghapusan atribut maka
atribut akan menjadi 10 atribut dari 13 atribut sebelum penghapusan data.
33
Gambar 4.3a Penghapusan atribut
Gambar 4.3b Penghapusan atribut
34
4.2
Pengolahan Data
Pada tahap pengolahan data, data berjumlah 500 data di masukkan
sebagai data training pada database matlab, melalui database training matlab,
data tersebut akan diolah kembali sehingga membentuk cluster menggunakan
tools matlab yang dapat digunakan sebagai data clustering, Data yang
dinputkan berupa Rapot matematika, Rapot IPA, Rapot IPS, Ujian Nasional
Matematika, Ujian Nasional IPA, dan Ujian Nasional IPS dan Rata rata, Data
nilai yang diinputkan tersebut akan memunculkan output peminatan jurusan
berdasarkan nilai siswa, Output yang tersedia adalah jurusan IPA dan IPS.
Data-data rapot matematika, rapot IPA, rapot IPS, UN matematika, UN
IPA, dan UN IPS diinputkan ke dalam matlab sebagai berikut :
Gambar 4.4 Tampilan Data yang Diinput
Data yang dinput akan memproses atau membentuk titik centroid atau
titik batasan pengelompokan atau cluster. Dari data cluster yang diolah
35
menggunakan matlab, data cluster di ubah menjadi 2 centroid yaitu berupa
outputan IPA dan IPS .
Berikut hasil data cluster menggunakkan matlab :
Gambar 4.5 Tampilan Data Cluster Matlab
Tabel 4.1 Centroid kluster
No
Rapot
Rapot
Rapot
UN
Mat
IPA
IPS
Mat
UN IPA
UN IPS
rata
IPA 82.8243
82.4156
82.4533
62.4289
71.5398
69.9688
75.2719
IPS
82.5821
82.5862
54.0962
74.9752
75.0157
75.3597
82.9019
36
Rata-
Dari data hasil cluster menggunakan matlab, kemudian data tersebut
diuji menggunakan data uji berjumlah 45 data yang diuji menggunakan
aplikasi Matlab. Dari data uji tersebut akan terlihat tingkat keakurasian yang
dihasilkan menggunakan aplikasi matlab, Jarak antara data uji dengan
centroid pada pengujian aplikasi ini menggunakan metode perhitungan jarak
Ecuildean Distance, sehingga akan terlihat jarak antara data objek dengan
centroid terdekat.
4.3
Menghitung Manual Clustering K-Means
Tahapan proses perhitungan secara manual yaitu:
a. Menentukan jumlah cluster
Dalam menentukan jumlah cluster dari data-data yang ada akan
dibuat menjadi 2 cluster yaitu IPA dan IPS .
b. Menghitung nilai centroid awal
Dalam menghitung nilai centroid awal menggunakan nilai mean.
Nilai masing-masing kolom rata-rata diambil berdasarkan sampel
500 dataset menggunakan matlab seperti pada sub bab sebelumnya.
Data centroid yang terbentuk sebagai berikut:
Tabel 4.2 Nilai Centroid
No
Rapot
Rapot
Rapot
Mat
IPA
IPS
RataUN Mat
UN IPA
UN IPS
rata
IPA 82.8243
82.4156 82.4533
62.4289
71.5398
69.9688
75.2719
IPS
82.5821 82.5862
54.0962
74.9752
75.0157
75.3597
82.9019
Sehingga nilai centroid untuk IPA dan IPS ditunjukan pada tabel diatas.
37
c. Menghitung dataset
Berikut contoh menghitung dataset :
Tabel 4.3 Data hitung
Rapot
Rapot
Matematika IPA
Rapot
UN
UN
IPS
Matematika
IPA
RataUN IPS
rata
85.57
88.72
89.67
62.20
75.99
64.77
77.82
79.11
76.95
85.55
35.58
57.78
61.64
66.10
91.24
71.72
80.11
75.06
84.94
70.51
78.93
92.22
81.43
70.54
83.36
58.12
56.11
73.63
76.64
93.53
84.49
73.40
59.11
65.76
75.49
72.57
91.46
77.48
37.91
60.19
89.46
71.51
Cara menentukan jarak dengan teknik euclidean distance yaitu :
1. IPA=
12.3573
IPS =
= 16.5117
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPA sehingga dataset ke-1 termasuk cluster 1 yang berarti masuk ke kluster
IPA dalam penjurusan SMA Negeri 3 Pati.
2. IPA=
= 33.421
38
IPS=
=30.956
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPS sehingga dataset ke-2 termasuk cluster 2 yang berarti masuk ke kluster
IPS dalam penjurusan SMA Negeri 3 Pati.
3. IPA=
=23.311
IPS=
=27.659
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPA sehingga dataset ke-3 termasuk cluster 1 yang berarti masuk ke kluster
IPA dalam penjurusan SMA Negeri 3 Pati.
4. IPA=
=32.316
IPS=
=41.648
39
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPA sehingga dataset ke-4 termasuk cluster 1 yang berarti masuk ke kluster
IPA dalam penjurusan SMA Negeri 3 Pati.
5. IPA=
=21.409
IPS=
=29.542
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPA sehingga dataset ke-5 termasuk cluster 1 yang berarti masuk ke kluster
IPA dalam penjurusan SMA Negeri 3 Pati.
6. IPA=
=36.543
IPS=
=30.262
Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu
IPS sehingga dataset ke-6 termasuk cluster 2 yang berarti masuk ke kluster
IPS dalam penjurusan SMA Negeri 3 Pati.
40
4.4
Implementasi
Dari
pengolahan
databet
yang
telah
diatur
maka
akan
diimplementasikan kealam sebuah prototype. Yang dimana program
pemprosesan tersebut akan melakukan mengelompokan atau klastering dari
data
yang
akan
diuji
coba.
Adapun
langkah-langkah
dalam
memimplementasikan sebagai berikut :
1. Tampilan sistem yang dibuat adalah sebagai berikut:
a. Tampilan Utama
Tampilan ini merupakan tampilan form utama program aplikasi
dijalankan. Pada form ini berisi : disisi pojok kiri atas ada simbol
logo
SMA
Negeri
3
Pati
yang
melambangkan
bahwa
implementasi dan data yang akan diproses berasal dari SMA
Negeri 3 Pati itu sendiri, disisi pojok kanan atas ada judul
implementasi penjurusan yang disertakan alamat SMA Negeri 3
Pati terletak. Setelah itu ada menu untuk penjurusan berdasarkan
inputan nilai menu terdapat dibarisan sebelah kiri bawah yaitu :
rapot matematika, rapot IPA, rapot IPS, UN matematika, UN IPA,
dan UN IPS. Dengan mengisi nilai-nilai variabel, yang nantinya
nilai variabel untuk menjadi data input dan akan diproses menjadi
output data yang menghasilkan hasil peminatan yang sudah di
klaster, dan hasil dari proses adalah masuk dalam penjurusan IPA
maupun IPS.
41
Tampilan utama dalam aplikasi yang akan dibangun adalah
sebagai berikut :
Gambar 4.6 Tampilan Menu Utama
Pada
tampilan
menu
utama
langsung
terdapat
menu
pengelompokan, aplikasi akan berjalan bila telah menginput data
sesuai dengan atributnya masing-masing yang terdiri dari inputan
rapot matematika, rapot IPA, rapot IPS,UN matematika, UN IPA,
dan UN IPS. Setelah penginputan maka diproses sebagai eksekusi
yang akan menghasilkan nilai rata-rata dan dapat dilihat kasil
klastering penjurusan yaitu IPA ataupun IPS.
42
Gambar 4.7 Editor Menu Utama
Gambar 4.8 Tampilan Contoh Penginputan
43
4.5
Hasil Analisis
Pada sub bab berikut akan menjelaskan tentang eksperimen yang
dilakukan untuk mendapatkan nilai akurasi berdasarkan output aplikasi yang
digunakan menggunakan metode K-Means dalam penjurusan siswa
menggunakan data nilai siswa di SMA Negeri 3 Pati. Tabel uji coba sebagai
berikut menggunakan data uji berjumlah 100 data nilai siswa .
Tabel 4.4 Tabel Evaluasi
No
IPA
IPS
Peminatan
Hasil
Rapot
Rapot
Rapot
UN
UN
UN
Rata-
Mat
IPA
IPS
Mat
IPA
IPS
rata
1
85.57
88.72
89.67
62.20
75.99
64.77
77.82 12.357 16.512
IPA
TRUE
2
79.11
76.95
85.55
35.58
57.78
61.64
66.10 33.421 30.956
IPS
TRUE
3
91.24
71.72
80.11
75.06
84.94
70.51
78.93 23.311 27.659
IPA
TRUE
4
92.22
81.43
70.54
83.36
58.12
56.11
73.63 32.316 41.648
IPA
TRUE
5
76.64
93.53
84.49
73.40
59.11
65.76
75.49 21.409 29.542
IPA
TRUE
6
72.57
91.46
77.48
37.91
60.19
89.46
71.51 36.543 30.262
IPS
TRUE
7
75.79
93.49
72.95
59.88
92.01
82.82
79.49 29.508 25.766
IPA
FALSE
8
82.95
78.79
70.33
53.59
76.30
87.81
74.96 24.071 18.181
IPS
TRUE
9
93.18
78.28
94.08
53.85
77.51
85.25
80.36 25.068 19.807
IPA
FALSE
10
78.80
94.30
74.34
75.84
94.88
53.24
78.57 35.191 39.694
IPA
TRUE
11
86.92
79.69
87.97
46.23
55.39
59.55
69.29 26.877 27.843
IPS
FALSE
12
84.80
86.87
82.67
83.43
94.09
65.63
82.92 32.415 37.323
IPA
TRUE
13
86.37
89.45
90.12
79.54
94.09
90.23
88.30 38.759 39.078
IPA
TRUE
14
79.21
71.83
72.43
63.74
71.28
70.02
71.42 15.557 19.478
IPS
FALSE
44
Angket
15
80.89
75.36
92.90
47.35
93.15
55.66
74.22 32.609 30.242
IPS
TRUE
16
88.30
81.47
76.34
83.37
71.04
78.02
79.76 24.332 31.149
IPA
TRUE
17
92.93
93.71
72.92
63.87
54.79
79.68
76.32 26.430 29.047
IPA
TRUE
18
71.23
70.64
80.15
51.20
89.81
86.05
74.85 31.574 25.197
IPS
TRUE
19
72.78
73.89
80.57
61.05
76.47
54.65
69.90 21.602 26.020
IPS
FALSE
20
89.87
84.43
75.52
66.79
62.05
78.94
76.27 17.100 21.131
IPA
TRUE
21
81.16
85.71
75.84
57.15
54.43
93.78
74.68 30.750 29.030
IPS
TRUE
22
74.15
73.32
88.72
65.68
86.82
70.33
76.50 21.052 22.308
IPA
TRUE
23
79.67
70.63
82.19
81.43
87.19
50.18
75.21 33.857 40.819
IPA
TRUE
24
75.21
76.95
72.27
80.29
74.77
67.59
74.51 22.957 30.646
IPA
TRUE
25
82.70
86.22
78.53
44.94
80.89
86.30
76.60 26.297 16.655
IPS
TRUE
26
85.71
86.29
94.15
82.63
70.67
57.99
79.57 27.034 35.991
IPA
TRUE
27
89.19
90.60
81.56
62.26
75.46
66.64
77.62 11.841 15.718
IPS
TRUE
28
71.61
78.20
71.43
41.54
86.99
74.95
70.79 31.385 24.374
IPS
TRUE
29
76.96
81.50
72.86
53.55
60.38
90.70
72.66 27.697 24.448
IPS
TRUE
30
84.56
76.78
85.44
49.12
92.14
55.96
74.00 29.041 27.001
IPS
TRUE
31
87.09
88.16
94.21
52.74
77.39
82.47
80.34 22.353 16.486
IPA
FALSE
32
76.79
90.23
73.97
37.91
88.42
80.96
74.71 34.299 25.466
IPS
TRUE
33
79.95
84.21
82.21
82.97
55.15
65.58
75.01 26.857 36.433
IPA
TRUE
34
75.85
87.03
71.84
65.07
50.93
76.07
71.13 35.854 30.047
IPS
TRUE
35
85.23
77.21
91.88
41.30
51.16
67.31
69.01 32.092 30.847
IPS
TRUE
36
86.56
70.75
70.71
48.82
87.00
81.60
74.24 29.131 22.616
IPS
TRUE
45
37
70.30
79.21
80.37
61.15
65.81
59.54
69.40 18.685 24.167
IPS
FALSE
38
90.87
90.31
86.62
81.84
51.02
58.75
76.57 32.708 41.824
IPA
TRUE
39
82.23
83.60
86.45
71.64
50.03
57.57
71.92 27.028 35.543
IPA
FALSE
40
88.11
91.36
92.37
68.87
81.04
84.08
84.31 24.875 24.838
IPS
FALSE
41
74.15
78.13
70.20
72.12
86.24
72.72
75.59 23.690 26.583
IPA
TRUE
42
92.93
74.36
92.12
70.07
92.33
90.17
85.33 31.501 33.819
IPA
TRUE
43
86.22
90.36
81.58
73.99
88.60
94.42
85.86 34.784 33.767
IPS
FALSE
44
81.88
89.50
75.20
35.58
51.74
84.54
69.74 38.205 33.303
IPS
TRUE
45
83.31
83.49
89.73
76.73
87.22
63.86
80.72 23.910 29.448
IPA
TRUE
46
88.26
90.76
88.03
64.25
73.50
62.24
77.84 14.275 19.997
IPA
TRUE
47
88.55
79.44
73.85
49.64
68.32
64.61
70.73 18.412 17.672
IPS
TRUE
48
90.11
92.03
71.59
51.36
83.15
66.85
75.85 23.033 20.080
IPS
TRUE
49
88.38
70.11
71.50
72.10
52.43
56.54
68.51 31.419 39.109
IPA
TRUE
50
80.72
88.15
76.93
51.45
92.63
75.31
77.53 25.819 29.778
IPA
TRUE
51
84.04
89.91
76.70
82.23
82.86
87.51
83.88 31.509 34.233
IPA
TRUE
52
75.21
89.24
89.67
35.37
78.32
85.41
75.54 34.255 24.975
IPS
TRUE
53
82.95
78.79
70.33
53.59
76.30
87.81
74.96 24.071 18.181
IPS
TRUE
54
88.23
80.80
80.79
53.85
88.71
69.62
77.00 20.148 15.970
IPA
FALSE
55
83.64
86.64
76.36
81.32
93.15
53.64
79.13 34.075 39.978
IPA
TRUE
56
75.12
82.19
81.83
38.36
91.66
63.64
72.13 33.072 26.966
IPS
TRUE
57
90.75
82.44
86.09
66.22
65.21
71.17
76.98 11.614 18.268
IPA
TRUE
58
80.56
91.35
82.88
66.93
67.57
93.85
80.52 26.809 26.136
IPA
FALSE
46
59
82.60
88.08
85.65
78.39
94.99
74.52
84.04 30.731 33.251
IPA
TRUE
60
92.80
73.88
80.17
35.95
62.38
61.35
67.76 33.066 30.202
IPS
TRUE
61
80.93
72.65
91.73
78.87
76.04
67.90
78.02 22.085 29.305
IPA
TRUE
62
72.45
72.90
92.90
44.49
88.56
51.59
70.48 35.773 34.041
IPS
TRUE
63
70.82
81.41
87.26
68.79
60.90
75.98
74.19 18.951 24.194
IPA
TRUE
64
72.97
87.04
86.78
35.20
69.69
57.85
68.25 32.837 29.439
IPS
TRUE
65
74.40
80.16
70.98
43.00
58.55
94.62
70.29 37.232 31.873
IPS
TRUE
66
74.87
86.81
80.93
66.94
74.81
87.94
78.72 18.230 20.695
IPA
TRUE
67
73.94
94.57
77.00
70.41
66.80
50.32
72.17 27.171 34.766
IPS
FALSE
68
91.06
80.54
73.41
62.89
77.28
85.72
78.48 21.086 19.021
IPS
FALSE
69
84.45
72.58
79.27
40.88
80.50
90.98
74.78 33.107 23.955
IPS
TRUE
70
86.16
77.26
93.41
55.56
94.06
71.18
79.61 27.068 23.560
IPA
FALSE
71
80.01
85.73
77.50
81.11
83.78
80.22
81.39 26.161 30.238
IPA
TRUE
72
77.02
76.75
85.87
62.36
74.40
92.29
78.11 24.329 21.299
IPS
FALSE
73
89.67
73.83
72.96
74.52
59.43
81.73
75.35 25.337 30.315
IPA
TRUE
74
86.55
87.66
70.39
37.97
53.32
83.89
69.97 36.592 32.016
IPS
TRUE
75
85.38
88.47
90.15
43.20
64.75
59.46
71.90 25.300 23.991
IPA
TRUE
76
84.52
78.31
74.93
52.85
94.22
55.76
73.43 29.796 28.740
IPS
TRUE
77
86.64
86.74
80.63
81.99
91.30
55.00
80.38 32.553 38.796
IPA
TRUE
78
76.19
93.81
75.32
81.44
93.83
59.18
79.96 34.948 39.990
IPA
TRUE
79
93.69
77.39
77.46
78.21
79.25
68.68
79.11 22.211 28.699
IPA
TRUE
80
70.97
76.88
93.75
39.47
61.52
59.97
67.09 33.065 31.456
IPA
FALSE
47
81
89.39
81.58
89.56
48.26
64.25
56.06
71.52 26.581 24.808
IPS
TRUE
82
79.67
76.20
73.96
79.13
52.96
58.58
70.09 30.019 39.176
IPS
FALSE
83
89.63
80.85
87.57
35.41
64.33
83.00
73.46 32.097 24.560
IPS
TRUE
84
81.21
87.88
78.70
83.91
51.48
73.50
76.11 30.385 38.596
IPA
TRUE
85
91.60
85.26
87.83
41.28
82.67
89.60
79.71 33.021 23.777
IPS
TRUE
86
78.21
91.05
71.80
80.92
75.88
94.34
82.04 34.780 36.717
IPA
TRUE
87
75.13
81.01
79.97
52.08
65.22
71.20
70.77 15.370 14.311
IPA
FALSE
88
88.14
71.63
74.82
56.89
83.13
84.72
76.56 24.231 19.426
IPA
FALSE
89
81.87
83.49
79.67
62.42
61.08
74.63
73.86 11.956 16.595
IPA
TRUE
90
80.57
72.01
76.88
78.00
54.94
51.09
68.91 32.546 41.673
IPA
FALSE
91
74.84
75.77
88.93
43.42
90.80
94.82
78.10 38.833 30.258
IPS
FALSE
92
79.08
82.29
81.77
64.10
90.82
62.69
76.79 21.080 22.809
IPA
TRUE
93
87.64
72.38
83.41
78.44
69.66
90.60
80.36 28.917 31.869
IPA
TRUE
94
77.83
91.52
74.65
43.32
93.01
81.10
76.91 33.481 25.478
IPA
FALSE
95
79.67
70.63
82.19
81.43
87.19
50.18
75.21 33.857 40.819
IPA
TRUE
96
84.80
86.87
82.67
83.43
94.09
65.63
82.92 32.415 37.323
IPA
TRUE
97
86.37
89.45
90.12
79.54
94.09
90.23
88.30 38.759 39.078
IPA
TRUE
98
80.30
90.98
92.43
39.79
62.49
67.06
72.17 28.144 24.673
IPS
TRUE
99
80.24
90.55
83.20
71.24
56.49
82.58
77.38 23.257 27.710
IPA
TRUE
100
79.65
73.72
83.28
55.44
64.04
81.42
72.93 18.113 16.055
IPS
TRUE
48
Berdasarkan data tabel diatas berjumlah 100 data pengujian, terdapat 22
data yang memiliki nilai kesalahan. Dari nilai tersebut akan dihitung nilai
akurasi terhadap implementasi aplikasi penjurusan menggunakan algoritma kMeans. Nilai akurasi yang digunakan dari jumlah citra bernilai kebenaran
dibagi dengan jumlah data uji keseluruhan dikali 100%
Akurasi =
x100%
= 78 %
49
BAB V
KESIMPULAN DAN SARAN
5.1
Kesimpulan
Dari permasalahan di atas mengenai penerapan data mining untuk
mengklasifikasi penjurusan IPA atau IPS dengan metode k-means, penulis
dapat menarik kesimpulan dan saran
1. Penelitian mendapatkan data dari SMA Negeri 3 Pati, dengan
jumlah data yang di gunakan 100 data siswa, kemudian diolah
dengan k-means.
5.2
Saran
Untuk
meningkatkan
kinerja
dan
menyempurnakan
analisis
penerapan data mining klasifikasi yang telah dibuat, peneliti memberikan
saran sebagai berikut :
1.
Penelitian ini dapat dikembangkan atau dibandingkan dengan
menggunakan metode data mining yang lainnya.
2.
Hasil dari penelitian ini dari rule yang terbentuk dapat
dikembangkan menjadi pengetahuan untuk sistem pendukung keputusan.
3.
Penelitian ini dapat diterapkan pada suatu program unuk digunakan
pada Sekolah Menengah Atas (SMA).
50
DAFTAR PUSTAKA
[1]
Nurmalasari, Riana; Wati, Reta Dian Purtama; Puspitasari, Poppy; Diana,
Wahyu Dewi, Nurmalita Kurnia. 2013. “Peran Guru Dalam Implementasi
Kurikulum 2013”, Mahasiswa Pascasarjana Universitas Negeri Malang.
[2]
Fitriyani. 2012. “Sistem Pendukung Keputusan Penjurusan SMA
Menggunakan Metode AHP”. Seminar Nasional Teknologi Informasi dan
Komunikasi Terapan.
[3]
Wijaya, Arim. 2011. “Analisis Algoritma K-Means Untuk Sistem
Pendukung Keputusan Penjurusan Siswa di MAN binong Subang”.
Universitas Komputer Indonesia.
[4]
Kristanto, Obbie. 2013. “Penerapan Algoritma Klasifikasi Data Mining
ID3 Untuk Menentukan Penjurusan Siswa SMA Negeri 6 Semarang”.
Jurusan Teknik Informatika Udinus.
[5]
Agustina, Silvi; Yhudo, Dhimas; Santoso, Hadi; Marnasusanto, Nofiadi;
Tirtana, Arif; Khusnu, Fakhris. 2014. “Clustering Kualitas Beras
Berdasarkan Ciri Fisik menggunakan Metode K-Means”. Universitas
Brawijaya Malang.
[7]
Ong, Johan Oscar. 2013. “Implementasi Algoritma K-Means Clustering
Untuk Menentukan Strategi Marketing President University”. President
University.
[8]
Simbolon, Cary Lineker; Kusumastuti, Nilamsari; Irawan, Beni. 2014.
“Clustering
Lulusan
Matematika
FMIPA
UNTAN
Pontianak
Menggunakan Fuzzy K-Means”.
[9]
Hartatik. 2014. “Pengelompokan Mahasiswa Berdasarkan Nilai Ujian
Nasional dan IPK Menggunakan Metode K-Means”.
51
[10]
Sutiknyo, Prabowo Hadi Putra. 2013. “Penggolongan Suara Berdasarkan
Usia Dengan Menggunakan Metode K-Means”.
[11]
Hamdu, Ghullam; Agustina, Lisa. 2011. “Pengaruh Motivasi Belajar
Siswa Terhadap Prestasi belajar IPA di Sekolah Dasar”. Universitas
Pendidikan Indonesia.
52
Download