BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu bagian paling penting dikehidupan manusia, yang dapat membedakan perilaku dan tata cara sikap manusia dengan makhluk hidup lainnya. Pendidikan juga dapat mengembangkan pola fikir dan potensi manusia melalui proses pembelajaran [1]. Pendidikan memilik beberapa tahapan salah satunya yaitu Sekolah Menengah Atas (SMA). Sekolah Menengah Atas (SMA) merupakan salah satu tahapan pendidikan setelah menyelesaikan Sekaloh Menengah Pertama (SMP) atau Madrasah Tsanawiyah (MTs) selama 3 tahun. Ada pula beberapa jurusan yang di miliki oleh Sekolah Menengah Atas (SMA) yaitu Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Di era kurikulum baru 2013 sekarang penjurusan dilakukan saat memasuki kelas X atau bisa dibilang juga saat pendaftaran SMA, berbeda dengan kurikulum 2003 yang dilakukan diwaktu di kelas X. Guru pun belum bisa mengukur kemampuan siswa dari segi bakat dan akademik. Kadang kala guru hanya mengukur dari segi nilai rapor atau ranking di kelas, serta dengan mengisi angket penjurusan. Dengan itulah para guru dapat menyimpulkan pengelompokan siswa. Hal ini tentunya menyulitkan siswa untuk masuk ke jurusan sesuai dengan bakatnya [1], begitu sulit dalam menentukan siswa mana yang memenuhi kriteria untuk menempati jurusan tertentu, yang akan dipilih siswa-siswi sesuai dengan kemampuannya untuk menentukan masa depan [2]. Dengan begitu siswasiswi membutuhkan keputusan dalam menentukan jurusan yang akan diambilnya kelak [3]. Dengan keputusan yang akan diambil siswa-siswi harus melakukan proses mengolah data-data yang dapat menghasilkan hasil akhirnya, dan kesalahan dalam penjurusan adalah rendahnya prestasi belajar 1 siswa atau dapat menyebabkan terjadinya ketidakcocokan dengan jurusan yang sudah dipilih oleh siswa atau siswi sebelumnya [4]. Di SMA Negeri 3 Pati memiliki beberapa persyaratan untuk peminatan penjurusan. Pertama dengan mengumpulkan hasil rapot SMP atau MTs dari kelas 7 sampai kelas 9. Kedua mengumpulkan hasil Ujian Nasional SMP atau MTs. Dan yang ketiga mengumpulkan angket peminatan yang telah diberikan SMA Negeri 3 Pati kepada calon siwa SMA. Tapi di tahun sebelumnya para siswa merasakan bahwa para siswa salah peminatan dikarenakan salah presepsi atau karena ikut-ikutan dengan temannya, menuruti kehendak atau disuruh orang tua atau tidak sesuai dengan kesesuaian para siswa. Di proses penjurusan pasti mempunyai data yang lebih dari 500 data, jadi selama ini para gurulah yang menyatakan keputusan akan diletakakan dimanakah siswa tersebut. Sebab guru yang mengetahui para siswanya dari sisi bakat, kemampuan dan minta siswanya. Jadi dengan adanya permasalahan yang mencakup diatas maka dibutuhkan suatu implementasi yang dapat meminimalisirkan keputusan secara cepat, tepat dan efisien serta menghemat tenaga, waku dan biaya. Dalam proses penilaian dapat dibantu dengan teknik data mining agar mempermudah pihak sekolah untuk mengetahui kemampuan pada siswasiswinya. Oleh karena itu sangat dibutuhkan sistem informasi yang berbasis destop yang akan memberi solusi untuk masalah pengelompokan penjurusan IPA ataupun IPS. Data mining itu sendiri sangat membantu dalam mengelolah sejumlah data yang begitu banyak untuk menghasilkan hasil yang akurat. Teknik data mining yang akan digunakan dalam pengelompokan penjurusan dengan metode algoritma K-Means. Algoritma K-Means itu sendiri adalah pengelompokan suatu data dari sejumlah kelompok data yang memiliki batas-batasan nilai pengelompokan. Manfaat dari menggunakan algoritma K-Means adalah mempermudah pengambilan keputusan yang sangat kompleks terlebih menjadi lebih akurat, sehingga pengambilan keputusan pun tidak menjadi masalah. Seperti yang pernah dilakukan peneliti sebelumnya oleh Silvi Agustina, Dhimas Yhudo, 2 hadi Santoso, Nofiadi Marnasusanto, Arif Tirtana dan Fakhris Khusnu “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan Metode KMeans”[5]. Dalam penelitian tersebut K-Means didukung hasil perbandingannya yang lebih akurat. Dengan menggunakan metode algoritma K-Means dapat menarik judul “IMPLEMENTASI DATA MINING UNTUK PENENTUAN PEMINATAN JURUSAN DENGAN ALGORITMA K-MEANS PADA SISWA SMA NEGERI 3 PATI”. 1.2 Rumusan Masalah Berdasarkan uraian latar belakang maka dapat mengambil rumusan masalah sebagai berikut : Bagaimana menerapkan metode algoritma K-Means dalam pengelompokan siswa-siswi berdasarkan nilai rapot mata pelajaran yang mempersyaratkan sebagai pemilihan jurusan yang sesuai dengan nilai kemampuan siswa-siswi. 1.3 Batasan Masalah Batasan-batasan masalah yang dimiliki anatara lain : 1. Penelitian dilakukan untuk para siswa-siswi SMA Negeri 3 Pati. 2. Penelitian menggunakan nilai rapot SMP/MTs dan hasil nilai UN. 3. Penelitian menggunakan data pengisian angket peminatan penjurusan. 4. Penelitian menggunakan aplikasi matlab 2013. 1.4 Tujuan Masalah Berdasarkan rumusan masalah maka dapat mengambil tujuan masalah yaitu : 3 Mengimplementasikan metode algoritma K-Means kedalam kasus pengklastering siswa-siswi berdasarkan nilai rapot mata pelajaran untuk pemilihan jurusan. 1.5 Manfaat Penelitian Manfaat penelitian dapat diambil sebagai berikut : 1. Bagi penulis, penelitian ini dapat berguna untuk menambahkan wawasan mengenai data mining menggunakan metode algoritma KMeans dan penerapannya. 2. Bagi SMA Negeri 3 Pati, penelitian ini merupakan salah satu upaya untuk dapat membantu siswa-siswinya dalam memilh jurusan yang tepat. 3. Hasil dari penelitian ini juga dapat dimanfaatkan sebagai referensi untuk penelitian selanjutnya. 4 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Penelitian Dalam penelitian pengelompokan yang betujuan untuk pemilihan jurusan bukan untuk yang pertama melainkan telah dilakukan pada sebelumnya. Beberapa penelitian yang telah dilakukan sebelumnya : 1. “Implementasi Algoritma K-Means Clustering Untuk Menentukan Strategi Marketing Presindent University” [6] yang menyimpulkan bahwa tim marketing melakukan promosi dengan pengiriman sesuai dengantujuan yang paling banyak diminati, serta berdasarkan titik kemampuan akademik mahasiswa yang akan diadakan promosi ke kota-kota Indonesia. 2. “Clutering Lulusan Mahasiswa Matematika FMIPA UNTAN Pontianak Menggunakan Algoritma Fuzzy K-Means” [7] yang menyimpulkan kelulusan mahasiswa dengan 33 lulusan kisaran lama studi 5,91, yang menunjukan mahasiswa FMIPA UNTAN Pontianak dapat menempuh waktu studi selama lebih dari 10 semester atau 5 tahun. Hasil akhir dapat menjadikan bahan pertimbangan jurusan dalam meningkatkan IPK mahasiswa yang menyelesaikan studi pada tepat waktu. 3. “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan Metode K-Means” [5] yang menyimpulkan bahwa dari 20 data uji menghasilkan 3 cluster yaitu beras kualitas buruk yang memiliki titik pusat (5,8933;2,05), beras kualitas sedang yang memiliki titik pusat (6,28199;2,546), dan beras denga kualitas baik dengan titik pusat (6,96583;2,999167) yang hasil validasinya sebesar 92,82% bualitas beras. 5 4. “Pengelompokan Mahasiswa Berdasarkan Nilai Ujian Nasional Dan IPK menggunakan K-Means” [9] dengan simpulan bahwa hasil pengelompokan jaraknya relatif sangatlah berbeda. Yang diperoleh setiap hasil akhir ujian nasional tidah menjamin setiap mahasiswa mempunyai nilai IPK yang baik di akhir. 5. “Penggolongan Suara Berdasarkan Usia Dengan Menggunakan Metode K-Means” [10] dengan hasil penyimpulan terdapatnya suara anak dan suara dewasa dengan nilai formant untuk dewasa lebih dari 2500 dibandingkan denngan nilai formant yang dibawah 2500. Dengan tingkat keberhasilan sistem 100% dengan 10 data yang di ujikan 5 dewasa dan 5 anak-anak secara offline. Tabel 2.1 Tabel Penelitian No Peneliti Judul Metode Hasil 1. Johan Oscar Implementasi K-Means Tim marketing Ong Algoritma K- akan dikirim Means dengan jurusan Clustering yang diminatin Untuk dengan Menentukan kemampuan Strategi akademik diari Marketing calon mahasiswa President pada koat-kota di University Indonesia. 2013 2. Cary Lineker Clutering Fuzzy K-Means Simbolon, Lulusan bahwa masih Nilamsari Matematika banyak mahasiswa Kusumastuti, FMIPA jurusan Beni Irawan UNTAN matematikan yang Pontianak menempuh 6 Menunjukan 2013 Menggunakan studinya lebih dari Fuzzy K-Means 10 semester atau 5 tahun. 3. Silvi Agustina, Clustering K-Means Dhimas Yhudo, Kualitas Beras bahwa mampu Hadi Santoso, Berdasarkan mentranslasi Nofiadi Ciri Fisik persamaan yang Marnasusanto, Menggunakan intuitif menjadi Arif Tirtana, dan Metode KFakhris Khusnu Menunjukan ukuran kuantitatif. Means 2014 4. Hartatik 2014 Pengelompokan K-Means Pengelompakan Mahasiswa tian nilai ujian Berdasarkan nasional dan IPK Nilai Ujian sangat jauh Nasional Dan jaraknya antara IPK titik pusat satu Menggunakan dengan yang Metode K- lainnya, karena itu Means nilai ujian nasional tidak dapat menjadi seorang mahasiswa memperoleh IPK yang baik. 5. Prabowo Hadi Penggolongan Putra Sutiknyo Suara menggolongkan Berdasarkan menjadi 2 bagian Usia Dengan yaitu suara dewasa 2013 K-Means 7 Analisis dapat Menggunakan dan anak, yang Metode K- memiliki formant Means niali untuk dewasa 2500 untuk anak dibawah 2500. 2.2 Landasan Teori 2.2.1 Siswa Siswa dapat disebut juga dengan anak didik yang sedang menempatkan diri di suatu tempang yang didalamnya ada suatu proses belajar mengajar [11]. Pengertian siswa menurut pasal 1 ayat 4 UU RI No. 20 Tahun 2003 adalah anggota masyarakat yang berusalah mengembangkan dirinya melalui proses pendidikan pada jalur jenjang dan jenis pendidikan tertentu. Dan didalan proses tersebut siswa memiliki pemikiran atau impian atau sering disebut dengan cita-cita untuk bertujuan di kemuadian hari. Siswa dapat menjadi fakto penentu untuk mendapatkan motifasi diri sendiri untuk giat dalam belajar. Setiap siswa memiliki keunikan masing-masing, seperti potensi dalam berkembang. Proses berkembang itu sendiri membutuhkan sifat kepercayana diri yang tidak ditentukan oleh pengajar. Hal pertama kali dimana proses belajar mengajar yang diperhatikan adalah bagaimana keadaan dan kemampuannya. Faktor dan fasilitas yang cocok untuk mendukung pembentukan karekteristik siswa. Dalam proses belajar siswa dididik menjadi sekelompok manusia yang berpotensi an memiliki kemampuan yang sehat akan rohani dan jasmani. Yang mengenal kedewasaan pandangan dan melaksanakan tugas sebagai makhluk ciptaan Tuhan Yang Maha Esa, warga dan negara di sekitar. Siswa juga memiliki kewajiaban yang tertulis di UU RI No. 20 Tahun 2003 yaitu : (1) menjaga norma-norma pendidikan untuk menjamin keberlangsungan 8 proses dan keberhasilan pendidikan, (2) ikut menanggung biaya pendidikan kecuali bagi yang dibebaskan dari kewajiban tersebut. 2.2.2 Sekolah Sekolah adalah sebuah lembaga yang dirancang untuk pengajaran siswa / murid dibawah pengawasan guru [11] adalah suatu tempat dimana caloncalon siswa baru yang akan mengawali proses belajar mengajar. Yang akan mengisi waktu luang dengan bermain dan belajar menikmati masa anak-anak dan remaja. Dan belajar mengenal huruf dan angka, dapat membaca dan berhitung serta dapat mengenal moral atau budi pekerti dan seni. Kegiatan sekolah didampingi oleh beberapa orang ahli dan orang yang mengerti psikologi, sehingga anak didik dapat menciptakan dunianya sendiri dalam berbagai pelajaran. Sekolah adalah bangunan atau lembaga yang menerima dan memberi didikan atau pelejaran kepada anak didiknya. Sekolah juga memiliki seorang yang pemimpin dan yang orang-orang yang membantu dalam melakukan kebutuhan anak didiknya tersebut, misalnya seperti kepala sekolah, wakil kepala sekolah, guru-guru yang mengajar serta pengurus sekolah. Sekolah juga harus memiliki sarana dan prasarana untuk memenuhi dan membantu proses belajar mengajar anak didik. Berikut ini adalah sana dan prasarana sekolah : 1. Ruang Belajar Ruang belajar aja tempat dimana proses belajar mengajar berlangsung yang dapat bertatap muka langsung antara siswa dan guru. Ruang belajar bukan hanya dalam pembagian kelas saja melainkan ruang praktik, ruang laboratorium, ruang komputer, ruang keterampilan dan masih banyak yang lain. 2. Ruang Kantor Ruang kantor adalah tempat dimana para guru-guru melakukan proses atau rapat mengenai administrasi pembangunan agar gedung sekolah dapat berkembang dengan baik. 9 3. Perpustakaan Perputakaan adalah salah satu fasilitas yang sangat penting bagi siswa untuk membaca dan mencari ilmu serta dapat meminjam buku yang belum anak didik ketahui. 4. Halaman atau Lapangan Halaman ataupun lapangan adalah area dimana terjadi kegitan seperti : upacara bendera, olahraga, kegiatan belajar mengajar diluar kelas, berlatihan anak didik (ekstrakulikuler), dan bermainnya dan istirahat siswa. 5. Lain-Lain Sekolahpun memiliki ruang lainnya yang dapat mengembangkan bakat dan potensi seperti : ruang organisasi peserta didik (OSIS, Pramuka, senat siswa, dll). Disisi lain sekolah memiliki ruang seprti : ruang komite, kantin, ruang keamanan, ruang Unit Kesehatan Sekolah (UKS) serta gudang dll. 2.2.3 Nilai Hasil Belajar Nilai hasil belajar secara umum menjadi patokan yang dianggap baik tidaknya, nilai dapat disebut juga hasil dimana seorang siswa telah melakukan hak dan kewajibannya satelah melakukan atau berlangsungnya proses belajar mengajar di sekolah saat siswa berada. Beberapa pengertian nilai hasil belajar dari para ahli : 1. Hamali (2008) nilai hasil belajar adalah sebagai terjadinya perubahan tingkah laku pada diri seseorang yang dapat diamatin dan diukur bentuk pengetahuan, sikap 2. dan keterampilan 3. Dimyati dan Mudjiono (2006) nilai hasil belajar adalah hasil yang dicapai dalam bentuk angka-angka atau skor setelah diberikan tes hasil belajar pada setiap akhir pembelajaran 4. Suprijono (2009) nilai hasil belajar adalah pola-pola perbuatan, nilainilai, pengertian-pengertian, sikap-sikap, aspirasi dan keterampilan. 10 2.2.4 Sekolah Menengah Atas (SMA) Sekolah Menengah Atas (SMA) merupakan salah satu tahapan pendidikan setelah menyelasaikan Sekalah Menengah Pertama (SMP) atau Madrasah Tsanawiyah (MTs) selama 3 tahun. Ada pula beberapa jurusan yang di miliki oleh Sekolah Menengah Atas (SMA) yaitu Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Sekolah Menengah Atas (SMA) pun memilik beberapa tujuan, yaitu : 1. Memberikan pengetahuan kepada siswa agar dapat melanjutkan pendidikan ke jenjeng lebih tinggi dan dapat mengembangkan potensi diri dengan berkembangnya ilmu dan teknologi. 2. Mengembangkan kempuan siswa terhadap masyarakat dalam berhubungan timbal balik dengan lingkungan sosial, budaya dan alam sekitarnya. Mata pelajaran wajib Ilmu Pengetahuan Alam (IPA) : 1. Biologi 2. Fisika 3. Kimia 4. Matematika Mata pelajaran wajib Ilmu Pengetahuan Sosial (IPS) : 1. Geografi 2. Sosiologi dan Anthropologi 3. Ekonomi 4. Sejarah 2.3 Penjuruan Kurikulum Tahun 2013 Penjuran di era kurikulum 2013 sangat cepat dikarenakan para calon siswa SMA belum sepenuhnya mengetahui dan mengerti mata pelajaran di tingkat SMA. [1]. Penjurusan yang dilakuan yang awalannya dimulai dari 11 kelas X yang akan naik ke kelas XI, tapi sebaliknya sekarang penjurusan itu sendiri dilakukuan di awal kelas X atay bisa dibilang dimulai awal pendaftaran SMA, penjurusan tersebut dikelompokkan menjadi 2 yaitu : Ilmu Pengetahuan Alam dan Ilmu Pengetahuan Sosial. Dalam Permendikbud 69 tahun 2013 kurikulum baru persyaratan yang diambil untuk keputusan penjurusan dengan menggunakan nilai rapot SMP/MTs, hasil nilai UN SMP/MTs, hasil tes yang diselenggarakan di SMA itu sendiri, hasil tes psikolog serta rekomendasi yang diajukan dari guru BK. Siswa kelas X diharapkan dengan adanya penjurusan yang dimulai dari awal pendaftar SMA tidak terkejuat dengan perubahan yang begitu pesat dibandingkan dengan jaman siswa masih duduk dikelas SMP/MTs. Yang sebelumnya di SMP/MTs sudah mengenal pelajaran IPA atau IPS yang belum menjurus kespesifikasinya akan memulai mempelajaran atau meminatan pelajaran tersebut. Tetapi walaupun siswa memilih kelas IPA maupun IPS bukan berarti siwa hanya mempelajarin mata pelajaran yang sesuai dengan jurusannya masing-masing, tetapi masih bisa menerima mata pelajaran seperti : PKN, Bahasa Indonesia, seni budaya, pendidikan agama dan olah raga. 2.4 Data Mining Data mining merupakan proses mengalisis data dan menyimpulkan hasilnya menjadi sebuah informasi-informasi penting meningkatkan dan juga menurunkan jumlah yang ada. Gambar 2.1 Tahap-Tahap Data Mining 12 yang dapat Tahap-tahap data mining : 1. Pembersihan data adalah proses dimana dilakukannya penghapusan data yang tidak konsisten. 2. Integrasi data adalah proses penggabungan data-data yang terdapat dari beberapa sumber. 3. Seleksi data adalah proses dimana dari penggabungan data hanya dipilih yang akan sering dipakai. 4. Transformasi data adalah dimana data-data tersebut akan ditranformasikan dan diproses dalam data mining. 5. Proses mining adalah proses yang penting yang melibatkan metode untuk dapta smenghasilkan pola data. 6. Evaluasi data adalah proses dimana pola-pola data akan diuji untuk nilai kebenarannya yang ada didalam data itu sendiri. 7. Presntasi pengetahuan adalah proses penyajian atau menampilkan hasil dari proses mining kepada user. Dari diagram diatas maka dapat dijelaskan bahwa terdapat alur pengolahan data, yang pertama terdapat data yang akan dipilih untuk di proses, setelah selesai dalam pemilihan maka data yang sudah dipilih tadi akan dilanjutkan dalam untuk di transmisikan atau dijabarkan sesuai tabel untuk mudah membedakannya, setelah hasil tersebut maka didapat hasil yang disebut data mining, dari data mining tersebut maka bisa didapat knowlage atau sumber informasi dari hasil data mining tersebut. Dengan upaya penggunaan data mining di sekolah dapat membantu untuk mendapatkan pola-pola keputusan yang dapat digunakan dalam mengambil keputusan untuk menentukan tindakan. Walaupun data mining memiliki banya aplikasi populer yang mudah dipahami dalam menjalankan data mining, namun campur tangan manusia masih sangat dibutuhkan dalam mengambil keputusan. Adapun para pakar yang mendefinisikan pengertian data mining, sebagai berikut [11]: 13 1. Gartner mendefinisikan data mining adalah suatu proses pencarian pola dari data-data dengan jumlah yang sangat banyak yang tersimpan dalam suatu tempat penyimpanan dengan menggunakan teknologi pengenalan pola, teknik statistik, dan matematik. 2. Hand et al mendefinisikan data mining adalah analisis dari sekumpulan data yang diamati (sangat besar) untuk menemukan hubungan yang tidak terduga dan merangkum data dengan cara yang baru yang dapat dipahami dan berguna bagi pemilik data. 3. Berry mendefinisikan data mining merupakan proses ekplorasi dan analisis data yang berjumlah sangat besar untuk menemukan pola dan aturan yang berarti. Faktor yang mendukung perkembangan data mining adalah peningkatan jumlah data dalam sekala besar, dengan adanya data mining yang dapat dikomputerisasikan. Ada beberapa foktor pendorong data mininng dalam kemajuan : 1. Pertumbuhan data yang berskala besar 2. Bertipe data warehouse, sehingga menjasi pengguna dalam luang lingkup sekolah agar dapat mengakses seluruh data yang dimiliki sekolah yang telah tersimpan didalam database. 3. Pertumbuhan teknologi seperti meningkatkan akases dengan menggunakan navigasi web ataupun internet. 4. Dari tekanan pihak luar prediksi meningkatkan pengambilan keputusan untuk memilih jurusan guna meyakinkan diri dalam menempati jurusan tertentu. 5. Berkembangnya pengembang teknologi perangkat lunak (software) dalam data mining. 6. Berkembangnya kemampuan dalan berkapasitas penyimpanan data. Hubungan yang dihasilkan dari data mining antara sekolah dengan siswa-siswi akan menghasilkan pola yang dapat meningkkatkan semangat 14 belajar dalam memilih penjurusan. Dari hasil pola tersebut sekolah akan mengetahui anak didiknya yang berminat ingin memilih jurusan Ilmu Pengetahuan Alan (IPA) ataupun Ilmu Pengetahuan Sosial (IPS). 2.4.1 Konsep Klasifikasi Beberapa model konsep klasifikasi, sebagai berikut : 1. Model pelatihan (data latih) Model pelatihan merupakan kumpulan dari suatu data yang memiliki pengelompokan atau kelas yang sudah ditetapkan. Kumpulan data latih tersebut dapat digunakan juga untuk membentuk model klasifikasi. 2. Model pengujian (data uji) Jika di dalam model klasifikasi terbentuk kelasnya maka akan diuji dengan data yang berbeda agar dapat mengetahui asil akurat dari model klasifikasi tersebut. Hasil dari model klasifikasi dapat digunakan untuk menentukan kelas dari data yang baru. 2.4.2 K-Means Clustering K-Means Clustering merupakan metode untuk mengklasifikasikan atau mengelompokkandata ke dalam cluster berdasarkan artibut tertentu. Pengelompokan data dilakukan dengan menghitung jarak terdekat antara data observasi dengan pusat cluster. Prinsip utama dari metode ini adalah menyusun K sebuah centroid atau rata-rata dari sekumpulan data berdimensi N, dimana metode ini mensyaratkan nilai K sudah diketahui sebelumnya. Algoritma K-Means dimulai dengan pembentukan prototipe cluster diawal kemudian secara iteratif prototipe cluster tersebut diperbaiki sehingga tercapai kondisi konvergen, yaitu kondisidimana tidak terjadi perubahan yang signitifikan pada prototipe cluster. Perubahan ini diukur dengan menggunakan fungsi objektif D yang umumnya didefinisikan sebagai jumlah atau rata-rata jarak tiap item data dengan centroid groupnya. 15 2.4.3 Algoritma Metode K-Means Clustering Algoritma K-Means Clustering merupakan metode clustering berbasis jarang yang membagi data-data ke dalam sejumalah cluster dimana proses clustering tersebut dilakukan dengan memperhatikan kumpulan dari data-data yang akan dikelompokkan. Pada algoritma ini, pusat cluster dipilih pada tahap awal secara acak dari sekumpulan data. Kemudian K-Means menguji masing-masing komponen didalam kumpulan data dan menandai komponen tersebut ke salah satu centroid yang telah didefinisikan sebelumnya berdasarkan jarak minimun anatar komponen data dengan masing-masing centroid. Posisi centroid akan dihitung kembali sampai semua komponen data dikelompokkan disetiap centroid dan terakhir akan terbentuk posisi centroid baru. Iterasi ini akan terus dilakukan sampai tercipta kondisi konvergen. Gambar 2.1 Algoritma Metode K-Means Clustering 16 Tahapan interasi algoritma K-Means Clustering : 1. Jumlah K-Cluster Jumlah cluster adalah sama dengan k, jika ada dua cluster maka ada 2 centroid. 2. Set awal iterasi atau iterasi 0 3. Iterasi 0dengan jarak data ke centroid Hitung jarak centroid dengan menggunakan Euclidean Distance, sehingga seperti sebagai berikut : 4. Iterasi 0 clustering objek data Melakukan pengelompokan menjadi satu ataupun dua group yang berdekatan dengan centroid 5. Iterasi 1 enentukan centroid baru Menghitung kembali centroid baru, untuk setiap group yang ada, group stu hanya mempunyai satu anggota yaitu centroid baru 6. Iterasi 1 jarak objek ke centroid Proses hitung jarak pada setiap objek ke centroid baru dengan formula step 3 17 7. Iterasi 1 melakukan pengelompokan Pengelompokan kembali centroid baru 8. Iterasi 2 menentukan centroid baru Ulangi step 5 9. Iterasi 2 jarak objek ke centroid Ulangi step 3 10. Iterasi 2 clustering objek data Melakukan pengelompokan data dari cluster group 1 atau group 2 berdasarkan jarak centroid dengan iterasi 2 Dari hasil yang ditunjukkan G2, maka terlihat ada perubahan antara group 1 dengan group 2 serta proses iterasi tidak perlu diulangi lagi. 18 2.5 Kerangka Pemikiran Masalah Penentu jurusan siswa siswi untuk mengambil keputusan guna memilih penjurusan Ilmu Pengetahuan Alam (IPA) atau Ilmu Pengetahuan Sosial (IPS). Tindakan Menemukan pola data dengan K-Means Eksperimen Tool = Rapidminer Data = nilai rapot dan hasil UN SMP/MTs metode = K-Means Hasil Dengan hasil yang dihasilkan penelitian ini, maka akan memudahkan siswa untuk mengambil penjurusan sesuai dengan nilai dari data yang siswa miliki dalam data rekap nilai siswa Gambar 2.3 Kerangka Pemikiran 19 2.6 Matlab 2013 Matlab adalah sebuah program yang berfungsi untuk menganalisis dan mengkomputasi numerik yang berdasarkan pemikiran dari suatu matematika lanjut yang berbentuk matriks. Matlab merupakan salah satu bahasa pemograman yang berkempang menjadi suatu bahasa pemograman yang canggih. Kegunaan matlab : 1. Matematika dan komputansi 2. Pengembangan dan algoritma 3. Pemograman modeling, simulasi, dan pembuatan prototipe 4. Analisis data, eksplorasi dan visualisasi 5. Analisis numerik dan statistik 6. Pengembangan aplikasi teknik Disisi lain matlab memiliki beberapa jenis window matlab, yakni ; a. Matlab Command Window / Editor b. Matlab Editor / Debugger (Editor M-File / Pencarian Kesalahan) c. Figure Windows d. Matlab Help Window 20 BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Sebagai instrumen penelitian akan dibuat dengan menggunakan beberapa perlengkapan, yaitu : 3.1.1 Perangkat Keras (Hardware) Perangkat keras berperan penting untuk melakukan penelitian ini. Berikut ini perangkat keras yang akan digunakan : a. Laptop Thosiba Satelite Pro C640 b. Processor Intel Prosesor c. RAM 2gb d. Printer e. Flash Disk 3.1.2 Perangkat Lunak (Software) Tak kalah pentingnya perangkat lunak dengan perangkat keras, perangkat lunak merupakan kebutuhan penting agar penelitian ini dapat berjalan dengan baik. Perangkat lunak yang dibutuhkan sebagai berikut : a. Sistem operasi : windows 7 32 bit b. Microsoft Excel 2013 c. Microsoft Word 2013 3.2 Jenis Penelitian Penelitian ini akan dilakukan di SMA Negeri 3 Pati, yang beralamat Jalan Panglima Sudirman No 1A, Desa Puri, Kec. Pati, Jawa Tengah. Penelitian ini juga disebut penelitian eksperimen yang ingin menerepankan 21 implemtasi alogoritma k-means yang berdasarkan nilai-nilai persyartan yang berhubungan dengan penjurusan diakhir semester kelas X. Atribut yang digunakan untuk penjurusan dengan : 1. Nilai rapot SMP/MTs. 2. Hasil nilai UN SMP/MTs. 3. Rekomendasi dari guru BK. 4. Hasil tes yang diadakan oleh calon SMA yang baru. 5. Hasil psikolog 3.3 Metode Pengumpulan Data Pengumpulan data ini dapat menggunakan beberapa metode, sebagai berikut : 1. Studi Kasus Studi kasus menurut Bimo Walgitu (2010 : 92) adalah suatu metode untuk mempelajari atau menyelidiki suatu kejadian mengenai perorangan. Studi kasus menurut W.S Winkel dan Sri Hastuti (2006 : 311) adalah metode untuk mempelajari keadaan dan perkembangan siswa secara lengkap dan mendalam, dengan tujuan memahami individualitas siswa dengan baik dan membantunya dalam perkembangan selanjutnya. Jadi dari metode kasus dapat menyimpulkan pengumpulan data dapat diperoleh dari wawancara serta mendapatkan data mengenai potensi dan masalah siswa-siwi dalam memilih penjurusan. 2. Dokumentasi Dokumentasi diperoleh saat penulis telah melakukan wawancara, dokumen yang dapat memperoleh informasi masa lalu atau informasi sebelumnya. Untuk memperlengkap data-data yang lain. 22 3. Studi Pustaka Studi pustaka dapat disebut dengan literature yang merupakan metode pengumpulan data dan informasi dari beberapa buku, jurnal, tesis, internet dan dari pustaka lainnya yang berhungngan dengan penjurusan siswa-siswi SMA, data mining dan metode k-means yang dapat membantu melaksanakan penelitian. 3.4 Jenis Data dan Sumber Data Peneliti menggunakan jenis data yang berbentuk kuantitatif. Data kuantitatif berbentuk angka atau pun nilai-nilai hasil akhir . Penelitian ini menggunakan data nilai rapot, hasil UN, hasil tes yang diadakan dipendaftaran SMA, serta hail psikolog dan digunakan sebagai bahan uji yang akan di olah dan akan menghasilkan hasil outputnya penjurusan Ilmu Pengetahuan Alan (IPA) ataupun Ilmu Pengetahuan Sosial (IPS). 3.4.1 Sumber Data a. Data Primer Untuk pengambilan data primer, akan dilakukan dengan cara mewawancarai kepala cabang tata usaha yang memegang tentang data siswa-siswi SMA Negeri 3 Pati yang diperlukan (interview). Pengumpulan data siswa-siswi yang dilakukan diperlukan meliputin : nama siswa-siswi, nilai rapot SMP/MTS, dan hasil UN SMP/MTS, b. Data Sekunder Guna mendapatkan kelengkapan data secara tidak langsung yang selengkap-lengkapnya penelitian ini juga menggunakan referensi dari beberapa jurnal, buku teks, paper, karya ilmiah, tesis, dan situ-situs penunjang diinternet, sebagai landasan teori guna memperkuat dasar penelitian ini. 23 3.5 Metode Penelitian Peneliti menggunakan metode penerapan penentuan sebagai pengelompokan. Data yang digunakan dalam penelitian ini adalah data berdasarkan , yang meliputi : 1. Nama siswa 2. Nilai rapot SMP/MTs. 3. Hasil nilai UN SMP/MTs. 4. Rekomendasi dari guru BK. 5. Hasil tes yang diadakan oleh calon SMA yang baru. 6. Hasil psikolog Untuk menarik kesimpulan di hasil akhir dengan metode K-Means yaitu dengan memperbarui tingkat kepercayaan diri dalam memilih pilihan yang pasti. Adapun proses penelitian atau gambaran untuk terlaksananya penelitian sebagai berikut ini : Data Siswa calon kelas X SMA Negeri 3 Pati, yang mengambil penjurusan IPA atau IPS Penerapan metode klastering Penerapan K-Means Perhitungan nilai preferensi untuk setiap data calon siswa kelas X Hasil akan menunjukan pengolongan pemilihan jurusan siswa mengambil jurusan IPA atau IPS Gambar 3.1 Alur yang Disusulkan (Proses Penelitian) 24 Berdasarkan proses penelitian seperti gambar yang diatas dapat dijelaskan, sebagai berikut ini : 1. Data set adalah data-data siswa calon kelas X pada yang mengenai persyaratan untuk memilih jurusan yang sudah ditentukan, serta menentukan artibut data yang akan digunakan dalam penelitian ini untuk melakukan perhitungan. 2. Kemudian data-data tersebut akan diproses dengan penerapan metode klastering dan k-means, untuk pengelompokan agar dapat mengetahui perbandingan apakah siswa masuk kedalam jurusan Ilmu Pengetahuan Alam (IPA) ataukah masuk kedalam jurusan Ilmu Pengetahuan Sosial (IPS) dengan syarat-syarat yang sudah ditentukan. 3. Setelah melakukan proses klastering dan k-means akan menghasilkan hasil akhir yang menyatakan keputusan siswa yang akan memilih jurusan Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Berdasarkan pada data-data penelitian ini memerlukan permasalahan dan tujuan yang telah dibahas dalam bab yang sebelumnya. Adapun metode yang digunakan untuk menyusun tugas akhir ini dengan : 3.5.1 Perencanaan Dalam tahap perencanaan ini peneliti membutuhkan kebutuhankebutuhkan dengan memberikan data primer dan data sekunder yang dilakukan dengan mengambil data hasil belajar dengan tujuan untuk penentu jurusan. 3.5.2 Analisis Kebutuhan Perangkat Keras dan Perangkat Lunak Dengan tahap ini peneliti menganalisa kebuthan yang diperlukan untuk melakukan penelitian tugas akhir seperti data-data yang telah dikumpulkan, data analisis, perangkat keras serta perangkat lunak yang dapat menlancarka proses penelitian Perangkat keras (hardware) yang dibutuhkan adalah : 25 a. Komputer atau leptop dengan spesifikasi : Processor : Core 3 Sistem operasi : Windows 7 RAM : 2gb b. Printer yang digunakan untuk hasil peneliti dengan bentuk hardcopy. Perangkat lunak (software) yang dibuttuhkan adalah : a. Sistem operasi yang akan digunakan dalam penelitian ini adalah windows 7. b. Microsotf word adalah salah satu perangkat lunak yang dapat mencatat penelitian dan akan menjadi sebuah laporan penelitian. 3.6 Teknik Analisis Data Proses data mining model CRISP-DM (Cross Industry Standard Process) inilah yang digunakan di penelitian ini memiliki beberapa tahap, sebagai berikut : 1. Tahap Pemahaman Bisnis a. Sebuah penelitian mempunyai tujuan bisnis dalam menentukan jurusan siswa-siswi SMA Negeri 3 Pati sehingga siswa-siswi dapat belajar maksimal sesuai dengan jurusan yang telah disediakan. b. Strategi awal yang digunakan adalah mencari database yang dibutuhkan. 2. Tahap Pemahaman Data Pengumpulan data primer dilakukan dengan mengambil data hasil belajar siswa-siswi saat mengakhiri penyelesaian SMP/MTS. 3. Tahap Pengolahan Data Pengumpulan data-data awal diperoleh sebanyak 500 data, dan tidak semuanya yang digunakan. Beberapa teknik yang akan dilakukan adalah : a. Data Validation 26 Penghapusan data yang tidak lengkap atau missing value. Pada penilitian ini tidak ada data yang missing value jadi semua data digunakan yaitu 500 data. b. Data integration dan transformasi, meningkatkan akurasi dan efisiensi algoritma. Algoritma k-means dapat memproses data yang bertipe nominal maupun ordinal, sehingga data tidak perlu untuk ditransformasi. c. Data size reduction Memperoleh data dengan record dan jumlah atribut sedikit tetapi bersifat informatif. Beberapa atribut dihilangkan dan hanya atribut inti saja yang digunakan adalah : 1. Tahap Pemodelan Dataset yang dimodelkan dengan algoritma k-means sehingga menghasilkan perhitungan dan digunkan untuk menentukan label dari inputan baru. 2. Tahap Evaluasi Perhitungan akurasi dari model yag telah dibentuk oleh algoritma k-means. 3. Tahap Implementasi Tahap yang mengimplementasi dimana model yang sudah dievaluasi diimplementasikan sehingga dapat digunakan untuk menentukan penjurusan pada SMA Negeri 3 Pati. 3.7 Model yang Diusulkan Penelitian membuat model yang diusulan agar dapat penerapan atau implementasi algoritma k-means sebagai berikut : 27 Penentuan Atribut Pengambilan Data Data Training Data Testing Hasil Gambar 3.2 Model Penelitian yang Diusulkan Berdasarkan analisis diatas : 1. Pengumpulan data dari nilai rapot SMP/MTs, dan hasil UN SMP/MTs. 2. Menentukan atribut data yang akan digunakan dalam penelitian ini untuk melakukan perhitungan. 3. Data testing siswa dihitung untuk dilakukan perbandingan dengan data training. 28 4. Perbandingan yang dihasilkan akan dapat mrngrtahui pengolongan apakan siswa masuk dalam penjurusan IPA atau IPS. 5. Dengan hasil yang demikian maka dapat di ambil keputusan siswa masuk ke dalam golongan IPA atau IPS tanpa kesulitan mengambil keputusan. 3.8 Eksperimen dan Pengujian Model Hasil dari model algoritma k-means peneliti akan mengimplementasikan klastering penjurusan ke dalam program matlab dan menghitung hasil akhir k-means sehingga menghasilkan penjurusan Ilmu Pengetahuan Alam (IPA) atau Ilmu Pengetahuan Sosial (IPS). 29 BAB IV ANALISIS HASIL PENELITIAN DAN PEMBAHASAN 4.1 Persiapan Data Dalam melakukan implementasi data mining guna klasifikasi penjurusan pada SMA Negeri 3 PATI menggunakan metode K-Means diperlukan data training yaitu berupa data nilai dan jurusan para siswa SMA Negeri 3 PATI. Adapun data 500 ini dari tahun 2013-2015 digunakan sebagai data training yang nantinya diolah menggunakan algoritma K-Means sehingga membentuk centroid cluster yang dapat mengelompokan jurusan para siswa. Berikut data yang diperoleh dari SMA Negeri 3 Pati : Gambar 4.1a Data Asli 30 Gambar 4.1b Data Asli Berikut adalah beberapa sampel data asli dari beberapa siswa, dan beberapa artibut pada data penelitian : a. No. Pendaftaran : nomer data dari sebuah pendaftaran di SMA Negeri 3 Pati b. Nama : nama dari beberapa calon siswa SMA Negeri 3 Pati c. Jenis Kelamin : jenis kelamin dari para calon siswa SMA Negeri 3 Pati d. Asal Sekolah : asal SMP/MTs clon siswa e. Rapot Matematika : rata-rata nilai matematika dari kelas 7 sampai kelas 9 f. Rapot IPA : rata-rata nilai IPA dari kelas 7 sampai kelas 9 g. Rapot IPS : rata-rata nilai IPS dari kelas 7 sampai kelas 9 h. UN Matematika : hasil dari ujian nasional siswa SMP?MTs 31 i. UN IPA : hasil dari ujian nasional siswa SMP/MTs j. UN IPS : hasil dari ujian nasional siswa SMP/MTs k. Rata-rata : rata-rata nilai seorang siswa dari rapot matematika, rapot IPA, rapot IPS, UN matematika, UN IPA, UN IPS l. Peminatan : angket peminatan siswa SMP/MTs yang diberikan kepada siswa dari guru BK SMP/MTs Setelah dari beberapa artibut diatas maka selanjutnya akan dilakukan teknik pengolahan data awal. Dari tahap ini akan menjadi lebih spesifikasi dan berkualitas dalam melakukan proses data mining yang bisa disebut juga pembersihan data ata transformasi data. 4.1.1 Pembersihan Data Dalam proses pembersihan data akan dilakuan penghapusan record yang terdapat pada atribut yang tidak diperlukan,tidak lengkap atau kosong, sebagai berikut : Gambar 4.2a Pembersihan Data yang Kosong 32 Gambar 4.2b Pembersihan Data yang Kosong Seperti gambar diatas ada pembersihan data yang kosong tersebut terletak pada kolom atribut peminatan penjurusan. Data tersebut agar proses dimana pengelompokan penjurusan tadik rancu saat pengelolahan data. Selain penghapusan data akan dilakukan penghapusan atribut atau babak penyisian data yang tidah berfungsi pasa saat proses pengekelompokkan dihilangkan atau dihapus. Atribut yang akan dihapus adalah no. Pendaftaran, jenes kelamin, dan asal sekolah. Dan setelah penghapusan data yang kosong yang semula pada awalnya data terdapata 500 data menjadi 411 data. Dan penghapusan atribut maka atribut akan menjadi 10 atribut dari 13 atribut sebelum penghapusan data. 33 Gambar 4.3a Penghapusan atribut Gambar 4.3b Penghapusan atribut 34 4.2 Pengolahan Data Pada tahap pengolahan data, data berjumlah 500 data di masukkan sebagai data training pada database matlab, melalui database training matlab, data tersebut akan diolah kembali sehingga membentuk cluster menggunakan tools matlab yang dapat digunakan sebagai data clustering, Data yang dinputkan berupa Rapot matematika, Rapot IPA, Rapot IPS, Ujian Nasional Matematika, Ujian Nasional IPA, dan Ujian Nasional IPS dan Rata rata, Data nilai yang diinputkan tersebut akan memunculkan output peminatan jurusan berdasarkan nilai siswa, Output yang tersedia adalah jurusan IPA dan IPS. Data-data rapot matematika, rapot IPA, rapot IPS, UN matematika, UN IPA, dan UN IPS diinputkan ke dalam matlab sebagai berikut : Gambar 4.4 Tampilan Data yang Diinput Data yang dinput akan memproses atau membentuk titik centroid atau titik batasan pengelompokan atau cluster. Dari data cluster yang diolah 35 menggunakan matlab, data cluster di ubah menjadi 2 centroid yaitu berupa outputan IPA dan IPS . Berikut hasil data cluster menggunakkan matlab : Gambar 4.5 Tampilan Data Cluster Matlab Tabel 4.1 Centroid kluster No Rapot Rapot Rapot UN Mat IPA IPS Mat UN IPA UN IPS rata IPA 82.8243 82.4156 82.4533 62.4289 71.5398 69.9688 75.2719 IPS 82.5821 82.5862 54.0962 74.9752 75.0157 75.3597 82.9019 36 Rata- Dari data hasil cluster menggunakan matlab, kemudian data tersebut diuji menggunakan data uji berjumlah 45 data yang diuji menggunakan aplikasi Matlab. Dari data uji tersebut akan terlihat tingkat keakurasian yang dihasilkan menggunakan aplikasi matlab, Jarak antara data uji dengan centroid pada pengujian aplikasi ini menggunakan metode perhitungan jarak Ecuildean Distance, sehingga akan terlihat jarak antara data objek dengan centroid terdekat. 4.3 Menghitung Manual Clustering K-Means Tahapan proses perhitungan secara manual yaitu: a. Menentukan jumlah cluster Dalam menentukan jumlah cluster dari data-data yang ada akan dibuat menjadi 2 cluster yaitu IPA dan IPS . b. Menghitung nilai centroid awal Dalam menghitung nilai centroid awal menggunakan nilai mean. Nilai masing-masing kolom rata-rata diambil berdasarkan sampel 500 dataset menggunakan matlab seperti pada sub bab sebelumnya. Data centroid yang terbentuk sebagai berikut: Tabel 4.2 Nilai Centroid No Rapot Rapot Rapot Mat IPA IPS RataUN Mat UN IPA UN IPS rata IPA 82.8243 82.4156 82.4533 62.4289 71.5398 69.9688 75.2719 IPS 82.5821 82.5862 54.0962 74.9752 75.0157 75.3597 82.9019 Sehingga nilai centroid untuk IPA dan IPS ditunjukan pada tabel diatas. 37 c. Menghitung dataset Berikut contoh menghitung dataset : Tabel 4.3 Data hitung Rapot Rapot Matematika IPA Rapot UN UN IPS Matematika IPA RataUN IPS rata 85.57 88.72 89.67 62.20 75.99 64.77 77.82 79.11 76.95 85.55 35.58 57.78 61.64 66.10 91.24 71.72 80.11 75.06 84.94 70.51 78.93 92.22 81.43 70.54 83.36 58.12 56.11 73.63 76.64 93.53 84.49 73.40 59.11 65.76 75.49 72.57 91.46 77.48 37.91 60.19 89.46 71.51 Cara menentukan jarak dengan teknik euclidean distance yaitu : 1. IPA= 12.3573 IPS = = 16.5117 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPA sehingga dataset ke-1 termasuk cluster 1 yang berarti masuk ke kluster IPA dalam penjurusan SMA Negeri 3 Pati. 2. IPA= = 33.421 38 IPS= =30.956 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPS sehingga dataset ke-2 termasuk cluster 2 yang berarti masuk ke kluster IPS dalam penjurusan SMA Negeri 3 Pati. 3. IPA= =23.311 IPS= =27.659 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPA sehingga dataset ke-3 termasuk cluster 1 yang berarti masuk ke kluster IPA dalam penjurusan SMA Negeri 3 Pati. 4. IPA= =32.316 IPS= =41.648 39 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPA sehingga dataset ke-4 termasuk cluster 1 yang berarti masuk ke kluster IPA dalam penjurusan SMA Negeri 3 Pati. 5. IPA= =21.409 IPS= =29.542 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPA sehingga dataset ke-5 termasuk cluster 1 yang berarti masuk ke kluster IPA dalam penjurusan SMA Negeri 3 Pati. 6. IPA= =36.543 IPS= =30.262 Maka hasil jarak terkecil pada data antara nilai centroid dengan objek yaitu IPS sehingga dataset ke-6 termasuk cluster 2 yang berarti masuk ke kluster IPS dalam penjurusan SMA Negeri 3 Pati. 40 4.4 Implementasi Dari pengolahan databet yang telah diatur maka akan diimplementasikan kealam sebuah prototype. Yang dimana program pemprosesan tersebut akan melakukan mengelompokan atau klastering dari data yang akan diuji coba. Adapun langkah-langkah dalam memimplementasikan sebagai berikut : 1. Tampilan sistem yang dibuat adalah sebagai berikut: a. Tampilan Utama Tampilan ini merupakan tampilan form utama program aplikasi dijalankan. Pada form ini berisi : disisi pojok kiri atas ada simbol logo SMA Negeri 3 Pati yang melambangkan bahwa implementasi dan data yang akan diproses berasal dari SMA Negeri 3 Pati itu sendiri, disisi pojok kanan atas ada judul implementasi penjurusan yang disertakan alamat SMA Negeri 3 Pati terletak. Setelah itu ada menu untuk penjurusan berdasarkan inputan nilai menu terdapat dibarisan sebelah kiri bawah yaitu : rapot matematika, rapot IPA, rapot IPS, UN matematika, UN IPA, dan UN IPS. Dengan mengisi nilai-nilai variabel, yang nantinya nilai variabel untuk menjadi data input dan akan diproses menjadi output data yang menghasilkan hasil peminatan yang sudah di klaster, dan hasil dari proses adalah masuk dalam penjurusan IPA maupun IPS. 41 Tampilan utama dalam aplikasi yang akan dibangun adalah sebagai berikut : Gambar 4.6 Tampilan Menu Utama Pada tampilan menu utama langsung terdapat menu pengelompokan, aplikasi akan berjalan bila telah menginput data sesuai dengan atributnya masing-masing yang terdiri dari inputan rapot matematika, rapot IPA, rapot IPS,UN matematika, UN IPA, dan UN IPS. Setelah penginputan maka diproses sebagai eksekusi yang akan menghasilkan nilai rata-rata dan dapat dilihat kasil klastering penjurusan yaitu IPA ataupun IPS. 42 Gambar 4.7 Editor Menu Utama Gambar 4.8 Tampilan Contoh Penginputan 43 4.5 Hasil Analisis Pada sub bab berikut akan menjelaskan tentang eksperimen yang dilakukan untuk mendapatkan nilai akurasi berdasarkan output aplikasi yang digunakan menggunakan metode K-Means dalam penjurusan siswa menggunakan data nilai siswa di SMA Negeri 3 Pati. Tabel uji coba sebagai berikut menggunakan data uji berjumlah 100 data nilai siswa . Tabel 4.4 Tabel Evaluasi No IPA IPS Peminatan Hasil Rapot Rapot Rapot UN UN UN Rata- Mat IPA IPS Mat IPA IPS rata 1 85.57 88.72 89.67 62.20 75.99 64.77 77.82 12.357 16.512 IPA TRUE 2 79.11 76.95 85.55 35.58 57.78 61.64 66.10 33.421 30.956 IPS TRUE 3 91.24 71.72 80.11 75.06 84.94 70.51 78.93 23.311 27.659 IPA TRUE 4 92.22 81.43 70.54 83.36 58.12 56.11 73.63 32.316 41.648 IPA TRUE 5 76.64 93.53 84.49 73.40 59.11 65.76 75.49 21.409 29.542 IPA TRUE 6 72.57 91.46 77.48 37.91 60.19 89.46 71.51 36.543 30.262 IPS TRUE 7 75.79 93.49 72.95 59.88 92.01 82.82 79.49 29.508 25.766 IPA FALSE 8 82.95 78.79 70.33 53.59 76.30 87.81 74.96 24.071 18.181 IPS TRUE 9 93.18 78.28 94.08 53.85 77.51 85.25 80.36 25.068 19.807 IPA FALSE 10 78.80 94.30 74.34 75.84 94.88 53.24 78.57 35.191 39.694 IPA TRUE 11 86.92 79.69 87.97 46.23 55.39 59.55 69.29 26.877 27.843 IPS FALSE 12 84.80 86.87 82.67 83.43 94.09 65.63 82.92 32.415 37.323 IPA TRUE 13 86.37 89.45 90.12 79.54 94.09 90.23 88.30 38.759 39.078 IPA TRUE 14 79.21 71.83 72.43 63.74 71.28 70.02 71.42 15.557 19.478 IPS FALSE 44 Angket 15 80.89 75.36 92.90 47.35 93.15 55.66 74.22 32.609 30.242 IPS TRUE 16 88.30 81.47 76.34 83.37 71.04 78.02 79.76 24.332 31.149 IPA TRUE 17 92.93 93.71 72.92 63.87 54.79 79.68 76.32 26.430 29.047 IPA TRUE 18 71.23 70.64 80.15 51.20 89.81 86.05 74.85 31.574 25.197 IPS TRUE 19 72.78 73.89 80.57 61.05 76.47 54.65 69.90 21.602 26.020 IPS FALSE 20 89.87 84.43 75.52 66.79 62.05 78.94 76.27 17.100 21.131 IPA TRUE 21 81.16 85.71 75.84 57.15 54.43 93.78 74.68 30.750 29.030 IPS TRUE 22 74.15 73.32 88.72 65.68 86.82 70.33 76.50 21.052 22.308 IPA TRUE 23 79.67 70.63 82.19 81.43 87.19 50.18 75.21 33.857 40.819 IPA TRUE 24 75.21 76.95 72.27 80.29 74.77 67.59 74.51 22.957 30.646 IPA TRUE 25 82.70 86.22 78.53 44.94 80.89 86.30 76.60 26.297 16.655 IPS TRUE 26 85.71 86.29 94.15 82.63 70.67 57.99 79.57 27.034 35.991 IPA TRUE 27 89.19 90.60 81.56 62.26 75.46 66.64 77.62 11.841 15.718 IPS TRUE 28 71.61 78.20 71.43 41.54 86.99 74.95 70.79 31.385 24.374 IPS TRUE 29 76.96 81.50 72.86 53.55 60.38 90.70 72.66 27.697 24.448 IPS TRUE 30 84.56 76.78 85.44 49.12 92.14 55.96 74.00 29.041 27.001 IPS TRUE 31 87.09 88.16 94.21 52.74 77.39 82.47 80.34 22.353 16.486 IPA FALSE 32 76.79 90.23 73.97 37.91 88.42 80.96 74.71 34.299 25.466 IPS TRUE 33 79.95 84.21 82.21 82.97 55.15 65.58 75.01 26.857 36.433 IPA TRUE 34 75.85 87.03 71.84 65.07 50.93 76.07 71.13 35.854 30.047 IPS TRUE 35 85.23 77.21 91.88 41.30 51.16 67.31 69.01 32.092 30.847 IPS TRUE 36 86.56 70.75 70.71 48.82 87.00 81.60 74.24 29.131 22.616 IPS TRUE 45 37 70.30 79.21 80.37 61.15 65.81 59.54 69.40 18.685 24.167 IPS FALSE 38 90.87 90.31 86.62 81.84 51.02 58.75 76.57 32.708 41.824 IPA TRUE 39 82.23 83.60 86.45 71.64 50.03 57.57 71.92 27.028 35.543 IPA FALSE 40 88.11 91.36 92.37 68.87 81.04 84.08 84.31 24.875 24.838 IPS FALSE 41 74.15 78.13 70.20 72.12 86.24 72.72 75.59 23.690 26.583 IPA TRUE 42 92.93 74.36 92.12 70.07 92.33 90.17 85.33 31.501 33.819 IPA TRUE 43 86.22 90.36 81.58 73.99 88.60 94.42 85.86 34.784 33.767 IPS FALSE 44 81.88 89.50 75.20 35.58 51.74 84.54 69.74 38.205 33.303 IPS TRUE 45 83.31 83.49 89.73 76.73 87.22 63.86 80.72 23.910 29.448 IPA TRUE 46 88.26 90.76 88.03 64.25 73.50 62.24 77.84 14.275 19.997 IPA TRUE 47 88.55 79.44 73.85 49.64 68.32 64.61 70.73 18.412 17.672 IPS TRUE 48 90.11 92.03 71.59 51.36 83.15 66.85 75.85 23.033 20.080 IPS TRUE 49 88.38 70.11 71.50 72.10 52.43 56.54 68.51 31.419 39.109 IPA TRUE 50 80.72 88.15 76.93 51.45 92.63 75.31 77.53 25.819 29.778 IPA TRUE 51 84.04 89.91 76.70 82.23 82.86 87.51 83.88 31.509 34.233 IPA TRUE 52 75.21 89.24 89.67 35.37 78.32 85.41 75.54 34.255 24.975 IPS TRUE 53 82.95 78.79 70.33 53.59 76.30 87.81 74.96 24.071 18.181 IPS TRUE 54 88.23 80.80 80.79 53.85 88.71 69.62 77.00 20.148 15.970 IPA FALSE 55 83.64 86.64 76.36 81.32 93.15 53.64 79.13 34.075 39.978 IPA TRUE 56 75.12 82.19 81.83 38.36 91.66 63.64 72.13 33.072 26.966 IPS TRUE 57 90.75 82.44 86.09 66.22 65.21 71.17 76.98 11.614 18.268 IPA TRUE 58 80.56 91.35 82.88 66.93 67.57 93.85 80.52 26.809 26.136 IPA FALSE 46 59 82.60 88.08 85.65 78.39 94.99 74.52 84.04 30.731 33.251 IPA TRUE 60 92.80 73.88 80.17 35.95 62.38 61.35 67.76 33.066 30.202 IPS TRUE 61 80.93 72.65 91.73 78.87 76.04 67.90 78.02 22.085 29.305 IPA TRUE 62 72.45 72.90 92.90 44.49 88.56 51.59 70.48 35.773 34.041 IPS TRUE 63 70.82 81.41 87.26 68.79 60.90 75.98 74.19 18.951 24.194 IPA TRUE 64 72.97 87.04 86.78 35.20 69.69 57.85 68.25 32.837 29.439 IPS TRUE 65 74.40 80.16 70.98 43.00 58.55 94.62 70.29 37.232 31.873 IPS TRUE 66 74.87 86.81 80.93 66.94 74.81 87.94 78.72 18.230 20.695 IPA TRUE 67 73.94 94.57 77.00 70.41 66.80 50.32 72.17 27.171 34.766 IPS FALSE 68 91.06 80.54 73.41 62.89 77.28 85.72 78.48 21.086 19.021 IPS FALSE 69 84.45 72.58 79.27 40.88 80.50 90.98 74.78 33.107 23.955 IPS TRUE 70 86.16 77.26 93.41 55.56 94.06 71.18 79.61 27.068 23.560 IPA FALSE 71 80.01 85.73 77.50 81.11 83.78 80.22 81.39 26.161 30.238 IPA TRUE 72 77.02 76.75 85.87 62.36 74.40 92.29 78.11 24.329 21.299 IPS FALSE 73 89.67 73.83 72.96 74.52 59.43 81.73 75.35 25.337 30.315 IPA TRUE 74 86.55 87.66 70.39 37.97 53.32 83.89 69.97 36.592 32.016 IPS TRUE 75 85.38 88.47 90.15 43.20 64.75 59.46 71.90 25.300 23.991 IPA TRUE 76 84.52 78.31 74.93 52.85 94.22 55.76 73.43 29.796 28.740 IPS TRUE 77 86.64 86.74 80.63 81.99 91.30 55.00 80.38 32.553 38.796 IPA TRUE 78 76.19 93.81 75.32 81.44 93.83 59.18 79.96 34.948 39.990 IPA TRUE 79 93.69 77.39 77.46 78.21 79.25 68.68 79.11 22.211 28.699 IPA TRUE 80 70.97 76.88 93.75 39.47 61.52 59.97 67.09 33.065 31.456 IPA FALSE 47 81 89.39 81.58 89.56 48.26 64.25 56.06 71.52 26.581 24.808 IPS TRUE 82 79.67 76.20 73.96 79.13 52.96 58.58 70.09 30.019 39.176 IPS FALSE 83 89.63 80.85 87.57 35.41 64.33 83.00 73.46 32.097 24.560 IPS TRUE 84 81.21 87.88 78.70 83.91 51.48 73.50 76.11 30.385 38.596 IPA TRUE 85 91.60 85.26 87.83 41.28 82.67 89.60 79.71 33.021 23.777 IPS TRUE 86 78.21 91.05 71.80 80.92 75.88 94.34 82.04 34.780 36.717 IPA TRUE 87 75.13 81.01 79.97 52.08 65.22 71.20 70.77 15.370 14.311 IPA FALSE 88 88.14 71.63 74.82 56.89 83.13 84.72 76.56 24.231 19.426 IPA FALSE 89 81.87 83.49 79.67 62.42 61.08 74.63 73.86 11.956 16.595 IPA TRUE 90 80.57 72.01 76.88 78.00 54.94 51.09 68.91 32.546 41.673 IPA FALSE 91 74.84 75.77 88.93 43.42 90.80 94.82 78.10 38.833 30.258 IPS FALSE 92 79.08 82.29 81.77 64.10 90.82 62.69 76.79 21.080 22.809 IPA TRUE 93 87.64 72.38 83.41 78.44 69.66 90.60 80.36 28.917 31.869 IPA TRUE 94 77.83 91.52 74.65 43.32 93.01 81.10 76.91 33.481 25.478 IPA FALSE 95 79.67 70.63 82.19 81.43 87.19 50.18 75.21 33.857 40.819 IPA TRUE 96 84.80 86.87 82.67 83.43 94.09 65.63 82.92 32.415 37.323 IPA TRUE 97 86.37 89.45 90.12 79.54 94.09 90.23 88.30 38.759 39.078 IPA TRUE 98 80.30 90.98 92.43 39.79 62.49 67.06 72.17 28.144 24.673 IPS TRUE 99 80.24 90.55 83.20 71.24 56.49 82.58 77.38 23.257 27.710 IPA TRUE 100 79.65 73.72 83.28 55.44 64.04 81.42 72.93 18.113 16.055 IPS TRUE 48 Berdasarkan data tabel diatas berjumlah 100 data pengujian, terdapat 22 data yang memiliki nilai kesalahan. Dari nilai tersebut akan dihitung nilai akurasi terhadap implementasi aplikasi penjurusan menggunakan algoritma kMeans. Nilai akurasi yang digunakan dari jumlah citra bernilai kebenaran dibagi dengan jumlah data uji keseluruhan dikali 100% Akurasi = x100% = 78 % 49 BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan Dari permasalahan di atas mengenai penerapan data mining untuk mengklasifikasi penjurusan IPA atau IPS dengan metode k-means, penulis dapat menarik kesimpulan dan saran 1. Penelitian mendapatkan data dari SMA Negeri 3 Pati, dengan jumlah data yang di gunakan 100 data siswa, kemudian diolah dengan k-means. 5.2 Saran Untuk meningkatkan kinerja dan menyempurnakan analisis penerapan data mining klasifikasi yang telah dibuat, peneliti memberikan saran sebagai berikut : 1. Penelitian ini dapat dikembangkan atau dibandingkan dengan menggunakan metode data mining yang lainnya. 2. Hasil dari penelitian ini dari rule yang terbentuk dapat dikembangkan menjadi pengetahuan untuk sistem pendukung keputusan. 3. Penelitian ini dapat diterapkan pada suatu program unuk digunakan pada Sekolah Menengah Atas (SMA). 50 DAFTAR PUSTAKA [1] Nurmalasari, Riana; Wati, Reta Dian Purtama; Puspitasari, Poppy; Diana, Wahyu Dewi, Nurmalita Kurnia. 2013. “Peran Guru Dalam Implementasi Kurikulum 2013”, Mahasiswa Pascasarjana Universitas Negeri Malang. [2] Fitriyani. 2012. “Sistem Pendukung Keputusan Penjurusan SMA Menggunakan Metode AHP”. Seminar Nasional Teknologi Informasi dan Komunikasi Terapan. [3] Wijaya, Arim. 2011. “Analisis Algoritma K-Means Untuk Sistem Pendukung Keputusan Penjurusan Siswa di MAN binong Subang”. Universitas Komputer Indonesia. [4] Kristanto, Obbie. 2013. “Penerapan Algoritma Klasifikasi Data Mining ID3 Untuk Menentukan Penjurusan Siswa SMA Negeri 6 Semarang”. Jurusan Teknik Informatika Udinus. [5] Agustina, Silvi; Yhudo, Dhimas; Santoso, Hadi; Marnasusanto, Nofiadi; Tirtana, Arif; Khusnu, Fakhris. 2014. “Clustering Kualitas Beras Berdasarkan Ciri Fisik menggunakan Metode K-Means”. Universitas Brawijaya Malang. [7] Ong, Johan Oscar. 2013. “Implementasi Algoritma K-Means Clustering Untuk Menentukan Strategi Marketing President University”. President University. [8] Simbolon, Cary Lineker; Kusumastuti, Nilamsari; Irawan, Beni. 2014. “Clustering Lulusan Matematika FMIPA UNTAN Pontianak Menggunakan Fuzzy K-Means”. [9] Hartatik. 2014. “Pengelompokan Mahasiswa Berdasarkan Nilai Ujian Nasional dan IPK Menggunakan Metode K-Means”. 51 [10] Sutiknyo, Prabowo Hadi Putra. 2013. “Penggolongan Suara Berdasarkan Usia Dengan Menggunakan Metode K-Means”. [11] Hamdu, Ghullam; Agustina, Lisa. 2011. “Pengaruh Motivasi Belajar Siswa Terhadap Prestasi belajar IPA di Sekolah Dasar”. Universitas Pendidikan Indonesia. 52