Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama2) dan Surya Sumpeno3) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember Surabaya, Indonesia 2,3) Program Studi Teknik Multimedia Jaringan, Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember Email: 1)[email protected] 1) ABSTRAK Pengolahan data secara cepat, efisien dan efektif di era teknologi seperti saat ini, sangat diperlukan oleh setiap instansi guna mendukung pengambilan keputusan. Salah satunya adalah pengolahan data nilai karakter siswa sebagai bagian dari pelaksanaan evaluasi pendidikan karakter di sekolah. Pengolahan data nilai karakter siswa untuk mendapatkan informasi yang penting dan berguna dalam merencanakan langkah-langkah strategis dan pengambil kebijakan anak didik di sekolah, sampai saat ini masih menggunakan cara yang konvensional. Sehingga diperlukan metode yang dapat mengolah data pencapaian karakter siswa secara cepat, efektif dan efisien.Pada penelitian ini akan digunakan Algoritma K-Means untuk mengolah data nilai karakter siswa. Data yang digunakan adalah nilai karakter siswa SMK Negeri 1 Kamal yang meliputi nilai karakter Religius, Jujur, Disiplin, Tanggung jawab, Kreatif, Gemar Membaca, berprestasi, Semangat kebangsaan, Bersih/sehat, dan Peduli. Setelah dinormalisasi, data tersebut dijadikan sebagai input pada metode yang digunakan.Hasil dari penelitian ini menunjukkan bahwa algoritma K-Means mampu menghasilkan clustering dengan empat kelompok karakter siswa. Masing-masing kelompok beranggotakan siswa sebanyak 33 siswa (15%) dengan karakter unggul, 69 siswa (31%) berkarakter mulai berkembang, 71 siswa (32%) mulai terlihat karakternya, dan 50 siswa (22%) masuk kategori siswa yang masih lemah karakternya. Kata kunci: Karakter, Pendidikan Karakter, Clustering, Algoritma K-Means PENDAHULUAN Pendidikan karakter, ataupun pendidikan akhlak dan karakter bangsa harus dipandang sebagai usaha sadar dan terencana, bukan usaha yang sifatnya terjadi secara kebetulan. Dengan kata lain, pendidikan karakter adalah usaha yang sungguh-sungguh untuk memahami, membentuk, memupuk nilai-nilai etika, baik untuk diri sendiri maupun untuk semua warga masyarakat atau warga negara secara keseluruhan. Berbagai cara dilakukan oleh sekolah untuk dapat mengimplementasikan pendidikan karakter ini secara tepat dan efektif. Salah satunya yang telah diterapkan oleh SMK Negeri 1 Kamal yaitu mengadakan evaluasi untuk mengukur tingkat pencapaian pendidikan karakter yang telah diterapkan. Permasalahan yang muncul dilapangan adalah belum ada metode yang mampu mengeksplorasi data pencapaian karakter siswa disekolah, secara cepat, tidak memerlukan waktu lama, akurat dan obyektif. Sehingga dengan adanya pengolahan data ini bisa ISBN : 978-602-97491-6-8 C-12-1 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 mendapatkan informasi yang penting dan berguna tentang gambaran karakter siswa, untuk merencanakan langkah-langkah strategis dan pengambil kebijakan selanjutnya. Metode yang diterapkan dalam penelitian ini adalah clustering dengan menggunakan Algoritma K-Means. Clustering digunakan untuk melakukan pengelompokan data tanpa berdasarkan target variabel kelas data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Tujuan penelitian ini adalah menggunakan Algoritma K-Means yang mempunyai kemampuan melakukan clustering data secara cepat dan efektif, untuk mengatasi permasalahan pengolahan data yang masih menggunakan cara konvensional. Pendidikan Karakter Dalam konteks definisi pendidikan karakter dalam setting sekolah sebagai “pembelajaran yang mengarah pada penguatan dan pengembangan perilaku anak secara utuh yang didasarkan pada suatu nilai tertentu yang dirujuk oleh sekolah”. Definisi ini mengandung makna: 1) Pendidikan karakter merupakan pendidikan yang terintegrasi dengan pembelajaran yang terjadi pada semua mata pelajaran; 2) Diarahkan pada penguatan dan pengembangan perilaku anak secara utuh. Asumsinya anak merupakan organism manusia yang memiliki potensi untuk dikuatkan dan dikembangkan; 3) Penguatan dan pengembangan perilaku didasari oleh nilai yang dirujuk oleh sekolah. Data Mining Data mining memegang peran penting dalam bidang industri, keuangan, cuaca dan teknologi. Data mining berkenaan dengan pengolahan data dalam skala besar. Masalahmasalah yang sesuai untuk diselesaikan dengan teknik data mining bila dicirikan dalam (Santosa, 2007) yaitu: 1. Memerlukan keputusan yang bersifat knowledge-based 2. Mempunyai lingkungan yang berubah 3. Tersedia data yang bisa diakses, cukup dan relevan. 4. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat. Algoritma K-Means Beberapa teori tentang Algoritma K-Means antara lain: Algoritma K-Means adalah algoritma partitional (Non Hierarchical) clustering yang mempartisi atau membagi sekumpulan data atau obyek ke dalam sejumlah cluster. Metode K-mengelompokan data dengan mengambil parameter sejumlah k cluster, dan mempartisi data kedalam cluster tersebut, dengan berpatokan pada kemiripan antar data dalam satu cluster dan ketidakmiripan di antar cluster yang berbeda, pusat dari cluster adalah rata-rata dari nilai anggota cluster yang disebut centroid atau center of gravity (Kamber, 2007). Secara detail Santosa, 2007, ketidak miripan bisa diterjemahkan dalam konsep jarak jika jarak dua obyek atau data titik cukup dekat, maka dua obyek itu mirip. (Budi Santosa, 2007). atau secara singkat, K-Means melakukan pengelompokan dengan meminimalkan jumlah kuadrat dari jarak (distance) antara data dengan centroid cluster yang cocok (Teknomo, 2006). Data clustering menggunakan metode K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut (MacQueen, 1967): K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut: 1. Tentukan jumlah cluster 2. Alokasikan data ke dalam cluster secara random 3. Hitung centroid/rata-rata dari data yang ada di masing-masing cluster 4. Alokasikan masing-masing data ke centroid/ratarata terdekat ISBN : 978-602-97491-6-8 C-12-2 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 5. Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai centroid., jika pusat cluster sudah tidak berubah, proses selesai. Untuk lebih mengetahui alur algoritma dari metode K-Means, dapat dilihat pada Gambar 1 berikut: Gambar 1 Flowchart Algoritma Clustering K-Means (Teknomo, 2006). METODE Dalam menjawab permasalahan yang diajukan dalam perumusan masalah, akan dilakukan serangkaian langkah yang secara menyeluruh dapat diilustrasikan pada Gambar 2 berikut ini : Mencari Data Nilai Karakter Siswa Normalisasi Data Proses clustering menggunakan SOM Data Hasil Pengelompokan Gambar 2 Blok Diagram Sistem Kerja Penelitian Data nilai karakter siswa diperoleh dari staf Tim Pengembang Pendidikan Karakter SMK Negeri 1 Kamal. Setelah sebelumnya mendapatkan rekomendasi dari kepala sekolah. Data ini bersifat sekunder karena data tersebut tidak diperoleh peneliti secara langsung, melainkan dari data yang sudah ada di sekolah. Nilai yang ada dalam pengambilan data ini adalah nilai dari Religius, Jujur, Disiplin, Tanggung jawab, Kreatif, Gemar Membaca, berprestasi, Semangat kebangsaan, Bersih/sehat, dan Peduli. Dengan jumlah 223 siswa, maka akan diperoleh data sebagai masukan sebanyak 223 data, masing-masing data dapat dipandang sebagai nilai masukan yaitu (x1, x2,….. xi). Sebelum dilakukan normalisasi data nilai tersebut di konversi terlebih dulu ke dalam bentuk angka. Data inilah yang dipersiapkan untuk di normalisasi dan digunakan sebagai data input. Normalisasi data dilakukan dengan rumus: F(x) = x – xmin (1) xmax – xmin ISBN : 978-602-97491-6-8 C-12-3 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 HASIL DAN PEMBAHASAN SSE (sum of squared errors) Pengamatan terhadap SSE dilakukan untuk mengukur validitas dari hasil clustering. Semakin kecil nilai SSE maka semakin baik kualitas cluster yang di dapat. Hasil lengkap pengujian SSE dapat dilihat pada Tabel 1. Tabel 1 Hasil Pengujian SSE pada Jumlah Cluster = 4 Seed 10 20 30 40 50 SSE 102.6205 106.4373 102.1926 102.5476 102.3268 Iterasi 11 11 12 9 15 Waktu (s) 0,03 0,02 0,02 0,02 0,02 Dari tabel terlihat bahwa hasil uji validitas cluster dengan nilai SEE terkecil terdapat pada seed 30 dengan iterasi 12 dan waktu iterasi 0,02. Hasil Clustering dengan Algoritma K-Means Jumlah dan persentase banyaknya anggota masing-masing cluster ditunjukkan pada Tabel 2. Tabel 2 Banyak Anggota Masing-masing Cluster Cluster Ke0 1 2 3 Banyak anggota 69 50 33 71 Persentase banyak anggota 31 % 22 % 15 % 32 % Tabel 3 Centroid Masing-masing Cluster Karakter Jujur T. Jawab Prestasi Kreatif Disiplin Gemar Baca Religius Peduli Bersih Kebangsaan Rata-rata Full Cluster keData 0 1 2 3 2.7623 3.5224 1.8571 2.9767 2.5156 2.4574 3.0896 1.7347 2.8605 2.0781 2.5426 3.2687 1.7143 2.9767 2.125 2.4215 2.9701 1.8163 2.7907 2.0625 2.7713 2.8358 1.7143 3.7209 2.875 2.4753 2.1045 2.2653 2.907 2.7344 2.5785 2.2239 2.0204 3.6512 2.6563 2.583 3 1.7143 2.814 2.6563 2.713 2.8806 1.8571 3.6279 2.5781 2.4529 2.5522 1.7551 2.9767 2.5313 2.57578 2.84478 1.84489 3.13023 2.48126 ISBN : 978-602-97491-6-8 C-12-4 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 Deskripsi Masing-masing Cluster Cluster 2 memiliki nilai rata-rata centroid tertinggi yaitu 3,1302 diikuti cluster 0 dengan rata-rata 2,845. Cluster 3 menempati urutan tertinggi ke-3 dengan nilai rata-rata 2,481 dan rata-rata terendah adalah cluster 1 dengan nilai rata-rata 1,845. Cluster 2 secara keseluruhan memiliki nilai karakter yang cukup dominan pada semua karakter. Bahkan ada tiga karakter yang memiliki nilai centroid di atas 3,5 yaitu karakter disiplin (3,7209), religius (3,6512), dan bersih (3,6279). Cluster 0 memiliki rata-rata nilai centroid 2,84478. Pada cluster ini terdapat empat karakter dengan diatas 3,00 yaitu karakter jujur, tanggung jawab, prestasi, dan peduli. Sedangkan karakter jujur, kratif, disiplin, bersih, dan kebangsaan memiliki nilai rata-rata diatas 2,50. Dan dua karakter lainnya yaitu gemar baca, dan religius, memiliki nilai dibawah 2,5. Cluster 3 memiliki nilai rata-rata 2,481. Tiga karakter yaitu tanggung jawab, prestasi, dan kreatif memiliki nilai dibawah nilai rata-rata keseluruhan data (2,5). Sedangkan tujuh karakter yang lain memiliki nilai di atas nilai rata-rata keseluruhan data. Cluster 4 memiliki nilai rata-rata paling rendah dari empat cluster yang terbentuk. Secara keseluruhan nilai ratarata pada cluster ini tidak mencapai 2,00. Hanya karakter gemar membaca dan religius saja yang bernilai diatas 2,00. Itupun masih dibawah nilai rata-rata keseluruhan data. Dari empat cluster yang terbentuk jika dilihat dari nilai rata-rata centroid masingmasing cluster maka metode K-Means dapat memberi gambaran bahwa cluster 2 adalah cluster yang beranggotakan siswa yang telah memiliki karakter unggul pada dirinya. Sedangan cluster 0 adalah cluster yang beranggotakan kelompok siswa yang karakternya “mulai berkembang“ artinya pada kelompok ini, siswa sudah menunjukkan karakter yang dominan pada diriya namun masih ada karakter yang belum dilaksanakan secara konsisten. Cluster 3, metode K-Means memberi gambaran bahwa cluster ini beranggotakan siswa yang “mulai terlihat“ karakternya. Siswa pada kelompok ini mulai menunjukkan beberapa karakter saja yang dijalankan dan belum konsisten. Sedangkan cluster 4 adalah cluster yang beranggotkan siswa yang “lemah“ karakternya. Pada kelompok ini hampir seluruh siswa belum menunjukkan karakter yang bisa dijalankan. Deskripsi Karakter Tertinggi dari Data Keseluruhan Grafik 1 berikut menggambarkan nilai centroid masing-masing karakter dari data keseluruhan. Grafik 1 Nilai Centroid Masing-masing Karakter dari Data Keseluruhan Pada Grafik 1 dapat dilihat nilai centroid karakter disiplin memiliki nilai tertinggi yaitu 2,7713 diikuti karakter jujur di peringkat ke-2 dengan nilai 2,7623 dan karakter bersih diperingkat ke tiga dengan nilai 2,713. Sedangkan tiga karakter dengan nilai rata-rata terkecil ISBN : 978-602-97491-6-8 C-12-5 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 adalah karakter kreatif (2,4215), tanggung jawab (2,4574), dan kebangsaan (2,4529), masingmasing berada di peringkat 8, 9, dan 10. Empat karakter lainnya yang berada diperingkat 4, 5, 6, dan 7 yaitu karakter berprestasi, religius, gemar membaca, dan peduli. Ini menunjukkan bahwa karakter yang sudah tinggi konsistensinya dilaksanakan oleh siswa SMK Negeri 1 Kamal adalah disiplin, jujur dan bersih. Sedangkan karakter kreatif, tanggung jawab dan kebangsaan perlu mendapat perhatian lebih untuk dapat dijalankan oleh siswa. Karakter lainnya yaitu karakter berprestasi, religius, gemar membaca, dan peduli masih perlu dikembangkan lagi agar siswa dapat mengimplementasikan karakter tersebut disekolah lebih konsisten. Deskripsi Karakter Tertinggi Masing-masing Cluster Karakteristik data yang ditampilkan oleh Algoritma K-Means juga memberikan informasi tentang karakter yang menonjol dimasing-masing cluster. Pada Tabel 4 dapat dilihat peringkat masing-masing cluster pada tiap cluster. Tabel 4 Urutan Masing-masing Karakter Pada Tiap Cluster Peringkat 1 2 3 4 5 6 7 8 9 10 0 Jujur Prestasi T. Jawab Peduli Kreatif Bersih Disiplin Kebangsaan Religius Gemar Baca Cluster ke- / Karakter 1 2 3 Gemar Baca Disiplin Disiplin Religius Religius Gemar Baca Jujur Bersih Religius Bersih Jujur Peduli Kreatif Prestasi Bersih Kebangsaan Kebangsaan Kebangsaan T. Jawab Gemar Baca Jujur Prestasi T. Jawab Prestasi Disiplin Peduli T. Jawab Peduli Kreatif Kreatif Karakter disiplin berada pada peringkat ke satu di cluster yang memiliki nilai rata-rata centroid tertinggi yaitu cluster 2. Peringkat ke dua adalah karakter religius dan kemudian karakter bersih. Cluster 3 memiliki nilai yang cukup kuat untuk karakter Gemar baca dan disiplin. Namun pada cluster ini lemah di nilai karakter prestasi, Kreatif, dan Tanggung Jawab. Karakter jujur memiliki nilai yang kuat di cluster 1 dengan menempati peringkat ke satu. Di cluster 0 ini memiliki kelemahan pada nilai karakter religius dan gemar baca. Sedangkan pada cluster yang memiliki rata-rata terendah yaitu cluster 1, karakter Gemar baca menempati peringkat ke satu. Pada cluster ini karakter prestasi, disiplin, dan peduli masingmasing menempati peringkat 8, 9, dan 10. KESIMPULAN Berdasarkan hasil dari proses clustering menggunakan self organizing maps, dapat diambil kesimpulan sebagai berikut: 1. Algoritma K-Means dapat melakukan clustering karakter siswa secara efektif sehingga mampu menyelesaikan permasalahan yang ada. 2. Hasil clustering Algoritma K-Means terdapat empat cluster yaitu kelompok siswa berkarakter unggul (cluster 2) 33 siswa, kelompok siswa berkarakter mulai berkembang ISBN : 978-602-97491-6-8 C-12-6 Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013 (cluster 0) 69 siswa, kelompok siswa berkarakter mulai terlihat (cluster 3) 71 siswa, dan kelompok siswa berkarakter lemah (cluster 1) 50 siswa. 3. Karakter yang paling tinggi diimplementasikan siswa di sekolah adalah karakter jujur dan disiplin, sedangkan karakter yang paling rendah/jarang diimplementasikan siswa di sekolah adalah karakter tanggung jawab dan kreatif. Saran Mengingatnya pentingnya pendidikan karakter sebagai sarana untuk penguatan, pengembangan, pembentuk watak kepribadian siswa, dan peradaban bangsa yang berkarakter tentang hasil yang berhubungan dengan evaluasi pendidikan karakter, maka perlu diadakan penelitian lanjutan dan dapat digabung dengan metode clustering lainnya agar informasi yang bernilai berupa karakteristik data dapat bermanfaat untuk pengambilan kebijakan yang tepat sasaran, dan tepat waktu. DAFTAR PUSTAKA Chen Yu, “K-Means Clustering”, Indiana University. Han, Kamber, "Data Mining Concepts and Techniques Second Edition", San Fransisco, 2007 : Elsevier Inc. Kementerian Pendidikan Nasional (2008), Pengembangan Pendidikan Budaya dan Karakter Bangsa, Jakarta. Kesuma, Dharma (2011), Pendidikan Karakter Kajian Teori dan Praktek di Sekolah, Bandung, Rosda Karya. Santosa, Budi (2007), Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Yogyakarta, Graha Ilmu. ISBN : 978-602-97491-6-8 C-12-7