12. Muhammad Toha - MMT – ITS

advertisement
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
CLUSTERING PENCAPAIAN KARAKTER SISWA
MENGGUNAKAN ALGORITMA K-MEANS
Muhammad Toha, 1), I Ketut Edy Purnama2) dan Surya Sumpeno3)
Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro
Institut Teknologi Sepuluh Nopember
Surabaya, Indonesia
2,3)
Program Studi Teknik Multimedia Jaringan, Jurusan Teknik Elektro
Institut Teknologi Sepuluh Nopember
Email: 1)[email protected]
1)
ABSTRAK
Pengolahan data secara cepat, efisien dan efektif di era teknologi seperti saat ini,
sangat diperlukan oleh setiap instansi guna mendukung pengambilan keputusan. Salah
satunya adalah pengolahan data nilai karakter siswa sebagai bagian dari pelaksanaan evaluasi
pendidikan karakter di sekolah. Pengolahan data nilai karakter siswa untuk mendapatkan
informasi yang penting dan berguna dalam merencanakan langkah-langkah strategis dan
pengambil kebijakan anak didik di sekolah, sampai saat ini masih menggunakan cara yang
konvensional. Sehingga diperlukan metode yang dapat mengolah data pencapaian karakter
siswa secara cepat, efektif dan efisien.Pada penelitian ini akan digunakan Algoritma K-Means
untuk mengolah data nilai karakter siswa. Data yang digunakan adalah nilai karakter siswa
SMK Negeri 1 Kamal yang meliputi nilai karakter Religius, Jujur, Disiplin, Tanggung jawab,
Kreatif, Gemar Membaca, berprestasi, Semangat kebangsaan, Bersih/sehat, dan Peduli.
Setelah dinormalisasi, data tersebut dijadikan sebagai input pada metode yang
digunakan.Hasil dari penelitian ini menunjukkan bahwa algoritma K-Means mampu
menghasilkan clustering dengan empat kelompok karakter siswa. Masing-masing kelompok
beranggotakan siswa sebanyak 33 siswa (15%) dengan karakter unggul, 69 siswa (31%)
berkarakter mulai berkembang, 71 siswa (32%) mulai terlihat karakternya, dan 50 siswa
(22%) masuk kategori siswa yang masih lemah karakternya.
Kata kunci: Karakter, Pendidikan Karakter, Clustering, Algoritma K-Means
PENDAHULUAN
Pendidikan karakter, ataupun pendidikan akhlak dan karakter bangsa harus dipandang
sebagai usaha sadar dan terencana, bukan usaha yang sifatnya terjadi secara kebetulan.
Dengan kata lain, pendidikan karakter adalah usaha yang sungguh-sungguh untuk memahami,
membentuk, memupuk nilai-nilai etika, baik untuk diri sendiri maupun untuk semua warga
masyarakat atau warga negara secara keseluruhan.
Berbagai cara dilakukan oleh sekolah untuk dapat mengimplementasikan pendidikan
karakter ini secara tepat dan efektif. Salah satunya yang telah diterapkan oleh SMK Negeri 1
Kamal yaitu mengadakan evaluasi untuk mengukur tingkat pencapaian pendidikan karakter
yang telah diterapkan.
Permasalahan yang muncul dilapangan adalah belum ada metode yang mampu
mengeksplorasi data pencapaian karakter siswa disekolah, secara cepat, tidak memerlukan
waktu lama, akurat dan obyektif. Sehingga dengan adanya pengolahan data ini bisa
ISBN : 978-602-97491-6-8
C-12-1
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
mendapatkan informasi yang penting dan berguna tentang gambaran karakter siswa, untuk
merencanakan langkah-langkah strategis dan pengambil kebijakan selanjutnya.
Metode yang diterapkan dalam penelitian ini adalah clustering dengan menggunakan
Algoritma K-Means. Clustering digunakan untuk melakukan pengelompokan data tanpa
berdasarkan target variabel kelas data tertentu. Bahkan clustering dapat dipakai untuk
memberikan label pada kelas data yang belum diketahui. Tujuan penelitian ini adalah
menggunakan Algoritma K-Means yang mempunyai kemampuan melakukan clustering data
secara cepat dan efektif, untuk mengatasi permasalahan pengolahan data yang masih
menggunakan cara konvensional.
Pendidikan Karakter
Dalam konteks definisi pendidikan karakter dalam setting sekolah sebagai
“pembelajaran yang mengarah pada penguatan dan pengembangan perilaku anak secara utuh
yang didasarkan pada suatu nilai tertentu yang dirujuk oleh sekolah”. Definisi ini
mengandung makna:
1) Pendidikan karakter merupakan pendidikan yang terintegrasi dengan pembelajaran yang
terjadi pada semua mata pelajaran;
2) Diarahkan pada penguatan dan pengembangan perilaku anak secara utuh. Asumsinya anak
merupakan organism manusia yang memiliki potensi untuk dikuatkan dan dikembangkan;
3) Penguatan dan pengembangan perilaku didasari oleh nilai yang dirujuk oleh sekolah.
Data Mining
Data mining memegang peran penting dalam bidang industri, keuangan, cuaca dan
teknologi. Data mining berkenaan dengan pengolahan data dalam skala besar. Masalahmasalah yang sesuai untuk diselesaikan dengan teknik data mining bila dicirikan dalam
(Santosa, 2007) yaitu:
1. Memerlukan keputusan yang bersifat knowledge-based
2. Mempunyai lingkungan yang berubah
3. Tersedia data yang bisa diakses, cukup dan relevan.
4. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat.
Algoritma K-Means
Beberapa teori tentang Algoritma K-Means antara lain: Algoritma K-Means adalah
algoritma partitional (Non Hierarchical) clustering yang mempartisi atau membagi
sekumpulan data atau obyek ke dalam sejumlah cluster. Metode K-mengelompokan data
dengan mengambil parameter sejumlah k cluster, dan mempartisi data kedalam cluster
tersebut, dengan berpatokan pada kemiripan antar data dalam satu cluster dan ketidakmiripan
di antar cluster yang berbeda, pusat dari cluster adalah rata-rata dari nilai anggota cluster yang
disebut centroid atau center of gravity (Kamber, 2007). Secara detail Santosa, 2007, ketidak
miripan bisa diterjemahkan dalam konsep jarak jika jarak dua obyek atau data titik cukup
dekat, maka dua obyek itu mirip. (Budi Santosa, 2007). atau secara singkat, K-Means
melakukan pengelompokan dengan meminimalkan jumlah kuadrat dari jarak (distance) antara
data dengan centroid cluster yang cocok (Teknomo, 2006). Data clustering menggunakan
metode K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut
(MacQueen, 1967):
K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut:
1. Tentukan jumlah cluster
2. Alokasikan data ke dalam cluster secara random
3. Hitung centroid/rata-rata dari data yang ada di masing-masing cluster
4. Alokasikan masing-masing data ke centroid/ratarata terdekat
ISBN : 978-602-97491-6-8
C-12-2
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
5.
Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila
perubahan nilai centroid., jika pusat cluster sudah tidak berubah, proses selesai.
Untuk lebih mengetahui alur algoritma dari metode K-Means, dapat dilihat pada
Gambar 1 berikut:
Gambar 1 Flowchart Algoritma Clustering K-Means (Teknomo, 2006).
METODE
Dalam menjawab permasalahan yang diajukan dalam perumusan masalah, akan
dilakukan serangkaian langkah yang secara menyeluruh dapat diilustrasikan pada Gambar 2
berikut ini :
Mencari Data Nilai Karakter Siswa
Normalisasi Data
Proses clustering menggunakan SOM
Data Hasil Pengelompokan
Gambar 2 Blok Diagram Sistem Kerja Penelitian
Data nilai karakter siswa diperoleh dari staf Tim Pengembang Pendidikan Karakter
SMK Negeri 1 Kamal. Setelah sebelumnya mendapatkan rekomendasi dari kepala sekolah.
Data ini bersifat sekunder karena data tersebut tidak diperoleh peneliti secara langsung,
melainkan dari data yang sudah ada di sekolah.
Nilai yang ada dalam pengambilan data ini adalah nilai dari Religius, Jujur, Disiplin,
Tanggung jawab, Kreatif, Gemar Membaca, berprestasi, Semangat kebangsaan, Bersih/sehat,
dan Peduli. Dengan jumlah 223 siswa, maka akan diperoleh data sebagai masukan sebanyak
223 data, masing-masing data dapat dipandang sebagai nilai masukan yaitu (x1, x2,….. xi).
Sebelum dilakukan normalisasi data nilai tersebut di konversi terlebih dulu ke dalam bentuk
angka. Data inilah yang dipersiapkan untuk di normalisasi dan digunakan sebagai data input.
Normalisasi data dilakukan dengan rumus:
F(x) = x – xmin
(1)
xmax – xmin
ISBN : 978-602-97491-6-8
C-12-3
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
HASIL DAN PEMBAHASAN
SSE (sum of squared errors)
Pengamatan terhadap SSE dilakukan untuk mengukur validitas dari hasil clustering.
Semakin kecil nilai SSE maka semakin baik kualitas cluster yang di dapat. Hasil lengkap
pengujian SSE dapat dilihat pada Tabel 1.
Tabel 1 Hasil Pengujian SSE pada Jumlah Cluster = 4
Seed
10
20
30
40
50
SSE
102.6205
106.4373
102.1926
102.5476
102.3268
Iterasi
11
11
12
9
15
Waktu (s)
0,03
0,02
0,02
0,02
0,02
Dari tabel terlihat bahwa hasil uji validitas cluster dengan nilai SEE terkecil terdapat
pada seed 30 dengan iterasi 12 dan waktu iterasi 0,02.
Hasil Clustering dengan Algoritma K-Means
Jumlah dan persentase banyaknya anggota masing-masing cluster ditunjukkan pada Tabel 2.
Tabel 2 Banyak Anggota Masing-masing Cluster
Cluster
Ke0
1
2
3
Banyak
anggota
69
50
33
71
Persentase
banyak anggota
31 %
22 %
15 %
32 %
Tabel 3 Centroid Masing-masing Cluster
Karakter
Jujur
T. Jawab
Prestasi
Kreatif
Disiplin
Gemar Baca
Religius
Peduli
Bersih
Kebangsaan
Rata-rata
Full
Cluster keData
0
1
2
3
2.7623 3.5224 1.8571 2.9767 2.5156
2.4574 3.0896 1.7347 2.8605 2.0781
2.5426 3.2687 1.7143 2.9767
2.125
2.4215 2.9701 1.8163 2.7907 2.0625
2.7713 2.8358 1.7143 3.7209
2.875
2.4753 2.1045 2.2653
2.907 2.7344
2.5785 2.2239 2.0204 3.6512 2.6563
2.583
3 1.7143
2.814 2.6563
2.713 2.8806 1.8571 3.6279 2.5781
2.4529 2.5522 1.7551 2.9767 2.5313
2.57578 2.84478 1.84489 3.13023 2.48126
ISBN : 978-602-97491-6-8
C-12-4
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
Deskripsi Masing-masing Cluster
Cluster 2 memiliki nilai rata-rata centroid tertinggi yaitu 3,1302 diikuti cluster 0
dengan rata-rata 2,845. Cluster 3 menempati urutan tertinggi ke-3 dengan nilai rata-rata 2,481
dan rata-rata terendah adalah cluster 1 dengan nilai rata-rata 1,845.
Cluster 2 secara keseluruhan memiliki nilai karakter yang cukup dominan pada semua
karakter. Bahkan ada tiga karakter yang memiliki nilai centroid di atas 3,5 yaitu karakter
disiplin (3,7209), religius (3,6512), dan bersih (3,6279).
Cluster 0 memiliki rata-rata nilai centroid 2,84478. Pada cluster ini terdapat empat
karakter dengan diatas 3,00 yaitu karakter jujur, tanggung jawab, prestasi, dan peduli.
Sedangkan karakter jujur, kratif, disiplin, bersih, dan kebangsaan memiliki nilai rata-rata
diatas 2,50. Dan dua karakter lainnya yaitu gemar baca, dan religius, memiliki nilai dibawah
2,5.
Cluster 3 memiliki nilai rata-rata 2,481. Tiga karakter yaitu tanggung jawab, prestasi,
dan kreatif memiliki nilai dibawah nilai rata-rata keseluruhan data (2,5). Sedangkan tujuh
karakter yang lain memiliki nilai di atas nilai rata-rata keseluruhan data. Cluster 4 memiliki
nilai rata-rata paling rendah dari empat cluster yang terbentuk. Secara keseluruhan nilai ratarata pada cluster ini tidak mencapai 2,00. Hanya karakter gemar membaca dan religius saja
yang bernilai diatas 2,00. Itupun masih dibawah nilai rata-rata keseluruhan data.
Dari empat cluster yang terbentuk jika dilihat dari nilai rata-rata centroid masingmasing cluster maka metode K-Means dapat memberi gambaran bahwa cluster 2 adalah
cluster yang beranggotakan siswa yang telah memiliki karakter unggul pada dirinya.
Sedangan cluster 0 adalah cluster yang beranggotakan kelompok siswa yang karakternya
“mulai berkembang“ artinya pada kelompok ini, siswa sudah menunjukkan karakter yang
dominan pada diriya namun masih ada karakter yang belum dilaksanakan secara konsisten.
Cluster 3, metode K-Means memberi gambaran bahwa cluster ini beranggotakan
siswa yang “mulai terlihat“ karakternya. Siswa pada kelompok ini mulai menunjukkan
beberapa karakter saja yang dijalankan dan belum konsisten. Sedangkan cluster 4 adalah
cluster yang beranggotkan siswa yang “lemah“ karakternya. Pada kelompok ini hampir
seluruh siswa belum menunjukkan karakter yang bisa dijalankan.
Deskripsi Karakter Tertinggi dari Data Keseluruhan
Grafik 1 berikut menggambarkan nilai centroid masing-masing karakter dari data
keseluruhan.
Grafik 1 Nilai Centroid Masing-masing Karakter dari Data Keseluruhan
Pada Grafik 1 dapat dilihat nilai centroid karakter disiplin memiliki nilai tertinggi
yaitu 2,7713 diikuti karakter jujur di peringkat ke-2 dengan nilai 2,7623 dan karakter bersih
diperingkat ke tiga dengan nilai 2,713. Sedangkan tiga karakter dengan nilai rata-rata terkecil
ISBN : 978-602-97491-6-8
C-12-5
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
adalah karakter kreatif (2,4215), tanggung jawab (2,4574), dan kebangsaan (2,4529), masingmasing berada di peringkat 8, 9, dan 10. Empat karakter lainnya yang berada diperingkat 4, 5,
6, dan 7 yaitu karakter berprestasi, religius, gemar membaca, dan peduli.
Ini menunjukkan bahwa karakter yang sudah tinggi konsistensinya dilaksanakan oleh
siswa SMK Negeri 1 Kamal adalah disiplin, jujur dan bersih. Sedangkan karakter kreatif,
tanggung jawab dan kebangsaan perlu mendapat perhatian lebih untuk dapat dijalankan oleh
siswa. Karakter lainnya yaitu karakter berprestasi, religius, gemar membaca, dan peduli
masih perlu dikembangkan lagi agar siswa dapat mengimplementasikan karakter tersebut
disekolah lebih konsisten.
Deskripsi Karakter Tertinggi Masing-masing Cluster
Karakteristik data yang ditampilkan oleh Algoritma K-Means juga memberikan
informasi tentang karakter yang menonjol dimasing-masing cluster. Pada Tabel 4 dapat dilihat
peringkat masing-masing cluster pada tiap cluster.
Tabel 4 Urutan Masing-masing Karakter Pada Tiap Cluster
Peringkat
1
2
3
4
5
6
7
8
9
10
0
Jujur
Prestasi
T. Jawab
Peduli
Kreatif
Bersih
Disiplin
Kebangsaan
Religius
Gemar Baca
Cluster ke- / Karakter
1
2
3
Gemar Baca
Disiplin
Disiplin
Religius
Religius
Gemar Baca
Jujur
Bersih
Religius
Bersih
Jujur
Peduli
Kreatif
Prestasi
Bersih
Kebangsaan Kebangsaan Kebangsaan
T. Jawab
Gemar Baca
Jujur
Prestasi
T. Jawab
Prestasi
Disiplin
Peduli
T. Jawab
Peduli
Kreatif
Kreatif
Karakter disiplin berada pada peringkat ke satu di cluster yang memiliki nilai rata-rata
centroid tertinggi yaitu cluster 2. Peringkat ke dua adalah karakter religius dan kemudian
karakter bersih. Cluster 3 memiliki nilai yang cukup kuat untuk karakter Gemar baca dan
disiplin. Namun pada cluster ini lemah di nilai karakter prestasi, Kreatif, dan Tanggung
Jawab.
Karakter jujur memiliki nilai yang kuat di cluster 1 dengan menempati peringkat ke
satu. Di cluster 0 ini memiliki kelemahan pada nilai karakter religius dan gemar baca.
Sedangkan pada cluster yang memiliki rata-rata terendah yaitu cluster 1, karakter Gemar baca
menempati peringkat ke satu. Pada cluster ini karakter prestasi, disiplin, dan peduli masingmasing menempati peringkat 8, 9, dan 10.
KESIMPULAN
Berdasarkan hasil dari proses clustering menggunakan self organizing maps, dapat
diambil kesimpulan sebagai berikut:
1. Algoritma K-Means dapat melakukan clustering karakter siswa secara efektif sehingga
mampu menyelesaikan permasalahan yang ada.
2. Hasil clustering Algoritma K-Means terdapat empat cluster yaitu kelompok siswa
berkarakter unggul (cluster 2) 33 siswa, kelompok siswa berkarakter mulai berkembang
ISBN : 978-602-97491-6-8
C-12-6
Prosiding Seminar Nasional Manajemen Teknologi XVII
Program Studi MMT-ITS, Surabaya 2 Februari 2013
(cluster 0) 69 siswa, kelompok siswa berkarakter mulai terlihat (cluster 3) 71 siswa, dan
kelompok siswa berkarakter lemah (cluster 1) 50 siswa.
3. Karakter yang paling tinggi diimplementasikan siswa di sekolah adalah karakter jujur dan
disiplin, sedangkan karakter yang paling rendah/jarang diimplementasikan siswa di sekolah
adalah karakter tanggung jawab dan kreatif.
Saran
Mengingatnya pentingnya pendidikan karakter sebagai sarana untuk penguatan,
pengembangan, pembentuk watak kepribadian siswa, dan peradaban bangsa yang berkarakter
tentang hasil yang berhubungan dengan evaluasi pendidikan karakter, maka perlu diadakan
penelitian lanjutan dan dapat digabung dengan metode clustering lainnya agar informasi yang
bernilai berupa karakteristik data dapat bermanfaat untuk pengambilan kebijakan yang tepat
sasaran, dan tepat waktu.
DAFTAR PUSTAKA
Chen Yu, “K-Means Clustering”, Indiana University.
Han, Kamber, "Data Mining Concepts and Techniques Second Edition", San Fransisco, 2007 :
Elsevier Inc.
Kementerian Pendidikan Nasional (2008), Pengembangan Pendidikan Budaya dan Karakter Bangsa,
Jakarta.
Kesuma, Dharma (2011), Pendidikan Karakter Kajian Teori dan Praktek di Sekolah, Bandung, Rosda
Karya.
Santosa, Budi (2007), Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Yogyakarta,
Graha Ilmu.
ISBN : 978-602-97491-6-8
C-12-7
Download