implementasi algoritma partitioning around

advertisement
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
IMPLEMENTASI ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) UNTUK
PENGELOMPOKAN SEKOLAH MENENGAH ATAS DI DIY BERDASARKAN NILAI
DAYA SERAP UJIAN NASIONAL
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Disusun Oleh:
Astri Widiastuti Setiyawati
125314076
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
IMPLEMENTATION OF PARTITIONING AROUND MEDOIDS (PAM) ALGORITHM FOR
CLUSTERING OF SENIOR HIGH SCHOOL IN DIY BASED ON VALUE ABSORPTION
DATA OF NATIONAL EXAM SCORE
FINAL PROJECT
Presented as Partial Fulfillment of the Requirements
To Obtain the Sarjana Komputer Degree
In Informatics Engineering Study Program
By:
Astri Widiastuti Setiyawati
125314076
INFORMATICS ENGINEERING STUDY PROGRAM
DEPARTMENT OF INFORMATIC ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN PERSEMBAHAN
”Sesungguhnya bersama kesulitan pasti ada kemudahan.
Maka apabila engkau telah selesai (dari suatu urusan),
tetaplah bekerja keras (untuk urusan yang lain)”
(QS 94: 6-7)
Karya ini, penulis persembahkan untuk :
Allah SWT
Keluarga
Sahabat
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak
memuat karya atau bagian karya orang lain, kecuali yang telah saya sebutkan
dalam kutipan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 2 Februari 2017
Penulis,
Astri Widiastuti Setiyawati
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRAK
Penambangan data (data mining) merupakan proses penemuan informasi baru
dengan mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar. Salah
satu metode dalam data mining adalah clustering. Clustering adalah proses
mengelompokan sejumlah sejumlah data/obyek ke dalam klaster (group) sehingga
dalam setiap klaster akan berisi data yang semirip mungkin. Salah satu algoritma
clustering adalah Partitioning Around Medoids (PAM). PAM adalah metode clustering
menggunakan metode partisi untuk mengelompokan sekumpulan n obyek menjadi
sejumlah k cluster. Algoritma PAM menggunakan obyek pada kumpulan obyek untuk
mewakili sebuah cluster. Obyek yang terpilih untuk mewakili sebuah cluster disebut
dengan medoids.
Pada tugas akhir ini akan diimplementasikan algoritma PAM untuk
mengelompokan data Sekolah Menengah Atas di DIY berdasarkan nilai daya serap
ujian nasional mata pelajaran matematika tahun ajaran 2014/2015 menjadi beberapa
kelompok sehingga diperoleh informasi mengenai kelompok-kelompok sekolah di
DIY. Proses penambangan data yang dilakukan adalah proses KDD (Knowledge
Discovery in Database) yaitu pembersihan data, integrasi data, seleksi data,
transformasi data, penambangan data, evaluasi pola, dan presentasi pengetahuan.
Penambangan data dan evaluasi dalam penelitian menggunakan dua jenis data
yaitu data nilai daya serap 29 kompetensi dan data rata-rata dari nilai daya serap 29
kompetensi. Berdasarkan evaluasi menggunakan nilai daya serap 29 kompetensi dapat
disimpulkan bahwa algoritma ini dapat digunakan untuk mengelompokan data sekolah
dengan nilai k yang diberikan. Berdasarkan evaluasi menggunakan rata-rata dari nilai
daya serap 29 kompetensi dapat disimpulkan bahwa algoritma ini dapat
mengelompokan nilai rata-rata daya serap ke dalam tiga kelompok yaitu kelompok
dengan standar deviasi tinggi, sedang, dan rendah.
Kata kunci : penambangan data, clustering, Partitioning Around Medoids (PAM),
medoids, KDD, nilai daya serap ujian nasional.
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRACT
Data mining is a mining process or extracting information by getting pattern or
specific rules from a large amount of data. One of the data mining method is clustering.
Clustering is a process of grouping data/objects into a cluster (group) so in that every
cluster contains data as closely as possible. One of clustering algorithm is Partitioning
Around Medoids (PAM). PAM is a clustering method that used partitioning method
for cluster some n object to k cluster. PAM algorithm used object on the set of objects
for representing a cluster. The choosen object for representing a cluster called as
medoids.
This thesis will implement of PAM algorithm for clustering high school data in
DIY based on the value of absorption data of national exam score mathematics subject
in 2014/2015 become some of group so that obtained the information about high school
groups in DIY. Process of data mining which is conducted is KDD (Knowledge
Discovery in Database) process that is data cleaning, data integration, selection data,
transformation data, data mining, pattern evaluation, and knowledge presentation.
Data mining and evaluation in research using two types of data that is value of
absorption data 29 comprehension, and data of the average of value of absorption data
29 comprehension. Based on the evaluation using value of absorption data 29
comprehension can be concluded that the algorithm can be used to classify the data of
high school by giving the value of k. Based on the evaluation using the average of value
of absorption data 29 comprehension can be concluded that this algorithm can be used
for grouping the value of the average of absorption data into three groups which is
group with high, medium, and low standard deviation.
Keyword : Data mining, Clustering, Partitioning Around Medoids (PAM), Medoids,
KDD, value of absorption data of national exam score.
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA
ILMIAH UNTUK KEPERLUAN KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma :
Nama
: Astri Widiastuti Setiyawati
Nomor Mahasiswa
: 125314076
Demi pengembagnan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah saya yang berjudul :
IMPLEMENTASI ALGORITMA PARTITIONING AROUND MEDOIDS
(PAM) UNTUK PENGELOMPOKAN SEKOLAH MENENGAH ATAS DI DIY
BERDASARKAN NILAI DAYA SERAP UJIAN NASIONAL
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada Perpustakaan Universitas Sanata Dharma untuk menyimpan, mengalihkan
dalam bentuk media lain, mengelolanya di internet atau media lain untuk kepentingan
akademis tanpa perlu meminta ijin dari saya maupun memberikan royalty kepada saya
selama tetap mencantumkan nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di Yogyakarta
Pada tanggal : 2 Februari 2017
Yang menyatakan,
(Astri Widiastuti Setiyawati)
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KATA PENGATAR
Puji dan syukur kepada Tuhan Yang Maha Esa, karena pada akhirnya penulis
dapat menyelesaikan peneitian tugas akhie ini yang berjudul ”IMPLEMENTASI
ALGORITMA
PARTITIONING
PENGELOMPOKAN
AROUND
SEKOLAH
MEDOIDS
MENENGAH
(PAM)
ATAS
UNTUK
DI
DIY
BERDASARKAN NILAI DAYA SERAP UJIAN NASIONAL”.
Dalam menyelesaikan seluruh penyusunan tugas akhir ini, penulis tak lepas dari
doa, bantuan, dukungan, dan motivasi dari banyak pihak. Oleh karena itu, pada
kesempatan kali ini penulis menyampaikan rasa penghargaan dan terima kasih yang
terdalam kepada:
1. Allah SWT yang selalu memberikan anugrah, rahmat, kekuatan yang
berlimpah sehingga penulis dapat menyelesaikan tugas akhi ini.
2. Kedua orang tua penulis, Drs. Setiawan dan Sumarwi atas doa, kasih
sayang, perhatian, kepercayaan, dukungan baik moral maupun financial
yang telah diberikan kepada penulis.
3. Bapak Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas
Sains dan Teknologi.
4. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik
Informatika Universitas Sanata Dharma Yogyakarta.
5. Romo Dr. C. Kuntoro Adi, S.J., M.A., M.Sc. selaku Dosen Pembimbing
Akademik penulis.
6. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku Dosen
Pembimbing skripsi yang telah memberikan waktu, bimbingan, nasihat, dan
motivasi kepada penulis.
7. Seluruh Dosen dan Karyawan jurusan Teknik Informatika Universitas
Sanata Dharma Yogyakarta, yang telah membimbing dan membantu selama
proses perkuliahan.
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8. Para sepupu penulis Arin, Dwi, Ayu, dan Bagas serta keluarga besar
Marsoedi yang selalu memberikan semangat, doa, dan motivasi dalam
penyusunan tugas akhir ini.
9. Vinna Marcelia Tamaela, Yohanes Ragil Purnomo, Laurensius Praba
Atmaja, Yosep Dwi N. selaku teman dekat penulis.
10. Untuk sahabat-sahabat penulis Nita, Dhesty, Prilly, Imas, Itha terima kasih
untuk persahabata yang terjalin selama perkuliahan.
11. Seluruh teman-teman TI angkatan 2012 untuk bantuan, kebersamaan
selama pengerjaan tugas akhir ini dan menjalani masa perkuliahan.
12. Serta semua pihak yang telah membantu penyusunan tugas akhir ini yang
tidak dapat disebutkan satu persatu.
Penulis menyadari bahwa masih banyak kekurangan-kekurangan yang perlu
diperbaiki dalam skripsi ini, untuk itu penulis mengharapkan masukan dan kritik, serta
saran dari berbagai pihak untuk menyempurnakannya. Semoga skripsi ini dapat
bermanfaat, baik bagi penulis maupun pembaca. Terima kasih.
Yogyakarta, 2 Februari 2017
Penulis
xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR ISI
HALAMAN JUDUL...................................................................................................... i
TITLE PAGE ................................................................................................................. ii
HALAMAN PERSETUJUAN .................................... Error! Bookmark not defined.
HALAMAN PENGESAHAN ..................................... Error! Bookmark not defined.
HALAMAN PERSEMBAHAN ................................................................................... v
PERNYATAAN KEASLIAN KARYA ...................................................................... vi
ABSTRAK .................................................................................................................. vii
ABSTRACT ............................................................................................................... viii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPERLUAN KEPENTINGAN AKADEMIS ............................................ ix
KATA PENGATAR ..................................................................................................... x
DAFTAR ISI ............................................................................................................... xii
DAFTAR GAMBAR ................................................................................................. xvi
DAFTAR TABEL ..................................................................................................... xvii
BAB I PENDAHULUAN ............................................................................................. 1
1.1
Latar Belakang ............................................................................................... 1
1.2
Rumusan Masalah .......................................................................................... 4
1.3
Batasan Masalah ............................................................................................. 4
1.4
Tujuan dan Manfaat ........................................................................................ 5
1.5
Metodologi Penelitian .................................................................................... 6
1.6
Sistematika Penulisan ..................................................................................... 8
BAB II LANDASAN TEORI ..................................................................................... 10
2.1
Knowledge Discovery in Database (KDD) .................................................. 10
2.1.1
Definisi Knowledge Discovery in Database (KDD) ............................. 10
2.1.2
Tahapan Knowledge Discovery in Database (KDD) ............................ 10
2.2
Penambangan Data (Data Mining) ............................................................... 14
2.2.1
Definisi Penambangan Data (Data Mining) .......................................... 14
2.2.2
Teknik Penambangan Data (Data Mining) ........................................... 14
2.3
Clustering ..................................................................................................... 15
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3.1
Definisi Clustering ................................................................................ 15
2.3.2
Tipe Clustering ...................................................................................... 16
2.4
Partitioning Around Medoids (PAM) .......................................................... 17
2.4.1
Algoritma Partitioning Around Medoids (PAM).................................. 17
2.4.2
Contoh Penerapan Algoritma Partitioning Around Medoids (PAM) ... 18
2.5
Silhouette ...................................................................................................... 19
2.5.1
Silhouette Index (SI) .............................................................................. 19
2.5.2
Silhouette Coefficient (SC).................................................................... 22
BAB III METODOLOGI PENELITIAN.................................................................... 23
3.1
Data .............................................................................................................. 23
3.2
Data yang Digunakan ................................................................................... 28
3.3
Spesifikasi Alat............................................................................................. 32
3.3.1
Spesifikasi Software .............................................................................. 32
3.3.2
Spesifikasi Hardware ............................................................................ 32
BAB IV PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK
PENAMBANGAN DATA.......................................................................................... 33
4.1
Pemrosesan Awal Sumber Data ................................................................... 33
4.1.1
Pembersihan Data.................................................................................. 33
4.1.2
Integrasi Data ........................................................................................ 33
4.1.3
Seleksi Data ........................................................................................... 33
4.1.4
Transformasi Data ................................................................................. 34
4.2
Perancangan Perangkat Lunak Penambangan Data ..................................... 35
4.2.1
Perancangan Umum .............................................................................. 35
4.2.1.1
Input ................................................................................................... 35
4.2.1.2
Proses................................................................................................. 35
4.2.1.3
Output ................................................................................................ 36
4.2.2
Diagram Konteks (Context Diagram) ................................................... 37
4.2.3
Diagram Usecase .................................................................................. 37
4.2.4
Diagram Aktivitas (Activity Diagram) .................................................. 38
4.2.5
Diagram Kelas (Class Diagram)........................................................... 40
4.2.6
Rancangan Antarmuka .......................................................................... 40
xiii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.6.1
Halaman Awal ................................................................................... 40
4.2.6.2
Halaman Bantuan .............................................................................. 41
4.2.6.3
Halaman Informasi ............................................................................ 42
4.2.6.4
Halaman Input Data ........................................................................... 42
4.2.6.5
Halaman K-Medoids ......................................................................... 43
BAB V IMPLEMENTASI DAN EVALUASI HASIL .............................................. 45
5.1
Implementasi Rancangan Perangkat Lunak Penambangan Data ................. 45
5.1.1
Implementasi Tampilan Antarmuka...................................................... 46
5.1.1.1
Halaman Utama ................................................................................. 46
5.1.1.2
Halaman Bantuan .............................................................................. 47
5.1.1.3
Halaman Informasi ............................................................................ 47
5.1.1.4
Halaman Input Data ........................................................................... 48
5.1.1.5
Halaman K-Medoids ......................................................................... 51
5.2
Evaluasi Hasil ............................................................................................... 52
5.2.1
Uji Coba Perangkat Lunak (Black Box) ................................................ 52
5.2.1.1
Rencana Pengujian Black Box ........................................................... 52
5.2.1.2
Prosedur Pengujian Black Box dan Kasus Uji ................................... 53
5.2.1.3
Evaluasi Pengujian Black Box ........................................................... 53
5.2.2
Pengujian Perbandingan Hasil Hitung Manual dengan Hasil
Perangkat Lunak.................................................................................................. 54
5.2.2.1
Perhitungan Manual .......................................................................... 54
5.2.2.2
Perhitungan Perangkat Lunak............................................................ 54
5.2.2.3
Evaluasi Pengujian Perbandingan Hitung Manual dengan Hasil
Perangkat Lunak.................................................................................................. 55
5.2.2.4
Pengujian Perangkat Lunak Dengan Menggunakan Dataset ............ 57
5.2.2.5
Evaluasi Hasil Clustering .................................................................. 57
BAB VI PENUTUP .................................................................................................... 63
6.1
Kesimpulan ................................................................................................... 63
6.2
Saran ............................................................................................................. 65
DAFTAR PUSTAKA ................................................................................................. 66
LAMPIRAN 1 : Contoh Perhitungan K-Medoids ...................................................... 68
LAMPIRAN 2 : Diagram Kelas .................................................................................. 72
xiv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 3 : Prosedur Pengujian dan Kasus Uji ................................................... 73
LAMPIRAN 4 : Data Uji Algoritma K-Medoids ....................................................... 77
LAMPIRAN 5 : Perhitungan Manual ......................................................................... 80
LAMPIRAN 6 : Hasil Pengujian Dataset ................................................................... 99
LAMPIRAN 7 : Perhitungan Standar Deviasi Tiap Cluster ..................................... 110
xv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR GAMBAR
Gambar 2.1 Proses Knowledge Discovery in Database (Han&Kamber, 2006) ......... 11
Gambar 4.1 Data awal nilai daya serap ....................................................................... 34
Gambar 4.2 Data setelah proses transformasi ............................................................. 35
Gambar 4.3 Proses Umum Sistem .............................................................................. 36
Gambar 4.4 Diagram Konteks..................................................................................... 37
Gambar 4.5 Diagram Usecase..................................................................................... 37
Gambar 4.6 Diagram Aktivitas Input Berkas .............................................................. 38
Gambar 4.7 Diagram Aktivitas Seleksi Atribut .......................................................... 39
Gambar 4.8 Diagram Aktivitas Proses Clustering ...................................................... 39
Gambar 4.9 Diagram Aktivitas Simpan Hasil............................................................. 40
Gambar 4.10 Rancangan Antarmuka Halaman Awal ................................................. 41
Gambar 4.11 Rancangan Antarmuka Halaman Bantuan ............................................ 42
Gambar 4.12 Rancangan Antarmuka Halaman Tentang............................................. 42
Gambar 4.13 Rancangan Antarmuka Halaman Input Data ......................................... 43
Gambar 4.14 Rancangan Antarmuka Halaman K-Medoids ....................................... 44
Gambar 5.1 Halaman Awal ......................................................................................... 46
Gambar 5.2 Halaman Bantuan .................................................................................... 47
Gambar 5.3 Halaman Informasi .................................................................................. 48
Gambar 5.4 Halaman Input Data ................................................................................ 49
Gambar 5.5 Halaman Input Data (berkas .xls) ............................................................ 49
Gambar 5.6 Halaman Input Data (hapus atribut) ........................................................ 50
Gambar 5.7 Halaman Input Data (Hapus Atribut) ...................................................... 50
Gambar 5.8 Halaman K-Medoids ............................................................................... 51
Gambar 5.9 Halaman K-Medoids (Clustering) ........................................................... 52
Gambar 5.10 Hasil Penambangan Data Menggunakan Perangkat Lunak .................. 55
Gambar 5.11 Grafik Perhitungan Nilai Silhouette Index ............................................ 59
xvi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR TABEL
Tabel 2.1 Data Contoh ................................................................................................ 19
Tabel 2.2 Kriteria subjektif pengukuran pengelompokan berdasarkan Silhouette
Coefficient (SC)............................................................................................... 22
Tabel 3.1 Atribut nilai daya serap ujian nasional pelajaran matematika tahun
2014/2015........................................................................................................ 23
Tabel 3.2 Atribut nilai daya serap ujian nasional pelajaran matematika tahun
2014/2015 yang digunakan dalam penelitian .................................................. 28
Tabel 5.1 Nama kelas yang diimpelentasikan ............................................................. 45
Tabel 5.2 Rencana Pengujian Black Box .................................................................... 53
Tabel 5.3 Uji Perbandingan Algoritma K-Medoids Secara Manual dan Sistem ........ 56
Tabel 5.4 Hasil Uji Perbandingan Anggota Cluster Secara Manual dan Sistem ........ 56
Tabel 5.5 Hasil Perhitungan Silhouette Coefficient (SC) ............................................ 57
Tabel 5.6 Hasil Standar Deviasi Tiap Cluster ............................................................. 61
xvii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I
PENDAHULUAN
1.1
Latar Belakang
Penambangan data (data mining) adalah proses yang memperkerjakan satu atau
lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan
mengekstraksi pengetahuan (knowledge) secara otomatis. Data mining berisi pencarian
trend atau pola yang diinginkan dalam database besar untuk membantu pengambilan
keputusan di waktu yang akan datang. Pola-pola ini dikenali oleh perangkat tertentu
yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang
kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan
perangkat pendukung keputusan yang lainnya (Hermawati, 2013).
Clustering merupakan salah satu teknik dalam penambangan data. Clustering
bertujuan untuk mengelompokkan sejumlah data/obyek ke dalam klaster (group)
sehingga dalam setiap klaster akan berisi data yang semirip mungkin. Salah satu
algoritma clustering adalah Partitioning Around Medoids (PAM). Algoritma
Partitioning Around Medoids (PAM) lebih dikenal dengan algoritma K-Medoids.
Algoritma ini merupakan teknik partisi klasik untuk clustering yang melakukan
klasterisasi data dari n obyek ke dalam k cluster yang dikenal dengan apriori.
Perbedaan antara K-Means dan K-Medoids terletak pada cara kedua metode tersebut
menghentikan perhitungan dan melakukan perulangan. Jika pada K-Means berpatokan
pada kondisi konvergen, pada K-Medoids tergantung pada kualitas kluster yang didapat
pada perulangan terakhir (Tiwari, 2012). Algoritma K-Medoids lebih kuat daripada
algoritma K-Means bila dihadapkan dengan noise dan outliers, karena medoid kurang
dipengaruhi oleh outliers atau nilai-nilai ekstrim yang lain daripada sebuah mean
(Yusupa, 2015).
Ujian Nasional merupakan penilaian pada akhir proses pembelajaran di
sekolah. Penilaian merupakan serangkaian kegiatan untuk memperoleh, menganalisis,
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
dan menafsirkan data tentang proses dan hasil belajar siswa yang dilakukan secara
sistematis dan berkesinambungan sehingga menjadi informasi yang bermaksa dalam
mengambil keputusan (Depdikbud, 1994). Ujian Nasional bertujuan untuk menilai
pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu. Ujian
Nasional diadakan sekurang-kurangnya satu kali dan sebanyak-banyaknya dua kali
dalam satu tahun pelajaran (PP No. 19 tahun 2005, ps. 66).
Dalam Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu
Pendidikan (SPMP) pasal 20 menyatakan bahwa salah satu jenis kegiatan penjaminan
mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau program pendidikan
oleh Pemerintah, Pemerintah Provinsi, dan Pemerintah Kabupaten atau Kota.
Pemerintah telah menentukan kebijakan dalam meningkatkan standar mutu pendidikan
dengan melakukan Ujian Nasional (UN) dan Ujian Sekolah (US) setiap tahunnya.
Hasil Ujian Nasional tersedia di web kemdikbud dengan berbagai format. Salah
satu format yang disajikan adalah mengenai daya serap. Daya serap memuat informasi
mengenai proporsi atau presentase jawaban benar yang bisa dipilih berdasarkan
kelompok maupun SKL. Daya serap memberikan gambaran tentang kemampuan
peserta didik dalam penguasaan indikator dari kompetensi/pokok bahasan mata
pelajaran. Mengetahui nilai daya serap dapat menjadikan sebagai tolak ukur untuk
mengetahui sejauh mana pemahaman peserta didik terhadap mata pelajaran yang
diajarkan oleh gurunya.
Dalam Permendikbud No. 143 tahun 2014 tentang Petunjuk Tekniks
Pelaksanaan Jabatan Fungsional Pengawas Sekolah dan Angka Kreditnya, beserta
lampirannya yang merupakan satu kesatuan utuh. Menurut permendikbud ini bahwa
tugas pokok pengawas sekolah adalah melaksanakan tugas pengawasan akademik dan
manajerial pada satuan pendidikan yang meliputi penyusunan program pengawasan,
peniliaian, pembimbingan, dan pelatiahan profesional guru, evaluasi hasil pelaksanaan
program pengawasan, dan pelaksanaan tugas pegawasan didaerah khusus. Adapun
beban kerja pengawas sekolah dalam melaksanakan tugas pengawasan adalah 37.50
jam perminggu. Dengan sasaran untuk SMP/MTs, SMA/MA, dan SMK/MAK paling
sedikit 7 (tujuh) satuan pendidikan.
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Clustering berpotensi sebagai alat untuk menganalisis nilai daya serap ujian
nasional, karena clustering memiliki konsep membagi data menjadi kelompokkelompok agar dapat membantu dalam proses pengelompokan SMA khususnya yang
berada di Provinsi DIY berdasarkan nilai daya serap ujian nasional.
Pada penelitian ini, penulis mengkhususkan melakukan pengelompokan
Sekolah Menengah Atas berdasarkan pada mata pelajaran matematika. Hal ini didasari
karena pentingnya peranan pelajaran matematika dalam kehidupan sehari-hari. Dengan
mempelajari matematika, manusia dapat memecahkan suatu permasalahan. Baik
memecahkan masalah dalam pengerjaan soal-soal maupun memecahkan permasalahan
yang lain dalam kehidupan nyata. Selain itu mempelajari matematika dapat membuat
manusia menjadi lebih teliti, cermat, dan tidak ceroboh dalam bertindak.
Penelitian serupa telah dilakukan oleh Megawati (2015) yang berjudul
“Implementasi Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah
Atas di DIY Berdasarkan Nilai Ujian Nasional dan Ujian Sekolah” yang bertujuan
untuk mengelompokkan Sekolah Menengah Atas berdasarkan nilai ujian nasional dan
nilai sekolah dengan menggunakan algoritma Fuzzy C-Means. Sedangkan, pada
penelitian ini hanya menggunakan nilai daya serap Ujian Nasional dengan lokasi
penelitian yang sama yaitu pada Provinsi DIY. Jika pada penelitian sebelumnya
menggunakan algoritma Fuzzy C-Means sebagai algoritma untuk mengelompokan
Sekolah Menengah Atas pada penelitian penulis saat ini adalah menggunakan
algoritma Partitioning Around Medoids sebagai algoritma untuk mengelompokkan
Sekolah Menengah Atas. Hasil pengelompokan sekolah menengah atas selanjutnya
dapat dipergunakan untuk membantu Departemen Pendidikan Provinsi dan juga
penyelenggara pendidikan untuk melihat dan mengevaluasi sekolah-sekolah yang
termasuk ke dalam kelompok nilai daya serap tinggi, sedang, dan rendah. Dengan
demikian Departemen Pendidikan Provinsi dapat mengambil langkah perbaikan yang
tepat.
Berdasarkan hal diatas, maka penulis tertarik untuk mengimplementasikan
algoritma Partitioning Around Medoids (PAM) dan mengambil judul untuk tugas akhir
yaitu “Implementasi Algoritma Partitioning Around Medoids (PAM) untuk
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pengelompokkan Sekolah Menengah Atas di DIY berdasarkan Nilai Daya Serap Ujian
Nasional” untuk membantu dalam proses pengelompokan data Sekolah Menengah
Atas dengan algoritma Partitioning Around Medoids (PAM).
1.2
Rumusan Masalah
Berdasarkan permasalahan yang telah dikemukakan diatas, maka rumusan
masalah yang akan penulis bahas adalah :
1. Bagaimana menerapkan algoritma Partitioning Around Medoid (PAM)
untuk mengelompokkan sekolah menengah atas di Provinsi DIY
berdasarkan nilai daya serap ujian nasional matapelajaran matematika?
2. Bagaimana hasil evaluasi dari pengelompokan sekolah berdasarkan nilai
daya serap 29 kompetensi dalam mata pelajaran matematika dengan
menggunakan algoritma Partitioning Around Medoid (PAM) berdasarkan
Silhouette Index (SI)?
3. Bagaimana hasil evaluasi dari pengelompokan sekolah berdasarkan rata-rata
nilai daya serap 29 kompetensi dalam mata pelajaran matematika dengan
algoritma Partitioning Around Medoid (PAM) menggunakan 3 cluster
sesuai peringkat akreditasi?
1.3
Batasan Masalah
Adapun batasan masalah dalam tugas akhir ini adalah :
1.
Algoritma yang digunakan adalah menggunakan algoritma Partitioning
Around Medoid (PAM) atau K-Medoids.
2.
Data yang digunakan adalah data nilai daya serap ujian nasional mata
pelajaran matematika siswa SMA jurusan IPA di Provinsi DIY tahun ajaran
2014/2015.
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.
Atribut clustering yang digunakan adalah data nilai daya serap ujian
nasional mata pelajaran matematika di Provinsi DIY yang meliputi atribut
nama sekolah dan jumlah kompetensi daya serap mata pelajaran
matematika.
1.4
Tujuan dan Manfaat
Tujuan dari penulisan tugas akhir ini adalah :
1. Mengetahui hasil pengelompokan Sekolah Menengah Atas berdasarkan nilai
daya serap mata pelajaran matematika dengan menggunakan 29 kompetensi
pada tahun ajaran 2014/2015 dengan menggunakan algoritma Partitioning
Around Medoid (PAM).
2. Mengevaluasi hasil pengelompokan Sekolah Menengah Atas berdasarkan
mata pelajaran matematika dengan menggunakan algoritma Partitioning
Around Medoid (PAM) berdasarkan nilai Silhouette Index (SI) untuk jumlah
cluster k=2 hingga k=(1/2)*n.
3. Mengetahui hasil pengelompokan Sekolah Menengah Atas berdasarkan nilai
daya serap mata pelajaran matematika dengan menggunakan rata-rata dari
29 kompetensi pada tahun ajaran 2014/2015.
4. Mengevaluasi hasil pengelompokan Sekolah Menengah Atas berdasarkan
rata-rata nilai daya serap mata pelajaran matematika dengan menggunakan
3 cluster sesuai peringkat akreditasi.
Manfaat dari penulisan tugas akhir ini adalah :
1. Diharapkan menjadi bahan evaluasi bagi Sekolah Menengah Atas khususnya
di DIY agar bisa meningkatkan kualitas pembelajaran mata pelajaran
matematika bagi siswanya.
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Dapat memberikan gambaran mengenai implementasi dari algoritma
Partitioning Around Medoids dalam menghasilkan pengelompokan Sekolah
Menengah Atas berdasarkan nilai daya serap ujian nasional.
1.5
Metodologi Penelitian
Metode penelitian yang digunakan penulis dalam menyelesaikan tugas akhir
adalah sebagai berikut :
1.
Studi Pustaka
Pada tahapan ini merupakan proses pengumpulan data dan pengumpulan
informasi algoritma yang akan digunakan dengan cara mempelajari
berbagai referensi (buku, laporan, hasil penelitian, jurnal, ataupun artikel)
yang berhubungan dengan masalah yang diteliti.
2.
Pembersihan data (data cleaning)
Pada tahapan ini merupakan proses pembuangan data yang tidak relevan
atau tidak konsisten terhadap data lainnya.
3.
Integrasi data (data integration)
Pada tahapan integrase data ini akan dilakukan penggabungan data dari
berbagai sumber/database yang ada.
4.
Seleksi data (data selection)
Pada tahapan seleksi data ini merupakan tahapan menyeleksi data yang
akan digunakan dalam penelitian.
5.
Transformasi data (data transformation)
Pada tahapan ini akan dilakukan format data asli ke dalam format data yang
sesuai dengan penelitian.
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6.
Penambangan data (data mining)
Pada tahapan ini akan dilakukan proses penambangan data menggunakan
algoritma Partitioning Around Medoids (PAM) dengan menggunakan
metode Waterfall dengan tahap-tahap sebagai berikut:
a. Analisa
Pada tahapan ini merupakan tahapan menganalisis hal-hal yang
diperlukan dalam pelaksanaan proses pembuatan perangkat lunak
penambangan data.
b. Desain
Tahapan desain ini merupakan tahapan penerjemahan dari data yang
dianalisis kedalam bentuk yang mudah dimengerti oleh user.
c. Coding
Tahapan coding merupakan tahapan pemecahan masalah yang telah
dirancang ke dalam bahasa pemrograman tertentu.
d. Testing atau pengujian
Pada tahapan ini merupakan tahap pengujian terhadap perangkat lunak
penambangan data yang telah dibangun.
7.
Evaluasi pola (pattern evaluasi)
Pada tahapan ini akan dilakukan proses evaluasi terhadap hasil data mining
yang telah dilakukan pada proses sebelumnya.
8.
Presentasi pengetahuan (knowledge presentation)
Pada tahapan ini akan dilakukan presentasi hasil data mining yang telah
dikerjakan sebelumnya.
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1.6
Sistematika Penulisan
Sistematika penulisan dibagi menjadi beberapa bab, sebagai berikut :
BAB I : Pendahuluan
Bab ini berisi tentang latar belakang, rumusan masalah, batasan
masalah, tujuan dan manfaat, metodologi penelitian, dan sistematika penulisan
tugas akhir.
BAB II : Landasan Teori
Bab ini membahas tentang teori-teori yang digunakan guna menunjang
penelitian dan menjadi dasar atau sumber tertulis dari apa yang akan dilakukan
yaitu, Knowledge Discovery in Database (KDD), Penambangan Data (data
mining), Clustering, Partitioning Around Medoids (PAM), dan Silhouette Index
(SI).
BAB III : Metodologi Penelitian
Bab ini akan menjelaskan tentang penelitian pustaka yang berisikan
data, data yang digunakan, dan spesifikasi alat.
BAB IV : Pemrosesan Awal dan Perancangan Perangkat Lunak
Penambangan Data
Bab ini membahas tentang pemrosesan awal dari data yang akan
digunakan dan perancangan dari perangkat lunak penambangan data yang akan
dibangun.
BAB V : Implementasi Penambangan Data dan Evaluasi Hasil
Bab ini berisi mengenai implementasi sistem yang dibangun dan
analisis hasil dari sistem yang telah dibuat.
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB VI : Penutup
Bab ini berisi mengenai kesimpulan dan saran mengenai sistem yang
dibuat.
LAMPIRAN
9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II
LANDASAN TEORI
2.1
Knowledge Discovery in Database (KDD)
2.1.1 Definisi Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database (KDD) adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola, atau
hubungan dalam set data berukuran besar. Penambangan data (data mining) merupakan
bagian dari Knowledge Discovery in Database yang merupakan kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola, atau
hubungan dalam data yang berukuran besar (Santosa, 2007).
2.1.2 Tahapan Knowledge Discovery in Database (KDD)
Menurut Han and Kamber (2006), penambangan data tidak dapat dipisahkan
dari proses Knowledge Discovery in Database (KDD). KDD merupakan sebuah proses
mengubah data mentah menjadi suatu informasi yang berguna. Tahapan KDD
merupakan suatu rangkaian proses penambangan data (data mining) dan dapat dibagi
menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana pemakai
terlibat langsung atau melalui perantara knowledge base. Ilustrasi proses KDD dapat
dilihat pada gambar 2.1.
10
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 2.1 Proses Knowledge Discovery in Database
(Han&Kamber, 2006)
Tahapan proses Knowledge Discovery in Database (KDD) adalah sebagai
berikut :
1. Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak
konsisten atau data tidak relevan. Pada umumnya data yang diperoleh, baik dari
database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang
tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya
sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan
dengan hipotesa data mining yang dimiliki. Data-data yang tidak relevan itu juga
lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi dari
teknik data mining karena data yang ditangani akan berkurang jumlah dan
kompleksitasnya.
11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai database ke dalam
satu database baru. Tidak jarang data yang diperlukan untuk data mining tidak
hanya berasal dari satu database tetapi juga berasal dari beberapa database atau
file teks. Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama, jenis produk, nomor pelanggan dan
lainnya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada
integrasi data bisa menghasilkan hasil yang menyimpang dan bahkan
menyesatkan pengambilan aksi nantinya. Sebagai contoh bila integrasi data
berdasarkan jenis produk ternyata menggabungkan produk dari kategori yang
berbeda maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada.
3. Seleksi data (data selection)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena
itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
Sebagai contoh, sebuah kasus yang meneliti faktor kecenderungan orang
membeli dalam kasus market basket analysis, tidak perlu mengambil nama
pelanggan, cukup dengan id pelanggan saja.
4. Transformasi data (data transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam
data mining. Beberapa metode data mining membutuhkan format data yang
khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar
seperti analisis asosiasi dan clustering hanya bisa menerima input data
kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagibagi menjadi beberapa interval. Proses ini sering disebut transformasi data.
12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5. Penambangan data (data mining)
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data.
6. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang
ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang
khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada
memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada
beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk
memperbaiki proses data mining, mencoba metode data mining lain yang lebih
sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang
mungkin bermanfaat.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang
digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap
terakhir dari proses data mining adalah bagaimana memformulasikan keputusan
atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan
orang-orang yang tidak memahami data mining. Karenanya presentasi hasil data
mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu
tahapan yang diperlukan dalam proses data mining. Dalam presentasi ini,
visualisasi juga bisa membantu mengkomunikasikan hasil data mining.
Tahap 1 sampai dengan tahap 4 merupakan berbagai bentuk dari data
preprocessing, dimana data disiapkan untuk dilakukan penambangan (mining).
Data mining hanya salah satu langkah dari keseluruhan proses dalam Knowledge
Discovery in Database (KDD).
13
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.2
Penambangan Data (Data Mining)
2.2.1 Definisi Penambangan Data (Data Mining)
Penambangan data (Data mining) adalah suatu istilah yang digunakan untuk
menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses
yang menggunakan teknik statistic, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar (Turban, dkk, 2005).
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual
(Pramudiono, 2006).
Data mining merupakan analisis dari peninjauan kumpulan data untuk
menemukan hubungan tidak diduga dan meringkas data dengan cara yang berbeda
dengan sebelumnya, yang dapat dipahami dengan bermanfaat bagi pemilik data
(Larose, 2005).
2.2.2 Teknik Penambangan Data (Data Mining)
Teknik dalam penambangan data adalah sebagai berikut (Hermawati, 2013):
1. Classification (klasifikasi)
Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari
beberapa kategori (atau klas) yang telah didefinisikan sebelumnya. Disebut juga
dengan ‘supervised learning’.
2. Clustering (klasterisasi)
Klasterisasi adalah mempartisi data-set menjadi beberapa sub-set atau
kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok
tertentu memiliki set property yang dishare bersama, dengan tingkat
similaritasyang tinggi dalam satu kelompok dan tingkat similaritas antar
kelompok yang rendah. Disebut juga dengan ‘unsupervised learning’.
14
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3. Association Rule Discovery (kaidah asosiasi)
Mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-occur)
dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulankumpulan tersebut.
2.3
Clustering
2.3.1 Definisi Clustering
Clustering yaitu menemukan kumpulan obyek hingga obyek-obyek dalam satu
kelompok sama (atau punya hubungan) dengan yang lain dan berbeda (atau tidak
berhubungan) dengan obyek-obyek dalam kelompok lain. Tujuan dari clustering
adalah untuk meminimalkan jarak di dalam cluster dan memaksimalkan jarak antar
cluster.
Dalam mengukur jarak dalam clustering dapat dilakukan dengan menggunakan
Euclidean Distance. Euclidean distance merupakan pengukuran jarak obyek dan pusat
cluster yang banyak digunakan secara luas dalam berbagai kasus pattern matching,
termasuk clustering. Eucludean distance dinyatakan dengan persamaan :
𝑑𝑖𝑠𝑡 = √∑𝑛𝑘=1(𝑝𝑘 − 𝑞𝑘 )2 …………………………………….(2.1)
Dimana :
n = jumlah fitur dalam suatu data.
k = indeks data.
pk = nilai atribut (fitur) ke-k dari p.
qk = nilai atribut (fitur) ke-k dari q.
15
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3.2 Tipe Clustering
Clustering merupakan suatu kumpulan dari keseluruhan cluster. Beberapa tipe
penting dari clustering adalah sebagai berikut (Hermawati, 2013):
1.
Partitional vs Hierarchical
Partitional clustering adalah pembagian obyek data ke dalam
subhimpunan (cluster) yang tidak overlap sedemikian hingga tiap obyek data
berada dalam tepat satu sub-himpunan.
Hierarchical clustering merupakan sebuah himpunan cluster bersarang
yang diatur sebagai suatu pohon hirarki. Tiap simpul (cluster) dalam pohon
(kecuali simpul daun) merupakan gabungan dari anaknya (subcluster) dan
simpul akar berisi semua obyek.
2.
Exclusive vs non-exclusive
Exclusive clustering adalah bila setiap obyek yang ada berada tepat di
dalam satu cluster.
Overlapping atau non-exclusive clustering adalah bila sebuah obyek
dapat berada di lebih dari satu cluster secara bersamaan.
3.
Fuzzy vs non-fuzzy
Dalam fuzzy clustering, sebuah titik termasuk dalam setiap cluster dengan
suatu nilai bobot antara 0 dan 1. Jumlah dari bobot-bobot tersebut sama
dengan 1. Clustering probabilitas mempunyai karakteristik yang sama.
4.
Partial vs complete
Dalam complete clustering, setiap obyek ditempatkan dalam sebuah
cluster. Tetapi dalam partial clustering, tidak semua obyek ditempatkan dalam
sebuah cluster. Kemungkinan ada obyek yang tidak tepat untuk ditempatkan
di salah satu cluster, misalkan berupa outlier atau noise.
16
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.4
Partitioning Around Medoids (PAM)
Algoritma Partitioning Around Medoids (PAM) atau dikenal juga dengan K-
Medoids adalah algoritma pengelompokan yang berkaitan dengan algoritma K-Means
dan algoritma medoidshift. Algoritma K-Medoids ini diusulkan pada tahun 1987.
Algoritma Partitioning Around Medoids (PAM) dikembangkan oleh Leonard
Kaufman dan Peter J. Rousseeuw. Algoritma ini sangat mirip dengan algoritma KMeans, terutama karena kedua algoritma ini partitional. Dengan kata lain, kedua
algoritma ini memecah dataset menjadi kelompok-kelompok dan kedua algoritma ini
berusaha untuk meminimalkan kesalahan. Tetapi algoritma Partitioning Around
Medoids (PAM) bekerja dengan menggunakan Medoids, yang merupakan entitas dari
dataset yang mewakili kelompok dimana ia dimasukkan.
Algoritma Partitioning Around Medoids (PAM) menggunakan metode partisi
clustering untuk mengelompokkan sekumpulan n obyek menjadi sejumlah kcluster.
Algoritma ini menggunakan obyek pada kumpulan obyek untuk mewakili sebuah
cluster. Obyek yang terpilih untuk mewakili sebuah cluster disebut dengan medoid.
Cluster dibangun dengan menghitung kedekatan yang dimiliki antara medoid dengan
obyek non-medoid.
2.4.1 Algoritma Partitioning Around Medoids (PAM)
Algoritma dari Partitioning Around Medoids (PAM) atau K-Medoids adalah
sebagai berikut (Han & Kamber, 2006):
1. Secara acak pilih k obyek pada sekumpulan n obyek sebagai medoid.
2. Ulangi langkah 3 hingga langkah 6.
3. Tempatkan obyek non-medoid ke dalam cluster yang paling dekat dengan
medoid.
4. Secara acak pilih orandom: sebuah obyek non-medoid.
17
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5. Hitung total biaya, S, dari pertukaran medoid oj dengan orandom.
6. Jika S < 0 maka tukar ojdengan orandom untuk membentuk sekumpulan k obyek
baru sebagai medoid.
7. Hingga tidak ada perubahan.
Nilai total biaya/cost dinyatakan dengan persamaan:
Total 𝑐𝑜𝑠𝑡 = ∑ 𝑑𝑖𝑠𝑡 …………………………………….(2.2)
Dimana :
dist = merujuk pada rumus 2.1
Nilai S dinyatakan dengan persamaan:
S = Total 𝑐𝑜𝑠𝑡 baru − Total 𝑐𝑜𝑠𝑡 lama ………………………….(2.3)
Dimana :
Total cost baru = jumlah biaya/cost non-medoids.
Total cost baru = jumlah biaya/cost medoids.
K-medoids sangat mirip dengan K-means, perbedaan utama diantara dua
algoritma tersebut adalah jika pada K-Means cluster diwakili dengan pusat dari
cluster, sedangkan pada K-Medoids cluster diwakili oleh obyek terdekat dari
pusat cluster.
2.4.2 Contoh Penerapan Algoritma Partitioning Around Medoids (PAM)
Berikut adalah contoh penerapan algoritma PAM atau K-Medoids pada kasus
nilai daya serap ujian nasional di provinsi DIY, dengan data sampel yang digunakan
adalah mata pelajaran matematika pada tahun ajaran 2013/2014.
18
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 2.1 Data Contoh
Nama Sekolah
MAT1
MAT2 MAT3 MAT4 MAT5 MAT6 MAT7
SMA NEGERI 3 YOGYAKARTA
54.55
74.33
76.87
92.51
74.87
66.84
88.23
SMA NEGERI 4 YOGYAKARTA
36.42
70.37
58.03
79.63
60.49
50.62
75.52
SMA NEGERI 6 YOGYAKARTA
31.35
61.08
67.43
81.62
64.32
50.81
82.70
SMA NEGERI 9 YOGYAKARTA
42.75
68.12
64.49
92.75
67.39
48.55
79.47
SMA NEGERI 11 YOGYAKARTA
34.39
60.85
51.98
79.37
48.15
38.10
70.55
YOGYAKARTA
36.59
73.98
64.63
83.74
69.92
47.97
84.55
SMA BOPKRI 1 YOGYAKARTA
37.21
81.40
60.75
89.53
37.21
39.53
77.13
SMA STELLA DUCE 1
Contoh perhitungan penerapan algoritma Partitioning Around Medoids (PAM)
atau K-Medoids terlampir pada lampiran 1.
2.5
Silhouette
2.5.1 Silhouette Index (SI)
Jika DBI digunakan untuk mengukur validasi seluruh cluster dalam set data,
maka Silhouette Index (SI) dapat digunakan untuk menvalidasi baik sebuah data,
cluster tunggal (satu cluster dari sejumlah cluster), atau bahkan keseluruhan cluster.
Metode ini yang paling banyak digunakan untuk memvalidasi cluster yang
menggabungkan nilai kohesi dan separasi. Untuk menghitung nilai SI dari sebuah data
ke-i, ada 2 komponen yaitu ai dan bi. ai adalah rata-rata jarak ke-i terhadap semua data
lainnya dalam satu cluster, sedangkan bi didapatkan dengan menghitung rata-rata jarak
data ke-i terhadap semua data dari cluster yang lain tidak dalam satu cluster dengan
data ke-i, kemudian diambil yang terkecil (Tan et al, 2006 & Petrovic, 2003).
𝑗
Berikut formula untuk menghitung 𝑎𝑖 :
𝑗
𝑎𝑖 =
1
𝑚𝑗 −1
𝑚
𝑗
𝑗
𝑗
∑ 𝑟=1
𝑑(𝑥𝑖 , 𝑥𝑟 ),
𝑟 ≠1
19
𝑖 = 1, 2, … , 𝑚𝑗 ………………… (2.4)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Dimana :
j = cluster
i = index data
𝑗
𝑎𝑖 = rata-rata jarak data ke–i terhadap semua data lainnya dalam satu cluster.
mj = jumlah data dalam cluster ke-j.
𝑗
𝑗
𝑑(𝑥𝑖 , 𝑥𝑟 ) adalah jarak data ke-i dengan data ke-r dalam satu cluster j.
𝑗
Berikut formula untuk menghitung 𝑏𝑖 :
𝑗
𝑏𝑖 =
𝑚𝑖𝑛
𝑛=1,…,𝑘
𝑛 ≠𝑗
1
𝑚𝑛
𝑗
{𝑚 ∑ 𝑟=1
𝑑(𝑥𝑖 , 𝑥𝑟𝑛 )}, 𝑖 = 1, 2, … , 𝑚𝑗 ……………….. (2.5)
𝑛
𝑟 ≠1
Dimana :
j = cluster
n = cluster
i = index data
mn = banyak data dalam satu cluster
𝑗
𝑏𝑖 = nilai terkecil dari rata-rata jarak data ke-i terhadap semua data dari cluster
yang lain tidak dalam satu cluster dengan data ke-i
𝑗
𝑑(𝑥𝑖 , 𝑥𝑟𝑛 ) adalah jarak data ke-i dalam satu cluster j dengan data ke-r dalam suatu
cluster n.
Untuk mendapatkan Silhouette Index (SI) data ke-i menggunakan persamaan berikut:
𝑗
𝑆𝐼𝑖 =
𝑗
𝑗
𝑏𝑖 − 𝑎𝑖
𝑗 𝑗
max{𝑎𝑖 ,𝑏𝑖 }
……….………………………(2.6)
Dimana :
𝑗
𝑆𝐼𝑖 = Silhouette Index data ke-i dalam satu cluster
𝑗
𝑏𝑖 = nilai terkecil dari rata-rata jarak data ke-i terhadap semua data dari cluster
yang lain tidak dalam satu cluster dengan data ke-i
𝑗
𝑎𝑖 = rata-rata jarak data ke–i terhadap semua data lainnya dalam satu cluster.
20
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Nilai ai mengukur seberapa tidak mirip sebuah data dengan cluster yang
diikutinya, nilai yang semakin kecil menandakan semakin tepatnya data tersebut berada
dalam cluster tersebut. Nilai bi yang besar menandakan seberapa jeleknya data terhadap
cluster yang lain. Nilai SI yang didapat dalam rentang [-1, +1]. Nilai SI yang mendekati
1 menandakan bahwa data tersebut semakin tepat berada dalam cluster tersebut. Nilai
SI negatif (ai > bi) menandakan bahwa data tersebut tidak tepat berada di dalam cluster
tersebut (karena lebih dekat ke cluster yang lain). SI bernilai 0 (atau mendekati 0)
berarti data tersebut posisinya berada di perbatasan di antara dua cluster.
Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata-rata nilai
SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut
:
𝑆𝐼𝑗 =
1
𝑚𝑗
𝑚
𝑗
𝑗
∑𝑖=1
𝑆𝐼𝑖 ……………….……………………… (2.7)
Dimana :
𝑆𝐼𝑗 = Rata-rata Silhouette Index cluster j
mj = jumlah data dalam cluster ke-j
𝑗
𝑆𝐼𝑖 = Silhouette Index data ke-i dalam satu cluster
i = index
Sementara nilai SI global didapatkan dengan menghitung rata-rata nilai SI dari semua
cluster seperti pada persamaan berikut:
𝑆𝐼 =
1
𝑘
∑𝑘𝑗=1 𝑆𝐼𝑗 ………………………………………(2.8)
Dimana :
SI = Rata-rata Silhouette Index dari dataset
k = jumlah cluster
𝑆𝐼𝑗 = Rata-rata Silhouette Index cluster j
21
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.5.2 Silhouette Coefficient (SC)
Silhouette Coefficient adalah suatu metode yang digunakan untuk mengetahui
apakah cluster yang terbentuk adalah cluster yang memiliki struktur kuat, struktur baik,
struktur lemah, maupun struktur yang buruk. Untuk menghitung nilai Silhouette
Coefficient, terlebih dahulu mengghitung nilai Silhouette Index dari sebuah data ke-i.
Nilai Silhouette Coefficient didapatkan dengan mencari nilai maksimal dari nilai
Silhouette Index Global dari jumlah cluster 2 sampai jumlah cluster n-1, seperti pada
persamaan berikut:
𝑆𝐶 = 𝑀𝑎𝑘𝑠𝑘 𝑆𝐼(𝑘) ………………………………………(2.9)
Dimana :
SC = Silhouette Coefficient
SI = Silhouette Index Global
k = jumlah cluster
Kriteria subjektif pengukuran baik atau tidaknya pengelompokan berdasarkan
Silhouette Coefficient (SC) menurut Kauffman dan Roesseeuw (1990) dapat dilihat
pada tabel 2.2.
Tabel 2.2 Kriteria subjektif pengukuran pengelompokan berdasarkan Silhouette
Coefficient (SC)
Nilai SC
Intepretasi oleh Kauffman dan Roesseeuw
0.71 – 1.00
Struktur kuat
0.51 – 0.70
Struktur baik
0.26 – 0.50
Struktur lemah
≤ 0.25
Struktur buruk
22
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III
METODOLOGI PENELITIAN
3.1
Data
Data yang digunakan diperoleh dari situs http://litbang.kemdikbud.go.id/. Data
yang digunakan pada penelitian ini adalah data nilai daya serap ujian nasional siswa
SMA jurusan IPA tahun ajaran 2014/2015. Data nilai daya serap yang digunakan
adalah mata pelajaran matematika. Pada setiap mata pelajaran terdapat beberapa nilai
kompetensi daya serap Ujian Nasional. Berikut ini adalah nilai kompetensi nilai daya
serap Ujian Nasional pada mata pelajaran matematika
Tabel 3.1 Atribut nilai daya serap ujian nasional pelajaran
matematika tahun 2014/2015.
No
Nama Atribut
Keterangan
1
KODE SEKOLAH
Kode Sekolah
2
NAMA SEKOLAH
Nama Sekolah
3
JNS SEKOLAH
Jenis Sekolah (SMA)
4
STS SE
Status Sekolah (Negeri/Swasta)
5
MAT1
Kompetensi 1 daya serap
matematika: Menentukan penarikan
kesimpulan dari beberapa premis.
6
MAT2
Kompetensi 2 daya serap
matematika:
Menentukan ingkaran atau
kesetaraan dari pernyataan
majemiuk atau pernyataan
berkuator.
7
MAT3
Kompetensi 3 daya serap
matematika:
23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menggunakan aturan pangkat, akar,
dan logaritma.
8
MAT4
Kompetensi 4 daya serap
matematika:
Menggunakan rumus jumlah dan
hasil kali akar-akar persamaan
kuadrat.
9
MAT5
Kompetensi 5 daya serap
matematika:
Menyelesaikan masalah persamaan
atau fungsi kuadrat dengan
menggunakan diskriminan.
10
MAT6
Kompetensi 6 daya serap
matematika:
Menyelesaikan masalah sehari-hari
yang berkaitan dengan sistem
persamaan linier.
11
MAT7
Kompetensi 7 daya serap
matematika:
Menentukan persamaan lingkaran
atau garis singgung lingkaran.
12
MAT8
Kompetensi 8 daya serap
matematika:
Menyelesaikan masalah yang
berkaian dengan teorema sisa atau
teorema faktor.
13
MAT9
Kompetensi 9 daya serap
matematika:
24
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menyelesaikan masalah program
linier.
14
MAT10
Kompetensi 10 daya serap
matematika:
Menyelesaikan operasi matriks.
15
MAT11
Kompetensi 11 daya serap
matematika:
Menyelesaikan operasi aljabar
beberapa vektor dengan syarat
tertentu.
16
MAT12
Kompetensi 12 daya serap
matematika:
Menyelesaikan masalah yang
berkaitan dengan besar sudut/nilai
perbandingan trigonometri sudut
antara 2 vektor.
17
MAT13
Kompetensi 13 daya serap
matematika:
Menyelesaikan masalah yang
berkaitan dengan panjang proyeksi
atau vektor proyeksi.
18
MAT14
Kompetensi 14 daya serap
matematika:
Menentukan bayangan titik atau
kurva karena dua transformasi atau
lebih.
19
MAT15
Kompetensi 15 daya serap
matematika:
25
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menentukan penyelesaian
pertidaksamaan eksponen atau
logaritma.
20
MAT16
Kompetensi 16 daya serap
matematika:
Menyelesaikan masalah yang
berkaitan dengan fungsi eksponen
atau fungsi logaritma.
21
MAT17
Kompetensi 17 daya serap
matematika:
Menyelesaikan masalah deret
aritmetika.
22
MAT18
Kompetensi 18 daya serap
matematika:
Menyelesaikan masalah deret
geometri.
23
MAT19
Kompetensi 19 daya serap
matematika:
Menghitung jarak dan sudut antara
dua obyek (titik, garis, dan bidang)
di ruang dimensi tiga.
24
MAT20
Kompetensi 20 daya serap
matematika:
Menyelesaikan masalah geometri
dengan menggunakan aturan sinus
atau kosinus.
25
MAT21
Kompetensi 21 daya serap
matematika:
26
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menyelesaikan persamaan
trigonometri.
26
MAT22
Kompetensi 22 daya serap
matematika:
Menyelesaikan masalah yang
berkaitan dengan nilai perbandingan
trigonometri yang menggunakan
rumus jumlah dan selisih sinus,
kosinus, dan tangen serta jumlah
dan selisih dua sudut.
27
MAT23
Kompetensi 23 daya serap
matematika:
Menghitung nilai limit fungsi
aljabar dan fungsi trigonometri.
28
MAT24
Kompetensi 24 daya serap
matematika:
Menyelesaikan soal aplikasi turunan
fungsi.
29
MAT25
Kompetensi 25 daya serap
matematika:
Menentukan integral tak tentu dan
integral tentu fungsi aljabar dan
fungsi trigonometri.
30
MAT26
Kompetensi 26 daya serap
matematika:
Menghitung luas daerah dan volume
benda putar dengan menggunakan
integral.
27
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
MAT27
Kompetensi 27 daya serap
matematika:
Menghitung ukuran pemusatan atau
ukuran letak dari data dalam bentuk
tabel, diagram, atau grafik.
32
MAT28
Kompetensi 28 daya serap
matematika:
Menyelesaikan masalah sehari-hari
dengan menggunakan kaidah
pencacahan, permutasi, atau
kombinasi.
33
MAT29
Kompetensi 29 daya serap
matematika:
Menyelesaikan masalah yang
berkaitan dengan peluang suatu
kejadian.
3.2
Data yang Digunakan
Data yang akan digunakan dalam penelitian ini adalah 31 atribut, yaitu kode
sekolah, nama sekolah, jns sek, sts sek, mat1, mat2, mat3, mat4, mat5, mat6, mat7,
mat8, mat9, mat10, mat11, mat12, mat13, mat14, mat15, mat16, mat17, mat18, mat19,
mat20, mat21, mat22, mat23, mat24, mat25, mat26, mat27, mat28, mat29, mat30.
Atribut jns sek, dan sts sek tidak digunakan pada penelitian ini. Sehingga atribut yang
digunakan menjadi 31 atribut yaitu :
Tabel 3.2 Atribut nilai daya serap ujian nasional pelajaran matematika
tahun 2014/2015 yang digunakan dalam penelitian.
No
Nama Atribut
Keterangan
1
KODE SEKOLAH
Kode Sekolah
2
NAMA SEKOLAH
Nama Sekolah
28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
MAT1
Kompetensi 1 daya serap matematika:
Menentukan penarikan kesimpulan dari
beberapa premis.
4
MAT2
Kompetensi 2 daya serap matematika:
Menentukan ingkaran atau kesetaraan dari
pernyataan majemiuk atau pernyataan
berkuator.
5
MAT3
Kompetensi 3 daya serap matematika:
Menggunakan aturan pangkat, akar, dan
logaritma.
6
MAT4
Kompetensi 4 daya serap matematika:
Menggunakan rumus jumlah dan hasil
kali akar-akar persamaan kuadrat.
7
MAT5
Kompetensi 5 daya serap matematika:
Menyelesaikan masalah persamaan atau
fungsi kuadrat dengan menggunakan
diskriminan.
8
MAT6
Kompetensi 6 daya serap matematika:
Menyelesaikan masalah sehari-hari yang
berkaitan dengan sistem persamaan linier.
9
MAT7
Kompetensi 7 daya serap matematika:
Menentukan persamaan lingkaran atau
garis singgung lingkaran.
10
MAT8
Kompetensi 8 daya serap matematika:
Menyelesaikan masalah yang berkaian
dengan teorema sisa atau teorema faktor.
11
MAT9
Kompetensi 9 daya serap matematika:
Menyelesaikan masalah program linier.
12
MAT10
Kompetensi 10 daya serap matematika:
29
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menyelesaikan operasi matriks.
13
MAT11
Kompetensi 11 daya serap matematika:
Menyelesaikan operasi aljabar beberapa
vektor dengan syarat tertentu.
14
MAT12
Kompetensi 12 daya serap matematika:
Menyelesaikan masalah yang berkaitan
dengan besar sudut/nilai perbandingan
trigonometri sudut antara 2 vektor.
15
MAT13
Kompetensi 13 daya serap matematika:
Menyelesaikan masalah yang berkaitan
dengan panjang proyeksi atau vektor
proyeksi.
16
MAT14
Kompetensi 14 daya serap matematika:
Menentukan bayangan titik atau kurva
karena dua transformasi atau lebih.
17
MAT15
Kompetensi 15 daya serap matematika:
Menentukan penyelesaian pertidaksamaan
eksponen atau logaritma.
18
MAT16
Kompetensi 16 daya serap matematika:
Menyelesaikan masalah yang berkaitan
dengan fungsi eksponen atau fungsi
logaritma.
19
MAT17
Kompetensi 17 daya serap matematika:
Menyelesaikan masalah deret aritmetika.
20
MAT18
Kompetensi 18 daya serap matematika:
Menyelesaikan masalah deret geometri.
21
MAT19
Kompetensi 19 daya serap matematika:
30
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menghitung jarak dan sudut antara dua
obyek (titik, garis, dan bidang) di ruang
dimensi tiga.
22
MAT20
Kompetensi 20 daya serap matematika:
Menyelesaikan masalah geometri dengan
menggunakan aturan sinus atau kosinus.
23
MAT21
Kompetensi 21 daya serap matematika:
Menyelesaikan persamaan trigonometri.
24
MAT22
Kompetensi 22 daya serap matematika:
Menyelesaikan masalah yang berkaitan
dengan nilai perbandingan trigonometri
yang menggunakan rumus jumlah dan
selisih sinus, kosinus, dan tangen serta
jumlah dan selisih dua sudut.
25
MAT23
Kompetensi 23 daya serap matematika:
Menghitung nilai limit fungsi aljabar dan
fungsi trigonometri.
26
MAT24
Kompetensi 24 daya serap matematika:
Menyelesaikan soal aplikasi turunan
fungsi.
27
MAT25
Kompetensi 25 daya serap matematika:
Menentukan integral tak tentu dan
integral tentu fungsi aljabar dan fungsi
trigonometri.
28
MAT26
Kompetensi 26 daya serap matematika:
Menghitung luas daerah dan volume
benda putar dengan menggunakan
integral.
29
MAT27
Kompetensi 27 daya serap matematika:
31
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Menghitung ukuran pemusatan atau
ukuran letak dari data dalam bentuk tabel,
diagram, atau grafik.
30
MAT28
Kompetensi 28 daya serap matematika:
Menyelesaikan masalah sehari-hari
dengan menggunakan kaidah pencacahan,
permutasi, atau kombinasi.
31
MAT29
Kompetensi 29 daya serap matematika:
Menyelesaikan masalah yang berkaitan
dengan peluang suatu kejadian.
3.3
Spesifikasi Alat
Sistem dibuat dengan menggunakan hardware dan software sebagai berikut :
3.3.1 Spesifikasi Software
Spesifikasi software yang dibutuhkan dalam pembuatan sistem ini adalah:
1.
Sistem Operasi Windows 7
2.
Compiler IDE Netbeans 7.2.
3.3.2 Spesifikasi Hardware
Spesifikasi hardware yang dibutuhkan dalam pembuatan sistem ini adalah:
1.
Processor Intel Core i5.
2.
RAM 4 GB.
3.
HDD 500 GB.
32
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB IV
PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT
LUNAK PENAMBANGAN DATA
4.1
Pemrosesan Awal Sumber Data
4.1.1 Pembersihan Data
Sebelum melakukan proses data mining perlu melakukan proses cleaning data
terlebih dahulu. Proses cleaning meliputi membuang duplikasi data, memeriksa data
yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak
(tipografi). Kemudian dilakukan proses enrichment, yaitu proses “memperkaya” data
yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk
KDD, seperti data atau informasi eksternal. Pada penelitian ini terdapat 2 data sekolah
yang dihapus karena kedua sekolah ini tidak memiliki nilai untuk tiap atribut. Kedua
sekolah tersebut adalah SMA Piri 2 Yogyakarta dan SMA Proklamasi’45 Yogyakarta.
4.1.2 Integrasi Data
Tahap integrasi ini merupakan tahap penggabungan data dari berbagai sumber.
Pada penelitian ini penulis menggunakan data yang diambil dari situs kemendikbud.
Data yang diambil dari situs kemendikbud yaitu data nilai daya serap Ujian Nasional
mata pelajaran matematika tahun ajaran 2014/2015, data tersebut memiliki 29
kompetensi. Data dari kemendikbud kemudian digabungkan menjadi 1 file excel
berekstensi .xls.
4.1.3 Seleksi Data
Tahap seleksi ini merupakan tahap pemilihan (seleksi) data dari sekumpulan
data, tahap ini perlu dilakukan sebelum tahap data mining dalam KDD. Data hasil
seleksi yang akan digunakan untuk proses penambangan data akan disimpan dalam
33
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
suatu berkas. Pada data nilai daya serap terdapat 2 atribut tetap yaitu KODE
SEKOLAH dan NAMA SEKOLAH. Sisanya merupakan atribut nama kompetensi
yang jumlahnya berbeda untuk tiap tahun ajaran. Daftar atribut yang digunakan dapat
dilihat pada tabel 3.2.
4.1.4 Transformasi Data
Pada tahap transformasi data adalah mengubah format data asli ke dalam format
data yang sesuai untuk penelitian, yaitu mengubah data dari kolom nilai daya serap per
sekolah menjadi baris per sekolah untuk mempermudah proses penambangan data.
Kemudian, mengubah format data yang sesuai untuk penelitian ini yaitu pada baris
pertama dalam excel adalah nama kolom dari data yang digunakan dan baris berikutnya
adalah data tersebut seperti pada gambar 4.2.
Gambar 4.1 Data awal nilai daya serap
34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4.2 Data setelah proses transformasi
4.2
Perancangan Perangkat Lunak Penambangan Data
4.2.1 Perancangan Umum
4.2.1.1 Input
Data input dari sistem yang akan dibangun berasal dari file dengan ekstensi
.xls atau .csv yang dipilih langsung oleh user (pengguna) dari direktori komputer.
Sebelum melakukan proses clustering, pengguna diharuskan mengisi jumlah cluster
yang dikehendaki pada textfield yang telah disediakan.
4.2.1.2 Proses
Sistem ini akan mengimplementasikan algoritma Partitioning Around
Medoids untuk mengelompokan data sekolah berdasarkan nilai daya serap ujian
nasional mata pelajaran matematika pada tahun ajaran 2014/2015. Pada gambar 4.1
diperlihatkan proses dari sistem membuka berkas atau data dengan tipe .xls atau .csv
kemudian sistem akan menyeleksi atribut yang tidak akan digunakan untuk proses
clustering. Kemudian jika telah selesai menyeleksi atribut yang tidak akan digunakan,
maka akan dilanjutkan dengan menginputkan nila untuk jumlah cluster. Kemudian
akan di lakukan proses clustering dengan menggunakan algoritma k-medoids atau
Partitioning Around Medoids. Kemudian sistem akan menampilkan hasil proses
clustering. Setelah itu, hasil clustering dapat disimpan ke dalam direktori computer
dengan tipe data berupa .doc atau .txt.
35
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Mulai
File data bertipe .xls atau .csv
Seleksi atribut
Ya
Proses seleksi atribut
Tidak
Memasukkan
jumlah cluster
Proses clustering
k-medoids
Tampilkan hasil
clustering
Simpan hasil
clustering
File data bertipe .doc atau .txt
Selesai
Gambar 4.3 Proses Umum Sistem
4.2.1.3 Output
Hasil keluaran yang diperoleh dari sistem yang dibangun adalah data-data
sekolah yang sudah dikelompokkan.
36
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.2 Diagram Konteks (Context Diagram)
Data daya serap, jumlah cluster
Clustering dengan KMedoids
Pengguna
Pengelompokan data sekolah
Gambar 4.4 Diagram Konteks
4.2.3 Diagram Usecase
Diagram usecase merupakan sebuah gambaran kebutuhan sistem dari sudut
pandang di luar sistem. Pengguna sistem dalam diagram usecase disebut dengan actor.
Pada sistem ini actor yang digunakan hanya satu actor. Fungsi yang dapat dilakukan
oleh actor pada sistem ini adalah memilih data, seleksi atribut, proses clustering
dengan memasukkan nilai jumlah cluster ,dan menyimpan hasil. Gambar dari usecase
ditunjukkan pada gambar 4.3 berikut.
Seleksi atribut
Input berkas
ex
<<
ten
<<include>>
Proses clustering
dengan algoritma PAM
actor
<<include>>
Simpan hasil
clustering
Gambar 4.5 Diagram Usecase
37
d
>
s>
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.4 Diagram Aktivitas (Activity Diagram)
Diagram aktivitas digunakan untuk menunjukkan aktivitas yang dikerjakan
oleh pengguna dan sistem dalam setiap usecase yang disebutkan dalam gambar 4.3.
Berikut adalah diagram aktivitas dari setiap usecase :
USER
SISTEM
Menampilkan kotak dialog file
chooser
Menekan tombol “Pilih File”
Memilih file yang akan digunakan
Menampilkan kotak dialog “File
yang dipilih harus berformat .xls”
Apakah file bertipe .xls ?
Menampilkan data pada tabel
Gambar 4.6 Diagram Aktivitas Input Berkas
38
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
USER
SISTEM
Memilih atribut yang akan dihapus
yang tidak akan digunakan untuk
clustering
Menampilkan data setelah atribut
yang terpilih dihapus
Menekan tombol “Hapus Atribut”
Gambar 4.7 Diagram Aktivitas Seleksi Atribut
USER
SISTEM
Menampilkan hasil Clustering
Menekan tombol “Process”
Gambar 4.8 Diagram Aktivitas Proses Clustering
39
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SISTEM
USER
Menekan tombol “Simpan Hasil”
Menampilkan kotak save dialog
Memilih lokasi dan tipe file untuk
menyimpan hasil
File berhasil disimpan pada direktori
komputer yang telah ditentukan
Gambar 4.9 Diagram Aktivitas Simpan Hasil
4.2.5 Diagram Kelas (Class Diagram)
Diagram kelas berguna untuk memperlihatkan hubungan antar kelas. Diagram
kelas dapat membantu menvisualisasikan struktur kelas-kelas dari suatu sistem.
Diagram kelas dapat dilihat pada lampiran 2.
4.2.6 Rancangan Antarmuka
4.2.6.1 Halaman Awal
Halaman awal adalah halaman yang digunakan sebagai halaman yang akan
muncul pertama kali ketika sistem dijalankan. Halaman ini berisi empat tombol yaitu
BERANDA, BANTUAN, TENTANG, dan MASUK SISTEM. Tombol BERANDA
akan menghubunkan pada halaman awal sistem, tombol BANTUAN akan
menghubungkan dengan halaman bantuan, tombol TENTANG akan menghubungkan
40
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
dengan halaman tentang, dan tombol MASUK SISTEM akan menghubungkan dengan
halaman prepocessing.
Gambar 4.10 Rancangan Antarmuka Halaman Awal
4.2.6.2 Halaman Bantuan
Halaman bantuan adalah halaman yang akan ditampilkan ketika pengguna
menekan tombol BANTUAN. Pada halaman ini berisi mengenai pentujuk
penggunaan sistem.
41
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4.11 Rancangan Antarmuka Halaman Bantuan
4.2.6.3 Halaman Informasi
Halaman tentang adalah halaman yang akan ditampilkan ketika pengguna
menekan tombol TENTANG. Pada halaman ini berisi mengenai informasi dari
sistem.
Gambar 4.12 Rancangan Antarmuka Halaman Tentang
4.2.6.4 Halaman Input Data
Halaman input berkas adalah halaman yang akan ditampilkan ketika pengguna
menekan tombol MASUK SISTEM pada halaman awal. Halaman ini berfungsi sebagai
sarana pengguna memilih data atau memasukkan data. Pada halaman ini pengguna bisa
memilih atribut yang akan digunakan dalam men-cluster dan pengguna juga bisa
menghapus atribut yang tidak dibutuhkan ketika akan men-cluster.
42
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4.13 Rancangan Antarmuka Halaman Input Data
4.2.6.5 Halaman K-Medoids
Halaman clustering adalah halaman yang akan ditampilkan ketika pengguna
menekan tombol CLUSTERING pada halaman preprocessing. Pada halaman ini
pengguna diminta untuk menginputkan jumlah cluster. Kemudian pengguna menekan
tombol PROCESS untuk melakukan clustering. Setelah proses clustering selesai,
pengguna bisa menyimpan hasil clustering.
43
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4.14 Rancangan Antarmuka Halaman K-Medoids
44
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V
IMPLEMENTASI DAN EVALUASI HASIL
5.1
Implementasi Rancangan Perangkat Lunak Penambangan Data
Implementasi rancangan perangkat lunak merupakan prosedur yang harus
dilakukan untuk menyelesaikan pemrograman sistem berdasarkan pada analisis dan
perancangan sistem pada bab sebelumnya. Implementasi rancangan perangkat lunak
pada sistem ini dilakukan dengan menggunakan tools Netbeans Integrated
Development Environment (IDE) 7.2 pada komputer dengan spesifikasi prosessor Intel
Core i5, RAM 4.00 GB, HDD 500 GB. Implementasi rancangan perangkat lunak pada
bab ini terdiri dari implementasi antarmuka. Sedangkan pada evaluasi hasil terdiri dari
pengujuan penggunaan sistem dengan data yang sudah siap untuk di proses clustering
dan hasil pengujian. Daftar nama kelas yang diimplementasikan dalam sistem ini dapat
dilihat pada tabel 5.1 berikut.
Tabel 5.1 Nama kelas yang diimpelentasikan
No Nama Kelas
Nama Berkas
1
Halaman Awal
halaman_awal.java
2
Halaman Input Data
halaman_preprocessing.java
3
Halaman K-Medoids
halaman_clustering.java
4
Halaman Bantuan
halaman_bantuan.java
5
Halaman Informasi
halaman_tentang.java
6
Model Tabel
Tabel.java
7
Model Data
Data.java
8
Model Check Box
CheckBoxTabelModel.java
9
Write Text Area
CustomOutoutStream.java
10
Write Excel
WriteExcel.java
11
Model K-Medoids
KMedoids.java
45
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Sistem pengelompokan menggunakan algoritma Partitioning Around Medoids
(PAM) untuk mengelompokkan Sekolah Menengah Atas di Provinsi DIY berdasarkan
nilai daya serap Ujian Nasional pada mata pelajaran matematika, maka pada sub bab
ini akan ditampilkan antarmuka dari sistem tersebut.
5.1.1 Implementasi Tampilan Antarmuka
5.1.1.1 Halaman Utama
Pada saat sistem pertama kali dijalankan akan ditampilkan form awal seperti
pada gambar 5.1 berikut.
Gambar 5.1 Halaman Awal
Pada halaman awal tersebut terdapat tombol beranda, bantuan, tentang dan
masuk sistem. Tombol beranda berfungsi untuk mengarahkan pada halaman awal.
Tombol bantuan berfungsi untuk mengarahkan pada halaman bantuan. Tombol tentang
berfungsi untuk mengarahkan pada halaman informasi. Tombol masuk sistem
berfungsi untuk mengarahkan ke halaman input data.
46
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5.1.1.2 Halaman Bantuan
Halaman bantuan adalah halaman yang akan ditampilkan ketika user memilih
tombol bantuan pada setiap halaman, yaitu halaman awal, halaman input data, halaman
k-medoids, dan halaman informasi. Halaman ini berisi petunjuk penggunaan sistem.
Tampilan halaman bantuan ditunjukkan pada gambar 5.2 berikut.
Gambar 5.2 Halaman Bantuan
5.1.1.3 Halaman Informasi
Halaman informasi adalah halaman yang akan ditampilkan ketika user
memilih tombol tentang pada setiap halaman, yaitu halaman awal, halaman input data,
halaman k-medoids, dan halaman informasi. Halaman ini berisi informasi mengenai
sistem. Tampilan halaman informasi ditunjukkan pada gambar 5.3 berikut.
47
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5.3 Halaman Informasi
5.1.1.4 Halaman Input Data
Halaman ini merupakan halaman yang digunakan unuk mempersiapkan data
yang akan diproses yang berasal dari berkas .xls. Pengolahan awal data dimaksudkan
agar format data sesuai dengan proses clustering yang akan dilakukan. Agar dapat
diproses, data yang dimasukkan harus dengan format numeric atau angka. Tampilan
halaman input data ditunjukkan pada gambar 5.4 berikut.
48
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5.4 Halaman Input Data
Pengguna dapat menekan tombol “Pilih Berkas” untuk memasukkan berkas
berekstensi .xls. Hasil setelah berkas data dimasukkan seperti pada gambar 5.5 berikut.
Gambar 5.5 Halaman Input Data (berkas .xls)
49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Kemudian pengguna dapat memilih atribut yang tidak akan digunakan dalam
clustering dengan memberikan tanda centang pada checkbox di kolom Seleksi
Atribut, seperti pada gambar 5.6 berikut.
Gambar 5.6 Halaman Input Data (hapus atribut)
Kemudian pengguna dapat menekan tombol “Hapus Atribut” dan atribut yang
dihapus akan hilang dari tabel data. Kemudian pengguna dapat menekan tombol
“Clustering” untuk melanjutkan ke halaman k-medoid. Tampilan penanda hapus
atribut ditunjukkan seperti gambar 5.7 berikut.
Gambar 5.7 Halaman Input Data (Hapus Atribut)
50
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5.1.1.5 Halaman K-Medoids
Halaman ini merupakan halaman selanjutnya setelah menekan tombol
“Clustering” pada halaman input data. Halaman ini berisi implementasi dari algoritma
Partitioning Around Medoids (PAM)/K-Medoids untuk mengelompokan sekolah
menengah atas berdasarkan nilai daya serap ujian nasional.
Isi dari halaman ini adalah tampilan data yang telah melewati tahap
penghapusan atribut pada halaman input data, parameter masukan untuk proses
clustering yaitu Jumlah Cluster, dan kolom hasil untuk menampilkan hasil dari proses
clustering. Tampilan halaman K-Medoids ditunjukkan seperti gambar 5.8 berikut.
Gambar 5.8 Halaman K-Medoids
Pada halaman k-medoids, telah terisi secara default parameter untuk melakukan
proses clustering berupa Jumlah Cluster. Pengguna dapat merubah nilai parameter
dengan cara menghapus kemudian menginputkan kembali nilai untuk jumlah cluster
yang diinginkan. Pemberian nilai default pada halaman ini dimaksudkan agar jika
pengguna lupa memasukkan nilai jumlah cluster pada sistem maka nilai default yang
akan digunakan untuk proses clustering.
51
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pengguna dapat melakukan proses clustering dengan menekan tombol
“Process”, yang hasilnya akan ditampilkan pada kolom hasil. Tampilan hasil proses
clustering ditunjukkan pada Gambar 5.9 berikut.
Gambar 5.9 Halaman K-Medoids (Clustering)
Pengguna dapat menyimpan hasil proses clustering seperti yang ditampilkan
pada kolom Hasil ke dalam bentuk dokumen berekstensi .txt atau .doc.
5.2
Evaluasi Hasil
5.2.1 Uji Coba Perangkat Lunak (Black Box)
5.2.1.1 Rencana Pengujian Black Box
Pada tabel 5.2 akan dijelaskan rencana pengujian dengan menggunakan
metode black box.
52
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
No
Usecase
Tabel 5.2 Rencana Pengujian Black Box
Butir Uji
Pengujian
memasukkan
Kasus Uji
UC-01
data file berekstensi .xls
1
Input berkas
Pengujian
memasukkan
UC-02
data selain file berekstensi
.xls
2
3
4
Seleksi atribut
Proses Clustering dengan
algoritma PAM
Simpan hasil clustering
Penguji menghapus atribut
UC-03
yang tidak diinginkan
Pengujian
melakukan
UC-04
Pengujian menyimpan hasil
UC-05
proses clustering
pengelompokkan ke dalam
file bertipe .doc
5.2.1.2 Prosedur Pengujian Black Box dan Kasus Uji
Setelah menyusun rencana pengujian pada tabel 5.2 maka, akan dilakukan
prosedur pengujian serta kasus uji yang terlampir pada lampiran 3.
5.2.1.3 Evaluasi Pengujian Black Box
Seluruh hasil pengujian black box pada lampiran 3 menunjukkan bahwa
perangkat lunak sudah dapat berjalan dengan baik dan sesuai dengan perancangan
yang sudah dibuat. Hal ini dapat dilihat dari semua fungsi yang sudah berjalan sesuai
dengan yang diharapkan.
53
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5.2.2 Pengujian Perbandingan Hasil Hitung Manual dengan Hasil
Perangkat Lunak
Data uji yang dilakukan secara manual dan sistem yaitu dengan banyak data
sejumlah 29 atribut dan 20 data. Data uji yang digunakan dicuplik dari data nilai daya
serap Ujian Nasional Matematika SMA jurusan IPA di DIY tahun ajaran 2014/2015.
Contoh input data yang digunakan sebagai data uji ditunjukkan pada lampiran 4.
5.2.2.1 Perhitungan Manual
Pengujian perhitungan manual menggunakan dataset daya serap Ujian
Nasional SMA mata pelajaran Matematika jurusan IPA di DIY tahun 2014/2015
sejumlah 29 atribut dan 20 data. Proses perhitungan manual dilakukan dengan
menggunakan aplikasi Microsoft Excel dengan hasil pengelompokkan 3 kolompok.
Proses perhitungan manual beserta dengan hasilnya dapat dilihat pada lampiran 5.
5.2.2.2 Perhitungan Perangkat Lunak
Pengujian perhitungan perangkat lunak menggunakan data yang sama dengan
perhitungan manual yaitu menggunakan dataset daya serap Ujian Nasional SMA mata
pelajaran Matematika jurusan IPA di DIY tahun 2014/2015 sejumlah 29 atribut dan 20
data. Hasil perhitungan perangkat lunak dapat dilihat pada gambar 5.9 berikut.
54
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5.10 Hasil Penambangan Data Menggunakan Perangkat Lunak
5.2.2.3 Evaluasi Pengujian Perbandingan Hitung Manual dengan Hasil
Perangkat Lunak
Setelah dilakukan pengujian pada perhitungan secara manual dibandingkan
dengan sistem didapatkan hasil perbandingan implementasi algoritma k-medoids
seperti ditunjukkan pada tabel 5.3 dan tabel 5.4 sebagai berikut.
55
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 5.3 Uji Perbandingan Algoritma K-Medoids Secara Manual dan Sistem
No Uji
Ms. Excel
Sistem
1
Jumlah data
20
20
2
Jumlah atribut
29
29
3
Jumlah anggota Cluster 1
9
9
4
Jumlah anggota Cluster 2
3
3
5
Jumlah anggota Cluster 3
8
8
Tabel 5.4 Hasil Uji Perbandingan Anggota Cluster Secara Manual dan Sistem
Manual
Sistem
Cluster 1
Cluster 2
Cluster 3
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA
SMA BHINNEKA TUNGGAL IKA
YOGYAKARTA
YOGYAKARTA
SMA TAMAN MADYA JETIS
SMA TAMAN MADYA JETIS
YOGYAKARTA
YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Kesimpulan hasil perbandingan algoritma k-medoids secara manual dan
dengan sistem yaitu bahwa sistem telah dapat mengimplementasikan algoritma kmedoids dengan baik dengan menghasilkan jumlah dan data anggota cluster yang sama
dengan pehitungan secara manual.
5.2.2.4 Pengujian Perangkat Lunak Dengan Menggunakan Dataset
Perangkat lunak yang telah dibuat diuji menggunakan dataset. Dataset yang
digunakan pada pengujian perangkat lunak adalah daaset nilai daya serap ujian nasional
mata pelajaran matematika SMA jurusan IPA di Provinsi DIY tahun ajaran 2014/2015.
Atribut yang digunakan dalam pengujian perangkat lunak menggunakan semua atribut
(29 atribut), dan pengujian dilakukan dengan mengelompokkan sampai n/2 data.
Dalam dataset nilai daya serap ujian nasional mata pelajaran matematika SMA
jurusan IPA di Provinsi DIY tahun ajaran 2014/2015 terdapat 137 baris data dan 29
atribut kompetensi. Hasil pengelompokan dan hasil Silhouette Index Global tiap cluster
dapat dilihat pada lampiran 6.
5.2.2.5 Evaluasi Hasil Clustering
Dari hasil pengujian dataset yang telah dilakukan, selanjutnya adalah
mengevaluasi hasil pengelompokan. Evaluasi clustering yang digunakan oleh peneliti
adalah menggunakan Silhouette Coefficient (SC). Berdasarkan pengujian yang telah
dilakukan terhadap dataset nilai daya serap Ujian Nasional mata pelajaran matematika
di provinsi DIY tahun ajaran 2014/2015, didapatkan hasil SI Global dari tiap cluster
seperti pada Tabel 5.5 berikut.
Tabel 5.5 Hasil Perhitungan Silhouette Coefficient (SC)
Jumlah
Cluster
(k)
2
3
4
Jumlah
Cluster
(k)
5
6
7
SI Global
0.4361
0.2134
0.1893
57
SI Global
0.2994
0.2629
0.2246
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
0.3294
0.2187
0.279
0.2483
0.3007
0.2178
0.1796
0.1827
0.1762
0.3210
0.2459
0.2829
0.3004
0.2743
0.2884
0.2063
0.1806
0.3359
0.4593
0.3076
0.2570
0.1836
0.3546
0.2933
0.2752
0.3142
0.2671
0.2459
0.4505
0.3813
0.3839
0.3148
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
SC
58
0.4460
0.3289
0.3617
0.3616
0.37
0.456
0.4585
0.4657
0.4364
0.3811
0.4638
0.5148
0.4317
0.4234
0.3427
0.4616
0.4169
0.4615
0.4701
0.5019
0.4235
0.5056
0.51
0.5454
0.4772
0.5167
0.5031
0.5118
0.5379
0.5454
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SI Global
0.6
SI Global
0.5
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
Jumlah Cluster
Gambar 5.11 Grafik Perhitungan Nilai Silhouette Index
Berdasarkan hasil pengujian dataset nilai daya serap Ujian Nasional SMA mata
pelajaran matematika tahun ajaran 2014/2015 yang terlihat pada Tabel 5.5 didapatkan
hasil sebagai berikut :
1. Nilai untuk Silhouette Coefficient (nilai maksimum dari Silhouette Index)
dari pengujian jumlah cluster (k)=2 hingga jumlah cluster (k)=68 sebesar
0.5454. Nilai Silhouette Coefficient (SC) sebesar 0.5454 berada pada
interval 0.51 – 0.70 yang menurut interpretasi Kauffman dan Rousseeuw
(1990) nilai SC tersebut dikatakan memiliki struktur yang baik. Pada Tabel
5.5 dapat dilihat bahwa SI Global bernilai 0.5454 terdapat pada jumlah
cluster (k) = 63. Menurut peraturan Menteri Pendidikan dan Kebudayaan
no.143 tahun 2014 tentang petunjuk teknik pelaksanaan jabatan fungsional
pengawas sekolah dan angka kreditnya, setiap pengawas pendidikan tingkat
SMA mengawasi minimal 7 sekolah berarti jumlah cluster yang relevan
untuk 138 sekolah berkisar antara 2 hingga 19 cluster.
2. Berdasarkan Tabel 5.5 dan Gambar 5.11 dapat dilihat hasil Silhouette Index
Global ketika diberi jumlah cluster (k)=2 hasil Silhouette Index Global yang
didapatkan sebesar 0.4361 dan ketika diberikan jumlah cluster (k) yang
59
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
semakin besar maka hasil Silhouette Index Global yang didapatkan beragam
namun cenderung lebih kecil dibandingkan jumlah cluster (k) yang
diberikan sebelumnya. Nilai Silhouette Index Global terlihat besar kembali
ketika jumlah cluster (k) yang diberikan 26 sebesar 0.4593, namun ketika
nilai dari jumlah cluster (k) ditambah kembali hasil Silhouette Index Global
yang didapatkan beragam kembali. Ketika jumlah cluster (k) yang
diberikan k=57 nilai Silhouette Index Global cenderung lebih besar
dibandingkan jumlah cluster (k) yang diberikan sebelumnya. Nilai
Silhouette Index Global terkecil terdapat pada jumlah cluster (k)=16 yaitu
sebesar 0.1762. Berdasarkan hal tersebut nilai Silhouette Index Global
tertinggi dan yang paling relevan adalah ketika jumlah cluster (k)=2 dengan
nilai 0.4361 yang menurut interpretasi Kauffman dan Rousseeuw (1990)
nilai tersebut dikatagorikan dalam struktur lemah.
Selain pengelompokan dengan menggunakan dataset dengan 29 kompetensi,
juga dilakukan pengelompokan menggunakan nilai rata-rata dari 29 kompetensi tiap
sekolah. Proses pengelompokan ulang dibagi menjadi 3 cluster untuk mendapatkan
kelompok sekolah sesuai dengan kriteria dalam akreditasi SMA. Tabel 5.6 merupakan
tabel hasil proses perhitungan standar deviasi. Standar deviasi digunakan untuk melihat
keberagaman anggota dari tiap cluster. Jika nilai standar deviasi yang didapatkan tinggi
maka anggota dari cluster tersebut memiliki tingkat keberagaman nilai yang tinggi.
Tetapi, jika nilai standar deviasi yang didapatkan rendah maka anggota dari cluster
tersebut memiliki tingkat keberagaman nilai yang rendah. Dari perhitungan standar
deviasi tersebut di dapatkan pula nilai tertinggi dan nilai terendah dari setiap cluster.
Hasil pengelompokan ulang beserta anggota tiap cluster dan hasil perhitungan standar
deviasi tiap cluster dapat dilihat pada lampiran 7.
Nilai Silhouette Index Global dari pengelompokan menggunakan nilai rata-rata
dari 29 kompetensi tiap sekolah yang dikelompokan menjadi 3 cluster adalah 0.2724.
Nilai tersebut lebih tinggi dibandingkan dengan nilai Silhouette Index Global dari
60
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
pengelompokan menggunakan nilai dari 29 kompetensi yang dikelompokan menjadi 3
cluster, yaitu sebesar 0.2134.
Tabel 5.6 Hasil Standar Deviasi Tiap Cluster
No
1
2
3
4
5
Nilai
Jumlah anggota cluster
Nilai maksimal cluster
Nilai minimal cluster
Nilai rata-rata cluster
Standar deviasi cluster
Cluster 1
66
35.72
18.10
29.03
4.5684
Cluster 2
40
88.87
46.98
59.93
9.5281
Cluster 3
31
46.15
36.13
40.44
3.3144
Dari tabel 5.6 dapat dilihat bahwa cluster 2 memiliki standar deviasi yang
tertinggi diantara cluster yang lainnya. Hal ini dapat dikatakan bahwa cluster 2
memiliki variasi nilai yang beragam. Cluster 3 memiliki standar deviasi yang terendah
diantara cluster yang lainnya. Hal ini dapat dikatakan bahwa cluster 3 merupakan
memiliki variasi nilai yang cenderung sama/tidak beragam. Cluster 1 memiliki standar
deviasi yang sedang diantara cluster yang lainnya.
Sekolah yang memiliki rata-rata tertinggi pada cluster 2 adalah SMA
MUHAMMADIYAH 1 PRAMBANAN dengan nilai rata-rata 88.87. Pada cluster 3
sekolah yang memiliki rata-rata tertinggi adalah SMA 1 SEMIN dengan nilai rata-rata
46.15. Pada cluster 1 sekolah yang memiliki rata-rata tertinggi SMA NEGERI 1
MINGGIR adalah dengan nilai rata-rata 35.72.
Sekolah yang memiliki rata-rata terendah pada cluster 2 adalah SMA
MUHAMMADIYAH BANTUL dengan nilai rata-rata 46.98. Pada cluster 3 sekolah
yang memiliki rata-rata terendah adalah SMA 1 TURI dengan nilai rata-rata 36.16.
Pada cluster 1 sekolah yang memiliki rata-rata terendah SMA MANDALA BHAKTI
adalah dengan nilai rata-rata 18.10.
Ketiga sekolah yang memiliki nilai rata-rata tertinggi dapat menjadi contoh
untuk sekolah lainnya dalam tiap kelompoknya. Ketiga sekolah yang memiliki nilai
61
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
rata-rata terendah dapat menjadikan sekolah yang memiliki nilai rata-rata tertinggi
menjadi contoh agar dapat meningkat nilai rata-rata sekolanya.
62
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB VI
PENUTUP
6.1
Kesimpulan
Hasil penelitian Impementasi Algoritma Partitioning Around Medoids (PAM)
untuk pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta
berdasarkan nilai daya serap Ujian Nasional mata pelajaran matematika menghasilkan
kesimpulan sebagai berikut :
1. Implementasi algoritma Partitioning Around Medoids (PAM) untuk
mengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya
serap Ujian Nasional mata pelajaran matematika telah berhasil dibangun dan
dapat digunakan untuk pengelompokan Sekolah Menengah Atas di DIY.
2. Metode Clustering dengan algoritma Partitioning Around Medoids (PAM)
terbukti dapat digunakan untuk mengelompokan data sekolah berdasarkan
Nilai Daya Serap Ujian Nasional Jurusan IPA Mata Pelajaran Matematika
tahun ajaran 2014/2015 di DIY.
3. Berdasarkan hasil evaluasi dari pengelompokkan nilai daya serap Ujian
Nasional mata pelajaran matematika tahun ajaran 2014/2015 dengan nilai
jumlah cluster (k)=2 sampai dengan jumlah cluster (k)=(1/2)*n, dapat
disimpulkan bahwa :

Tidak terdapat nilai Silhouette Index Global yang bernilai negatif,
berarti data yang terdapat dalam cluster telah tepat berada didalam
cluster masing-masing.

Nilai Silhouette Index Global yang didapatkan bernilai antara 0.1762
yang terdapat pada jumlah cluster (k)=16 hingga 0.5454 yang
terdapat pada jumlah cluster (k)=63.

Nilai Silhouette Index Global ketika diberi jumlah cluster (k)=2 hasil
Silhouette Index Global yang didapatkan sebesar 0.4361 dan ketika
63
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
diberikan jumlah cluster (k) yang semakin besar maka hasil
Silhouette Index Global yang didapatkan beragam namun cenderung
lebih kecil dibandingkan jumlah cluster (k) yang diberikan
sebelumnya. Nilai Silhouette Index Global terlihat besar kembali
ketika jumlah cluster (k) yang diberikan 26 sebesar 0.4593, namun
ketika nilai dari jumlah cluster (k) ditambah kembali hasil Silhouette
Index Global yang didapatkan beragam kembali. Ketika jumlah
cluster (k) yang diberikan k=57 nilai Silhouette Index Global
cenderung lebih besar dibandingkan jumlah cluster (k) yang
diberikan sebelumnya. Nilai Silhouette Index Global terkecil terdapat
pada jumlah cluster (k)=16 yaitu sebesar 0.1762.

Nilai Silhouette Coefficient (SC) yang didapatkan adalah 0.5454.
Nilai tersebut berada pada interval 0.51 – 0.70 yang dapat dikatakan
memiliki struktur pengelompokan yang baik. Jumlah cluster yang
disarankan untuk pengelompokkan adalah 2.
4. Hasil pengelompokan nilai daya serap ujian nasional mata pelajaran
matematika dengan menggunakan nilai rata-rata dari 29 kompetensi yang
dikelompokan menjadi 3 cluster didapatkan hasil sebagai berikut :

Nilai Silhouette Index Global yang didapatkan bernilai 0.2724. nilai
tersebut berada pada interval 0.26 – 0.50 yang dapat dikatakan
memiliki struktur pengelompokan yang lemah.

Jumlah anggota tiap cluster yang didapatkan adalah cluster 1
sebanyak 66 anggota, cluster 2 sebanyak 40 anggota, dan cluster 3
sebanyak 31 anggota.

Standar deviasi tiap cluster yang didapatkan adalah cluster 1 bernilai
4.5684, cluster 2 bernilai 9.5281, dan cluster 3 bernilai 3.3144.
5. Hasil anggota pengelompokan/clustering bisa berbeda-beda walaupun
menggunakan jumlah cluster yang sama. Hal ini disebabkan karena ketika
proses clustering terjadi menggunakan baris yang random/acak untuk tiap
medoids.
64
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6.2
Saran
Penelitian Impementasi Algoritma Partitioning Around Medoids (PAM) untuk
pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta berdasarkan
nilai daya serap Ujian Nasional ini memberikan saran untuk pengembangan penelitian
di masa mendatang, yaitu :
1. Perangkat lunak perlu dikembangkan agar dapat menyimpan hasil
pengelompokkan data ke dalam file selain berekstensi .doc dan .txt.
2. Perangkat
lunak
dikembangkan
agar
dapat
menampilkan
hasil
pengelompokan ke dalam bentuk yang lebih menarik dan mudah dipahami
(misalnya tabel, diagram atau grafik).
3. Penelitian dikembangkan menggunakan dataset yang berbeda. Misalnya
dataset mata pelajaran yang berbeda untuk tahun ajaran yang sama atau
dataset mata pelajaran yang sama untuk tahun ajaran yang berbeda atau
dataset mata pelajaran yang sama dengan provinsi yang bebeda atau seluruh
indonesia.
65
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR PUSTAKA
Anonim.
2015.
Pembahasan
Mengenai
Pengertian
Data
Mining.
http://infodanpengertian.blogspot.co.id/2015/11/pengertian-data-mining.html.
Diakses pada tanggal 12 April 2016.
Han, Jiawei, and Kamber, Micheline. 2006. Data Mining : Concepts and Techniques
Second Edition. San Francisco, CA: Morgan Kaufmann Publishers.
Hermawati, Fajar Astuti. 2013. Data Mining. Yogyakarta: ANDI.
Indriyati, Mardji, dan Abusamad, Abdol. Implementasi K-Medoids Menggunakan
Data Numerik Berukuran Besar.
Kaufman, Leonard, and Rousseeuw, Peter J. 1990. Finding Group in Data. John Willey
& Sons, Inc. Kanada.
Megawati, Maria Riana. 2015. Implementasi Algoritma Fuzzy C-Means untuk
Pengelompokan Sekolah Menengah Atas di DIY Berdasarkan Nilai Ujian
Nasional dan Nilai Sekolah. Yogyakarta: Universitas Sanata Dharma.
Prasetyo, Eko. 2014. Data Mining-Mengolah Data Menjadi Informasi Menggunakan
Matlab. Yogyakarta: Andi.
Santosa, Budi. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis.
Yogyakarta: Graha Ilmu.
Sudrajat, Akhmad. 2015. Permendikbud No. 143/2014: Petunjuk Teknis Pengawas
Sekolah. https://akhmadsudrajat.wordpress.com/2015/11/26/permendikbud-no143-tahun-2014/. Diakses pada tanggal 15 Januari 2017.
Vania, Leonie. Range, Deviasi, dan Variasi. https://leonievania20.wordpress.com/
tugas-statistik-ekonomi/range-deviasi-dan-variansi/. Diakses pada tanggal 26
Januari 2017.
66
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Yusupa, Ade. 2015. Algoritma K-Medoids. http://dokumen.tips/documents/algoritmak-medoids.html. Diakses pada tanggal 12 April 2016.
67
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 1 : Contoh Perhitungan K-Medoids
1.
Menginisialisasi pusat cluster sebanyak k (jumlah cluster) dari data sampel. Diasumsikan bahwa sekolah SMA Negeri 4
Yogyakarta dan SMA Stella Duce 1 yogyakarta adalah medoids. Jadi C1 = (36.42, 70.37, 58.03, 79.63, 60.49, 50.62, 75.52)
dan C2 = (36.59, 73.98, 64.63, 83.74, 69.92, 47.97, 84.55).
2.
Menghitung jarak menggunakan Euclidean distance dari data contoh tabel 2.1 yang digunakan.
C1
SMA NEGERI 4 YOGYAKARTA
I
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1
YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
36.42
70.37
58.03
328.697 15.6816 354.946
0
0
0
25.7049 86.3041
88.36
40.0689 5.0625 41.7316
4.1209 90.6304 36.6025
0.0289 13.0321
0.6241 121.661
68
79.63
60.49
50.62
75.52
(i-C1)^2
Jumlah Cost
165.894 206.784 263.088 161.544 1496.64 38.6864
0
0
0
0
0
0
3.9601 14.6689 0.0361 51.5524 270.587 16.4495
172.134
47.61 4.2849 15.6025 326.495 18.0692
0.0676 152.276 156.75 24.7009 465.148 21.5673
43.56 16.8921 88.9249 7.0225 81.5409 251.001 15.843
7.3984
98.01 541.958 122.988 2.5921 895.232 29.9204
Total Cost C1
51.4877
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
C2
SMA STELLA DUCE 1
YOGYAKARTA
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1
YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
36.59
73.98
64.63
322.562 0.1225 149.818
0.0289 13.0321
43.56
27.4576 166.41
7.84
37.9456 34.3396 0.0196
4.84 172.397 160.023
83.74
69.92
47.97
84.55
(i-C1)^2
Jumlah Cost
76.9129 24.5025 356.077 13.5424 943.536 30.717
16.8921 88.9249 7.0225 81.5409 251.001 15.843
4.4944
31.36 8.0656 3.4225 249.05 15.7813
81.1801 6.4009 0.3364 25.8064 186.029 13.6392
19.0969 473.933 97.4169
196 1123.71 33.5217
0
0
0
0
0
0
0
0
0
0.3844 55.0564 15.0544 33.5241 1069.94 71.2336 55.0564 1300.25 36.059
Total Cost C2
60.1376
Setelah menghitung cost/jarak. Kemudian, menentukan cost/jarak yang terdekat dengan medoids. Cost/jarak yang terdekat
dengan medoids terlihat dengan data yang diberi blok merah dalam tabel. Setelah selesai, menghitung total cost/jarak dari kedua
cluster.
3.
Memilih obyek non-medoids. Asumsikan non-medoids 1 adalah SMA Negeri 6 Yogyakarta dan non-medoids 2 adalah SMA
11 Yogyakarta. Jadi non-medoids1 = (31.25, 61.08, 67.43, 81.62, 64.32, 50.81, 82.70) dan non-medoids2 = (34.39, 60.85,
51.98, 79.37, 48.15, 38.10, 70.55). Kemudian, ulangi langkah 2 hingga didapatkan hasil seperti dibawah ini.
69
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
non-medoids1
I
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1
YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
538.24 175.563
25.7049 86.3041
0
0
129.96 49.5616
9.2416 0.0529
(i-nonMed1)^2
Jumlah Cost
89.1136 118.592 111.303 256.961 30.5809 1320.35 36.3367
88.36 3.9601 14.6689 0.0361 51.5524 270.587 16.4495
0
0
0
0
0
0
0
8.6436 123.877 9.4249 5.1076 10.4329 337.008 18.3578
238.703 5.0625 261.469 161.544 147.623 823.695 28.7001
27.4576 166.41
7.84 4.4944
31.36 8.0656 3.4225 249.05 15.7813
34.3396 412.902 44.6224 62.5681 734.952 127.238 31.0249 1447.65 38.048
Total Cost
nonMed1
86.9253
non-medoids2
I
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1
YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
406.426 181.71
4.1209 90.6304
9.2416 0.0529
69.8896 52.8529
0
0
(i-nonMed1)^2
Jumlah Cost
619.512 172.66 713.958 825.988 312.582 3232.84 56.858
36.6025 0.0676 152.276 156.75 24.7009 465.148 21.5673
238.703 5.0625 261.469 161.544 147.623 823.695 28.7001
156.5 179.024 370.178 109.203 79.5664 1017.21 31.8938
0
0
0
0
0
0
0
4.84 172.397 160.023 19.0969 473.933 97.4169
196 1123.71 33.5217
7.9524 422.303 76.9129 103.226 119.684 2.0449 43.2964 775.418 27.8463
Total Cost
nonMed2
27.8463
70
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.
Menghitung nilai selisih antara total cost baru dengan total cost lama.
Total Cost C1, C2
Total Cost nonMed1, nonMed2
Selisih
5.
111.625
114.772
3.14627
Jika selisih yang didapatkan kurang dari 0 maka, tukar nilai C1 dan C2 dengan non-medoids1 dan non-medoids2. Ulangi
langkah 3 dengan menggunakan non-medoids baru hingga pada langkah ke 4 di dapatkan nilai selisih lebih dari 0. Jika selisih
yang didapatkan lebih dari 0 maka, proses clustering berhenti.
6.
Didapatkan cluster beserta anggota cluster dari masing-masung yaitu:
Cluster 1
Cluster 2
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
71
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 2 : Diagram Kelas
72
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 3 : Prosedur Pengujian dan Kasus Uji
Identifikasi
Deskripsi
Usecase
UC-01
Masukan
Pengujian
Pengujian
memasukkan
data dari file
UC-02
Prosedur
1. Jalankan
Contoh2.xls
sistem.
2. Pada
Keluaran yang Hasil yang
Catatan Proses
Diharapkan
Didapat
Pengembangan
Data pada file
Data pada file
Tidak
Contoh2.xls
Contoh2.xls
diperbaiki
ditampilkan
ditampilkan
berekstensi
halaman
pada tabel
pada tabel
.xls
awal, tekan
data pada
data pada
tombol
halaman Input
halaman Input
“MASUK
Data.
Data.
Pengujian
memasukkan
SISTEM”.
ContohDoc.doc Muncul
3. Pada
Muncul
Tidak
pemberitahuan pemberitahuan diperbaiki
data selain file
halaman
bahwa tipe
bahwa file
berekstensi
input data,
yang dipilih
yang dipilih
.xls
tekan tombol
bukan
harus
“PILIH
merupakan
berekstensi/
FILE”.
file
berformat .xls
73
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Pilih file
berekstensi
yang akan
.xls
digunakan.
5. Tekan tombol
“OPEN”
UC-03
Penguji
1. Tabel pada
Atribut yang
Kolom Kode
Kolom Kode
Tidak
menghapus
halaman
tercentang :
Sekolah pada
Sekolah pada
diperbaiki.
atribut yang
input data
KODE
tabel data
tabel data
tidak
sudah berisi
SEKOLAH.
terhapus.
terhapus.
diinginkan
data.
2. Memilih
atribut yang
ingin di
hapus pada
kolom seleksi
atribut.
3. Tekan tombol
“Hapus
Atribut”
74
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
UC-04
Pengujian
1. Atribut yang
Metode
Proses
Proses
Tidak
diperbaiki.
melakukan
akan
clustering : K-
clustering
clustering
proses
digunakan
Medoids/PAM
berjalan. Hasil
berjalan. Hasil
clustering
untuk proses
clustering
clustering
telah dipilih
Jumlah cluster
muncul pada
muncul pada
dari halaman
:2
textArea.
text area.
input data.
2. Menekan
tombol
proses pada
halaman
input data.
3. Menampilkan
data yang
dipilih pada
tabel di
halaman
kmedoids.
75
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Menekan
tombol
“PROCESS”
pada halaman
kmedoids.
UC-05
Pengujian
1. Proses
Tipe file : .doc
File tersimpan
File tersimpan
Tidak
diperbaiki
menyimpan
clustering
pada direktori
pada direktori
hasil
sudah
D:
D:
clustering ke
berhasil
dalam file
dilakukan.
bertipe .doc
2. Memilih
direktori
penyimpanan.
3. Memberi
nama pada
file yang
akan
disimpan.
76
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 4 : Data Uji Algoritma K-Medoids
KODE
01-001
01-002
01-003
01-004
01-005
01-006
01-007
01-008
01-009
01-010
01-011
01-012
01-015
01-017
01-018
01-019
01-021
01-022
01-025
01-026
NAMA SEKOLAH
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA
YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
77
MAT1
66.51
32.86
46.11
51.02
47.59
52.99
42.22
28.00
30.00
MAT2
91.39
56.43
85.56
76.87
72.19
69.40
81.11
32.00
30.00
MAT3
82.42
49.47
60.00
63.10
56.69
52.24
56.95
30.00
23.75
MAT4
89.00
72.14
78.89
74.83
70.59
68.66
77.78
58.00
50.00
MAT5
64.11
40.00
44.44
59.18
45.99
41.79
26.67
26.00
20.00
MAT6
71.29
43.57
50.56
39.46
48.66
48.51
38.89
28.00
30.00
MAT7
90.43
68.10
78.52
81.18
74.33
76.61
64.44
54.67
55.00
75.00
54.55
35.78
59.43
57.98
46.10
60.00
49.09
35.46
39.76
30.00
25.00
31.82
64.22
90.57
81.09
71.63
20.00
63.64
24.11
26.51
30.00
6.25
61.37
51.30
79.41
71.11
67.91
42.50
64.78
22.34
28.31
35.00
50.00
63.64
73.71
89.34
88.24
86.52
60.00
77.27
46.10
46.99
45.00
50.00
54.55
39.22
70.08
43.70
50.35
20.00
58.18
22.70
33.73
40.00
0.00
54.55
54.74
59.02
57.56
40.43
50.00
55.45
29.79
34.94
50.00
50.00
48.48
68.68
89.62
84.18
79.67
40.00
80.30
45.39
28.92
40.00
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KODE
01-001
01-002
01-003
01-004
01-005
01-006
01-007
01-008
01-009
01-010
01-011
01-012
01-015
01-017
01-018
01-019
01-021
01-022
01-025
01-026
MAT8
84.21
54.29
67.22
61.90
41.71
55.22
35.56
40.00
35.00
25.00
36.36
54.31
77.05
78.15
53.90
50.00
50.00
29.08
26.51
35.00
MAT9
47.37
27.86
34.72
28.23
26.74
25.75
21.67
21.00
10.00
0.00
50.00
23.92
41.81
36.14
36.88
35.00
35.91
11.70
27.11
27.50
MAT10 MAT11 MAT12 MAT13 MAT14 MAT15 MAT16 MAT17 MAT18
63.16
90.44
89.95
93.78
75.60
89.47
48.80
83.73
89.00
32.50
54.29
67.86
72.14
55.71
56.43
45.00
57.86
62.86
34.72
65.84
83.33
82.22
68.89
68.33
42.22
67.22
68.89
45.92
75.51
86.39
87.76
65.31
68.03
44.22
71.43
70.75
32.62
64.71
86.63
83.42
49.73
66.31
44.92
60.96
68.45
34.70
69.41
79.85
85.82
61.94
61.94
47.76
64.93
72.39
37.78
48.89
60.00
67.78
50.00
61.11
30.00
58.89
81.11
30.00
41.00
32.00
46.00
32.00
44.00
26.00
48.00
56.00
25.00
35.00
45.00
45.00
40.00
25.00
15.00
50.00
70.00
25.00
25.00
25.00
25.00
0.00
25.00
25.00
100.00
25.00
47.73
50.00
50.00
68.18
54.55
45.45
36.36
50.00
63.64
37.07
58.62
67.67
67.24
60.78
50.00
34.91
49.57
65.95
55.94
84.43
90.16
91.80
66.80
87.30
49.59
70.90
88.11
52.31
71.64
88.24
90.76
73.95
83.19
46.64
73.11
85.29
36.53
73.41
81.56
89.36
79.43
85.11
41.13
73.05
66.67
20.00
35.00
40.00
50.00
30.00
40.00
30.00
30.00
40.00
40.46
70.46
87.27
83.64
48.18
60.91
45.45
74.55
75.45
21.63
38.66
49.65
40.43
23.40
22.70
14.89
43.26
48.94
21.09
24.70
34.94
45.78
21.69
26.51
26.51
39.76
39.76
17.50
35.00
50.00
50.00
40.00
30.00
40.00
35.00
55.00
78
MAT19
78.95
60.71
67.22
72.11
65.78
66.42
54.44
46.00
20.00
75.00
50.00
59.48
80.33
79.41
68.79
60.00
67.27
38.30
46.99
50.00
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KODE MAT20 MAT21 MAT22 MAT23 MAT24 MAT25 MAT26 MAT27 MAT28 MAT29
01-001
94.26
90.36
7.18
82.66
77.51
76.08
97.01
98.56
79.43
39.71
01-002
80.00
63.39
12.14
62.32
37.14
42.86
75.89
94.29
57.14
29.29
01-003
84.44
79.72
7.22
68.20
41.67
48.89
83.45
92.22
61.67
25.56
01-004
87.07
82.20
14.29
72.11
41.50
50.34
89.74
98.64
61.22
26.53
01-005
75.40
75.33
10.70
61.36
32.09
47.59
79.05
95.19
59.89
37.43
01-006
83.58
82.24
8.21
63.25
42.54
52.99
85.05
98.51
51.49
36.57
01-007
51.11
52.11
14.44
51.67
31.11
36.67
73.97
84.44
44.44
23.33
01-008
42.00
43.59
30.00
41.50
32.00
28.00
48.78
68.00
34.00
52.00
01-009
60.00
31.25
15.00
48.75
25.00
30.00
81.25
85.00
25.00
25.00
01-010
25.00
0.00
0.00
37.50
0.00
50.00
66.67
50.00
50.00
50.00
01-011
63.64
52.94
13.64
54.55
54.55
50.00
47.06
68.18
45.45
68.18
01-012
67.67
57.84
13.36
54.85
31.90
39.66
66.85
89.66
53.45
28.45
01-015
93.44
91.28
9.84
79.61
70.08
73.36
94.39
98.77
79.10
26.64
01-017
94.96
85.71
9.66
75.00
60.50
64.71
91.49
96.64
77.73
28.15
01-018
93.62
81.25
18.44
72.16
43.26
71.63
91.15
97.87
70.92
26.24
01-019
30.00
25.00
0.00
35.00
40.00
50.00
50.00
60.00
50.00
50.00
01-021
83.64
72.73
6.36
65.91
45.45
56.36
89.77
96.36
50.00
41.82
01-022
32.62
31.86
14.18
32.98
12.06
15.60
48.21
60.28
21.28
29.79
01-025
31.33
28.79
14.46
31.33
26.51
20.48
46.97
60.24
25.30
28.92
01-026
30.00
37.50
5.00
40.00
25.00
15.00
56.25
65.00
40.00
40.00
79
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 5 : Perhitungan Manual
1. Menginisiai pusat cluster sebanyak 3 cluster dari data uji (Lampiran 4 menggunakan 29 atribut MAT1, MAT2, MAT3, …,
MAT29). C1 adalah SMA MUHAMMADIYAH 6 YOGYAKARTA, C2 adalah SMA MUHAMMADIYAH 3
YOGYAKARTA, dan C3 adalah SMA NEGERI 10 YOGYAKARTA.
2. Menghitung jarak menggunakan Euclidean Disance dari data uji yang digunakan. Hasilnya seperti dibawah ini.
C1 :
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
1333.0
8.2
259.5
441.8
309.4
528.5
149.3
4.0
0.0
2025.0
602.7
33.4
866.1
782.9
80
3768.7
698.5
3086.9
2196.8
1780.0
1552.4
2612.2
4.0
0.0
25.0
3.3
1171.0
3668.7
2610.2
2248.7
209.4
625.0
789.6
470.5
297.2
481.8
25.0
126.6
826.6
695.4
265.7
1972.2
1303.9
(i-C1)^2
1936.0
736.6
1148.5
889.8
654.8
559.8
1074.5
169.0
25.0
25.0
347.4
824.3
1966.0
1869.7
581.3
0.0
19.7
367.9
35.9
3.2
177.7
196.0
400.0
100.0
211.7
0.6
904.8
13.7
453.3
41.3
0.3
111.1
1.8
2.2
123.4
484.0
400.0
2500.0
20.7
22.5
81.4
57.2
2543.2
789.6
1483.8
1695.8
1178.5
1340.3
597.3
215.2
225.0
100.0
71.9
822.5
2462.1
1951.9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
2421.6
372.1
1038.1
723.6
45.0
408.8
0.3
25.0
0.0
100.0
1.8
372.9
1768.2
1861.9
357.2
225.0
225.0
35.0
394.8
0.1
52.1
0.5
0.6
3.1
34.0
42.3
306.3
756.3
506.3
12.8
204.8
74.6
88.0
56.3
70.7
249.6
2084.8
225.0
296.5
807.7
228.6
295.8
411.3
156.3
56.3
56.3
913.9
383.0
1477.6
1211.7
362.1
6.3
527.2
17.1
3073.6
372.1
951.1
1641.1
882.7
1184.0
192.9
36.0
0.0
100.0
225.0
557.9
2443.3
1342.5
1475.3
0.0
1257.4
13.4
1596.0
319.0
1110.9
1324.2
1341.8
891.0
100.0
324.0
25.0
625.0
0.0
312.2
1612.8
1462.3
996.0
100.0
1389.1
0.1
259.2
900.0
364.4
29.8
95.3
0.0
1916.7
490.2
1038.1
1425.8
1116.9
1283.1
316.1
16.0
25.0
625.0
330.5
297.2
1747.2
1661.4
1549.2
0.0
1131.6
91.6
(i-C1)^2
1267.4
246.8
834.6
640.6
94.7
481.4
100.0
64.0
0.0
1600.0
211.7
431.8
718.2
1152.6
1554.7
100.0
66.9
275.6
81
1733.1
100.0
1131.6
34.7
12.2
0.0
3536.7
698.5
1469.2
1446.3
1318.4
1020.2
967.8
196.0
25.0
25.0
238.7
400.0
3283.3
2829.2
3037.1
100.0
955.4
53.3
1083.1
56.3
886.8
160.3
44.8
0.0
77.4
25.0
4.9
17.8
24.2
60.2
100.0
196.0
625.0
225.0
13.2
25.9
92.0
44.1
1.3
100.0
29.7
630.5
1723.9
225.0
1041.4
1.2
4.0
0.0
2374.6
522.6
1038.1
1327.1
673.9
895.8
570.7
169.0
225.0
4225.0
225.0
212.3
1288.8
1452.4
1447.8
25.0
1564.2
68.2
107.1
400.0
330.5
299.3
39.3
0.0
1156.0
61.8
192.9
248.1
180.9
302.4
681.7
1.0
225.0
900.0
74.6
119.9
1096.3
917.5
136.2
225.0
418.2
36.7
91.6
0.0
29.7
408.4
226.8
0.0
838.1
114.7
296.5
488.9
249.0
269.6
19.7
16.0
900.0
625.0
0.0
89.9
919.9
864.9
353.1
100.0
298.3
136.9
1573.7
0.0
1624.1
29.1
122.8
0.0
4129.3
2500.0
2963.7
3257.0
2061.2
2870.8
445.6
144.0
900.0
25.0
1131.6
1419.0
4024.6
4219.8
4047.5
0.0
2877.2
6.9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72.1
0.0
2794.2
670.3
1782.5
1998.1
1431.1
2001.7
213.5
37.1
39.1
1406.3
238.4
413.7
2892.3
2324.2
1914.1
156.3
1241.2
31.8
75.9
0.0
0.2
0.0
4.8
51.0
4.9
86.3
32.5
10.3
89.1
625.0
100.0
25.0
74.6
69.9
23.4
21.7
180.6
25.0
1.8
84.3
89.5
0.0
12.9
0.0
1819.9
498.2
795.2
1031.1
456.2
540.6
136.2
2.3
76.6
6.3
211.7
220.5
1569.0
1225.0
1034.3
25.0
671.3
49.3
75.2
0.0
106.1
0.0
2757.3
147.4
277.9
272.3
50.3
307.7
37.3
49.0
0.0
625.0
873.2
47.6
2032.2
1260.3
333.4
225.0
418.2
167.4
2.3
0.0
226.8
0.0
17.8
0.0
(i-C1)^2
3730.8
1661.4
776.2
385.7
1148.5
739.8
1248.9
1121.6
1062.1
519.8
1443.2
829.4
469.6
314.0
169.0
55.8
225.0
625.0
1225.0
108.6
1225.0
84.5
608.1
112.4
3405.9
1454.7
2471.1
1241.9
3207.0
1218.0
1225.0
39.1
1710.6
1123.6
0.4
64.6
30.0
86.1
0.0
0.0
Total C1
335.3
0.0
1126.3
857.9
740.9
1131.6
911.4
1122.9
377.9
9.0
400.0
225.0
10.1
608.1
1140.4
1001.1
1080.4
25.0
983.4
22.3
22.7
0.0
82
12.2
0.0
1554.7
293.8
469.6
450.3
395.6
132.0
19.7
36.0
225.0
100.0
29.7
180.9
1528.8
1423.6
956.0
100.0
100.0
350.4
216.1
0.0
182.0
0.0
0.1
114.7
208.5
181.4
6.6
11.8
277.9
144.0
225.0
100.0
794.1
133.4
178.5
140.4
189.3
100.0
3.3
104.2
122.8
0.0
22.7
0.0
Jumlah
53180.55
12226.68
24078.74
27363.08
17514.49
20649.49
11091.8
3609.848
6404.688
19310.14
9366.907
10169.45
46823.7
38793.54
32090.42
4639.063
22473.07
3452.458
2496.487
0
232.3
0.0
cost
230.6091
110.5743
155.1733
165.4179
132.3423
143.6993
105.3176
60.08201
80.02929
138.9609
96.78278
100.8437
216.3879
196.9608
179.138
68.11066
149.9102
58.75762
49.96486
0
224.9755
9.1
0.0
1.8
0.0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
C2 :
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
964.10
6.76
113.42
242.11
147.14
307.30
45.70
55.65
29.81
1563.41
364.43
0.10
574.56
507.15
113.21
602.21
185.78
0.00
18.49
29.8116
83
4526.60
1044.58
3776.10
2783.62
2311.69
2051.18
3249.00
62.25
34.69
0.79
59.44
1608.81
4416.93
3246.72
2258.15
16.89
1562.62
0.00
5.76
34.6921
3609.61
736.04
1418.28
1661.38
1179.92
894.01
1197.85
58.68
1.99
258.89
1523.34
838.68
3256.98
2378.51
2076.62
406.43
1801.15
0.00
35.64
160.2756
(i-C2)^2
1840.41
678.08
1075.18
825.41
599.76
508.95
1003.62
141.61
15.21
15.21
307.65
762.31
1869.70
1775.78
1633.78
193.21
971.57
0.00
0.79
1.21
1714.79
299.29
472.63
1330.79
542.42
364.43
15.76
10.89
7.29
745.29
1014.42
272.91
2244.86
441.00
764.52
7.29
1258.83
0.00
121.66
299.29
1722.25
189.89
431.39
93.51
356.08
350.44
82.81
3.20
0.04
887.44
613.06
622.50
854.39
771.17
113.21
408.44
658.44
0.00
26.52
408.4441
2028.60
515.74
1097.60
1280.92
837.52
974.69
362.90
86.12
92.35
21.25
9.55
542.42
1956.29
1504.66
1175.12
29.05
1218.71
0.00
271.26
29.0521
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3039.32
635.54
1454.66
1077.15
159.52
683.30
41.99
119.25
35.05
16.65
53.00
636.55
2301.12
2407.86
616.03
437.65
437.65
0.00
6.60
35.0464
1272.35
261.15
529.92
273.24
226.20
197.40
99.40
86.49
2.89
136.89
1466.89
149.33
906.61
597.31
634.03
542.89
586.12
0.00
237.47
249.64
3422.25
994.14
2290.58
1724.74
118.16
171.35
590.00
120.78
170.82
260.82
70.06
11.36
11.36
681.21
238.39
1177.18
941.26
222.01
2.66
354.57
0.00
0.29
17.0569
49.00
4.16
48.44
2681.17
244.30
738.75
1357.92
678.60
945.56
104.65
5.48
13.40
186.60
128.60
398.40
2094.89
1087.68
1207.56
13.40
1011.24
0.00
194.88
13.3956
2468.10
860.84
1240.45
1624.09
331.60
1134.34
1349.83
1367.52
912.04
107.12
311.52
21.62
607.62
0.12
324.72
1641.06
1489.19
1018.25
93.12
1415.26
0.00
216.38
0.1225
4283.70
629.01
876.75
2846.22
1005.52
1746.40
2240.13
1848.14
2060.25
748.02
31.02
20.88
238.08
770.06
718.78
2638.88
2533.11
2394.14
91.58
1867.10
0.00
28.62
91.5849
(i-C2)^2
3657.83
743.11
1108.22
(i-C2)^2
2724.84
1043.94
2069.34
1756.45
693.27
1485.33
707.56
73.96
275.56
547.56
970.32
1397.26
1883.56
2555.30
3139.36
43.56
614.05
0.00
2.92
275.56
2381.44
766.18
1241.86
84
4458.23
1137.71
2082.10
2054.81
1901.83
1539.78
1475.33
453.69
5.29
5.29
517.56
745.29
4173.16
3659.04
3895.01
299.29
1460.00
0.00
14.52
53.29
1465.36
1156.68
1020.16
1149.89
906.61
746.93
860.25
901.80
1080.44
228.31
123.43
0.01
102.21
460.96
400.80
1204.09
1008.06
688.54
228.31
933.91
0.00
135.02
630.5121
3381.42
1285.94
1631.35
1637.82
213.16
574.08
793.55
313.29
469.59
244.30
22.47
45.43
3219.43
45.43
39.82
763.97
891.02
887.44
175.83
979.06
0.00
12.25
68.2276
1604.80
193.77
398.00
475.68
380.64
549.90
1034.91
49.84
443.52
573.12
216.09
289.34
1534.29
1321.32
314.35
79.92
702.78
0.00
84.27
36.7236
Jumlah
98.41 67829.25
0.25 18749.22
17.89 33027.87
1652.42
502.21
836.37
1143.12
755.15
790.73
260.50
59.29
334.89
1346.89
136.89
448.59
1766.52
1690.03
929.64
470.89
839.26
0.00
75.52
136.89
cost
260.4405
136.9278
181.7357
3799.49
2244.86
2685.31
2964.80
1830.13
2596.92
341.88
87.98
749.66
58.06
962.24
1228.50
3699.07
3886.28
3721.00
6.86
2603.04
0.00
1.66
6.8644
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2534.12
1889.64
2538.14
410.06
137.59
0.37
1015.06
444.37
674.96
3530.74
2899.82
2439.37
47.06
1670.36
0.00
9.42
31.8096
0.01
12.11
35.64
0.07
250.27
0.67
201.07
0.29
0.67
18.84
20.43
18.15
201.07
61.15
0.00
0.08
84.2724
1531.16
805.42
916.27
349.32
72.59
248.69
20.43
465.26
478.30
2174.36
1765.68
1535.07
4.08
1084.38
0.00
2.72
49.2804
866.71
401.20
929.03
362.90
397.60
167.44
145.44
1805.40
393.63
3366.32
2346.43
973.44
780.64
1114.89
0.00
208.80
167.4436
1206.87 1724.74
1023.36
951.11
1398.01 1357.19
443.94
663.58
153.76
0.32
207.36 1091.64
1183.36
340.77
1183.36
1.32
578.88
347.45
3336.22 2132.59
2411.79 1873.16
3139.36 1843.84
1183.36
3.20
1661.38 1727.23
0.00
0.00
23.81
1.54
0.36 64.6416
Total C2
1471.49
1218.71
1461.53
583.71
59.60
611.08
105.68
62.41
863.18
1481.48
1322.05
1413.01
0.08
1301.77
0.00
0.00
22.2784
1595.20
1490.73
912.64
536.39
161.80
13.84
824.84
584.19
1034.91
3343.15
3186.60
2464.13
824.84
824.84
0.00
16.16
350.4384
10.63
58.37
45.97
41.73
493.28
22.94
408.44
1473.79
1.80
9.92
2.69
12.60
408.44
144.72
0.00
0.76
104.2441
36095.6
25002.06
28527.51
15004.14
3639.711
4504.996
14787.15
16321.66
16037.3
60351.74
50521.14
41640.96
7602.271
31051.88
0
1753.847
3452.458
189.9884
158.1204
168.9009
122.4914
60.33002
67.11926
121.6024
127.7563
126.6385
245.6659
224.7691
204.0612
87.191
176.2154
0
41.87895
58.75762
230.6006
C3 :
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
303.46
263.41
8.88
3.72
85
770.06
51.98
480.49
175.03
311.17
234.40
22.85
2.82
(i-C3)^2
137.59
26.32
2.62
5.95
35.16
330.51
188.79
1.00
250.91
141.13
23.91
255.68
102.62
148.84
3.17
0.77
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
2.25
15.21
47.20
444.79
364.43
671.33
29.81
177.16
106.92
79.03
8.94
119.03
0.00
185.78
87.05
364.43
86
73.10
33.18
305.20
1001.09
1131.65
1493.05
1012.51
0.34
725.22
304.50
63.84
1904.45
0.00
1562.62
1378.64
1131.65
65.45
157.25
61.31
1209.65
1683.46
3425.76
11.63
181.71
214.04
40.07
9.80
496.40
0.00
1801.15
1330.06
886.85
44.62
74.13
0.26
371.33
743.65
743.65
185.78
12.67
145.68
120.34
85.56
298.25
0.00
971.57
916.88
1041.35
148.60
268.63
992.88
1035.55
1457.71
66.91
13.18
359.48
141.61
209.67
61.31
1457.71
0.00
1258.83
597.80
330.51
46.10
48.16
274.23
753.50
647.70
3074.70
0.81
0.50
12.74
4.45
225.60
29.70
0.00
658.44
420.66
29.70
35.64
13.62
251.54
656.90
640.09
918.09
1012.51
135.02
86.86
15.05
0.40
1624.09
0.00
1218.71
2639.90
1624.09
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1170.32
18.40
296.53
141.61
68.72
27.25
208.51
100.00
225.00
625.00
186.05
18.58
731.70
792.42
15.21
0.00
0.00
437.65
551.78
225.00
131.33
64.80
1.42
58.98
84.09
103.23
202.78
222.31
671.33
1289.53
198.53
143.76
34.81
0.05
0.94
0.83
0.00
586.12
77.44
70.73
310.82
87.24
48.86
89.68
515.29
63.36
32.95
29.81
61.47
33.18
7.18
109.41
239.01
239.01
52.85
11.49
239.63
140.42
15.44
418.61
0.00
354.57
375.20
527.16
0.67
33.41
0.74
62.88
399.20
261.47
21.34
25.50
33.06
1.10
465.26
867.89
1257.41
2066.61
418.61
140.19
195.16
1.39
8.70
1257.41
0.00
1011.24
2093.98
1257.41
280.56
12.89
5.24
38.44
7.18
376.75
15.52
0.77
0.41
55.06
743.65
3054.77
1786.75
3877.55
1389.05
384.16
8.35
0.94
32.60
2234.45
0.00
1415.26
2738.43
1389.05
1027.84
69.06
14.29
15.60
102.82
132.25
2.02
16.97
0.05
4.75
251.54
1416.77
1493.05
3438.65
239.01
268.96
66.59
50.69
32.72
1131.65
0.00
1867.10
1433.38
1131.65
(i-C3)^2
388.88
182.25
55.80
36.24
(i-C3)^2
751.86
56.70
428.90
293.44
2.40
189.34
3.31
261.79
66.91
2321.31
40.58
158.76
346.70
664.09
976.56
330.51
0.00
614.05
701.72
66.91
52.42
192.65
39.94
0.00
87
815.67
20.07
55.06
50.69
29.16
1.06
0.04
285.95
1289.53
1289.53
239.01
119.03
696.43
496.40
585.64
437.23
0.00
1460.00
1183.36
955.43
4.84
4.28
17.14
5.20
11.22
0.20
10.43
1.51
0.28
5.34
238.70
378.30
927.20
418.20
82.63
111.09
17.14
1.42
18.66
238.70
0.00
933.91
358.72
29.70
866.12
50.98
136.19
125.89
84.27
278.56
53.73
9.73
184.69
92.54
245.24
704.90
602.70
647.70
602.70
624.00
13.32
2.07
2.25
1984.70
0.00
979.06
1210.34
1564.20
4.45
157.00
264.39
233.78
183.60
158.51
43.03
22.09
49.00
9.36
32.04
378.30
29.70
2545.20
139.48
90.25
160.28
96.83
77.09
1256.70
0.00
702.78
1273.78
418.20
136.42
43.03
0.00
23.43
2.22
0.72
164.61
452.41
2234.45
59.75
298.25
60.68
170.56
147.38
2.31
52.85
0.00
839.26
411.28
298.25
Jumlah
cost
9269.56 96.27855
3473.711 58.9382
2274.874 47.69564
1739.023 41.7016
112.78
13.25
0.64
11.76
67.90
0.00
1058.20
1733.89
558.85
3438.65
400.00
255.04
96.04
128.14
99.60
2877.25
0.00
2603.04
2736.34
2877.25
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6.76
90.44
425.18
849.14
1720.59
5289.65
391.64
221.71
344.10
168.48
72.59
2278.15
0.00
1670.36
1930.72
1241.15
18.84
3.42
65.29
558.85
74.65
40.45
53.00
49.00
12.11
10.89
145.93
40.45
0.00
61.15
65.61
1.85
20.70
7.08
202.78
595.85
294.47
807.13
129.05
122.32
187.69
82.63
39.06
955.43
0.00
1084.38
1195.78
671.33
178.49
8.47
205.64
180.90
418.20
2065.70
82.81
183.60
606.64
226.50
4.80
29.70
0.00
1114.89
358.72
418.20
76.91
114.92
11.36
22.28
387.70
249.64
804.29
1680.18
694.85
72.59
40.45
533.61
40.45
1824.14
278.89
525.33
289.00
21.34
69.72
2.96
233.17
1.90
40.45
1581.65
0.00
0.00
1661.38
1727.23
1287.37
1831.84
1710.65
1123.59
Total C3
1.37
4.62
142.09
804.29
129.05
2149.25
794.11
44.89
5.81
0.08
2.28
1322.05
0.00
1301.77
1304.65
983.45
97.81
2.22
30.91
256.00
625.00
0.00
20.70
11.90
846.81
768.95
437.65
0.00
0.00
824.84
610.09
100.00
19.27
27.56
341.88
103.63
282.91
66.91
694.85
178.76
230.43
186.87
242.74
66.91
0.00
144.72
166.41
3.31
1534.285
1310.561
7604.787
21272.65
22362.91
43643.36
10583.74
4869.28
6753.734
4812.458
3503.296
24465.34
0
31051.88
31267.94
22473.07
39.16994
36.20168
87.20543
145.8515
149.5423
208.9099
102.8773
69.78022
82.1811
69.37188
59.18865
156.414
0
176.2154
176.8274
149.9102
687.7129
Setelah menghitung cost/jarak. Menentukan cost/jarak yang terdekat dengan medoids. Cost/jarak yang terdekat dengan
medoids telihat dengan data yang memiliki blok merah pada tabel.
3. Menghitung total cost dari ketiga C (C1, C2, C3)
Total Cost C1, C2, C3 = 1143.29
88
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Memilih non-medoids. nonMedoids 1 adalah SMA BUDYA WACANA YOGYAKARTA, nonMedoids 2 adalah SMA
NEGERI 1 YOGYAKARTA, dan nonMedoids 3 adalah SMA NEGERI 11 YOGYAKARTA.
5. Mengulangi langkah 2 – 3. Hasilnya seperti dibawah ini:
nonMedoids 1 :
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
1332.98
8.18
259.53
441.84
309.41
528.54
149.33
4.00
0.00
2025.00
602.70
33.41
866.12
782.88
259.21
900.00
364.43
29.81
95.26
0.00
89
3768.73
698.54
3086.91
2196.80
1780.00
1552.36
2612.23
4.00
0.00
25.00
3.31
1171.01
3668.72
2610.19
1733.06
100.00
1131.65
34.69
12.18
0.00
3442.17
661.52
1314.06
1548.42
1085.04
811.68
1102.24
39.06
0.00
306.25
1415.26
759.00
3098.04
2242.97
1950.11
351.56
1683.46
1.99
20.79
126.56
(i-non1)^2
1521.00
490.18
834.63
616.53
423.95
348.20
771.73
64.00
0.00
0.00
186.05
562.16
1547.64
1462.30
1333.71
100.00
743.65
15.21
9.06
25.00
1945.69
400.00
597.31
1535.07
675.48
474.80
44.49
36.00
0.00
900.00
1193.70
369.41
2508.01
561.69
921.12
0.00
1457.71
7.29
188.51
400.00
1704.86
184.14
422.71
89.49
348.20
342.62
79.03
4.00
0.00
900.00
602.70
612.07
842.16
759.55
108.78
400.00
647.70
0.04
24.40
400.00
1255.28
171.61
553.19
685.39
373.65
466.99
89.11
0.11
0.00
25.00
42.51
187.14
1198.54
851.47
608.61
225.00
640.09
92.35
680.17
225.00
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2421.62
372.10
1038.13
723.61
45.02
408.85
0.31
25.00
0.00
100.00
1.85
372.88
1768.20
1861.92
357.21
225.00
225.00
35.05
72.08
0.00
3493.99
1032.98
2349.34
1396.52
318.98
611.08
332.33
280.23
248.06
136.19
121.00
0.00
100.00
1600.00
193.77
1011.88
683.30
722.53
625.00
671.33
2.89
292.75
306.25
61.15
8.18
60.53
1456.19
56.25
94.48
437.65
58.06
94.09
163.33
25.00
0.00
0.00
516.65
145.68
957.28
745.84
132.94
25.00
239.01
11.36
15.29
56.25
1149.89
184.14
378.30
3073.59
372.10
951.11
1641.06
882.68
1184.05
192.93
36.00
0.00
100.00
225.00
557.90
2443.32
1342.49
1475.33
0.00
1257.41
13.40
106.09
0.00
2020.50
522.58
1469.19
1713.13
1733.06
1214.52
225.00
169.00
0.00
400.00
25.00
513.93
2039.43
1869.70
1336.63
25.00
1786.75
21.62
101.20
25.00
2379.49
736.58
1385.33
1828.42
1476.10
1666.27
518.93
1.00
0.00
400.00
537.31
494.62
2190.24
2093.98
1967.81
25.00
1493.05
20.88
0.61
25.00
(i-non1)^2
2757.30 2123.37
248.38
147.38
165.38
28.73
277.89
356.83
4.84
(i-non1)^2
1267.36
246.80
834.63
640.60
94.67
481.36
100.00
64.00
0.00
1600.00
211.70
431.81
718.24
1152.60
1554.72
100.00
66.91
275.56
335.26
0.00
183.87
86.30
52.13
90
4156.38
987.84
1877.49
1851.58
1706.52
1364.56
1303.93
361.00
0.00
0.00
418.20
625.00
3881.29
3386.08
3613.21
225.00
1289.53
5.29
2.28
25.00
2962.62
1032.98
1344.69
1142.44
900.00
740.93
853.81
895.21
1073.22
225.00
121.00
0.00
100.00
456.25
396.41
1196.47
1001.09
682.78
225.00
927.20
0.01
132.48
625.00
1137.71
61.78
296.53
459.24
120.12
222.90
79.03
4.00
0.00
2500.00
0.00
0.18
436.81
534.07
531.30
400.00
602.70
45.43
104.86
225.00
Jumlah
216.38 53629.34
18.40 12001.97
0.31 24020.38
361.00
50.98
1.23
0.56
2.40
5.71
123.43
196.00
0.00
2025.00
40.45
16.40
327.97
233.78
11.09
900.00
29.70
443.52
914.46
225.00
cost
231.5801
109.5535
154.9851
3475.10
1657.30
2229.73
2715.45
2095.81
2154.82
1186.11
676.00
0.00
3025.00
900.00
1558.67
3639.71
3529.55
2380.46
1600.00
2234.45
334.89
728.46
900.00
1173.75
400.00
597.31
732.78
237.16
556.02
79.03
324.00
0.00
1225.00
13.25
58.83
1118.23
1222.20
1130.30
900.00
558.85
749.66
821.97
900.00
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2595.90
1943.05
2599.98
435.14
152.28
0.00
976.56
470.46
707.03
3603.60
2965.89
2500.00
39.06
1720.59
0.37
6.05
39.06
0.50
18.49
46.10
0.31
225.00
0.00
225.00
1.85
2.69
26.63
28.52
11.83
225.00
74.65
0.67
0.29
100.00
545.69
159.01
210.25
8.53
52.56
0.00
126.56
33.64
37.21
952.34
689.06
548.03
189.06
294.47
248.69
303.46
76.56
272.25
50.27
307.65
37.33
49.00
0.00
625.00
873.20
47.61
2032.21
1260.25
333.43
225.00
418.20
167.44
2.28
0.00
413.72
72.08
309.41
4.84
528.54
14.44
44.49
53.00
4.00 1054.30
0.00
0.00
400.00
212.58
400.00 1168.96
93.32
207.36
1880.09
172.66
1204.78
104.86
1733.06
98.01
400.00
976.56
694.85
72.59
207.36 1091.64
90.63 1175.12
225.00
625.00
Total Non 1
186.05
103.84
182.52
0.31
289.00
0.00
1225.00
282.91
21.72
189.61
135.49
165.64
625.00
129.05
611.08
613.06
400.00
1311.89
1217.31
701.72
377.91
81.00
0.00
625.00
418.20
809.40
2926.81
2780.45
2108.65
625.00
625.00
13.84
0.09
225.00
2.34
154.50
133.86
2.79
729.00
0.00
625.00
1864.51
11.90
2.69
9.92
1.54
625.00
282.91
22.94
15.37
225.00
26444.19
18583.48
19924.7
10141.21
4910.31
0
20796.95
14505.64
10998.52
47244.94
38106.88
30311.11
11281.25
22362.91
4504.996
6864.5
6404.688
162.6167
136.3212
141.1549
100.7036
70.07361
0
144.2115
120.4394
104.8738
217.359
195.2098
174.1009
106.2132
149.5423
67.11926
82.85228
80.02929
550.4991
nonMedoids 2 :
i
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
50.13
705.96
177.42
70.73
91
0.67
1165.54
25.10
187.69
9.06
896.40
376.75
266.02
(i-non2)^2
0.12
35.64
295.84
904.81
109.20
657.41
210.54
118.81
150.55
238.70
71.57
382.59
0.66
463.11
123.21
71.23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
51.27
518.02
96.63
229.52
1248.92
476.55
1721.42
1372.70
30.91
194.60
50.27
184.42
227.10
257.92
405.62
433.06
52.13
549.43
450.29
100.40
543.82
451.14
329.79
672.88
36.12
908.42
345.59
79.57
388.88
225.60
1263.09
1886.16
0.04
497.29
46.65
14.21
12.46
106.30
909.63
3382.59
140.19
41.47
296.18
987.84
866.12
242.42
23.81
559.32
0.00
2.10
177.69
0.32
106.92
574.56
386.91
866.12
3.92
386.52
91.78
16.32
70.22
35.76
576.96
2097.64
337.82
448.17
89.49
3430.44
3668.72
4299.42
3451.56
694.32
0.00
89.87
358.72
4980.12
725.22
4416.93
4103.68
3668.72
516.20
738.21
504.45
2441.35
3098.04
5352.39
325.44
790.17
0.00
68.89
132.25
1362.35
214.04
3256.98
2611.21
1972.25
(i-non2)^2
77.44
4.71
122.99
952.96
4.37
359.86
2.22
371.33
291.38
440.58
23.62
643.13
282.24
685.92
1211.04 1874.89
92
351.56
427.66
133.63
982.20
1547.64
1547.64
660.49
244.30
0.00
1.21
7.95
860.84
145.68
1869.70
1793.52
1966.04
0.62
21.07
54.32
28.84
21.81
3.35
383.77
556.49
580.33
800.32
1884.43
1943.05
2508.01
403.21
241.18
952.34
0.00
695.90
389.27
2508.01
141.61
2244.86
1321.32
904.81
164.61
170.04
13.54
0.28
98.80
35.64
144.24
524.41
107.33
110.46
405.22
962.24
842.16
3483.36
19.98
18.32
0.00
2.13
345.59
81.36
12.74
854.39
579.85
81.36
0.79
637.56
369.41
301.37
386.52
247.12
49.00
1031.05
233.78
169.26
634.03
1221.50
1198.54
1569.74
1692.50
438.48
0.00
29.59
99.00
2462.14
86.86
1956.29
3684.49
2462.14
1.90
384.94
171.87
67.57
211.70
193.49
670.29
1178.55
0.67
180.63
81.00
40.58
325.44
97.22
1791.83
2646.07
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1768.20
2709.20
1655.68
517.11
0.00
1.21
535.92
731.70
731.70
2301.12
2554.29
1768.20
0.85
777.85
133.63
82.45
254.40
81.72
1534.29
2274.34
3603.60
8332.04
1469.96
1118.23
1011.88
1748.08
67.08
320.05
0.00
32.15
24.30
46.38
34.81
906.61
216.09
204.78
7.08
5.29
6.86
19.80
0.74
2.66
21.16
406.43
26.63
96.83
14.44
12.39
957.28
957.28
67.40
356.08
0.00
13.18
376.75
1291.68
239.63
1177.18
1214.52
1477.63
9.30
298.94
130.19
56.25
333.06
267.65
780.64
1452.37
952.34
1773.25
628.00
613.06
2443.32
3531.92
1185.42
666.16
0.00
163.58
121.44
2443.32
195.16
2094.89
3567.67
2443.32
55.20
1085.04
807.13
816.82
1443.24
758.45
1518.66
1450.09
2032.21
4911.21
241.18
1457.71
2039.43
4245.83
1612.83
505.80
0.00
3.69
73.96
2516.03
8.35
1641.06
3049.25
1612.83
(i-non2)^2
7.40
930.25
598.78
529.92
664.09
414.94
1346.16
2057.53
1880.09
545.69
545.69
1135.69
2190.24
4462.24
557.90
603.19
0.00
1.08
5.95
1747.24
66.59
2638.88
2117.84
1747.24
6.86
342.25
119.68
21.62
235.32
87.24
416.98
2080.27
172.66
768.40
2240.13
758.45
718.24
4462.24
150.06
36.24
0.00
51.12
159.52
1354.24
346.70
1883.56
2034.91
718.24
0.04
20.07
42.90
0.02
12.82
0.07
205.35
946.79
189.61
2378.51
935.75
82.99
93
3881.29
3881.29
1751.42
1391.29
0.00
16.89
4.80
2237.29
696.43
4173.16
3695.42
3283.29
0.11
482.24
303.80
319.69
369.02
762.31
1201.32
2034.01
2926.81
846.81
1132.32
657.92
1196.47
604.67
175.03
215.50
0.00
8.70
71.57
383.77
17.14
1204.09
532.69
91.97
436.81
846.81
436.81
454.97
0.00
4.88
4.62
1672.81
13.32
763.97
969.70
1288.81
327.97
3982.87
598.78
491.07
0.00
7.95
459.67
2314.57
160.28
1534.29
2337.72
1096.27
170.82
7.02
1.17
0.01
116.42
98.60
10.96
643.13
2.69
545.69
1725.57
3.28
Jumlah
929.6375
14143.81
5820.384
4590.819
9963.974
8006.027
20196.73
44181.11
47244.94
73241.48
25414.38
16193.25
cost
30.48996
118.9277
76.29144
67.75558
99.81971
89.4764
142.1152
210.193
217.359
270.6316
159.4189
127.2527
3639.71
28.41
919.91
434.72
0.00
0.85
133.17
413.31
170.56
1766.52
1111.56
919.91
1118.23
4684.03
888.04
664.09
0.00
2.31
0.03
4024.63
96.04
3699.07
3857.65
4024.63
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
0.00
31.02
100.60
4393.04
344.10
3530.74
3905.00
2892.29
0.00
0.03
73.96
96.83
12.11
18.84
21.34
23.43
0.00
21.25
55.50
1990.05
187.69
2174.36
2330.96
1568.95
0.00
91.78
719.31
904.81
606.64
3366.32
1898.34
2032.21
0.00
0.00
74.82
8.41
2.99
10.50
545.69 1970.47
289.00
21.34
3336.22 2132.59
2796.29 2248.66
3405.89 1454.66
Total Non 2
0.00
4.54
0.81
1503.11
5.81
1481.48
1484.56
1140.41
0.00
1.88
66.91
846.81
846.81
3343.15
2894.44
1528.81
0.00
2.28
0.16
545.69
230.43
9.92
5.20
178.49
0
1433.313
4512.941
46228.62
6753.734
60351.74
59325.1
46823.7
0
37.85912
67.17843
215.0084
82.1811
245.6659
243.5674
216.3879
68.34908
nonMedoids 3 :
I
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
357.97
216.97
2.19
11.76
0.00
29.16
28.84
383.77
309.41
751.31
48.44
139.48
140.19
107.95
94
368.64
248.38
178.76
21.90
0.00
7.78
79.57
1615.24
1780.00
2226.90
1629.74
63.52
337.82
79.21
662.03
52.13
10.96
41.09
0.00
19.80
0.07
712.36
1085.04
2544.19
21.90
29.05
516.20
207.94
(i-non3)^2
338.93
2.40
68.89
17.98
0.00
3.72
51.70
158.51
423.95
423.95
48.30
9.73
351.56
311.52
328.33
35.88
2.40
173.98
0.00
17.64
373.26
399.60
675.48
16.08
73.27
45.83
580.33
5.24
512.12
25.91
3.61
84.64
0.00
0.02
95.45
426.84
348.20
2367.80
34.69
36.97
107.33
79.21
259.21
38.81
17.56
46.92
0.00
5.20
97.81
386.52
373.65
591.95
668.22
31.92
233.78
97.02
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
1806.25
158.26
650.76
407.64
0.00
182.52
37.82
2.92
45.02
279.22
28.62
158.76
1248.92
1327.87
148.60
68.72
68.72
159.52
425.60
1.25
63.68
2.22
0.00
0.98
25.70
32.95
280.23
715.03
541.03
7.95
227.10
88.36
102.82
68.23
84.09
226.20
932.69
0.01
4.41
176.89
0.00
4.33
26.63
6.86
58.06
58.06
228.31
19.80
543.82
387.70
15.29
159.26
61.47
120.78
662.03
108.58
1.28
116.64
0.00
22.09
250.27
562.16
882.68
1576.88
216.38
37.09
388.88
48.02
75.69
882.68
33.06
678.60
11.02
352.31
10.89
0.06
0.00
45.97
709.16
2984.44
1733.06
3798.26
1341.76
359.48
12.46
2.59
25.70
2174.36
0.41
1367.52
2.22
154.01
2.25
147.14
61.31
309.41
107.33
127.24
1.44
18.84
0.00
5.76
244.61
1400.26
1476.10
3412.90
232.26
261.79
70.22
53.88
35.28
1116.90
0.05
1848.14
(i-non3)^2
669.26
35.76
367.11
242.74
0.00
149.08
0.07
314.35
94.67
2473.07
23.23
122.10
291.38
586.61
882.09
389.27
2.40
693.27
95
0.31
2723.80
73.10
2311.69
2086.66
1780.00
536.39
97.61
4.08
2.96
0.00
19.10
27.04
497.74
1706.52
1706.52
435.14
266.02
440.58
284.93
353.44
692.22
29.16
1901.83
125.89
201.36
65.45
1179.92
805.42
470.46
253.76
112.15
44.62
599.76
556.96
654.85
15.05
0.01
7.29
0.49
0.00
8.07
222.61
357.97
895.21
396.81
73.27
100.20
21.81
2.96
14.36
222.61
0.28
901.80
518.47
9.61
39.19
109.62
0.00
15.76
4.28
167.96
120.12
1524.12
120.12
129.73
98.80
147.62
146.17
958.52
184.69
313.29
19.01
675.48
148.60
542.42
150.31
35.88
422.30
31.25
0.19
5.29
0.00
15.52
160.28
155.00
2.40
1887.90
23.14
6.25
386.52
283.59
3.17
809.40
49.00
380.64
67.73
1.80
46.10
356.08
188.24
1.80
173.45
25.70
2.07
40.07
0.00
0.41
128.60
391.25
2095.81
85.01
249.01
39.69
211.70
185.78
9.06
33.41
2.22
755.15
28.52
1178.55
35.64
837.52
2062.07
1178.55
355.70
21.16
81.72
136.19
0.00
66.91
590.00
1115.56
237.16
2540.16
138.30
59.75
325.44
382.59
331.97
2061.16
67.90
1830.13
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
231.04
45.02
0.14
0.58
225.90
142.56
19.27
47.20
0.00
47.75
539.17
1007.43
1943.05
5674.61
501.31
305.90
254.40
107.74
35.05
2533.11
6.76
1889.64
2165.97
1431.11
132.94
228.61
12.39
2.07
12.11
12.89
0.00
6.20
13.99
372.49
18.49
114.49
8.64
7.08
0.74
1.08
59.91
114.49
18.84
12.11
14.14
32.49
1600.80
882.68
453.69
0.92
46.79
115.56
0.00
3.57
93.90
394.42
159.01
569.30
46.38
42.38
333.06
186.05
116.64
694.85
20.70
805.42
901.80
456.25
2671.86
1341.76
2062.98
25.50
91.78
88.55
0.00
109.20
0.96
0.01
50.27
1029.77
504.45
0.04
1443.24
807.13
124.77
62.57
178.49
401.20
31.14
50.27
1416.77
1116.90
786.24
94.67
(i-non3)^2
811.68
322.56
22.37
9.99
1.69
19.36
7.56
114.28
0.00
0.00
29.16
36.00
119.25
25.81
383.77
916.27
309.41
4.84
5.81
153.26
5.81
1023.36
62.88
148.84
664.09
235.32
293.09
154.75
577.92
146.41
5.81
843.90
76.91
114.92
1023.36
951.11
734.95
1029.13
1062.11
519.84
Total Non 3
96
1584.04
1318.42
11.36
0.81
8.82
11.90
0.00
11.02
115.56
739.30
103.84
2042.14
729.54
30.58
12.82
2.10
7.18
1238.34
1.37
1218.71
1221.50
911.44
338.93
24.21
381.81
7.56
3.17
1.77
0.00
70.56
238.70
670.29
1217.31
97.81
208.51
41.47
369.02
318.27
121.66
97.81
97.81
1490.73
1196.47
395.61
449.44
673.92
5.20
66.26
140.90
118.81
0.00
0.74
198.81
212.28
154.50
158.00
945.56
80.64
116.42
86.12
125.22
158.00
19.27
58.37
72.42
6.60
823.12
180.90
353.06
249.01
Jumlah
cost
13750.34
117.2618
1867.292
43.21217
1862.353
43.15498
2176.42
46.65212
0
0
934.0353
30.56199
4499.906
67.08134
16768.5
129.4932
18583.48
136.3212
39221.3
198.0437
10148.71
100.7408
2644.938
51.42896
9963.974
99.81971
6626.938
81.40601
3955.84
62.89547
20432.75
142.9432
1534.285
39.16994
25002.06
158.1204
25609.02
160.0282
17514.49
132.3423
344.987
1942.16
2061.16
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6. Menghitung total cost dari ketiga non-medoids.
Total cost nonMedoids1, nonMedoids2, nonMedoids3 = 963.84
7. Menghitung selisih dari total cost nonMedoids dengan total cost C.
Selisih = Total cost nonMedoids – Total cost C
= 963.84 – 1143.29
= -179.454
8. Karena nilai selisih yang didapatkan kurang dari 0 maka, tukar nonMedoids dengan C. Kemudian ulangi langkah 5 – 7
dengan menggunakan nonMedoids baru. Hingga didapatkan hasil seperti dibawah.
Total cost C = 963.84
Total cost nonMedoids = 1288.37
Selisih = 324.538
9. Karena nilai selisih yang didapatkan lebih dari 0. Kurang tepat apabila mengganti nilai C1, C2, dan C3 dengan
nonMedoids1, nonMedoids2, dan nonMedoids3. Karena nilai C1, C2, dan C3 sudah baik.
10. Didapatkan hasil anggota dari ketiga cluster, yaitu :
C1 = SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
97
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
C2 =
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
C3 =
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
98
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 6 : Hasil Pengujian Dataset
Jumlah
Cluster
(k)
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
SI
Global
0.4361
0.2134
0.1893
0.2994
0.2629
0.2246
0.3294
0.2187
0.279
0.2483
0.3007
0.2178
0.1796
0.1827
0.1762
0.321
0.2459
0.2829
0.3004
Jumlah Anggota Cluster ke 1
106
32
29
23
19
2
1
10
27
6
6
19
13
2
3
11
5
3
4
2
31
60
25
39
33
38
14
18
1
17
1
44
2
26
14
10
23
8
5
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
45
38
53
50
33
21
1
11
44
18
7
1
6
13
10
20
18
10
45
21
22
13
3
2
4
14
1
8
15
27
2
30
1
42
11
1
1
1
46
18
13
3
1
14
1
4
7
1
14
6
1
12
42
32
23
34
1
16
1
3
4
8
8
6
10
7
8
19
3
34
6
2
2
3
1
6
1
30
1
19
1
42
5
1
19
8
11
6
1
8
2
3
9
20
1
25
27
5
18
2
3
13
1
5
6
7
6
2
6
5
2
38
20
7
1
6
14
24
2
32
15
23
1
4
1
6
20
1
13
8
3
1
11
1
6
20
4
4
9
6
3
3
1
16
29
1
5
3
3
34
1
4
5
2
4
1
2
1
1
1
5
6
3
18
1
99
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
SI
Global
0.4361
0.2134
0.1893
0.2994
0.2629
0.2246
0.3294
0.2187
0.279
0.2483
0.3007
0.2178
0.1796
0.1827
0.1762
0.321
0.2459
0.2829
0.3004
Jumlah Anggota Cluster ke 18
19
20
1
5
2
4
1
2
21
22
23
24
25
100
26
27
28
29
30
31
32
33
34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
SI
Global
0.2743
0.2884
0.2063
0.1806
0.3359
0.4593
0.3076
0.257
0.1836
0.3546
0.2933
0.2752
0.3142
0.2671
0.2459
0.4505
0.3813
0.3839
0.3148
0.446
0.3289
0.3617
Jumlah Anggota Cluster ke 1
9
20
7
16
5
1
1
3
1
1
7
3
8
15
4
1
2
3
2
1
1
2
2
10
4
10
2
2
2
1
2
2
14
4
1
1
3
2
4
3
3
1
4
3
1
3
1
6
14
21
1
18
3
6
1
13
14
10
2
4
1
1
4
12
3
2
1
9
4
11
6
1
16
1
1
11
1
2
21
11
1
7
1
3
5
1
1
8
1
2
1
5
1
4
9
2
11
5
4
6
1
3
5
2
7
4
5
3
1
1
6
1
2
1
6
3
7
8
5
6
14
18
9
2
3
1
4
1
5
3
1
2
9
14
3
1
1
7
3
1
6
3
1
1
1
1
4
6
2
2
1
3
2
9
1
10
4
2
4
7
8
11
2
6
3
4
1
1
17
3
2
4
2
5
1
3
2
2
2
2
10
3
1
101
9
14
3
4
6
1
5
6
1
8
7
1
7
11
4
3
2
1
3
7
1
2
2
10
23
5
2
7
13
1
2
3
2
4
3
2
5
3
1
1
1
1
1
1
1
3
11
2
5
11
4
1
4
7
2
4
19
1
5
3
1
3
3
1
5
1
1
7
2
12
4
1
7
3
13
1
8
7
2
1
2
1
12
1
2
2
8
1
1
3
7
3
13
2
14
4
1
13
1
2
4
2
2
3
10
9
6
4
7
10
8
2
1
1
4
14
20
20
19
4
1
20
1
5
4
1
2
4
4
4
1
1
1
8
13
2
8
1
15
7
1
6
2
1
9
2
4
9
2
15
4
2
6
2
15
1
5
3
13
1
11
16
3
9
1
12
4
1
3
7
2
1
12
3
3
1
2
1
4
2
1
1
6
7
17
4
4
4
6
10
5
1
1
3
3
1
2
3
6
1
2
1
7
4
2
2
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
SI
Global
0.2743
0.2884
0.2063
0.1806
0.3359
0.4593
0.3076
0.257
0.1836
0.3546
0.2933
0.2752
0.3142
0.2671
0.2459
0.4505
0.3813
0.3839
0.3148
0.446
0.3289
0.3617
Jumlah Anggota Cluster ke 18
1
10
4
3
4
2
6
2
4
2
6
1
2
1
1
1
3
1
1
2
1
4
19
1
12
3
4
7
1
6
7
1
1
1
5
2
6
1
4
4
1
1
12
2
3
20
6
1
1
8
9
1
2
9
5
5
4
2
1
2
14
1
2
7
2
1
4
3
21
1
1
1
1
7
6
12
9
8
1
3
2
6
3
11
1
1
2
1
1
1
4
22
23
24
25
26
27
28
29
30
31
32
33
34
1
4
1
4
5
5
4
2
1
1
1
2
2
2
3
22
2
5
9
4
1
5
6
1
7
2
1
16
3
3
3
1
3
6
1
1
4
5
3
9
2
1
14
9
1
3
4
4
5
1
1
2
2
10
3
1
9
1
4
3
3
15
5
13
7
1
7
7
4
5
7
1
2
1
1
8
4
1
1
1
2
1
1
1
1
1
11
17
13
1
1
2
1
3
1
25
7
3
7
1
1
1
1
3
2
7
4
5
9
5
14
1
14
2
9
2
4
9
2
1
3
2
1
3
2
1
20
5
1
10
3
12
1
9
3
1
3
9
4
2
1
2
8
9
4
13
9
4
14
2
2
3
1
5
28
1
1
5
1
2
2
3
1
8
1
2
14
2
2
13
15
1
3
7
9
7
1
4
5
3
1
5
1
1
9
2
1
1
1
3
1
2
1
2
1
102
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
SI
Global
0.2743
0.2884
0.2063
0.1806
0.3359
0.4593
0.3076
0.257
0.1836
0.3546
0.2933
0.2752
0.3142
0.2671
0.2459
0.4505
0.3813
0.3839
0.3148
0.446
0.3289
0.3617
Jumlah Anggota Cluster ke 35
36
37
38
39
40
41
42
2
2
6
2
5
1
1
4
1
4
1
2
1
2
2
6
2
5
3
1
4
1
1
9
1
4
4
1
1
3
2
4
1
1
3
7
103
43
44
45
46
47
48
49
50
51
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
SI
Global
0.3616
0.37
0.456
0.4585
0.4657
0.4364
0.3811
0.4638
0.5148
0.4317
0.4234
0.3427
0.4616
0.4169
0.4615
0.4701
0.5019
0.4235
0.5056
0.51
0.5454
Jumlah Anggota Cluster ke 1
1
2
2
2
4
2
2
3
2
2
10
1
1
2
2
6
2
1
1
1
5
2
2
1
2
1
1
3
1
1
1
5
1
1
1
3
2
1
6
1
1
2
1
3
1
6
8
1
2
5
1
1
1
6
1
3
1
3
1
1
4
2
6
5
1
4
1
2
1
1
1
1
3
3
1
9
4
2
4
1
1
1
4
2
1
8
3
5
3
1
6
1
1
6
1
7
1
2
1
2
2
1
2
1
3
2
1
3
6
6
1
9
7
9
2
1
6
1
1
1
5
3
8
1
14
2
1
1
2
1
1
7
3
2
1
1
5
1
1
5
1
3
4
2
2
1
1
1
1
11
8
2
2
8
4
6
3
2
1
4
3
1
3
2
1
2
1
1
1
2
1
1
1
3
1
9
2
4
1
1
3
1
2
3
1
1
2
8
2
3
2
1
1
2
1
1
2
104
10
2
2
1
4
9
1
3
6
1
1
1
1
1
2
1
4
2
1
2
1
5
11
1
1
8
5
3
5
2
1
1
1
5
1
1
2
1
2
1
2
1
1
11
12
2
1
4
2
4
2
1
1
10
8
1
1
3
1
1
1
1
3
1
3
2
13
1
2
3
1
5
1
3
1
2
1
1
1
5
1
1
4
1
3
1
1
1
14
1
3
1
1
1
1
2
1
1
2
4
2
1
1
1
4
4
1
1
1
3
15
6
1
4
1
5
1
2
1
1
3
2
5
1
2
1
2
1
5
2
1
1
16
3
6
1
1
1
2
4
4
1
3
1
3
1
2
1
3
1
1
4
1
3
17
2
1
1
2
4
1
3
2
2
1
1
5
6
1
6
2
1
2
3
3
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
SI
Global
0.3616
0.37
0.456
0.4585
0.4657
0.4364
0.3811
0.4638
0.5148
0.4317
0.4234
0.3427
0.4616
0.4169
0.4615
0.4701
0.5019
0.4235
0.5056
0.51
0.5454
Jumlah Anggota Cluster ke 18
1
3
2
1
1
5
2
2
1
4
1
1
1
4
2
3
1
2
2
1
3
19
12
1
2
2
4
10
1
2
2
1
3
1
4
1
5
5
1
3
1
2
5
20
3
3
4
12
1
2
5
2
1
4
2
2
2
6
3
1
1
5
1
5
1
21
3
1
2
2
1
5
1
1
1
2
1
2
1
5
5
3
2
1
3
2
2
22
2
6
1
8
8
4
1
1
4
2
9
3
4
1
4
3
2
3
1
1
1
23
7
5
4
8
2
4
10
4
1
1
6
16
2
1
4
3
2
1
3
2
2
24
1
1
4
11
1
8
7
1
5
1
2
1
4
8
2
1
11
3
1
1
2
25
2
4
1
6
6
14
6
5
2
7
1
1
11
2
2
1
1
2
4
2
2
105
26
1
5
1
8
4
1
2
5
3
2
1
4
4
2
3
4
2
2
1
1
3
27
5
1
8
2
2
1
1
8
1
6
1
2
2
3
3
6
1
3
1
1
2
28
16
2
7
1
2
1
4
1
18
1
6
3
4
2
1
1
3
1
6
1
2
29
4
1
1
3
1
3
1
2
1
2
1
4
1
1
1
1
1
2
1
2
1
30
3
3
3
5
1
4
1
8
2
2
1
2
5
1
1
3
4
3
6
1
1
31
4
1
4
3
1
3
1
6
7
2
2
1
2
4
7
8
1
2
2
2
1
32
3
5
8
1
3
3
1
1
6
1
2
2
2
2
1
1
1
2
1
1
3
33
1
5
2
1
9
1
5
1
2
1
2
6
1
3
1
1
4
1
2
2
3
34
7
2
2
3
6
1
2
1
5
3
2
3
1
2
1
3
1
2
1
1
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
SI
Global
0.3616
0.37
0.456
0.4585
0.4657
0.4364
0.3811
0.4638
0.5148
0.4317
0.4234
0.3427
0.4616
0.4169
0.4615
0.4701
0.5019
0.4235
0.5056
0.51
0.5454
Jumlah Anggota Cluster ke 35
7
17
2
1
1
1
4
1
1
4
2
5
1
1
1
1
4
3
3
13
1
36
1
3
8
1
1
2
5
2
5
1
2
2
1
2
2
1
2
1
6
2
3
37
1
4
1
1
2
6
1
1
4
2
2
1
1
6
1
1
2
1
2
1
1
38
6
1
1
1
13
3
1
3
6
1
1
2
7
1
1
1
2
1
3
2
1
39
4
1
1
1
5
1
9
1
1
1
3
3
1
1
2
13
6
5
1
9
1
40
2
2
8
1
1
1
2
4
1
2
3
2
2
1
4
3
2
3
1
1
1
41
3
3
2
3
1
2
2
10
3
1
5
1
2
1
2
2
1
3
1
2
1
42
1
1
1
3
1
2
1
1
2
1
1
2
2
1
1
3
2
11
2
1
1
106
43
1
1
1
2
2
1
2
1
4
1
9
3
1
13
1
2
1
2
2
1
1
44
45
46
47
48
49
50
51
5
1
1
1
3
1
1
3
2
2
1
1
1
1
2
4
1
1
4
1
1
5
2
3
1
1
3
1
4
2
1
5
1
1
2
1
1
1
1
4
1
2
1
3
1
1
2
3
1
1
2
1
6
3
2
1
1
1
1
10
3
1
2
2
1
1
2
2
3
1
1
2
4
1
1
1
3
6
1
1
2
4
1
8
1
1
2
1
4
3
5
3
1
18
1
2
3
2
1
2
6
1
2
1
3
6
1
2
1
1
4
5
2
1
1
1
2
1
1
1
2
1
2
6
2
2
1
3
1
16
3
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
SI
Global
0.3616
0.37
0.456
0.4585
0.4657
0.4364
0.3811
0.4638
0.5148
0.4317
0.4234
0.3427
0.4616
0.4169
0.4615
0.4701
0.5019
0.4235
0.5056
0.51
0.5454
Jumlah Anggota Cluster ke 52
53
54
55
56
57
58
59
60
61
62
63
1
1
1
1
4
4
1
1
1
2
2
1
6
1
1
2
2
2
1
1
1
3
1
3
1
3
2
2
2
4
1
1
1
3
4
7
1
1
2
2
2
8
2
1
4
1
3
3
1
1
2
1
4
1
1
3
4
1
1
2
1
3
1
6
1
2
1
1
2
1
2
3
1
1
1
1
1
6
107
64
65
66
67
68
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
64
65
66
67
68
SC
Jumlah
Cluster
(k)
64
65
66
67
68
SC
SI
Global
0.4772
0.5167
0.5031
0.5118
0.5379
0.5454
SI
Global
0.4772
0.5167
0.5031
0.5118
0.5379
0.5454
Jumlah Anggota Cluster ke 1
1
1
1
4
1
2
1
3
1
3
1
3
2
2
1
2
1
4
1
4
2
1
3
5
1
1
2
2
1
6
1
1
1
1
2
7
5
3
2
1
6
8
1
1
1
1
1
9
1
2
1
1
2
10
1
1
2
2
1
11
1
1
1
1
3
12
3
1
1
2
7
13
2
2
2
1
3
14
3
1
2
3
1
15
2
3
3
1
1
16
3
1
1
1
5
17
3
13
2
3
1
Jumlah Anggota Cluster ke 18
4
2
4
7
1
19
2
1
1
1
1
20
1
2
3
1
2
21
1
2
1
1
1
22
1
3
1
1
2
23
1
5
6
2
2
24
1
1
2
1
2
25
1
2
3
3
4
108
26
1
6
1
2
2
27
1
1
1
1
2
28
5
2
2
4
1
29
4
3
2
2
1
30
1
1
3
2
1
31
1
1
2
1
8
32
1
1
5
1
1
33
2
2
2
2
2
34
4
1
5
1
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Jumlah
Cluster
(k)
64
65
66
67
68
SC
Jumlah
Cluster
(k)
64
65
66
67
68
SC
SI
Global
0.4772
0.5167
0.5031
0.5118
0.5379
0.5454
SI
Global
0.4772
0.5167
0.5031
0.5118
0.5379
0.5454
Jumlah Anggota Cluster ke 35
2
2
8
1
5
36
3
2
1
1
1
37
3
2
1
3
1
38
3
3
1
1
3
39
1
1
1
5
1
40
3
1
1
2
1
41
3
1
1
3
2
42
1
2
3
1
2
43
3
2
2
1
1
44
2
5
2
1
1
45
5
1
1
1
1
46
1
1
5
12
2
47
2
4
1
3
2
48
2
1
7
1
2
49
1
8
2
4
1
50
4
1
5
1
1
51
1
4
1
4
2
63
1
1
1
2
1
64
3
1
2
1
1
65
66
67
68
1
1
1
1
1
4
1
2
2
2
Jumlah Anggota Cluster ke 52
1
1
1
2
1
53
3
2
3
3
1
54
1
1
3
2
1
55
2
2
1
2
8
56
3
1
1
1
2
57
2
1
1
2
1
58
1
1
4
1
1
59
2
1
2
1
3
109
60
1
2
1
1
3
61
8
1
1
3
1
62
5
3
1
1
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN 7 : Perhitungan Standar Deviasi Tiap Cluster
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA '17' YOGYAKARTA
SMA MUHAMMADIYAH 5 YOGYAKARTA
SMA MUHAMMADIYAH 4 YOGYAKARTA
SMA SANTO THOMAS YOGYAKARTA
SMA MARSUDI LUHUR YOGYAKARTA
SMA PIRI 1 YOGYAKARTA
Cluster SMA TAMAN MADYA IBU PAWIYATAN YOGYAKARTA
1
SMA BERBUDI YOGYAKARTA
SMA 17 BANTUL
SMA MUHAMMADIYAH KASIHAN
SMA NEGERI 1 SRANDAKAN
SMA DHARMA AMILUHUR
SMA MUHAMMADIYAH SEWON
SMA MUHAMMADIYAH IMOGIRI
SMA MUHAMMADIYAH PIYUNGAN
SMA BOPKRI BANGUNTAPAN
SMA PATRIA BANTUL
110
Rata-rata Nilai
Sekolah Maksimal
33.12
31.29
32.24
19.88
27.09
35.53
31.90
34.27
28.46
26.69
35.72
26.76
24.71
22.28
32.34
25.67
28.24
26.14
30.72
34.24
21.55
Nilai
Minimal
Rata-rata
Cluster
18.10
29.03
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA UII BANGUNTAPAN
SMA NEGERI 1 KOKAP
SMA MUHAMMADIYAH WATES
SMA MA'ARIF WATES
SMA NEGERI 1 SAMIGALUH
SMA NEGERI 1 KALIBAWANG
SMA MUHAMMADIYAH GALUR
SMA MANDALA BHAKTI
SMA INSTITUT INDONESIA SLEMAN
SMA ISLAM 1 PRAMBANAN
SMA MUHAMMADIYAH KALASAN
SMA NEGERI 1 MINGGIR
SMA ISLAM 1 GAMPING
SMA MUHAMMADIYAH MLATI
SMA SANTO MIKAEL SLEMAN
SMA MUHAMMADIYAH PAKEM
SMA ISLAM 3 SLEMAN
SMA PEMBANGUNAN 1 WONOSARI
SMA DOMINIKUS WONOSARI
SMA PEMBANGUNAN 2 KARANGMOJO
SMA PEMBANGUNAN 3 PONJONG
SMA MUHAMMADIYAH PONJONG
Jumlah Anggota
Standar Deviasi
32.23
35.05
33.57
23.30
34.48
32.80
33.52
18.10
27.11
27.49
26.44
35.72
24.84
27.13
31.96
25.66
35.54
27.28
23.29
30.47
30.78
29.41
42
4.5684
111
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Cluster 2
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA GAJAH MADA YOGYAKARTA
SMA PANGUDI LUHUR YOGYAKARTA
SMA NEGERI 5 YOGYAKARTA
SMA NEGERI 8 YOGYAKARTA
SMA K SANG TIMUR YOGYAKARTA
SMA STELLA DUCE 2 YOGYAKARTA
SMA ISLAM TERPADU ABU BAKAR
SMA NEGERI 2 BANTUL
SMA NEGERI 1 BANTUL
SMA NEGERI 1 KASIHAN
112
Rata-rata
Nilai
Nilai
Rata-rata
Sekolah Maksimal Minimal Cluster
76.98
53.95
61.65
63.68
58.00
60.03
50.30
51.36
52.44
73.73
69.90
65.34
88.87
46.98
59.93
61.95
74.47
51.15
70.71
73.36
53.80
50.13
48.34
68.84
65.06
71.12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 3 BANTUL
SMA NEGERI 1 SANDEN
SMA MUHAMMADIYAH BANTUL
SMA NEGERI 1 PAJANGAN
SMA STELLA DUCE BANTUL
SMA NEGERI 1 BAMBANGLIPURO
SMA NEGERI 1 SEWON
SMA NEGERI 1 JETIS
SMA NEGERI 1 BANGUNTAPAN
SMA NEGERI 1 PUNDONG
SMA NEGERI 2 BANGUNTAPAN
SMA NEGERI 1 KRETEK
SMA KESATUAN BANGSA
SMA NEGERI 1 WATES
SMA NEGERI 2 WATES
SMA NEGERI 1 PENGASIH
SMA NEGERI 1 SENTOLO
SMA NEGERI 1 GALUR
SMA NEGERI 1 PRAMBANAN
SMA NEGERI 1 DEPOK
SMA NEGERI 1 KALASAN
SMA KOLESE DE BRITTO
SMA KOLOMBO SLEMAN
SMA MUHAMMADIYAH 1 PRAMBANAN
SMA NEGERI 1 GODEAN
79.68
60.18
46.98
55.07
50.95
56.30
57.01
63.97
57.94
53.76
50.02
52.42
72.56
61.53
51.81
55.40
48.79
53.21
53.43
65.15
62.34
66.72
57.22
88.87
66.07
113
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA NEGERI 1SEYEGAN
SMA NEGERI 1 SLEMAN
SMA NEGERI 1 MLATI
SMA NEGERI 1 PAKEM
SMA NEGERI 2 NGAGLIK
SMA NEGERI 1 TEMPEL
SMA NEGERI 1 NGEMPLAK
SMA NEGERI 1 CANGKRINGAN
SMA IT BINA UMAT
SMA 2 WONOSARI
SMA 1 WONOSARI
SMA 2 PLAYEN
Jumlah Anggota
Standar Deviasi
Cluster 3
49.17
58.97
59.40
62.86
47.95
50.61
67.53
47.88
48.46
61.09
77.12
51.34
60
9.5281
Rata-rata
Sekolah
39.26
37.24
39.40
37.54
36.89
45.83
45.55
36.35
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
SMA MUHAMMADIYAH 2 YOGYAKARTA
SMA SANTA MARIA YOGYAKARTA
SMA BINA ANAK SHOLEH
SMA NEGERI 1 SEDAYU
114
Nilai
Maksimal
46.15
Nilai
Rata-rata
Minimal Cluster
36.13
40.44
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA PANGUDI LUHUR SEDAYU
SMA NEGERI 1 IMOGIRI
SMA NEGERI 1 PLERET
SMA NEGERI 1 PIYUNGAN
SMA NEGERI 1 DLINGO
SMA NEGERI 1 TEMON
SMA NEGERI 1 LENDAH
SMA NEGERI 1 GIRIMULYO
SMA ANGKASA
SMA GAMA YOGYAKARTA
SMA IMANUEL KALASAN
SMA NEGERI 1 GAMPING
SMA NEGERI 2 SLEMAN
SMA NEGERI 1 TURI
SMA MUHAMMADIYAH 1 SLEMAN
SMA NEGERI 1 NGAGLIK
SMA BUDI MULIA DUA
SMA 1 PLAYEN
SMA 1 PATUK
SMA 1 PANGGANG
SMA 1 TANJUNGSARI
SMA MUHAMMADIYAH WONOSARI
SMA 1 KARANGMOJO
SMA 1 SEMIN
SMA 1 RONGKOP
41.63
41.81
37.48
38.00
36.58
36.76
37.15
42.53
42.72
36.90
42.31
45.67
41.15
36.13
41.52
40.66
44.70
45.73
42.23
38.45
38.49
38.83
36.14
46.15
45.39
115
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SMA IKIP VETERAN III TAMBAKROMO
SMA 1 SEMANU
Jumlah Anggota
Standar Deviasi
41.88
40.48
35
3.3144
116
Download