BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan manusia akan informasi memacu pesatnya perkembangan teknologi di bidang informasi. Kemajuan teknologi yang semakin meningkat didukung dengan sarana dan prasarana yang memadai, membuktikan bahwa kini informasi telah menjadi kebutuhan yang cukup penting dalam kehidupan manusia. Teknologi informasi dalam hal ini berfungsi sebagai pendukung untuk mengambil keputusan yang tepat berdasarkan informasi yang tersedia. Program Studi Sistem Informasi merupakan salah satu program studi yang ada pada STIKOM Bali. Kurikulum pada Program Studi Sistem Informasi disusun sampai dengan 8 semester dengan total sks sebesar 144 sks. Pada semester VI, mahasiswa Program Studi ini diwajibkan untuk memilih konsentrasi berdasarkan minat mahasiswa. Masing-masing konsentrasi memilki kompetensi yang berbedabeda. Namun dikarenakan konsentrasi ini beririsan satu sama lain, maka ada kompetensi yang berada di beberapa konsentrasi. Kompetensi adalah suatu kemampuan untuk melaksanakan atau melakukan suatu pekerjaan yang dilandasi atas keterampilan dan pengetahuan serta didukung oleh sikap kerja yang dituntut oleh pekerjaan tersebut (Posuma, 2013). Penentuan kompetensi mahasiswa merupakan hal yang penting karena akan memudahkan mahasiswa untuk memasuki dunia kerja yang sesuai 1 dengan kompetensinya. Mahasiswa akan memiliki landasan untuk bekerja baik sebagai karyawan ataupun sebagai pengusaha berdasarkan kompetensi yang dimilikinya. Dengan adanya kompetensi akan berpengaruh positif terhadap kinerja karyawan pada suatu perusahaan (Posuma, 2013). Klasterisasi (clustering) merupakan proses mengelompokkan atau menggolongkan obyek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster (Kim, 2008). Algoritma klasterisasi (clustering) berusaha untuk menemukan kelompok komponen secara natural, berdasarkan pada beberapa kesamaan yang dimiliki. Implementasi klasterisasi dapat diterapkan pada berbagai bidang sebagai contoh dalam hal pemasaran, klasterisasi dapat digunakan sebagai metode untuk mengelompokkan pelanggan yang memiliki kesamaan dalam perilaku keseharian belanja (Liu, 2008). Penerapan klasterisasi dalam bidang ilmu biologi dapat dilakukan salah satunya dalam pengelompokan tumbuhan ataupun hewan. Dalam bidang informatika, teknik klasterisasi sangat banyak digunakan antara lain pada data mining, information retrieval, pengolahan citra, dan lain sebagainya. Contoh lainnya juga dalam hal penentuan kompetensi mahasiswa. Penelitian terdahulu membahas proses klasterisasi data menggunakan algoritma K-Means dan Algoritma Genetik (Kim, 2008) dimana proses 2 klasterisasi data pada metode K-Means, pembentukan partisi dilakukan sedemikian rupa sehingga setiap objek berada tepat pada satu partisi. Akan tetapi pada suatu saat secara alami hal ini sering tidak dapat dilakukan untuk menempatkan suatu objek tepat pada satu partisi, karena sebenarnya objek tersebut bisa saja terletak di antara dua atau lebih partisi yang lain. Sehingga perlu dilakukan klasterisasi data dengan menggunakan fuzzy clustering. Batas pada cluster dapat bersifat fuzzy maupun crisp, dimana fuzzy artinya titik data dapat berada pada dua atau lebih kelompok dengan derajat keanggotaan yang berbeda. Dengan batasan seperti ini dianggap lebih dekat dengan masalah yang ada di dunia nyata, sehingga kinerja yang lebih baik dapat diharapkan dibandingkan batasan crisp yang datanya hanya dapat berada pada satu cluster saja. Inilah yang menjadi alasan untuk menggunakan model fuzzy. karena pemodelan fuzzy berarti pemodelan yang lebih fleksibel yang keanggotaan berada dalam interval 0 sampai 1. Alasan lainnya untuk menggunakan model fuzzy adalah bahwa lebih mudah untuk memecahkan komputasi, karena pada kenyataannya, model non-fuzzy sering menghasilkan pencarian yang melelahkan di ruang besar, karena variabel kunci hanya dapat mengambil nilai-nilai 0 dan 1. Sebagai contoh, pada kasus kompetensi mahasiswa. Seorang mahasiswa mungkin saja berada/memiliki lebih dari 1 (satu) buah kompetensi. Peneilitian oleh Syaiful (2015) mendapatkan hasil yang menunjukkan pengelompokkan dengan Fuzzy C-Means mendapatkan hasil yang lebih baik jika dibandingkan K-Means karena Fuzzy C-Means menghasilkan rasio Sw/Sb yang 3 lebih kecil dibandingkan metode K-Means. Penelitian yang dilakukan oleh Widodo (2013), mendapatkan hasil dengan pembandingan berdasarkan fungsi obyektif, indeks validitas dan waktu komputasinya, didapatkan bahwa metode Fuzzy C-Means merupakan metode terbaik untuk digunakan dengan jumlah kelompok yang optimum adalah enam kelompok. Algoritma Fuzzy C-Means merupakan salah satu teknik pengelompokkan data dimana tingkat keberadaan data dalam suatu kelas atau cluster ditentukan oleh derajat keanggotaannya. Pada algoritma Fuzzy C-Means ini setiap objek/data dapat menjadi anggota dari beberapa cluster. Batasan dalam C-Means adalah bersifat soft. Algoritma ini termasuk dalam metode pengelompokan fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster terbentuk dengan derajat atau tingkat keanggotaan yang berbeda antara 0 hingga 1 (Sukim, 2011). Teknik klasterisasi data (clustering) telah dipakai dengan sangat luas sekarang ini. Namun ternyata pada kenyataannya, masalah-masalah tentang fitur yang digunakan dalam proses clustering masih sangat diabaikan, sehingga kerap kali terjadi penggunaan fitur-fitur yang kurang relevan dalam proses klasterisasi data (clustering) tersebut. Hal ini dapat mengakibatkan hasil klasterisasi juga akan menjadi kurang optimal. Pemilihan fitur merupakan kegiatan yang termasuk ke dalam preprocessing yang bertujuan untuk memilih fitur yang berpengaruh dan mengesampingkan fitur 4 yang tidak berpengaruh dalam suatu kegiatan pemodelan atau penganalisaan data. Terdapat banyak alternatif yang dapat digunakan dan juga dilakukan proses mencoba-coba untuk mencari fitur yang cocok (Laetitia, 2001). Algoritma Genetik telah banyak digunakan dalam penelitian serupa. Algoritma genetik berhasil dalam memilih dan menemukan fitur genetik dan faktor lingkungan yang terlibat dalam penyakit multifaktorial seperti obesitas dan diabetes (Laetitia, 2001). Metode Algoritma Genetik juga digunakan dalam menyelesaikan masalah variabel yang tidak relevan dalam hal segmentasi pemasaran (Liu, 2008). Algoritma Genetik merupakan metode adaptive yang biasa digunakan untuk memecahkan suatu pencarian nilai dalam sebuah masalah optimasi. Algoritma ini didasarkan pada proses genetik yang ada dalam makhluk hidup, yaitu perkembangan generasi dalam sebuah populasi yang alami. Secara lambat laun mengikuti prinsip seleksi alam dan menurut teori ini, di alam terjadi persaingan antara individu-individu untuk memperebutkan sumber daya lain yang langka sehingga makhluk yang kuat mendominasi makhluk yang lemah. Dengan meniru teori evolusi ini, Algoritma Genetik dapat digunakan untuk mencari solusi permasalahan-permasalahan yang ada dalam dunia nyata. Berdasarkan permasalahan yang ada tersebut, maka pada penelitian ini akan digunakan penggabungan antara Algoritma Genetik dan Fuzzy C-Means dalam penentuan kompetensi mahasiswa. Algoritma Genetik digunakan dalam 5 menentukan fitur yang valid dan metode Fuzzy C-Means digunakan dalam melakukan pengelompokkan secara optimal dalam hal penentuan kompetensi mahasiswa. Sehingga dengan adanya kombinasi antara dua buah algoritma ini, maka dapat menghasilkan nilai fitness dan tingkat konvergensi yang lebih baik serta membentuk hasil cluster yang semakin akurat dalam proses klasterisasi (clustering). Batasan yang digunakan adalah batasan soft, yaitu dengan menggunakan fuzzy dimana memungkinkan sebuah data berada pada beberapa cluster yang berbeda. 1.2 Rumusan Masalah Berdasarkan latar belakang di atas, maka muncul permasalahan yang akan dibahas pada penelitian ini, yaitu: 1. Bagaimana merancang dan membangun sistem untuk menentukan kompetensi mahasiswa STIKOM Bali dengan batasan soft menggunakan Algoritma Genetik dan Fuzzy C-Means. 2. Bagaimana hasil unjuk kerja dari penerapan Algoritma Genetik dan metode Fuzzy C-Means untuk penentuan kompetensi mahasiwa STIKOM Bali. 1.3 Tujuan Penelitian Adapun yang menjadi tujuan dalam penelitian ini adalah: 1. Untuk mendapatkan rancangan dan implementasi sistem dalam menentukan kompetensi mahasiswa STIKOM Bali dengan batasan soft. 6 2. Untuk mendapatkan hasil pemilihan fitur dengan Algoritma Genetik dan hasil olahan data mahasiswa dengan metode Fuzzy C-Means . 3. Untuk mendapatkan informasi tentang unjuk kerja dari penerapan Algoritma Genetik dan metode Fuzzy C-Means untuk penentuan kompetensi mahasiwa STIKOM Bali. 1.4 Manfaat Penelitian Manfaat dari penelitian ini dibagi menjadi 2 (dua), yaitu manfaat akademik dan manfaat praktis sebagai berikut: 1.4.1 Manfaat Akademik Manfaat akademik dari penelitian ini, yaitu dapat memberikan informasi, ilmu dan bahan pembanding untuk penelitian selanjutnya yang berkaitan dalam penentuan kompetensi mahasiswa. Dapat memberikan informasi, ilmu dan bahan pembanding untuk penelitian selanjutnya yang berkaitan dalam bidang Data Mining. 1.4.2 Manfaat Praktis Manfaat praktis dari penelitian ini, yaitu menghasilkan sistem yang mampu menentukan kompetensi mahasiswa STIKOM Bali dengan menggabungkan Algoritma Genetik dan metode Fuzzy C-Means, sehingga mahasiswa mengetahui kompetensinya untuk diterapkan di dunia kerja nantinya. 7 1.5 Batasan Masalah Menghindari bahasan yang terlalu luas, maka dibutuhkan batasan masalah untuk membatasinya. Adapun batasan masalah dalam penelitian ini adalah: 1. Sistem yang dibangun digunakan untuk menentukan kompetensi mahasiswa. 2. Studi kasus diambil pada Program Studi Sistem Informasi STIKOM Bali 3. Menerapkan Algoritma Genetik dan metode Fuzzy C-Means untuk menentukan kompetensi mahasiswa. 1.6 Keaslian Penelitian Penelitian yang dilakukan oleh Laetitia Jourdan, Clarisse Dhaenens, El- Ghazali Talbi dalam penelitiannya yang berjudul “A Genetic Algorithm for Feature Selection in Data-Mining for Genetics” menbahas penyelesaian masalah seleksi fitur dengan menggunakan algoritma genetik (GA) dan menggunakan algoritma K-Means untuk clustering. Penelitian yang dilakukan oleh Hsiang-Hsi Liu, Chorng-Shyong Ong dalam penelitiannya yang berjudul “Variable selection in clustering for marketing segmentation using genetic algorithms” menerangkan Algoritma genetik (GA) yang digunakan untuk pemilihan variabel dan untuk menentukan jumlah cluster pada kasus nyata segmentasi pemasaran. Penelitian yang dilakukan oleh Kyoung-jae Kim dan Hyunchul Ahn dalam “A recommender system using GA K-Means clustering in an online shopping market” membahas tentang algoritma clustering Algoritma Genetik dan K-Means pada kasus dunia nyata untuk segmentasi pasar dalam perdagangan elektronik dan menemukan bahwa Algoritma Genetik dan K-Means mengakibatkan segmentasi yang lebih 8 baik dari algoritma clustering tradisional K-Means dan SOM (Self Organizing Map). Penelitian oleh Annas Syaiful Rizal dan R.B Fajriya Hakim melanjutkan penelitian Sarita Budiyani Purnamasari dkk dengan judul “Metode K-Means Cluster dan Fuzzy C-Means Cluster (Studi Kasus: Indeks Pembangunan Manusia di Kawasan Indonesia Timur tahun 2012), mendapatkan hasil yang menunjukkan pengelompokkan dengan Fuzzy C-Means mendapatkan hasil yang lebih baik jika dibandingkan K-Means karena Fuzzy C-Means menghasilkan rasio Sw/Sb yang lebih kecil dibandingkan metode K-Means. Berdasarkan pada beberapa hasil penelitian yang telah dilakukan sebelumnya, maka penulis mengusulkan pendekatan baru yaitu algoritma Fuzzy C-Means yang dikombinasikan dengan Algoritma Genetik untuk menghasilkan pengelompokan yang optimal dan fitur yang valid pada penentuan kompetensi mahasiswa. Untuk beberapa penelitian terkait yang menggunakan metode berbeda penulis rangkum di Bab II pada sub bab state of the art. 9