1 PENDAHULUAN 1.1 Latar Belakang Kebutuhan manusia akan

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang
Kebutuhan manusia akan informasi memacu pesatnya perkembangan
teknologi di bidang informasi. Kemajuan teknologi yang semakin meningkat
didukung dengan sarana dan prasarana yang memadai, membuktikan bahwa kini
informasi telah menjadi kebutuhan yang cukup penting dalam kehidupan manusia.
Teknologi informasi dalam hal ini berfungsi sebagai pendukung untuk mengambil
keputusan yang tepat berdasarkan informasi yang tersedia.
Program Studi Sistem Informasi merupakan salah satu program studi yang
ada pada STIKOM Bali. Kurikulum pada Program Studi Sistem Informasi disusun
sampai dengan 8 semester dengan total sks sebesar 144 sks. Pada semester VI,
mahasiswa Program Studi ini diwajibkan untuk memilih konsentrasi berdasarkan
minat mahasiswa. Masing-masing konsentrasi memilki kompetensi yang berbedabeda. Namun dikarenakan konsentrasi ini beririsan satu sama lain, maka ada
kompetensi yang berada di beberapa konsentrasi.
Kompetensi
adalah
suatu
kemampuan
untuk
melaksanakan
atau
melakukan suatu pekerjaan yang dilandasi atas keterampilan dan pengetahuan
serta didukung oleh sikap kerja yang dituntut oleh pekerjaan tersebut
(Posuma, 2013). Penentuan kompetensi mahasiswa merupakan hal yang penting
karena akan memudahkan mahasiswa untuk memasuki dunia kerja yang sesuai
1
dengan kompetensinya. Mahasiswa akan memiliki landasan untuk bekerja baik
sebagai karyawan ataupun sebagai pengusaha berdasarkan kompetensi yang
dimilikinya. Dengan adanya kompetensi akan berpengaruh positif terhadap
kinerja karyawan pada suatu perusahaan (Posuma, 2013).
Klasterisasi
(clustering)
merupakan
proses
mengelompokkan
atau
menggolongkan obyek berdasarkan informasi yang diperoleh dari data yang
menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan
kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar
kelas/cluster (Kim, 2008). Algoritma klasterisasi (clustering) berusaha untuk
menemukan kelompok komponen secara natural, berdasarkan pada beberapa
kesamaan yang dimiliki.
Implementasi klasterisasi dapat diterapkan pada berbagai bidang sebagai
contoh dalam hal pemasaran, klasterisasi dapat digunakan sebagai metode untuk
mengelompokkan pelanggan yang memiliki kesamaan dalam perilaku keseharian
belanja (Liu, 2008). Penerapan klasterisasi dalam bidang ilmu biologi dapat
dilakukan salah satunya dalam pengelompokan tumbuhan ataupun hewan. Dalam
bidang informatika, teknik klasterisasi sangat banyak digunakan antara lain pada
data mining, information retrieval, pengolahan citra, dan lain sebagainya. Contoh
lainnya juga dalam hal penentuan kompetensi mahasiswa.
Penelitian terdahulu membahas proses klasterisasi data menggunakan
algoritma K-Means dan Algoritma Genetik (Kim, 2008) dimana proses
2
klasterisasi data pada metode K-Means, pembentukan partisi dilakukan
sedemikian rupa sehingga setiap objek berada tepat pada satu partisi. Akan tetapi
pada suatu saat secara alami hal ini sering tidak dapat dilakukan untuk
menempatkan suatu objek tepat pada satu partisi, karena sebenarnya objek
tersebut bisa saja terletak di antara dua atau lebih partisi yang lain. Sehingga perlu
dilakukan klasterisasi data dengan menggunakan fuzzy clustering.
Batas pada cluster dapat bersifat fuzzy maupun crisp, dimana fuzzy artinya
titik data dapat berada pada dua atau lebih kelompok dengan derajat keanggotaan
yang berbeda. Dengan batasan seperti ini dianggap lebih dekat dengan masalah
yang ada di dunia nyata, sehingga kinerja yang lebih baik dapat diharapkan
dibandingkan batasan crisp yang datanya hanya dapat berada pada satu cluster
saja. Inilah yang menjadi alasan untuk menggunakan model fuzzy. karena
pemodelan fuzzy berarti pemodelan yang lebih fleksibel yang keanggotaan berada
dalam interval 0 sampai 1. Alasan lainnya untuk menggunakan model fuzzy adalah
bahwa lebih mudah untuk memecahkan komputasi, karena pada kenyataannya,
model non-fuzzy sering menghasilkan pencarian yang melelahkan di ruang besar,
karena variabel kunci hanya dapat mengambil nilai-nilai 0 dan 1. Sebagai contoh,
pada kasus kompetensi mahasiswa. Seorang mahasiswa mungkin saja
berada/memiliki lebih dari 1 (satu) buah kompetensi.
Peneilitian oleh Syaiful (2015) mendapatkan hasil yang menunjukkan
pengelompokkan dengan Fuzzy C-Means mendapatkan hasil yang lebih baik jika
dibandingkan K-Means karena Fuzzy C-Means menghasilkan rasio Sw/Sb yang
3
lebih kecil dibandingkan metode K-Means. Penelitian yang dilakukan oleh
Widodo (2013), mendapatkan hasil dengan pembandingan berdasarkan fungsi
obyektif, indeks validitas dan waktu komputasinya, didapatkan bahwa metode
Fuzzy C-Means merupakan metode terbaik untuk digunakan dengan jumlah
kelompok yang optimum adalah enam kelompok.
Algoritma Fuzzy C-Means merupakan salah satu teknik pengelompokkan
data dimana tingkat keberadaan data dalam suatu kelas atau cluster ditentukan
oleh derajat keanggotaannya. Pada algoritma Fuzzy C-Means ini setiap objek/data
dapat menjadi anggota dari beberapa cluster. Batasan dalam C-Means adalah
bersifat
soft.
Algoritma ini termasuk dalam metode pengelompokan fuzzy
sehingga data dapat menjadi anggota dari semua kelas atau cluster terbentuk
dengan derajat atau tingkat keanggotaan yang berbeda antara 0 hingga 1 (Sukim,
2011).
Teknik klasterisasi data (clustering) telah dipakai dengan sangat luas
sekarang ini. Namun ternyata pada kenyataannya, masalah-masalah tentang fitur
yang digunakan dalam proses clustering masih sangat diabaikan, sehingga kerap
kali terjadi penggunaan fitur-fitur yang kurang relevan dalam proses klasterisasi
data (clustering) tersebut. Hal ini dapat mengakibatkan hasil klasterisasi juga akan
menjadi kurang optimal.
Pemilihan fitur merupakan kegiatan yang termasuk ke dalam preprocessing
yang bertujuan untuk memilih fitur yang berpengaruh dan mengesampingkan fitur
4
yang tidak berpengaruh dalam suatu kegiatan pemodelan atau penganalisaan data.
Terdapat banyak alternatif yang dapat digunakan dan juga dilakukan proses
mencoba-coba untuk mencari fitur yang cocok (Laetitia, 2001).
Algoritma Genetik telah banyak digunakan dalam penelitian serupa.
Algoritma genetik berhasil dalam memilih dan menemukan fitur genetik dan
faktor lingkungan yang terlibat dalam penyakit multifaktorial seperti obesitas dan
diabetes (Laetitia, 2001). Metode Algoritma Genetik juga digunakan dalam
menyelesaikan masalah variabel yang tidak relevan dalam hal segmentasi
pemasaran (Liu, 2008).
Algoritma Genetik merupakan metode adaptive yang biasa digunakan untuk
memecahkan suatu pencarian nilai dalam sebuah masalah optimasi. Algoritma ini
didasarkan pada proses genetik yang ada dalam makhluk hidup, yaitu
perkembangan generasi dalam sebuah populasi yang alami. Secara lambat laun
mengikuti prinsip seleksi alam dan menurut teori ini, di alam terjadi persaingan
antara individu-individu untuk memperebutkan sumber daya lain yang langka
sehingga makhluk yang kuat mendominasi makhluk yang lemah. Dengan meniru
teori evolusi ini, Algoritma Genetik dapat digunakan untuk mencari solusi
permasalahan-permasalahan yang ada dalam dunia nyata.
Berdasarkan permasalahan yang ada tersebut, maka pada penelitian ini akan
digunakan penggabungan antara Algoritma Genetik dan Fuzzy C-Means dalam
penentuan kompetensi mahasiswa. Algoritma Genetik digunakan dalam
5
menentukan fitur yang valid dan metode Fuzzy C-Means digunakan dalam
melakukan pengelompokkan secara optimal dalam hal penentuan kompetensi
mahasiswa. Sehingga dengan adanya kombinasi antara dua buah algoritma ini,
maka dapat menghasilkan nilai fitness dan tingkat konvergensi yang lebih baik
serta membentuk hasil cluster yang semakin akurat dalam proses klasterisasi
(clustering). Batasan yang digunakan adalah batasan soft, yaitu dengan
menggunakan fuzzy dimana memungkinkan sebuah data berada pada beberapa
cluster yang berbeda.
1.2
Rumusan Masalah
Berdasarkan latar belakang di atas, maka muncul permasalahan yang akan
dibahas pada penelitian ini, yaitu:
1. Bagaimana merancang dan membangun sistem untuk menentukan
kompetensi mahasiswa STIKOM Bali dengan batasan soft menggunakan
Algoritma Genetik dan Fuzzy C-Means.
2. Bagaimana hasil unjuk kerja dari penerapan Algoritma Genetik dan
metode Fuzzy C-Means untuk penentuan kompetensi mahasiwa
STIKOM Bali.
1.3
Tujuan Penelitian
Adapun yang menjadi tujuan dalam penelitian ini adalah:
1. Untuk mendapatkan rancangan dan implementasi sistem dalam
menentukan kompetensi mahasiswa STIKOM Bali dengan batasan soft.
6
2. Untuk mendapatkan hasil pemilihan fitur dengan Algoritma Genetik dan
hasil olahan data mahasiswa dengan metode Fuzzy C-Means .
3. Untuk mendapatkan informasi tentang unjuk kerja dari penerapan
Algoritma Genetik dan metode Fuzzy C-Means untuk penentuan
kompetensi mahasiwa STIKOM Bali.
1.4
Manfaat Penelitian
Manfaat dari penelitian ini dibagi menjadi 2 (dua), yaitu manfaat akademik
dan manfaat praktis sebagai berikut:
1.4.1
Manfaat Akademik
Manfaat akademik dari penelitian ini, yaitu dapat memberikan informasi,
ilmu dan bahan pembanding
untuk penelitian selanjutnya yang berkaitan
dalam penentuan kompetensi mahasiswa. Dapat memberikan informasi, ilmu
dan bahan pembanding untuk penelitian selanjutnya yang berkaitan dalam
bidang Data Mining.
1.4.2
Manfaat Praktis
Manfaat praktis dari penelitian ini, yaitu menghasilkan sistem yang mampu
menentukan kompetensi mahasiswa STIKOM Bali dengan menggabungkan
Algoritma Genetik dan metode Fuzzy C-Means, sehingga mahasiswa
mengetahui kompetensinya untuk diterapkan di dunia kerja nantinya.
7
1.5
Batasan Masalah
Menghindari bahasan yang terlalu luas, maka dibutuhkan batasan masalah
untuk membatasinya. Adapun batasan masalah dalam penelitian ini adalah:
1. Sistem yang dibangun digunakan untuk menentukan kompetensi
mahasiswa.
2. Studi kasus diambil pada Program Studi Sistem Informasi STIKOM Bali
3. Menerapkan Algoritma Genetik dan metode Fuzzy C-Means untuk
menentukan kompetensi mahasiswa.
1.6
Keaslian Penelitian
Penelitian yang dilakukan oleh Laetitia Jourdan, Clarisse Dhaenens, El-
Ghazali Talbi dalam penelitiannya yang berjudul “A Genetic Algorithm for
Feature Selection in Data-Mining for Genetics” menbahas penyelesaian masalah
seleksi fitur dengan menggunakan algoritma genetik (GA) dan menggunakan
algoritma K-Means untuk clustering. Penelitian yang dilakukan oleh Hsiang-Hsi
Liu, Chorng-Shyong Ong dalam penelitiannya yang berjudul “Variable selection
in clustering for marketing segmentation using genetic algorithms” menerangkan
Algoritma genetik (GA) yang digunakan untuk pemilihan variabel dan untuk
menentukan jumlah cluster pada kasus nyata segmentasi pemasaran. Penelitian
yang dilakukan oleh Kyoung-jae Kim dan Hyunchul Ahn dalam “A recommender
system using GA K-Means clustering in an online shopping market” membahas
tentang algoritma clustering Algoritma Genetik dan K-Means pada kasus dunia
nyata untuk segmentasi pasar dalam perdagangan elektronik dan menemukan
bahwa Algoritma Genetik dan K-Means mengakibatkan segmentasi yang lebih
8
baik dari algoritma clustering tradisional K-Means dan SOM (Self Organizing
Map). Penelitian oleh Annas Syaiful Rizal dan R.B Fajriya Hakim melanjutkan
penelitian Sarita Budiyani Purnamasari dkk dengan judul “Metode K-Means
Cluster dan Fuzzy C-Means Cluster (Studi Kasus: Indeks Pembangunan Manusia
di Kawasan Indonesia Timur tahun 2012), mendapatkan hasil yang menunjukkan
pengelompokkan dengan Fuzzy C-Means mendapatkan hasil yang lebih baik jika
dibandingkan K-Means karena Fuzzy C-Means menghasilkan rasio Sw/Sb yang
lebih kecil dibandingkan metode K-Means.
Berdasarkan pada beberapa hasil penelitian yang telah dilakukan
sebelumnya, maka penulis mengusulkan pendekatan baru yaitu algoritma Fuzzy
C-Means yang dikombinasikan dengan Algoritma Genetik untuk menghasilkan
pengelompokan yang optimal dan fitur yang valid pada penentuan kompetensi
mahasiswa. Untuk beberapa penelitian terkait yang menggunakan metode berbeda
penulis rangkum di Bab II pada sub bab state of the art.
9
Download