7 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan (SPK) Konsep sistem pendukung keputusan (SPK) pertama kali di ungkapkan pada awal tahun 1970 oleh Michael S. Scott Morton dengan istilah management decision system. Morton mendefenisikan SPK sebagai “Sistem berbasis komputer interaktif, yang membantu para pengambil keputusan untuk menggunakan data dan berbagai model untuk membantu memecahkan masalah-masalah yang tidak terstruktur”. SPK merupakan sistem informasi interaktif yang menyediakan informasi, pemodelan dan pemanipulasian data. Sistem digunakan untuk membantu pengambilan keputusan dalam situasi yang semi terstruktur dan situasi yang tidak terstruktur, dimana tidak seorangpun tahu secara pasti bagaimana keputusan seharusnya dibuat. SPK biasanya dibangun untuk mendukung solusi atas suatu masalah atau untuk mengevaluasi suatu peluang. Aplikasi SPK menggunakan CBIS (Computer Based Information System) yang fleksibel, interaktif, dan dapat di adaptasi, yang di kembangkan untuk mendukung solusi atas masalah manajemen spesifik yang tidak terstruktur. Aplikasi SPK menggunakan data, memberikan antarmuka pengguna yang mudah dan dapat menggabungkan pemikiran pengambil keputusan. SPK lebih ditujukan untuk mendukung manajemen dalam melakukan pekerjaan yang bersifat analitis dalam situasi yang kurang terstruktur dan dengan kriteria yang kurang jelas. SPK tidak dimaksudkan untuk mengotomatisasikan pengambilan keputusan tetapi memberikan perangkat interaktif yang memungkinkan pengambil keputusan untuk melakukan berbagai analisis menggunakan model-model yang tersedia. 2.1.1 Nilai Guna dan Karakteristik Sistem Pendukung Keputusan Pada dasarnya SPK ini merupakan pengembangan lebih lanjut dari Sistem Informasi Manajemen Terkomputerisasi (Computerized Management Information system), yang dirancang sedemikian rupa sehingga bersifat interaktif dengan pemakainya. Sifat interaktif ini berguna untuk memudahkan integrasi antara berbagai komponen dalam proses pengambilan keputusan seperti prosedur, kebijakan, teknik analisis, serta Universitas Sumatera Utara 8 pengalaman dan wawasan manajerial guna membentuk suatu kerangka keputusan yang bersifat fleksibel. Sifat interaktif tersebut memiliki tujuan SPK (Turban, 2005): 1. Membantu dalam pengambilan keputusan atas masalah yang terstruktur. 2. Memberikan dukungan atas pertimbangan manajer dan bukan untuk menggantikan fungsi manajer. 3. Meningkatkan efektivitas keputusan yang diambil lebih daripada perbaikan efisiensinya. 4. Kecepatan komputasi, Komputer memungkinkan para pengambil keputusan untuk melakukan banyak komputasi secara cepat dengan biaya yang rendah. 5. Peningkatan produktivitas. 6. Dukungan kualitas. 7. Berdaya saing. 8. Mengatasi keterbatasan kognitif dalam pemrosesan dan penyimpanan. Aplikasi SPK yang dikembangkan untuk mendukung solusi atas masalah manajemen spesifik yang tidak terstruktur memiliki ciri-ciri yaitu (Suryadi e.t al, 1998): 1. SPK ditujukan untuk membantu keputusan-keputusan yang kurang terstruktur. 2. SPK merupakan gabungan antara kumpulan model kualitatif dan kumpulan data. 3. SPK bersifat luwes dan dapat menyelesaikan dengan perubahanperubahan yang terjadi. Berdasarkan ciri-ciri di atas, maka karakteristik yang membedakan SPK dengan sistem informasi lainnya yaitu : 1. SPK dirancang untuk membantu pengambilan keputusan dalam memecahkan masalah yang sifatnya semi terstruktur atau tidak terstruktur dengan menambahkan kebijaksanaan manusia dan informasi komputerisasi. Universitas Sumatera Utara 9 2. Pada proses pengolahannya, SPK mengkombinasikan penggunaan model model analisis dengan teknik pemasukan data konvensional serta fungsi-fungsi pencari atau pemerikasa informasi. 3. SPK dapat digunakan atau dioperasikan dengan mudah oleh orangorang yang tidak memiliki dasar kemampuan pengoperasian komputer yang tinggi, pendekatan yang digunakan biasanya model interaktif. 4. SPK dirancang pada aspek fleksibilitas serta kemampuan adaptasi yang tinggi, sehingga mudah disesuaikan dengan berbagai perubahan lingkungan yang terjadi dan kebutuhan pengguna. Dalam membangun suatu SPK diperoleh beberapa manfaat atau keuntungan bagi pemakainya. Keuntungannya adalah sebagai berikut : 1. SPK memperluas kemampuan pengambil keputusan dalam memproses data/informasi bagi pemakainya. 2. SPK membantu pengambil keputusan dalam hal penghematan waktu yang dibutuhkan untuk memecahkan masalah terutama bagi masalah yang sangat kompleks dan tidak terstruktur. 3. Sistem pendukung keputusan dapat menghasilkan solusi dengan lebih cepat serta hasilnya dapat di andalkan. 4. Suatu SPK mungkin saja tidak mampu memecahkan masalah yang dihadapi oleh pengambil keputusan, namun dapat menjadi stimulan bagi pengambil keputusan dalam memahami persoalannya. Hal ini dikarenakan SPK mampu menyajikan berbagai alternative. 2.1.2 Komponen-Komponen Sistem Pendukung Keputusan SPK terdiri dari tiga subsistem utama yaitu sebagai berikut : 1. Subsistem Manajemen Database (Database Management Subsystem) 2. Subsistem Manajemen Basis Model (Model Base Management Subsistem) 3. Subsistem Perangkat Lunak Penyelenggara Dialog (Dialog Generation and Management Software Subsystem) Universitas Sumatera Utara 10 2.1.3 Subsistem Manajemen Database Ada beberapa perbedaan antara database untuk SPK dan non-SPK. Sumber data SPK lebih kaya dari pada non-SPK dimana data harus berasal dari luar dan dari dalam karena proses pengambilan keputusan. Perbedaan lain adalah proses pengambilan dan ekstraksi data dari sumber data yang sangat besar. SPK membutuhkan proses ekstraksi dan DBMS yang pengelolaannya cukup fleksibel untuk memungkinkan penambahan dan pengurangan secara cepat. Dalam hal ini, kemampuan yang dibutuhkan dari manajemen database adalah: 1. Kemampuan untuk mengkombinasikan berbagai variasi data melalui pengambilan dan ekstraksi data. 2. Kemampuan untuk menambahkan sumber data secara cepat dan mudah. 3. Kemampuan untuk menggambarkan struktur data logikal sesuai dengan pengertian pemakai sehingga pemakai mengetahui apa yang tersedia dan dapat menentukan kebutuhan penambahan dan pengurangan. 4. Kemampuan untuk menangani data sehingga pemakai dapat mencoba berbagai alternatif. 5. Kemampuan untuk mengelola berbagai variasi data. 2.1.4 Subsistem Manajemen Basis Model Salah satu keunggulan SPK adalah kemampuan untuk mengintegrasikan akses data dan model-model keputusan. Hal ini dapat dilakukan dengan menambahkan modelmodel keputusan kedalam sistem informasi dan komunikasi diantara model-model. Karakteristik ini menyatukan kekuatan pencarian dan pelaporan data. Salah satu persoalan yang berkaitan dengan model adalah bahwa penyusunan model sering terikat pada struktur model yang mengasumsikan adanya masukan yang benar dan cara keluaran yang tepat. Sementara itu, model cenderung tidak mencukupi karena adanya kesulitan dalam mengembangkan model yang terintegrasi untuk menangani sekumpulan keputusan yang saling berkaitan. Cara untuk menangani persoalan ini dengan menggunakan koleksi berbagai model yang terpisah, dimana setiap model digunakan untuk menangani bagian yang berbeda dari masalah yang dihadapi. Komunikasi antara berbagai model digunakan untuk menangani bagian yang berbeda dari masalah tersebut. Komunikasi antara berbagai model yang saling Universitas Sumatera Utara 11 berhubungan diserahkan kepada pengambil keputusan sebagai proses intelektual dan manual. Salah satu pandangan yang lebih optimis diantaranya bisa menambah modelmodel kedalam sistem informasi dengan database sebagai mekanisme integrasi dan komunikasi. Kemampuan yang dimiliki subsistem basis model meliputi hal-hal sebagai berikut : 1. Kemampuan untuk menciptakan model-model baru secara cepat dan mudah. 2. Kemampuan untuk mengakses dan mengintegrasikan model-model keputusan. 3. Kemampuan untuk mengelola basis model dengan fungsi manajemen yang analog dan manajemen database (seperti mekanisme untuk menyimpan, membuat dialog, menghubungkan, dan mengakses model). 2.1.5 Subsistem Perangkat Lunak Penyelenggara Dialog Fleksibilitas dan kekuatan karakteristik SPK timbul dari kemampuan interaksi antara sistem dan pemakai yang dinamakan subsistem dialog. Bennet mendefinisikan pemakai, terminal, dan sistem perangkat lunak sebagai komponen-komponen dari sistem dialog sehingga subsistem dialog terbagi menjadi tiga bagian yaitu: 1. Bahasa aksi, meliputi apa yang dapat digunakan oleh pemakai dalam berkomunikasi dengan sistem. Hal ini meliputi pemilihan-pemilihan seperti papan ketik (keyboard), panel-panel sentuh, joystick, perintah suara dan sebagainya. 2. Bahasa tampilan dan presentasi, meliputi apa yang harus diketahui oleh pemakai. Bahasa tampilan meliputi pilihan-pilihan seperti printer, tampilan layar, grafik, warna, plotter, keluaran suara, dan sebagainya 3. Basis pengetahuan, meliputi apa yang harus diketahui oleh pemakai agar pemakaian sistem bisa efektif. Basis pengetahuan bisa berada dalam pikiran pemakai, pada kartu referensi atau petunjuk dalam buku manual, dan sebagainya. Kombinasi dari kemampuan-kemampuan di atas terdiri dari apa yang disebut gaya dialog misalnya pendekatan tanya jawab, bahasa perintah, menu-menu, dan Universitas Sumatera Utara 12 mengisi tempat kosong. Kemampuan yang harus dimiliki oleh SPK untuk mendukung dialog pemakai atau sistem adalah sebagai berikut : 1. Kemampuan untuk menangani berbagai variasi dialog, bahkan untuk mengkombinasikan berbagai gaya dialog sesuai dengan pilihan pemakai. 2. Kemampuan untuk mengakomodasikan tindakan pemakai dengan berbagai peralatan masukan. 3. Kemampuan untuk menampilkan data dengan berbagai variasi format dan peralatan keluaran. 4. Kemampuan untuk memberikan dukungan yang fleksibel untuk mengetahui. 5. Basis pengetahuan pemakai. 2.2 Beasiswa Universitas Sumatera Utara Beasiswa dapat dikatakan sebagai pembiayaan yang tidak bersumber dari pembiayaan sendiri atau orang tua, akan tetapi diberikan oleh pemerintah, perusahaan swasta, kedutaan, universitas, serta lembaga pendidikan atau peneliti, dan juga dari kantor tempat bekerja yang karena prestasi seorang karyawan dapat diberikan kesempatan untuk meningkatkan kapasitas sumberdaya manusianya melalui pendidikan. Biaya tersebut diberikan kepada yang berhak menerima, terutama berdasarkan klasifikasi, kualitas, dan kompetensi si penerima beasiswa (Gafur, 2008). Pemberian beasiswa kepada mahasiswa di perguruan tinggi merupakan wujud dari partisipasi masyarakat, instansi, pemerintah, perusahaan-perusahaan swasta dalam membangun bangsa khususnya dalam bidang pendidikan. Pada Universitas Sumatera Utara terdapat beberapa instansi pemerintah (BUMN) dan perusahaan swasta yang menyalurkan bantuan beasiswa kepada mahasiswa. Ada beberapa program beasiswa yang ditawarkan di Unniversitas Sumatera Utara. Beasiswa diberikan kepada mahasiswa yang berprestasi dan memerlukan bantuan ekonomi sehingga mahasiswa tidak kesulitan dalam menyelesaikan kuliahnya. Banyak mahasiswa yang mendapat beasiswa dari berbagai macam beasiswa yang di salurkan melalui Biro Administrasi Kemahasiswaan Universitas Sumatera Utara. Oleh karena itu beasiswa harus diberikan kepada mahasiswa yang berhak memperoleh beasiswa dan memang membutuhkan beasiswa untuk menyelesaikan kuliahnya. Universitas Sumatera Utara 13 2.2.1 Persyaratan Beasiswa di Universitas Sumatera Utara Untuk dapat memproleh beasiswa harus memenuhi syarat sebagai berikut : Adapun syarat-syarat umum untuk mendapatkan beasiswa adalah : 1. Terdaftar sebagai mahasiswa Universitas Sumatera Utara. 2. Berprestasi/berasal dari keluarga yang ekonominya kurang mampu. 3. Tidak menerima beasiswa dari sumber lain. 4. Belum bekerja dan belum berkeluarga 5. Aktif dalam mengikuti kegiatan kemahasiswaan (ekstrakurikuler). 6. Tidak akan mengambil PKA (Penundaan Kegiatan Akademik) selama terdaftar sebagai penerima beasiswa. 7. Patuh pada peraturan yang ditetapkan oleh Universitas/Fakultas 8. Mempunyai No. Rekening pada PT.Bank Negara Indonesia Tbk Cabang USU 2.2.2 Syarat Khusus Persyaratan khusus penerima beasiswa pada Universitas Sumatera Utara disesuaikan dengan jenis beasiswa. Jenis beasiswa pada Universitas Sumatera Utara berjumlah 18 yang ditawarkan untuk mahasiswa dan dapat diikuti dengan persyaratan khusus sebagai berikut : Tabel 2.1 Jenis dan Syarat Besiswa No Jenis Beasiswa Persyaratan Khusus Beasiswa 1. Beasiswa Peningkatan Prestasi Akademik (PPA) 1. Terdaftar sebagai mahasiswa Program S1 (Mahasiswa baru dan lama). 2. Indeks Prestasi/Indeks Prestasi Kumulatif (IP/IPK) minimal 3.00 untuk mahasiswa lama. 3. Nilai rata-rata STTB minimal 6.50 untuk mahasiswa baru. 2. Beasiswa Bantuan Mahasiswa (BBM) Belajar 1. Terdaftar sebagai mahasiswa Program Diploma dan S1. Universitas Sumatera Utara 14 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa Persyaratan Khusus Beasiswa 2. Minimal telah duduk di semester II (dua). 3. Indeks Prestasi Kumulatif (IPK) minimal 2.50 3. Beasiswa BANK INDONESIA (BI) 1. Terdaftar sebagai mahasiswa Program S1. 2. Minimal telah duduk di semester V (lima) dan telah menempuh 90 SKS 3. Indeks Prestasi Kumulatif minimal 3.00 4. Usia Maksimal 25 tahun. 4. Beasiswa Technological and Professional Skills Development Sector Project (TPSDP) 1. Terdaftar sebagai mahasiswa Program S1. o Fakultas Teknik (Program studi Kimia, Sipil, Elektro dan Mesin). o Fakultas MIPA (Program studi Biologi, Kimia, Matematika, Fisika dan Informatika/Ilmu Komputer. o Fakultas Pertanian (Program studi Teknik Pertanian, Pemuliaan Tanaman, Hortikultura, Teknologi Pengelolaan hasil Perikanan, Teknologi pengelolaan hasil Ternak, Pemanfaatan Sumber Daya Kelautan). 2. Penghasilan perbulan orangtua <Rp.2.000.000 (dua juta rupiah). Universitas Sumatera Utara 15 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa Persyaratan Khusus Beasiswa 3. Mengisi formulir pengajuan beasiswa. 5. Beasiswa Yayasan Supersemar 1. Terdaftar sebagai mahasiswa Program S1 2. Minimal telah duduk di semester III (tiga) 3. Indeks Prestasi Kumulatif (IPK) minimal 2.50 4. Mengisi formulir beasiswa Yayasan Supersemar serta di tandatangani oleh Pudek III Fakultas dan Pimpinan Perguruan Tinggi bidang Kemahasiswaan 6. Beasiswa Yayasan Toyota Astra 1. Terdaftar sebagai mahasiswa Program S1 o Fakultas Teknik o Fakultas Pertanian o Fakultas MIPA 2. Berada di semester V (lima) atau VII (tujuh) 3. Indeks Prestasi Kumulatif (IPK) minimal 2.80 4. Mengisi formulir pendaftaran beasiswa Yayasan Astra serta di tandatangani oleh Pudek III Fakultas dan Pimpinan Perguruan Tinggi bidang Kemahasiswaan 5. Menyerahkan pasfhoto ukuran 3 x 4 sebanyak 3 (tiga) lembar dan Surat Keterangan Dokter. Universitas Sumatera Utara 16 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa 7. Beasiswa Yayasan Jepang Persyaratan Khusus Beasiswa 1. Terdaftar sebagai mahasiswa Program S1. 2. Minimal telah duduk di semester VII (tujuh). 3. Indeks Prestasi Kumulatif (IPK) minimal 2.76 4. Memiliki surat keterangan sehat dari Dokter 5. Mengisi Formulir riwayat hidup. 8. Beasiswa PT.DJARUM 1. Terdaftar sebagai mahasiswa Program S1 2. Berada di semester V (lima) 3. Indeks Prestasi Kumulatif (IPK) minimal 3.00 4. Mengikuti Psikotest yang diadakan oleh PT.Djarum 9. Beasiswa TANOTO FOUNDATION 1. Terdaftar sebagai mahasiswa Program S1 2. Usia maksimum 21 tahun 3. Indeks Prestasi Kumulatif (IPK) minimal 3.00 4. Mengisi Formulir Pendaftaran Beasiswa Tanoto Foundation 5. Mengikuti Psikotest yang diadakan oleh Tanoto Foundation 10. Beasiswa TJIPTA SARJANA 1. Terdaftar sebagai mahasiswa baru USU Program S1 2. Berprestasi di sekolah (SMA) 3. Mengisi formulir pendaftaran Program Tjipta Sarjana. Universitas Sumatera Utara 17 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa Persyaratan Khusus Beasiswa 4. Menyerahkan 2 (dua) lembar pasfhoto berwarna 4 x 6 5. Mengikuti wawancara yang diadakan oleh Eka Tjipta Foundation. 11. Beasiswa Konsorsium Pendidikan BPMIGAS -KKKS (Badan Pelaksanaan Minyak dan Gas – Kontraktor Kontrak Kerja Sama) 1. Terdaftar sebagai mahasiswa Program Diploma (D3) dan S1. 2. Minimal telah duduk di semester III (tiga). 3. Indeks Prestasi Kumulatif (IPK) minimal 2.75 4. Telah menyelesaikan 25% dari jumlah kredit yang disyaratkan untuk program S1 atau D3 yang diambil. 5. Berusia maksimal 25 tahun. 6. Menyerahkan 2 (dua) lembar pasfhoto hitam putih 4 x 6 7. Mengisi formulir khusus yangdiberikan oleh pihak Konsorsium Pendidikan BPMIGAS – KKKS. 12. Beasiswa Society of Petroleum (SPE) 1. Terdaftar sebagai mahasiswa Program S1 Fakultas Teknik, Jurusan Teknik Kimia/Mesin/Elektro. 2. Sedang menjalani semester III (tiga) (minimum) hingga semester VII (tujuh) (maksimum). 3. Indeks Prestasi Kumulatif (IPK) minimal > 3.00 4. Menyerahkan fotokopi Kartu Penduduk. Universitas Sumatera Utara 18 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa 13. Beasiswa Yayasan Salim Persyaratan Khusus Beasiswa 1. Terdaftar sebagai mahasiswa Program S1 2. Mahasiswa semester I (satu) s/d VII (tujuh) 3. Nilai minimum: o Untuk mahasiswa semester I nilai rata-rata ujian Nasional dan Rapor kelas terakhir di SMU sederajat minimum 7.6 o Untuk mahasiswa semester III ke atas, rata-rata Indeks Prestasi Semester (IPS) dua semester terakhir minimum 2.80, bukan Indeks Prestasi Kumulatif (IPK). 4. Mengisi formulir permohonan beasiswa Yayasan Salim. 5. Menyerahkan fotokopi Kartu Penduduk dan pasfhoto 4 x 6 sebanyak 2 (dua) lemmbar. 14. Beasiswa PT. Bank Rakyat Indonesia (BRI) Persero Tbk 1. Terdaftar sebagai mahasiswa Program S1 2. Indeks Prestasi Kumulatif (IPK) minimal 2.50 3. Minimal telah duduk di semester III (tiga) 4. Usia tidak lebih dari 23 tahun pada saat mengajukan permohonan 15. Beasiswa PT. Gudang Garam 1. Terdaftar sebagai mahasiswa Program S1 2. Minimal telah duduk di semester III (tiga). Universitas Sumatera Utara 19 Tabel 2.1 Jenis dan Syarat Beasiswa (Lanjutan) No Jenis Beasiswa Persyaratan Khusus Beasiswa 3. Indeks Prestasi Kumulatif (IPK) minimal 2.50 16. Beasiswa YKPP (Yayasan 1. M ahasiswa Program S1. Kesejahteraan Pegawai 2. Telah duduk di semester II (dua) dan Pertamina) IV (empat). 3. Indeks Prestasi Kumulatif (IPK) minimal 3.00 4. Mengikuti wawancara yang diadakan oleh YKPP. 17. Beasiswa PT. SUN LIFE FINANCIAL INDONESIA 1. Terdaftar sebagai mahasiswa Fak. MIPA Jurusan Matematika, Fak. ISIP, dan Fak. Kesehatan Masyarakat USU. 2. Telah duduk di semester IV (empat). 3. Indeks Prestasi Kumulatif (IPK) minimal 3.50 18. Beasiswa Peningkatan Prestasi Ekstrakurikuler (PPE) 1. Terdaftar sebagai mahasiswa program Diploma dan S1. 2. Indeks Prestasi Kumulatif (IPK) minimal 2.50 3. Mempunyai prestasi tinggi atau baik sesuai dengan kegiatannya yang dibuktikan dengan Sertifikat atau Piagam Penghargaan yang diterbitkan oleh Panitia Penyelenggara atau pihak yang berwenang 4. Bukti Prestasi yang diusulkan mahasiswa yangbersangkutan sudah menjadi mahasiswa USU dan tidak boleh lebih 3 (tiga) tahun sejak bulan Januari pada tahun mengusulkan. Universitas Sumatera Utara 20 2.2.3 Prosedur Untuk Mendapatkan Beasiswa 1. Mahasiswa harus mengajukan permohonan kepada Rektor Universitas Sumatera Utara melalui Pembantu Dekan III masing-masing, dan dilampiri dengan: 2. Rekomendasi dari Pembantu Dekan III. 3. Transkip Nilai dan fotokopi Kartu Hasil Ujian (KHS) yang di legalisir untuk mahasiswa lama atau STTB SMU sederajat yang dilegalisir untuk mahasiswa baru. 4. Fotokopi Kartu Keluarga (KK) yang dilegalisir. 5. Surat Keterangan Penghasilan Orang tua yang disahkan oleh pejabat yang berwenang. 6. Surat pernyataan yang berisi: o Belum memproleh beasiswa lain dan tidak sedang dalam proses pengajuan beasiswa lain. o Belum bekerja dan berkeluarga. o Tidak akan mengambil penundaan kegiatan akademik. 7. Fotokopi NO. Rekening yang bersangkutan pada PT. Bank BNI Persero Tbk cabang USU. 8. Fotokopi Kartu Tanda Mahasiswa (KTM). 9. Fotokopi pembayaran SPP yang terakhir. 10. Surat keterangan berkelakuan baik dari pimpinan Fakultas/Prodi. 2.3 Data Mining Data mining adalah proses yang mempekerjakan suatu atau lebih teknik pembelajaran computer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Knowledge Discoveri in Database (KDD) adalah penerapan metode saintifik pada data mining. Operasi data mining menurut sifatnya dibedakan menjadi dua yaitu bersifat prediksi (prediction driven) untuk menjawab pertanyaan “apa ?” dan sesuatu yang bersifat remang-remang atau transparan. Penemuan (discovery driven) bersipat transparan dan untuk menjawab pertanyaan “mengapa ?”. Universitas Sumatera Utara 21 Tahapan proses dalam penggunaan data mining yang merupakan proses knowledge Discovery in Database (KDD) seperti yang terllihat pada gambar 2.1 dapat di uraikan sebagai berikut (Hermawati, 2009) : 1. Memahami domain aplikasi untuk mengetahui dan menggali pengetahuan awal serta apa sasaran pengguna. 2. Membuat target data-set yang meliputi pemililhan data dan fokus pada sub-set data. 3. Pembersihan dan transformasi data meliputi eliminasi derau, outliers, missing value serta pemilihan fitur dan reduksi dimensi. 4. Penggunaan algoritma data mining yang terdiri dari asosiasi, sekuensial, klasifikasi, klasterisasi, danlainnya. 5. Interpretasi, evaluasi dan visualisasi pola untuk melihatapakah ada sesuatu yang baru dan menarik dan dilakukan iterasi jika diperlukan. Interpretation/ Evaluation Data Mining Knowledge Transformation Preprocessing selection … … … .. … … … .. Data Target Data Preprocessed Data Patterns Transformed Data Gambar 2.1 Proses Knowledge Discovery in Database (KDD) (Sumber : Hermawati, 2009) Data mining berpotensi tinggi jika data yang tepat di kumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Data warehouse baik untuk mengintegrasikan keseluruhan data sebuah perusahaan, tanpa memperhatikan lokasi, format atau kebutuhan komunikasi yang memungkinkan untuk memasukkan informasi tambahan atau ahli. Menghubungkan secara logis antara apa yang dilihat oleh manajer dalam aplikasi sistem informasi pendukung keputusan dan aktifitas operasional Universitas Sumatera Utara 22 perusahaan. Data warehouse menyediakan data yang siap di transformasi yang disimpulkan sedemikian hingga membuat sesuai untuk aplikasi DSS dan SIM yang efisien (Hermawati, 2009). 2.3.1 Teknik Data Mining Beberapa teknik dan sifat data mining adalah Classification yaitu menentukan sebuah record data baru ke salah satu dari beberapa kategori atau klas. Regresi yang memprediksi nilai dari suatu variable kontinu yang diberikan berdasarkan nilai dari variable yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau non linier. Clustering mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemet-element dari suatu kelompok tertentu memuliki set property yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster hingga titiktitik data dalam satu klaster mempunyai similaritas yang lebih besar dan titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil. Ukuran similaritas yang digunakan adalah Euclidean Distance jika atributnya kontinu dalam permasalahan lain dengan ukuran tertentu. Kaidah asosiasi (Association Rules) mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-occur) dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Pencarian pola sekuensial (sequence mining) mencari sejumlah event yang secara umum terjadi bersama-sama. Jika diberikan sekumpulan objek, dengan masing-masing objek dihubungkan dengan waktu kejadiannya maka didapatkan pola yang akan memprediksi ketergantungan sekuensial (sequential dependencis) yang kuat di antara kejadian-kejadian yang beerbeda (Hermawati, 2009). (A B) (C) (D E) Pola-pola sekuensial pertama, pada dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilai-nilai kejadian dalam pola diatur berdasarkan urutan waktu kejadian. (A B) (C) (D E) Universitas Sumatera Utara 23 2.4 Metode Clustering Klastering (clustering) adalah salah satu analisis peubah ganda (multivariate analisys) yang digunakan untuk mengelompokkan objek-objek sedemikian rupa sehingga objek dalam satu cluster yang sangat mirip dan objek di berbagai cluster cukup berbeda. Analisis cluster banyak digunakan dalam penelitian-penelitian di bidang social, bidang kesehatan, bidang marketing, bidang akademik, dan bidang kewilayahan (Santosa, 2007). Metode analisis cluster (clustering methods) dibedakan menjadi dua yaitu metode hierarki (hierarchical clustering methods) dan metode tak berhierarki (non hierarchical clustering methods). Metode hierarki dibedakan menjadi dua yaitu metode penggabungan (agglomerative/bottom up) dan metode pemecahan (devisive/ topdown). Prosedur yang digunakan dalam metode hierarki adalah prosedur pautan tunggal (single linkage), pautan lengkap (complete linkage), dan pautan rata-rata (average linkage). Hasil clustering metode berhierarki secara umum membentuk diagram pohon (tree diagram) atau dendrogram yang menggambarkan pengelompokan objek berdasarkan jarak. Metode tak berhierarki disebut juga metode partisi (partitional methods). Metode tak berhierarki yang banyak digunakan adalah metode C-means Cluster. Yang membedakan fuzzy clustering dan non fuzzy clustering adalah dalam fuzzy clustering, sebuah titik termasuk dalam setiap cluster dengan suatu nilai bobot antara 0 dan 1, sedangkan yang non fuzzy jumlah dari bobot-bobot tersebut sama dengan 1. Clustering probabilitas mempunyai karakteristik yang sama (Hermawati, 2009). 2.4.1 Analisa Cluster Analisa cluster yaitu menemukan kumpulan objek hingga objek-objek dalam suatu kelompok sama (mempunyai hubungan) dengan yang lain dan berbeda (tidak berhubungan) dengan objek-objek dalam kelompok lain. Tujuan dari analisa cluster adalah meminimalkan jarak di dalam cluster dan memaksimalkan jarak anatar cluster. Aplikasi dari analisa cluster dibedakan menjadi understanding yaitu kelompok dokumen-dokumen yang saling berhubungan untuk proses browsing, pengelompokan gen dan protein yang mempunyai fungsi sama atau pengelompokan stok dengan harga yang fluktuatif. Summarization untuk menurunkan ukuran dari data-set yang besar. Universitas Sumatera Utara 24 2.4.2 Clustering dengan C-Means C-Means merupakan salah satu metode data Clustering non hierarki yang berusaha mempartisi data yang ada kedalam bentuk satu atau lebih cluster (kelompok). Metode ini mempartisi kedalam cluster (kelompok) sehingga data yang memiliki karakteristik yang sama (High Intra Class Similarity) dikelompokkan kedalam satu cluster yang sama dan yang memiliki karakteristik yang berbeda (Law Inter Class Similarity) di kelompokkan pada kelompok yang lain (Giyanto, 2008). C-means Cluster merupakan metode pengelompokan yang terkenal dan banyak digunakan di berbagai bidang karena sederhana, mudah di implementasikan, dan memiliki kemampuan untuk mengelompokkan data yang besar. C-means digunakan untuk meng cluster data-data mahasiswa dan jumlah cluster bisa ditentukan di awal (Khoiruddin, 2007). Metode ini mengelompokkan secara partisi yang memisahkan data kedalam kelompok yang berbeda. Dengan proses partisi secara iteratif, C-means Cluster mampu meminimalkan jarak rata-rata setiap data ke kelompoknya. Metode ini dikembangkan oleh MacQueen pada tahun 1967, yang merupakan pengembangan dari Steinhaus tahun 1956. Kemudian dikembangkan terus sampai saat ini diberbagai bidang. Langkah-langkah Clustering data dengan C-Means terdiri dari (Suryadi, e.t al, 1998): 1. Langkah Pertama : Menanyakan kepada pemakai algoritma C-Means, obyek yang ada akan dibuat menjadi berapa kelompok, sebutlah sebanyak C cluster. 2. Langkah Kedua : Secara sembarang, pilihlah C buah obyek (dari sekian obyek yang ada) sebagai pusat-pusat kelompok cluster awal. 3. Langkah Ketiga : Untuk setiap obyek, tentukan pusat cluster terdekatnya dan tetapkan obyek tersebut sebagai anggota dari cluster yang terdekat pusat clusternya. Hitung rasio antara Between Cluster Variation (BCV) dengan Whiting Cluster Variation (WCV), lalu bandingkan rasio tersebut dengan rasio sebelumnya (bila sudah ada). Jika rasio tersebut membesar, lanjutkan ke langkah keempat. Jika tidak, hentikan prosesnya. 4. Langkah keempat : Perbaharui pusat-pusat cluster (berdasarkan cluster yang didapat dari langkah ketiga) dan kembalilah ke langkah ketiga. Apabila nilai rasio sudah tidak lagi membesar dibandingkan dengan rasio sejenis yang didapatkan pada langkah sebelumnya, maka algoritma akan dihentikan. Universitas Sumatera Utara 25 Diagram alir (flowchart) algoritma C-Means sesuai dengan langkah-langkah diatas ditunjukkan dalam gambar 2.2. Terdapat 18 cluster pada aplikasi yang dibangun. Cluster ditentukan dari banyaknya jenis beasiswa yang di tawarkan. Pusat dari tiap-tiap cluster di tentukan dari jarak yang terkecil. Kemudian dihitung jarak objek ke pusat cluster. Objek di kelompokkan berdasarkan jarak minimum, jika ada objek yang harus dipindahkan, proses selanjutnya akan kembali ke penentuan pusat pada objek yang dipindah. Jika tidak ada objek yang dipindah maka prosesnya selesai. Gambar 2.2 Flowchart Algoritma C-Means Universitas Sumatera Utara 26 2.4.3 Sifat Pengelompokan Clustering C-means Data dibagi menjadi beberapa kelompok atau cluster hingga terbentuk beberapa kelompok data. Centroid 1 – Gabungan dari semua kelompok (set), ⋃ meliputi himpunan titik data X )=1∀ ( Centroid 2 – Tidak ada yang overlap (bertimpa) antar Cluster ( )∩ )=0∀ ( Centroid 3 – Cluster tidak boleh kosong, dan tidak dapat memuat semua titik 0< ∑ ( )< ∀ Matriks U = a c x P , matriks dari titik data dan cluster. Jika = ( ) mewakili ke anggotaan (0 atau 1) antara data titik j dan i, kemudian U adalah matriks dari = 1, …, cj, J = 1, …, P). Jika (i menjadi partisi dari ‘c’ maka lokasi ke anggotaan (0 atau 1) setiap data berhubungan dengan satu kelas. ∈ {0,1}; ∑ = ∪| = 1; 0 < ∑ < Fungsi objektif adalah membedakan antara kualitas alokasi cluster yang berbeda. Algoritma C-Means menggunakan jumlah jarak antara claster usulan dan data terkait menunjukkan milik kelompok tersebut. Tujuannya adalah untuk menemukan centroid terbaik dan alokasi titik data sedemikian rupa sehingga jarak diminimalkan yaitu dengan rumus : Dimana matriks data k, J (U, V) = ∑ ∑ ( ) adalah jarak yang cocok menurut Euclidean norm, antara sampel dan i pusat cluster = ( − )= | − | = ( − ) / Setiap titik data terletak pada ruang dimensi ‘m’ untuk mengoptimalkan kombinasi dari cluster (U*, V*) , meminimalkan J (U, V) atau : J (U*, V*) = ∪∈ { ( , )} Universitas Sumatera Utara 27 2.4.4 Kelebihan dan Kekurangan C-Means Cluster Kelebihan metode C-Means diantaranya adalah sebagai berikut : 1. Mampu mengelompokkan obyek yang besar. 2. Mampu mengecilkan obyek dengan cepat. 3. Mempercepat proses pengelompokan. Adapun kekurangan yang dimiliki oleh C-Means diantaranya sebagai berikut : 1. Sangat sensitif pada pembangkitan titik pusat awal secara random. 2. Memungkinkan suatu gerombol tidak mempunyai anggota. 3. Hasil pengelompokan bersifat tidak unik terkadang selalu berubah-ubah. 4. Terkadang bagus, terkadang tidak bagus. 5. Menentukan jumlah gerombol sebelum kita mengetahui jumlah kelompok yang optimal. 6. Semua obyek harus masuk kedalam satu cluster, dan sangat bergantung pada inisialisasi cluster centers. 2.5 Pemrograman PHP dan MySQL PHP (Hipertext Preprocessor) adalah bahasa pemrograman yang paling popular dan banyak digunakan untuk pemrograman web. Pada umumnya PHP digunakan di server namun juga dapat berdiri sendiri sebagai aplikasi graphical. MySQL merupakan DBMS yang multithread, multi-user yang bersifat gratis dibawah lisensi GNU General Public Licence (GPL). MySQL memiliki dua bentuk lisensi, yaitu free software dan shareware. Sebagai software DBMS, MySQL memiliki sejumlah fitur seperti multiplatform, andal (cepat dan mudah digunakan), jaminan keamanan akses, dukungan SQL, adanya fasilitas API (Application Programming Interface), MySQL terbukti kestabilannya karna digunakan oleh banyak proyek besar (Lubis & Syahputra, 2011). MySQL merupakan database multi-user yang menggabungkan bahasa Structure Query Language (SQL). MySQL dalam operasi client-server, melibatkan server-daemon MySQL disisi serverdan berbagai macam program, serta library yang berjalan disisi client. MySQL mampu menangani data yang cukup besar. MySQL adalah bahasa standar yang digunakan untuk mengakses sever database. Dengan menggunakan SQL, proses akses database menjadi lebih friendly. Dalam konteks Universitas Sumatera Utara 28 bahasa SQL, informasi umumnya tersimpan dalam tabel-tabel yang secara logis merupakan struktur dua dimensi yang terdiri dari baris-baris data yang berada dalam satu atau lebih kolom. Baris pada tabel sering disebut entitas dari data, sedangkan kolom sering disebut atribut atau field. Keseluruhan tabel itu dihimpun dalam satu kesatuan yang disebut database (Wirawan, 2009). Dalam penerapan metode Clustering data dengan C-Means untuk rekomendasi penerima beasiswa pada Universitas Sumatera Utara digunakan bahasa pemrograman PHP dan database MySQL sebagai penyimpanan data dan basis pengetahuan. Penggunaan PHP dan MySQL dipilih karena PHP dan MySQL memiliki beberapa kelebihan, kelebihan yang dimaksud seperti (Nugroho, 2008) : 1. Bahasa pemrograman PHP adalah sebuah bahasa script yang tidak melakukan sebuah kompilasi dalam penggunaannya. 2. Web server yang mendukung PHP dapat ditemukan dimana-mana dari mulai IIS sampai dengan Apache, dengan konfigurasi yang relative mudah. 3. Dalam isi pengembangan lebih mudah, karena banyaknya milis-milis dan developer yang siap membantu dalam pengembangan. 4. Dalam sisi pemahaman, PHP adalah bahasa scripting yang paling mudah karena referensi yang banyak. 5. PHP adalah bahasa open source yang dapat digunakan diberbagai mesin (Linux, Unix, Windows) dan dapat dijadikan secara runtime melalui console serta juga dapat menjalankan perintah-perintah sistem. Sedangkan database MySQL memiliki beberapa kelebihan yaitu (Lubis & Syahputra, 2011) : 1. MySQL merupakan server tercepat dan mempunyai performa yang tinggi tapi simple. 2. Bersifat Open Source. 3. Database MySQL mengerti bahasa SQL (Structured Query Language). 4. Memiliki kecepatan yang lebih baik dalam menangani query (perintah SQL). 5. Dapat berjalan dengan stabil pada berbagai sistem operasi. 6. Bersifat multiuser, MySQL dapat digunakan oleh beberapa user dalam waktu yang bersamaan tanpa mengalami masalah. Universitas Sumatera Utara 29 7. Scalability dan limits yaitu MySQL mampu menangani database dalam skala besar, dengan jumlah records lebih dari 50 juta dan 60 ribu tabel serta 5 milyar baris. Selain itu batas indeks yang dapat ditampung mencapai 32 indeks pada tiap tabelnya. 8. Connectivity MySQL dapat melakukan koneksi dengan client menggunakan protokol TCP/IP, Unix soket (UNIX), atau Named Pipes (NT). 9. Interface MySQL memiliki interface (antar muka) terhadap berbagai aplikasi dan bahasa pemrograman dengan menggunakan fungsi API (Application Programming Interface). 10. Clients dan tools MySQL dilengkapi dengan berbagai tool yang dapat digunakan untuk administrasi database, dan pada setiap tool yang ada disertakan petunjuk online. 11. Struktur tabel MySQL memiliki struktur tabel yang lebih fleksibel dalam menangani ALTER TABLE, dibandingkan database lainnya semacam PostgreSQL ataupun Oracle. 2.6 Data Flow Diagram (DFD) Data Flow Diagram (DFD) adalah alat pembuatan model yang memungkinkan professional sistem untuk menggambarkan sistem sebagai suatu jaringan proses fungsional yang dihubungkan satu sama lain dengan alur data, baik secara manual maupun komputerisasi. DFD merupakan alat perancangan yang berorientasi pada alur data dengan konsep dekomposisi yang digunakan untuk menggambarkan analisa maupun rancangan system yang mudah di komunikasikan oleh profesional sistem kepada pemakai maupun pembuat program (Muchtar & Sani, 2011). 2.7 Flowchart Flowchart adalah penggambaran secara grafik dari langkah-langkah dan urutan-urutan prosedur dari suatu program. Flowchart mempermudah penyelesaian suatu masalah, flowchart sistem merupakan bagan yang menunjukkan alur kerja atau apa yang sedang dikerjakan di dalam sistem secara keseluruhan dan menjelaskan urutan dari prosedurprosedur yang ada di dalam sistem. Flowchart program dihasilkan dari flowchart sistem (Muchtar & Sani, 2011). Universitas Sumatera Utara