TUGAS AKHIR PENERAPAN DATA MINING UNTUK MENENTUKAN PENILAIAN KINERJA KARYAWAN RESTORAN IBARBO MENGGUNAKAN METODE NAÏVE BAYES IMPLEMENTATION OF DATA MINING FOR DETERMINING THE PERFORMANCE ASSESSMENT OF EMPLOYEES IN IBARBO RESTAURANT USING NAÏVE BAYES METHOD Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika Disusun Oleh : Nama Nim Program Studi : Yuli Rizqianto Aldi : A11.2012.07091 : Teknik Informatika – S1 TEKNIK INFORMATIKA S1 UNIVERSITAS DIAN NUSWANTORO SEMARANG 2016 PERSETUJUAN SKRIPSI Nama : Yuli Rizqianto Aldi NIM : A11.2012.07091 Program Studi : Teknik Informatika Fakultas : Ilmu Komputer Judul Tugas Akhir : Penerapan Data Mining Untuk Menentukan Penilaian Kinerja Karyawan Restoran Ibarbo Menggunakan Metode Naïve Bayes Tugas Akhiriini telah diperiksa dan disetujui, Semarang, 24 Januari 2017 Menyetujui: Mengetahui: Pembimbing Dekan Fakultas Ilmu Komputer Wijanarto M.Kom Dr Drs Abdul Syukur, MM ii PENGESAHAN DEWAN PENGUJI Nama : Yuli Rizqianto Aldi NIM : A11.2012.07091 Program Studi : Teknik Informatika Fakultas : Ilmu Komputer Judul Tugas Akhir : Penerapan Data MiningiiUntuk Menentukan Penilaian Kinerja Karyawan Restoran Ibarbo Menggunakan Metode Naïve Bayes Tugas akhir ini telahidiujikan dan dipertahankanidihadapan Dewan Penguji pada Sidang tugas akhir tanggal 24 Januari 2017. Menurut pandangan kami, tugas akhir ini memadai dari segi kualitas maupun kuantitas untuk tujuan penganugrahan gelar Sarjana Komputer (S.Kom.) Semarang, 24 Januari 2017 Dewan Penguji: Dr. Muljono S.Si, M.Kom Erna Zuni Astuti, M.Kom (0686.11.1996.104) (0681.11.1997.132) Anggota Anggota T.Sutojo, S.Si.M.Kom (0686.11..1996.094) Ketua Penguji iii PERNYATAAN KEASLIAN SKRIPSI Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah ini, saya: Nama : Yuli Rizqianto Aldi NIM : A11.2012.07091 Menyatakan bahwa karya ilmiah saya yang berjudul: Penerapan Data Mining Untuk Menentukan Penilaian Kinerja Karyawan Restoran Ibarbo Menggunakan Metode Naïve Bayes Merupakan karya asliisaya (terkecualiicuplikanidan ringkasan yang masingmasing telah sayaijelaskan sumbernya serta berbagaiiperangkat pendukung sepertiiweb cam dll). Apabila di kemudian hari, karya sayaidisinyalir bukan merupakan karya asli saya, yangidisertai denganibukti-bukti yangicukup, maka saya bersediaiuntuk dibatalkan gelarisaya beserta hakidan kewajiban yangimelekat pada gelar tersebut. Demikian surat pernyataan ini saya buat dengan sebenarnya. Dibuat di : Semarang Pada tanggal : 24 Januari 2017 Yang menyatakan (Yuli Rizqianto Aldi) iv PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah ini, saya: Nama : Yuli Rizqianto Aldi NIM : A11.2012.07091 demi mengembangkan Ilmu Pengetahuan, menyetujui untuk memberikan kepada Universitas Dian Nuswantoro Hak Bebas Royalti Non-Ekskusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul: Penerapan Data Mining Untuk Menentukan Penilaian Kinerja Karyawan Restoran Ibarbo Menggunakan Metode Naïve Bayes Dengan Hak Bebas Royalti Non-Eksklusif ini Universitas Dian Nuswantoro berhak untuk menyimpan, mengcopy ulang (memperbanyak), menggunakan, mengelolanya dalamiibentuk pangkalaniidata (database), mendistribusikannya dan menampilkan/mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya selama tetap mencantumkan nama saya sebagai penulis/pencipta. Saya bersedia untukiimenanggung secaraiipribadi, tanpa melibatkan pihak Universitas Dian Nuswantoro, segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak Cipta dalam karya ilmiah saya ini. Demikian surat pernyataan ini saya buat dengan sebenarnya. Dibuat di : Semarang Pada tanggal : 24 Januari 2017 Yang menyatakan (Yuli Rizqianto Aldi) v UCAPAN TERIMA KASIH Dengan memanjatkan puji syukur kehadirat Allah SWT. Tuhan Yang Maha Pengasih dan Maha Penyayang yang telah melimpahkan segala rahmat, hidayah dan inayah-Nya kepada penulis sehingga laporan tugas akhir dengan judul “ PENERAPAN DATA MINING UNTUK MENENTUKAN PENILAIAN KINERJA KARYAWAN RESTORAN IBARBO MENGGUNAKAN METODE NAÏVE BAYES ” dapat penulis selesaikan sesuai dengan rencana karena dukungan dari berbagai pihak yang tidak ternilai besarnya. Oleh karena itu penulis menyampaikan terimakasih kepada: 1. Bapak Prof.Dr.Ir. Edi Noersasongko,M.Kom, selaku Rektor Universitas Dian Nuswantoro Semarang. 2. Bapak Dr. Abdul Syukur, MM, selaku Dekan Fakultas Ilmu Komputer Universitas Dian Nuswantoro. 3. Bapak Heru Agus Santoso, S.Kom,MT selaku Ketua Progdi Teknik Informatika 4. Bapak Wijanarto M.Kom. selaku pembimbing tugas akhir yang memberikan ide penelitian, informasi referensi yang penulis butuhkan dan bimbingan yang berkaitan dengan penelitian penulis. 5. Dosen-dosen pengampu di Fakultas Ilmu Komputer Teknik Informatika Universitas Dian Nuswantoro Semarang yang telah memberikan ilmu dan pengalamannya masing-masing, sehingga penulis dapat mengimplementasikan ilmu yang telah disampaikan. 6. Ibu, adik Tuffa, alm. Bapak, dan Rizka Kurniasih yang selalu memberikan doa dan semangat supaya menyelesaikan skripsi. 7. Terimakasih kepada seluruh penghuni kost Sentiyaki, kalian memang selalu bisa membuat saya lebih semangat. Semoga Tuhan yang Maha Esa memberikan balasan yang lebih besar kepada beliau-beliau, dan pada akhirnya penulis berharap bahwa penulisan laporan tugas akhir ini dapat bermanfaat dan Semarang, 24 Januari 2017 Penulis vi ABSTRAK Dalam dunia kerja terutama pada sebuah perusahaan atau instansi, karyawan merupakan sumber daya manusia (SDM) utama yang berperan dalam kesuksesan perusahaan atau instansi tersebut. Dengan demikian, perusahaan harus selekstif dalam melakukan perekrutan dan penilaian karyawan agar dapat mempertahankan karyawan dengan kinerja terbaik. Ibarbo adalah sebuah perusahaan yang bergerak dalam bidang kuliner yang bersentuhan langsung dengan konsumen, sehingga karyawan Ibarbo dituntut untuk mampu memberi pelayanan kepada konsumen berupa memasak dan menjaga kebersihan lingkungan kerja dengan baik. Pada kenyataannya, kinerja yang baik dari para karyawan terkadang mendapatkan penilaian yang buruk hingga sebuah peringatan dari atasan. Hal ini disebabkan oleh sistem monitoring penilaian karyawan yang digunakan yakni hanya penilaian personal saja tanpa menggunakan system penilaian seperti model 360 derajat, serta data yang telah terkumpul tidak digunakan secara maksimal. Melihat permasalahan diatas, penulis melakukan penelitian menggunakan metode Naive Bayes untuk melakukan perancangan sistem dan pengolahan data menggunakan algoritma data mining untuk mendapatkan prediksi yang dapat dijadikan sebagai acuan tambahan dalam keputusan penilaian kinerja karyawan. Naive Bayes sebagai algoritma pengolah data yang tergolong dengan perhitungan yang mudah dipahami namun hasil akurasinya dapat diandalkan, Hasil dari pengujian yang telah dilakukan dengan jumlah 670 data dan dihasilkan akurasi sebesar 93.13%, recall terbesar adalah 97.41%, dan precision 95.35%. Kata kunci : penerapan data mining untuk menentukan penilaian kinerja karyawan menggunakan naïve bayes. xi + 75 halaman; 26 gambar; 20 tabel Daftar acuan: 17 (2006 – 2016) vii DAFTAR ISI PERSETUJUAN SKRIPSI ..................................................................................... ii PENGESAHAN DEWAN PENGUJI .................................................................... iii PERNYATAAN KEASLIAN SKRIPSI ................................................................ iv PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH .................... v UCAPAN TERIMA KASIH .................................................................................. vi ABSTRAK ............................................................................................................ vii DAFTAR ISI ........................................................................................................ viii DAFTAR GAMBAR ............................................................................................. xi DAFTAR TABEL ................................................................................................. xii BAB I ...................................................................................................................... 1 PENDAHULUAN .................................................................................................. 1 1.1. Latar Belakang ......................................................................................... 1 1.2. Rumusan Masalah .................................................................................... 3 1.3. Batasan Masalah ....................................................................................... 4 1.4 Tujuan Penelitian ...................................................................................... 4 1.5 Manfaat Penelitian .................................................................................... 4 BAB II ..................................................................................................................... 6 TINJAUAN STUDI DAN LANDASAN TEORI ................................................... 6 2.1. Tinjauan Studi .......................................................................................... 6 2.2. Tinjauan Umum Restoran ........................................................................ 8 2.2.1. Pengertian Karyawan ........................................................................ 8 2.2.2. Kinerja ............................................................................................... 8 2.2.3. Penilaian Kinerja ............................................................................... 8 viii 2.2.4. 2.3. Prosedur Penilaian Kinerja Karyawan .............................................. 9 Tinjauan Data Mining ......................................................................... 11 2.3.1 Proses CRISP Data Mining .................................................................. 12 2.3.2 Teknik Klasifikasi Data Mining ........................................................... 14 2.3.3 Naive Bayes ......................................................................................... 15 2.3.4 Confusion Matrix ................................................................................. 18 2.3.5 Cross Validation ................................................................................... 19 2.4. Kerangka Pemikiran ................................................................................... 20 BAB III ................................................................................................................. 21 3.1. Instrumen Penelitian ............................................................................... 21 3.1.1. Kebutuhan Perangkat Lunak ........................................................... 21 3.1.2. Kebutuhan Perangkat Keras ............................................................ 22 3.2. Sumber Data ........................................................................................... 22 3.3. Metode Pengumpulan Data .................................................................... 24 3.3.1. Studi Pustaka ................................................................................... 24 3.3.2. Wawancara ...................................................................................... 25 3.3.3. Observasi ......................................................................................... 25 3.4. Metode Atau Model Yang Diusulkan .................................................... 25 3.4.1. Analisis Dan Perancangan............................................................... 26 3.4.2. Software Development .................................................................... 31 3.4.3. Pengujian Hasil Penelitian .............................................................. 31 BAB IV ................................................................................................................. 33 4.1. Identifikasi Masalah dan Identifikasi Sumber Masalah ......................... 33 4.1.1. Identifikasi Masalah ........................................................................ 33 4.1.2. Identifikasi Sumber Masalah .......................................................... 33 ix 4.1.3. Pemecahan Masalah ........................................................................ 33 4.2. Analisis Kebutuhan Sistem .................................................................... 34 4.3. Analisis Sistem dengan UML................................................................. 34 4.3.1. Diagram Use Case ........................................................................... 34 4.3.2. Class Diagram ................................................................................. 42 4.4. Desain Antar Muka (User Interface)...................................................... 44 4.5. Implementasi .......................................................................................... 48 4.6. Pengujian Perangkat Lunak .................................................................... 51 BAB V................................................................................................................... 55 5.1. Data Penelitian ....................................................................................... 55 5.2. Pengolahan Data (Data Preparation)..................................................... 55 5.2.1. Cleaning Data .................................................................................. 56 5.2.2. Integrasi Data .................................................................................. 56 5.2.3. Reduksi Data ................................................................................... 56 5.3. Transformasi Data (Transformation) ..................................................... 56 5.4. Validasi dan Evaluasi ............................................................................. 57 5.5. Hasil Pengujian ....................................................................................... 59 5.6. Pembahasan Proses Perhitungan Prediksi .............................................. 61 BAB VI ................................................................................................................. 64 6.1 Kesimpulan ............................................................................................. 64 6.2. Saran ....................................................................................................... 64 x DAFTAR GAMBAR Gambar 2. 1 Proses KDD database ....................................................................... 12 Gambar 2. 2 Tahap CRISP-DM ............................................................................ 13 Gambar 3. 1 Model RAD (Rapid Application Development) .............................. 26 Gambar 3. 2 Model Yang Diusulkan .................................................................... 30 Gambar 4.1 Use Case Sistem Prediksi Penilaian Kinerja..................................... 34 Gambar 4.2 Diagram Activity Mengelola Data Karyawan................................... 35 Gambar 4.3 Diagram Sequence Melihat Data Karyawan..................................... 36 Gambar 4.4 Diagram Activity Proses Perhitungan Naive Bayes.......................... 37 Gambar 4.5 Diagram Sequence Proses Perhitungan Prediksi............................... 38 Gambar 4.6 Diagram Activity Lihat Hasil Prediksi.............................................. 39 Gambar 4.7 Diagram Sequence Hasil Prediksi..................................................... 40 Gambar 4.8 Class Diagram Aplikasi..................................................................... 40 Gambar 4.9 Halaman Login.................................................................................. 42 Gambar 4.10 Halaman Utama............................................................................... 43 Gambar 4.11 Halaman Data Karyawan.................................................................44 Gambar 4.12 Halaman Perhitungan Prediksi........................................................ 45 Gambar 4.13 Form Login...................................................................................... 46 Gambar 4.14 Form Utama User Setelah Login..................................................... 47 Gambar 4.15 Form Data Karyawan...................................................................... 48 Gambar 4.16 Form Prediksi Karyawan................................................................ 49 Gambar 5.1 Pemodelan Pada Rapid Miner.......................................................... 56 Gambar 5.2 Percobaan Pertama Hasil Akurasi Data Awal.................................. 57 Gambar 5.3 Percobaan Kedua Hasil Akurasi Setelah Preparation Data.............. 58 Gambar 5.4 Hasil Akurasi Setelah Preparation dan Transformasi Data...............58 Gambar 5.5 Contoh Inputan Data Pengajuan Dan Output Data.......................... 59 Gambar 5.6 Hasil Aplikasi Running.................................................................... 61 xi DAFTAR TABEL Tabel 2. 1 State Of The Art ..................................................................................... 7 Tabel 2. 2 Dataset Karyawan ................................................................................ 14 Tabel 2. 3 Confusion Matrix ................................................................................. 18 Tabel 2. 4 Keranga Pemikiran ............................................................................... 20 Tabel 3. 1 Atribut dan Keterangan Karyawan ...................................................... 23 Tabel 3. 2 Atribut karyawan sebelum dilakukan reduction data .......................... 28 Tabel 3. 3 Atribut karyawan setelah dilakukan reduction data ............................ 29 Tabel 3. 4 Rumus precision, recall, dan accuracy ................................................. 32 Tabel 4. 1 Skenario Pengolahan Data Karyawan ................................................. 35 Tabel 4. 2 Skenario Proses Perhitungan Naive Bayes ......................................... 36 Tabel 4. 3 Skenario Lihat Hasil ........................................................................... 38 Tabel 4. 4 User Akun ........................................................................................... 41 Tabel 4. 5 Tabel Karyawan .................................................................................. 41 Tabel 4. 6 Pengujian Acceptance Test Pada User Login ..................................... 50 Tabel 4. 7 Pengujian Acceptance Test Pada Form Prediksi Kinerja ................... 51 Tabel 4. 8 Pengujian Acceptance Test Pada Laporan .......................................... 52 Tabel 5. 1 Data Awal Sebelum Preparation Data ................................................ 53 Tabel 5. 2 Transformasi Data Kedalam Bentuk Normal ..................................... 55 Tabel 5. 3 Hasil Dari Tahap Preparation Data ..................................................... 55 Tabel 5. 4 Data Training ...................................................................................... 60 xii 1 55 BAB I PENDAHULUAN 1.1. Latar Belakang Dewasa ini, bisnis kuliner berkembang dengan sangat pesat, ditandai dengan beraneka ragamnya bisnis kuliner yang bisa ditemukan di Indonesia, mulai dari warung, restoran, kafe, dan bar. Terlebih saat ini, Pasar Bebas ASEAN ikut menggempur dunia bisnis Indonesia sehingga berbagai jenis waralaba asing juga ikut menggeluti bisnis kuliner. Hal ini tentu saja makin menimbulkan persaingan yang semakin ketat antar berbagai usaha kuliner. Sehingga, masing-masing pemilik tempat usaha berlomba-lomba dalam membuat unggul usaha kulinernya dari berbagai aspek agar menarik banyak pelanggan. Lokasi, harga, kualitas makanan, hingga kualiatas pelayananiimerupakan faktor-faktor penentu dalam kesuksesan bisnis kuliner [1]. Kualitas pelayanan adalah hal yang menjadi tolak ukur dalam menjalankan suatu bisnis, dimana jasa layanan untuk memenuhi kebutuhan internal dan eksternal pelanggan secara konsisten sesuai prosedur yang diharapkan agar keinginan pelanggan terpenuhi. Kualiatas pelayanan meliputi 5 hal, yakni Reliability, Responsiveness, Assurance, Empathy, Tangible [2]. Kualitasiipelayanan sangat berhubungan erat dengan kualitas karyawan dari suatu perusahaan. Karena karyawan merupakan ujung tombak dari pelayanan itu sendiri. Karyawan atau pegawai adalah Sumber Daya Manusia (SDM) yang merupakan aset perusahaan yang sangat berharga dan harus dikelola dengan baik agar dapat memberikan kontribusi yang optimal dalam kemajuan suatu perusahaan atau instansi. Sumber daya manusia dalam perusahaan memiliki peranan penting dalam menciptakan daya saing pada perusahaan terutama pada era globalisasi. Sumber daya manusia yang berkualitas merupakan 1 sumber daya yang memiliki 2 kompetensi melalui keterampilan (skill), pengetahuan (knowledge) serta sikap atau gaya kepribadian (style) sehingga dapat melaksanakan tugas dan pekerjaan dengan baik [3]. Penilaian kinerja karyawan perusahaan agar dapat memperbaiki dan merupakan cara yang dilakukan mengembangkan sumber daya manusia. Hasil dari penilaian kinerja, perusahaan diharapkan agar dapat mengetahui kelebihan dan kelemahan karyawan sebagai dasar untuk mempertahankan kelebihan dan mengurangi kelemahan yang ada dalam upaya meningkatkan produktivitas demi kemajuan perusahaan [3]. Ibarbo merupakan sebuah restoran masakan italia dengan menu andalan pizza dan pasta. Saat ini Ibarbo memiliki lebih dari 10 outlet yang tersebar di Pulau Jawa dengan jumlah karyawan mencapai 500 orang. Dalam melakukan penilaian kinerja karyawan, kafe ini menggunakan metode penilaian secara manualiyakni nilai yang didapatkan antara baik dan buruk saja tanpa ada kepastian informasi mengenai kelebihan dan kelemahan karyawan tersebut. Akibatnya sulit dibedakan antara karyawan yang berkompeten dan tidak berkompeten karena kurang akuratnya informasi dari nilai yang didapatkan. Pemilik usaha akan sulit untuk menimbang karyawan yang layak dipertahankan dan karyawan yang sebaiknya diberi teguran. Hal ini juga di perburuk dengan jumlah karyawan yang cukup banyak dan tersebar diberbagai cabang outlet yang menyebabkan pemilik usaha kesulitan untuk melihat hasil kinerja karyawan di seluruh outlet. Dengan demikian, sulit bagi pemilik usaha untuk melakukan kontrol dan pelatihan bagi karyawan-karyawan yang kurang berkompeten serta memberikan apresiasi bagi karyawan dengan kompetensi terbaik. Melihat permasalahan diatas, maka di perlukan sebuah sistem yang terpadu, efektif, dan akurat dalam melakukan penilain kinerja karyawan sehingga dihasilkan nilai dan kesimpulan yang benar. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh Thomas Bayes. Naive Bayes digunakan untuk memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya [4]. Definisi lain menyebutkan bahwa Naive Bayes merupakan 3 sebuah program pengklasifikasian probabilistik sederhana yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan. Algoritma mengunakan teorema Bayes dan mengasumsikan semua atribut independen atau tidak saling ketergantungan yang diberikan oleh nilai pada variabel kelas [5]. Keuntungan menggunakan metode Naive Bayes adalah metode ini hanya membutuhkan jumlah data pelatihan (Training Data) kecil untuk menentukan estimasi paremeter yang diperlukan dalam proses pengklasifikasian. NaiveiiBayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang kompleks dari pada yang diharapkan [6]. Adapun beberapa penelitian yang menggunakan metode Naïve Bayes, yang pertama dilakukan oleh Mujib Ridwan, Hadi Suyono, dan M. Sarosa dalam penelitian yang berjudul Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier, hasil penelitian tersebut berupa system akan membantu merekomendasi data siswa yang akan lulusiitepat waktu atau tidak, berdasarkan histori nilai yang ditempuh mahasiswa [7]. Kemudian adalah penelitian yang kedua dilakukan oleh Hera Wasiati dan Dwi Wijayanti, denga penelitian yang berjudul Sistem Pendukung Keputusan Penentuan Kelayakan Calon Tenaga Kerja Indonesia Menggunakan Metode NaiveiiBayes, penelitian tersebut dilakukan dengan data sebanyak 542 dengan rincian 362 dimasukkan sebagai data training dan 180 sebagaiiidata tes, sehingga menghasilkan akurasi sebesar 73.89 % dan error 26.11% sehingga jumlah data yang tepat sebanyak 133 dan yang tidak tepat 47 [8]. Berdasarkan uraian diatas, penulis menggunakan metode naïve bayes pada system penilaian kinerja karyawan di restoran ibarbo. 1.2. Rumusan Masalah Diambil dari penjelasan diatas, didapat rumusan masalah bagaimana menganalisis dan mengolah dataiuntukimembuat sistem penilaian kinerja karyawan di Restoran Ibarbo dengan metode naïve bayes? 4 1.3. Batasan Masalah Penelitian yang dilakukan ini memiliki beberapa poin sebagai batasan masalah. Adapun batasan-batasan masalah yang dimaksud adalah sebagai berikut: 1. Data yang dipakai dalam penelitian ini adalah sampel data seluruh karyawan restoran ibarbo tahun 2016. 2. Aplikasi ini hanya akan menganalisis dan menentukan produktif atau tidaknya karyawan restoran ibarbo. 3. Algoritma yang digunakan pada penelitian ini yaitu Naïve Bayes. 1.4 Tujuan Penelitian Berdasarkan rumusan masalah yang telah dijabarkan, Tujuan penelitian yang ingin dicapai restoran Ibarbo adalah membuat sebuah penilaian kinerja karyawan menggunakan metode naïve bayes. 1.5 Manfaat Penelitian Manfaat dari penelitian ini, antara lain: 1. Bagi retoran ibarbo Hasil penelitian ini diharapkan akan mampu membantu dalam system pengambilan keputusan kinerja karyawan, sehingga dengan adanya system ini pihak restoran tau mana karyawan yang masih produktif dan karyawan yang tidak lagi produktif. 2. Bagi penulis Penelitian ini diharapkan dapat menambah wawasan ilmu pengetahuan dengan cara meneliti penerapan algoritma naive bayes dalam mengklasifikasikan data karyawan resto ibarbo untuk menentukan produtif atau tidaknya karyawan ibarbo. Sekaligun sebagai salah satu syarat kelulusan Sarjana S1. 3. Bagi Universitas Dian Nuswantoro, 5 Dalam Rangka pengembangan ilmu pengetahuan untuk penelitian selanjutnya hasil penelitian ini diharapkan turut ikut menyumbangkan pengetahuan tentang klaisifikasi data tentang sistem penilaian kinerja karyawan. 6 BAB II TINJAUAN STUDI DAN LANDASAN TEORI 2.1. Tinjauan Studi Berikut adalah penjelasan singkat beberapa penelitian terkait dengan penelitian ini : Mujib Ridwan, Hadi Suyono, dan M. Sarosa (2013) menerapkan algoritma Naïve Bayes untuk mengevaluasi kinerja mahasiswa pada bidang akademik bahwa mahasiswa tersebut akan lulus tepat waktu atau tidak,iiberdasarkan histori IPK pada semester 1, semester 4, dan jenis kelamin, pada penelitian ini dibagi menjadi tiga poin nilai yaitu recall, precition dan accuracy masingmasing 50%, 83%, dan 70%, hasil tersebut dipengaruhi oleh pola data training yangidigunakan [7]. Amelia Yusnita dan Rosiana Handini (2012) menerapkan algoritma data mining naive bayes untuk sistem pengambil keputusan penentuan rumah makan yag strategis, naive bayesiiditerapkan dengan menggunakan berbagai kriteria, dengan cara menerapkan probabilitas ya atau probabilitas tidak, apabila hasil dari probabilitas ya lebih banyakiidaripada probabilitas tidak maka hasilnya tempat tersebut dianggap strategis, sebaliknya apabila probabilitas tidak lebih banyak artinya tempat tersebut kurang strategis [9]. Nia Esti Karina dan Yuni Yamasari (2013) menggunakan algoritma Naive Bayes untuk mendiaknosis penyakit kanker kandungan, penerapan metode Naive Bayes pada penelitian ini yaitu dengan cara membuat gejala penyakit kanker pada umumnya,iikemudian pasien mengisi sesuai apa yang dialam, sehingga dari hasil tersebut dapat dihitung dengan rumus Naive Bayes dan dapat dilihat hasilnya [10]. 6 7 Tabel 2. 15State Of The Art No 1 Penulis Mujib Judul Penerapan Data Metode Naive Bayes Hasil Pengujian pada data mahasiswa Ridwan, Hadi Mining Untuk angkatani 2005-2009 mining NBC Suyono, dan EvaluasiiKinerja menghasilkan nilai precision, M. Sarosa Akademik recall,iidan Mahasiswa masing 83%, 50%, Menggunakanii dan 70%. accuracy masing- Algoritma Naive Bayes Classifier 2 Amelia Sistem Naive Bayes Pengguna dapat Yusnita dan Pendukung lokasi Rosiana Keputusan kurang Handini Penentuan strategis, berdasarkan nilai akhir Lokasi Rumah dariiiprobabilitasiiyaiidan MakaniStrategis probabilitas tidak, dimana apabila Menggunakan nilai probabilitas ya lebih Metode Naive besar Bayes maka tersebut dari mengetahui strategis probabilitas lokasinya atau tidak strategis, sebaliknya jika nilai probabilitas tidak lebih tinggi dari probabilitas tidakiimaka lokasinya kurang strategis. 3 Nia Esti Aplikasi Karina dan Yuni Naive Bayes Aplikasi ini dapat Diagnosa prediksi bahwa Kanker mengidap menjadi siperempuan penyakit kanker 8 Yamasari Kandungan kandungan atau tidak, menurut Dengan Metode hasil diagnosis yang ditanyakan. Naïve Bayes (Study Kasus : Rumah Sakit Islam Surabaya) 2.2. Tinjauan Umum Restoran Menurut SK menteri pariwisata dan Komunikasi nomor KM73/PW 105/MPPT-85 menerangkan bahwa restoran adalah salah satu jenis usaha pada bidang pangan yang menggunakan tempat, baik itu sebagiannya ataupun seluruhnya adalah bangunan permaneniiyang dilengkapi oleh peralatan serta perlengkapan untuk melakukan proses pembuatan, penyajian dan penjualan makanan dan minuman untuk masyarakat umum. 2.2.1. Pengertian Karyawan Menurut Kamus Besar Bahasa Indonesia (KBBI) karyawan merupakan seseorang yang bekerja dalam suatu lembaga baik itu dikantor ataupun perusahaan, dengan mendapatkan upah atau gaji selama masa kerja tertentu. 2.2.2. Kinerja Menurut Hadari Nawawi (2006) kinerjaiiadalah suatu kemampuan kerja, prestasi yang diperlihatkan, serta suatu target yang dapat tercapai dengan jangka waktu yang telah ditentukan, kinerjaiidapat dikatakan tinggi apabila suatu kemampuan seseorang menyelesaikan pekerjaan sesuai dengan target dalam jangka waktu yang telah ditentukan,iisebaliknya kinerja yang rendah yaitu apabila seseorang tersebut menyelesaikan pekerjaannya melampaui batas waktu yang ditentukan ataupun pekerjaannya sama sekali tidak diselesaikan [11]. 2.2.3. Penilaian Kinerja Menurut dessler (2003) penilaian kinerja adalah proses mengevaluasi kinerja karyawan baik itu kinerja pada saat ini atau dimasa 9 lalu, terhadap standar prestasi yang pernah ia capai, maupun standar prestasi yang ditetapkan oleh perusahaan. 2.2.4. Prosedur Penilaian Kinerja Karyawan Dalam proses penilaian kinerja karyawan restoran Ibarbo, pihak HRD menerapkan penilaian konsep 360 derajat, berikut adalah poin penilaiannya yaitu : a. Disiplin Tingkat kedisipinan karyawan mulai dipantai dari waktu kedatangannya sampai waktu closing selesai, tiap karyawan wajib datang pukul 15.00 WIB, apabila lebih dari waktu tersebut maka akan dikenakan pemotongan uang service (uang bagian hasil laba perusahaan) dengan jumlah lima ribu rupiah setiap lima menit, hal ini berlaku akumulasi. b. Attitude (sikap) Pada poin ini sikap karyawan akan dimati menggunakan kamera CCTV yang telah dipasang pada tiap sudut restoran, penilaian sikap ini mulai dari seberapa tanggap karyawan apabila terdpat konsumen yang baru datang, sikap melayani konsumen, sikap melakukan proses memasak apakah waktu memasak terlalu lama atau tidak, dan cara penyajian makanan kepada konsumen. c. Detail Poin detail adalah dimana karyawan dapat melakukan pekerjaannya secara teliti, baik itu captain dengan tugasnya sebagai checker, chashier dengan tugasnya sebagai penghitung keuangan dan estimasi waktu proses masakan, hot dengan tugasnya dalam membuat makanan apakah memprosesnya dengan teliti dan pizza dengan tugasnya membuat hidangan dengan topping yang telah dipesan, apakah sudah benar atau belum. d. Konsistensi 10 Konsistensiiimerupakan bagian poin yang sangat penting dalam proses penilaian, karena pada dasarnya sifat manusia pasti akan ada titik jenuh, baik itu karena rutinitas atau terdapat masalah lain didalam maupun diluar pekerjaannya, pihak HRD akan melihat konsistensi karyawan dalam melakukan pekerjaannya, kemudian dari hasil penilaiannya akan dibuat grafik konsistensi karyawan, sehingga akan didapatkan pada masa tertentu karyawan tersebut daya kerjanya sedang naik atau menurun, hal tersebut dapat sebagai tolak ukur grafik konsistensi karyawan. e. Job Knowledge Job knowledge atau lebih sering disebut sebagai pengetahuan karyawan tentang pekerjaan apa yang dilakukannya, pada restoran Ibarbo terdapat struktur pekerjaan yaitu captain yang bertugas sebagai ceker atau melihat menu masakan mana yang sudah selesai diproses dan mana yang belum diproses,iicashier bertugas sebagai menghitung jumlah total pembelian konsumen serta mampu mengestimasi berapa lamakah waktu yang dibutuhkan untuk memproses pesanan baru jika jumlah order makanan sedang banyak dan membuat minuman atau baverage ,hot bertugas membuat makanan berupa pasta dan nasi sesuai dengan arahan captain, dan posisi karyawan pada outlet adalah pizza yang bertugas membuat pizza kemudian mengecek apakah tingkat kematangannya sudah sesuai atau belum, apabila tingkat kematangan sudah sesuai karyawan pada bagian ini wajib mengangkat dan memeberitahu pada captain bahwa pesanannya sudah siap. fungsi dari poin ini adalah untuk melihat seberapa luas penggetahuan masing – masing karyawan akan pekerjaan yang mereka lakukan apakah sudah sesuai dengan SOP perusahaan. Dalam hal melakukan penilaian selain dengan lima poin diatas, pihak HRD juga melakukan sub poin terhadap masing – masing poin 11 utama tersebut, sub poin tersebut yaitu dihitung dari angka 1 – 5 (satu sampai lima), sub poin tersebut yaitu : a. angka satu berarti sangat buruk. b. angka dua berarti buruk. c. angka tiga berarti sedang. d. angka empat berarti baik. e. dan yang terakhir angka lima berarti sangat baik. 2.3. Tinjauan Data Mining Data mining atau lebih sering disebut dengan istilah knowledge discovery (mining) in databases (KDD), data/pattern analysis, data dredging, business intelligence, dan knowledge extraction merupakan sebuahiiproses pencarian data yang dilakukan secara otomatis pada tempat penyimpanan data yang berukuran besar atau data yang banyak, data mining juga bertujuan sebagai metode pengurai database atau lebih seringiidisebut juga dengan namaiidataset yang hasilnya digunakan untuk mendapatkan pengetahuan baru supaya bisa lebih bermanfaat. Pengetahuan tersebut dapat berupa suatu penjelasan tentang prediksi masa depan atau masa lampau. Ada beberapa teknik dalam data mining diantaranya yaitu teknik, statistika, kecerdasan buatan (AI), matematika dan machine learning. Hasil dari penggunaaniibeberapa teknik tersebut dapatiidigunakan untuk bahan pertimbangan prediksi sistem pengambilan keputusan di masa mendatang. 12 Gambar 2.1 Proses KDD database 2.3.1 Proses CRISP Data Mining Untuk membuat suatu projek didalam Data Mining yang sistematis, banyak ilmuan dan peneliti data mining mengusulkan untuk menggunakan beberapa tahapan dalam proses data mining, gunanya untuk meningkatkan peluang keberhasilan dalam pelaksanaan projek data mining tersebut. Tahapan - tahapan yang diusulkan tersebut kemudian dijadikan sebagai standarisasi didalam tahap data mining atau lebih sering disebut CRISP-DM [12]. CRISP-DM merupakan singkatan dari Cross-Industry Standard Process for Data Mining adalah standar yang telah dikembangkan pada tahun 1996, yang awalnya digunakan untuk melakukan proses analisis dari suatu industri sebagai salah satu cara pemecahan masalah dari unit atau bisnis penelitian, CRISP-DM ditujukan untuk menemukan suatu pola didalam database untuk mendapatkan pengetahuan dengan cara atau model baru, dengan menerapkan tahap-tahap dalam data mining. Berikut adalah gambar tahap – tahap CRISP-DM, barikut penjelasannya : 13 Gambar 2. 2 Tahap CRISP-DM 1. Fase Pemahaman Bisnis ( Business Understanding ) Ini merupakan tahap awal, pada tahap pemahaman bisnis ini dilakukan penentuan tujuan proyek dan kebutuhan secara mendetail serta menyeluruh, selain itu pada tahapan ini dilakukan penerjemahan tujuan serta batasan untuk dijadikan formula atau sumber masalah dalam data mining dan penyiapan strategi awal supaya proyek yang dihasilkan dapat mencapai tujuan. 2. Fase Pemahaman Data ( Data Understanding Phase ) Pada tahap ini dilakukan pengumpulan data, apabila jumlah database lebih dari satu maka akan dilakukan proses penggabungan data ( data integration ), kemudian dilakukan analisis data berupa pembersihan data yang tidak valid atau proses data cleaning, jika sudha mendapatkan data yang diinginkan akan dilakukan pemilihan sampel data yang mengandung pola dari permasalahan. 3. Fase Pengolahan Data ( Data Preparation Phase ) 14 Pada tahap ini adalah persiapan data yang akan digunakan pada tahap selanjutnya, data yang disiapkan yaitu berupa atribut serta kasus yang akan dianalisis, Jika diperlukan akan dilakukan perubahan pada atribut data untuk mendapatkan hasil yang maksimal. 4. Fase Pemodelan ( Modeling Phase ) Dalam tahapan ini dilakukan pemilihan dan penerapan teknik permodelan yang sesuai serta mengkalibrasi aturan model untuk mencapai hasil yang maksimal, proses kalibrasi dapat menggunakan teknik yang sama untuk diterapkan pada permasalahan yang sama, apabila ingin mengubah data dalam bentuk tertentu maka dapat kembali pada fase pengolahan data. 5. Fase Evaluasi ( Evaluation Phase ) Pada fase permodelan sudah dibuat dan diharapkan mempunyai kualitas yang baik, oleh karena itu dilakukan evaluasi dari permodelan yang digunakan pada fase sebelumnya. Pada tahap ini juga dilakukan pengujian terhadap keefektifan dan kualitas dari model yang sudah dibuat dalam fase sebelumnya. Tahap ini bertujuan untuk menemukan apakah ada masalah yang belum dipertimbangkan serta untuk menententukan keefektifan penggunaan pada hasil proses data mining. 6. Fase Penyebaran ( Deployment ) Dari informasi yang diperoleh akan diproses sehingga informasi yang dihasilkan dapat digunakan dan dipahami oleh pengguna. Hasil dari tahap ini, dapat berupa laporan sederhana atau dapat juga berupa implementasi dalam proses data mining yang berulang. Tahap ini sangat penting, karena pada tahap ini secara tidak langsung melibatkan konsumen agar dapat memahami model atau konsep yang sudah dibuat. 2.3.2 Teknik Klasifikasi Data Mining Teknik klasifikasi merupakan suatu proses dalam upaya untuk menemukan atribut yang sama pada sebuah himpunan obyek di dalarn database, kemudian dilakukan proses klasifikasi atau penyaringan ke dalam tiap kelas yang berbeda tergantung dengan model klasifikasi apa 15 yang ditetapkan, tujuan dari klasifikasi data mining yaitu membangun model yang tepat digunakan untuk memprediksi data dimasa depan [13].iiAlgoritma yang sering digunakan yaituiiseperti Naïve Bayes, Decision Tree, NeuraliiNetwork, Suport Vector Machines (SVM) ,KNearest Neighbor (KNN) [14]. 2.3.3 Naive Bayes Algoritma Naive Bayes pertama kali dikemukakan oleh seorang yang bernama Thomas Bayes, dimana beliau adalah seorang pendeta dari Inggris pada tahun 1763. Algoritma Bayes ini kemudian disempurnakan lagi oleh Laplace yang seorang ahli matematika , Algoritma Bayes umumnya digunakan untuk menghitung probabilitas terjadinya suatu peristiwa berdasarkan pengaruh yang didapat dari hasil suatu observasi. Teorema ini menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syaratiiperistiwa B telah terjadi serta probabilitas terjadinya peristiwa B dengan syarat peristiwa A harus sudah terjadi [15]. Algoritma ini didasarkan pada prinsip bahwaiitambahan informasi dapat memperbaiki suatu probabilitas, adapun perhitungan algoritma Naïve Bayes adalah sebagai berikut : π(πΆπ|π) = π(π|πΆπ)π(πΆπ) . . . (π − π) π(π) Demikian penjelasannya: X = data dengan class belum diketahui. Ci = hipotesis data X merupakan suatu class yang spesifik π(πΆπ |π) = probabilitas hipotesis H berdasarkan kondisi X (posterior probability) π(πΆπ )= probabilitas hipotesis (prior probability) id_karyawan jk umur status divisi gaji kontrak ketkinerja 16 1 2 3 4 5 6 7 8 9 10 P L P L L L P P P L 22 - 26 27 - 30 22 - 26 18 - 21 > 30 22 - 26 22 - 26 22 - 26 22 - 26 22 - 26 KAWIN KAWIN KAWIN KAWIN BELUM KAWIN KAWIN KAWIN KAWIN KAWIN KAWIN Cashier Cooker Pizza Pizza Cashier Cooker Cashier Pizza Cooker Cashier 1 - 1,5 jt 1 - 1,5 jt 1,5 - 2 jt 1,5 - 2 jt 1,5 - 2 jt 1,5 - 2 jt 1 - 1,5 jt 1,5 - 2 jt 2 - 2,5 jt 2 - 2,5 jt > 2 thn 2 thn 2 thn 1 thn 6 bln 6 bln 6 bln > 2 thn > 2 thn 2 thn BAIK BAIK BURUK BAIK BURUK BURUK SANGAT BAIK SANGAT BAIK BURUK CUKUP Berikut adalah contoh perhitungan manual dari metode Naive Bayes : Tabel 2. 2 Dataset Karyawan Class: C1 : ketkinerja = ‘SANGAT BAIK’ C : ketkinerja = ‘BAIK’ 2 C3 : ketkinerja = ‘CUKUP’ C4 : ketkinerja = ‘BURUK’ Data to be classified: X = (jenis kelamin L, umur 22 - 26, status = KAWIN, divisi = Pizza, gaji = 1,5– 2 juta, kontrak = 1 tahun, ketkinerja = ?) • P(C ): P(ketkinerja = “SANGAT BAIK”) = 2/10 = 0.2 • P(Ci): P(ketkinerja = “BAIK”) = 3/10= 0.3 • P(Ci): P(ketkinerja = “CUKUP”) = 1/10 = 0.1 • i P(Ci): • P(ketkinerja = “BURUK”) = 4/10 = 0.4 Menghitung class jenis kelamin P(X|Ci) P(JENIS KELAMIN = “L” | ketkinerja = SANGAT BAIK ) = 0 P(JENIS KELAMIN = “L” | ketkinerja = BAIK ) = 2/3 = 0.66 P(JENIS KELAMIN = “L” | ketkinerja = CUKUP ) = 1 P(JENIS KELAMIN = “L” | ketkinerja = BURUK ) = 2/4 = 0.5 • Menghitung Class Umur P(X|Ci) 17 P( UMUR = “ 22 – 26 ” | ketkinerja = SANGAT BAIK ) = 2 / 2 = 1 P( UMUR = “ 22 – 26 ” | ketkinerja = BAIK ) = 1 / 3 = 0.33 P( UMUR = “ 22 – 26 ” | ketkinerja = CUKUP ) = 1 / 1 = 1 P( UMUR = “ 22 – 26 ” | ketkinerja = BURUK ) = 3 / 4 = 0.75 • Menghitung Class Status P(X|Ci) P( STATUS = “ KAWIN ” | ketkinerja = SANGAT BAIK ) = 2 / 2 = 1 P( STATUS = “ KAWIN ” | ketkinerja = BAIK ) = 3 / 3 = 1 P( STATUS = “ KAWIN ” | ketkinerja = CUKUP ) = 1 / 1 = 1 P( STATUS = “ KAWIN ” | ketkinerja = BURUK ) = 3 / 4 = 0.75 • Menghitung Class Divisi P(X|Ci) P( DIVISI = “ PIZZA ” | ketkinerja = SANGAT BAIK ) = 1 / 2 = 0.5 P( DIVISI = “ PIZZA ” | ketkinerja = BAIK ) = 1 / 3 = 0.33 P( DIVISI = “ PIZZA ” | ketkinerja = CUKUP ) = 0 P( DIVISI = “ PIZZA ” | ketkinerja = BURUK ) = 1 / 4 = 0.25 • Menghitung Class Gaji P(X|Ci) P( GAJI = “ 1.5 - 2 JUTA ” | ketkinerja = SANGAT BAIK ) = 1 / 2 = 0.5 P( GAJI = “ 1.5 - 2 JUTA ” | ketkinerja = BAIK ) = 1 / 3 = 0.33 P( GAJI = “ 1.5 – 2 JUTA ” | ketkinerja = CUKUP ) = 0 P( GAJI = “ 1.5 – 2 JUTA ” | ketkinerja = BURUK ) = 3 / 4 = 0.75 • Menghitung Class Kontrak P(X|Ci) P( KONTRAK = “ 2 TAHUN ” | ketkinerja = SANGAT BAIK ) = 0 P( KONTRAK = “ 2 TAHUN ” | ketkinerja = BAIK ) = 1 / 3 = 0.33 P( KONTRAK = “ 2 TAHUN ” | ketkinerja = CUKUP ) = 1 / 1 = 1 P( KONTRAK = “ 2 TAHUN ” | ketkinerja = BURUK ) = 1 / 4 = 0.25 P(X|Ci) P(X|Ci) SANGAT BAIK = 1*1*0.5*0.5*0*0 = 0 P(X|Ci) BAIK = 0.33*1*0.33*0.33*0.33*0.66 = 0.00782 P(X|Ci) CUKUP = 1*1*0*0*1*1 = 0 18 P(X|Ci) BURUK = 0.75*0.75*0.25*0.75*0.25*0.5 = 0.01318 P(X|Ci)*P(Ci) : P(X|Ci)*P(Ci) SANGAT BAIK = 0.2 * 0 = 0 P(X|Ci)*P(Ci) BAIK = 0.00782* 0.3 = 0.00234 P(X|C )*P(C ) CUKUP = 0.1 * 0 = 0 i i P(X|Ci)*P(Ci) BURUK = 0.4 * 0.01318= 0.00527 Jadi hasil prediksi yang didapat adalah angka terbesar dari rumus akhir P(X|Ci)*P(Ci) dengan angka 0.00527 yaitu sama dengan buruk. 2.3.4 Confusion Matrix Confusion Matrix merupakan suatu alat yang digunakan sebagai sistem pengevaluasianiimodel klasifikasi dengan cara membandingakan matrix dari prediksi dengan kelas dari suatu inputan,iidimana inputan tersebut berisi informasi nilai aktual daniprediksi pada klasifikasi. Hasil dari proses ini yaitu perkiraan antara dua objek yaitu objek yang benar (true) atau salah (false) [16]. Tabel 2. 3 Confusion Matrix Classification Predicted class Class = Yes Class = No Class = Yes a (true positive-TP) b (true negative-TN) Class = No c (false positive-FP) d (false negative-FN) Dibawah ini adalah rumus confusion matrix untuk menghitung nilai tingkat akurasi : 19 π΄πππ’ππππ¦ = ππ + πΉπ . . . (π − π) ππ + πΉπ + ππ + πΉπ Contoh tingkat akurasi, sebagai berikut: Accuracy 0.90 – 1.00 = Excellent classification (Sangat Baik) Accuracy 0.80 – 0.90 = Good classification (Baik) Accuracy 0.70 – 0.80 = Fair classification (Sedang) Accuracy 0.60 – 0.70 = Poor classification (Buruk) Accuracy 0.50 – 0.60 = Failure (Sangat Buruk) 2.3.5 Cross Validation Menurut B Santoso validasi merupakan suatu prosesiiuntuk mengevaluasi keakuratan prediksi dari suatu model.iValidasi dilakukan dengan membandingkan hasil model yang sudah diprediksiisebelumnya dengan hasil yang sudah diketahui. Cross Validation merupakan suatu teknik validasi dengan melakukan pembagian data secara random dalam kiibagian,iikemudian setiap bagian dilakukan proses pengklaifikasian.iCross Validation yang mempunyai jumlah tetap kelipatan atau pembagian dari data ditentukan sendiri.iiUntuk memprediksi error rate dari teknik pembelajaran data mining sebuah sampel data tetap adalah dengan menggunakan 10-fold cross validation. Dengan 10-fold cross validation, data akan dibagi secara acak menjadi 10 bagian,iidimana class diwakili (kurang lebih) proporsi yang sama seperti pada dataset yang penuh. Setiap bagian mendapatkan gilirannya dan skema pembelajaran dilatih pada sisa sembilan persepuluh, kemudian error rate dihitung pada holdout set. Dengan demikian, prosedur pembelajaraniidilaksanakan sebanyak 10 kali di training set yang berbeda (setiap set memiliki banyak kesamaan dengan yang lain). Akhirnya, 10 estimasi error dirata-rata untuk menghasilkan perkiraan kesalahan keseluruhan [17]. 20 2.4. Kerangka Pemikiran Tabel 2. 4 Keranga Pemikiran Masalah 1. Bagaimana algoritma Naive Bayes dapat mengklasifikasi data karyawan. 2. Bagaimana hasil tingkat akurasi algoritma Naïve Bayes dalam mengklasifikasi penilaian kinerja karyawan. Tujuan 1. Untuk mengetahui bagaimana penerapan dari algoritma Naive Bayes dalam mengklasifikasikan penilaian kinerja karyawan . 2. Untuk mengetahui tingkat akurasi dari penggunaan algoritm Naive Bayes dalam mengklasifikasi penilaian kinerja karyawan resto Ibarbo. Metode Metode yang digunakan yaitu metode Naive Bayes Development Data Konstruksi Data proposal karyawan restoran Notepad++, XAMPP, MySQL Ibarbo. Pengujian Confusion Matrix Hasil Nilai akurasi penerapan algoritma Naive Bayes terhadap sistem pendukung keputusan penilaian kinerja karyawan resto Ibarbo. 21 55 BAB III METODOLOGI PENELITIAN 3.1. Instrumen Penelitian Instrumen penelitian adalah suatu tahapan yang digunakan untuk mengumpulkan, memeriksa, serta menyelidiki suatu masalah serta mengolah, menganalisa dan menjadikan data-data secara sistematis serta objektif dengan tujuan untuk memecahkan suatu permasalahan ataupun sebagai pengujian hipotesis. Berikut instrument yang digunakan : 3.1.1. Kebutuhan Perangkat Lunak Adapun kebutuhan perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut : a. Rapid Miner Rapid Miner merupakan salah satu software yang digunakan untuk mengolah data padaiidata mining. Sebagai langkah untuk mempermudah pengujian model yang dibuat maka digunakan Rapid Miner, supaya model yang dibuat memiliki tingkat akurasi yang tinggi sekaligusisebagai evaluasi dan validasi model. b. Visual Basic Adalah Tools yang digunakan untuk menyusun dan merancang program aplikasi.iiPada tools ini pemodelan yang dibuat akan disisipkan pada script VB6 sebagai pengelolah data karyawan, yang nantinya akan dihasilkan berupa output dari pengolahan tersebut. c. Interprice Architecture Salah satu perancangan yang digunakan dalam penelitian ini adalah perancangan UML. Untuk melakukan perancangan model UML penulis menggunakan software berupa Enterprice Architect (EA).iiSoftware EA sering digunakan dalam suatu perancangan 21 55 22 UML karena kemudahan dalam penggunaan serta UI yang mudah dipahami. Software ini dapat digunakan untuk melakukan berbagai pemodelan terkait UML (seperti usercases, sequence diagram, activity diagram, dll). 3.1.2. Kebutuhan Perangkat Keras Kebutuhan perangkat keras yang digunakan harus mempunyai beberapa spesifikasi tertentu, demikian adalah spesifikasi minimum perangkat keras yang dapat menunjang penggunaan aplikasi tersebut : 3.2. - Processor yang mempunyai kecepatan minimal 1GHz - RAM minimal 512 MB - VGA onboard minimal 16MB - Hardisk free space dengan memory minimal 2 GB Sumber Data Dalam penelitian ini sumber data dibagi menjadi dua bagian yaitu sumber data data primer dan sumber data sekunder. Berikut merupakan sumber data yang diperoleh : a. Data Primer Data primer merupakan data yang didapat secara langsung atau dengan cara melakukan proses wawancara kepada pihak terkait, pada penelitian ini penulis melakukan sesi wawancara dengan HRD resto Ibarbo, hal ini dilakukan untuk mendapatkan sumber informasi yang lebih akurat, langkah penilaian tersebut berupa : 1. Proses penilaian kinerja karyawan Setelah para karyawan melengkapi data diri mereka, kemudian dilakukan proses penilaian kinerja, berupa : - Menganalisa kinerja karyawan Merupakan aktivitas Kunjungan HRD atau manager ketiap cabang resto Ibarbo , minimal tiga kali dalam satu bulan, dengan aktivitas sebagai berikut : 22 22 23 a. Mengamati secara seksama siapa sajakah karyawan yang datang tepat waktu. b. Mengamati kinerja karyawan yang sedang melakukan pekerjaannya, diantaranya cook, pizza, cashier, dan captain, serta melihat apakah tugas yang mereka lakukan tersebut selesai tepat waktu dan kalau dikasih tugas tambahan dari atasan apakah akan menolak atau tidak. c. Melakukan proses penilaian dengan cara melakukan sesi tanya jawab kepada seluruh karyawan secara bergantian, pertanyaan tersebut berupa kendala apa saja yang dihadapi dalam masing – masing pekerjaannya, menanyakan respon karyawan satu dengan karyawan lain terkait respon menangani pelanggan, serta apakah karyawan bisa berkoordinasi dengan baik kepada semua bagian baik atasan maupun bawahan dan juga dalam team. d. Kemudian pihak HRD mengisi form penilaian yang berisi nama, tanggal lahir, pendidikan terakhir, alamat, masa kerja, status, jenis kelamin, agama, dan form rangking penilaian yang berisi lima poin (sesuai dengan yang dijelaskan pada bab sebelumnya). - HRD mengumpulkan berkas penilaian, kemudian diambil nilai rata – rata dari setiap penilaian tersebut. - Hasil dari nilai penilaian tersebut dijadikan acuan untuk memberikan hasil penilaian terhadap karyawan mana saja yang layak untuk diberikan apresiasi, dan karyawan mana yang dapat teguran. 2. Atribut yang digunakan dalam proses penilaian karyawan Tabel 3. 1 Atribut dan Keterangan Karyawan No Atribut 1 Id_karyawan 2 Nama 3 Alamat Keterangan Nomor ID karyawan Nama Karyawan Alamat lengkap karyawan 24 4 5 6 7 8 9 Agama Jenis Kelamin Umur Status Divisi Gaji Agama karyawan Jenis kelamin karyawan Umur karyawan Sudah atau belum menikah Bagian kerja karyawan (masak,dll) Gaji karyawan perbulan 10 11 Kontrak Ket. Kinerja Lama masa kerja karyawan Keterangan hasil kinerja karyawan 3. Kendala yang dihadapi Penilaian kinerja terkadang dirasa kurang adil oleh karyawan, sebab beberapa karyawan terlihat cekatan hanya pada waktu saat HRD atau manager datang untuk memantau saja, sehingga timbul masalah kesenjangan kerja terhadap karyawan lain, hal ini menjadikan teamwork menjadi kurang terjaga b. Data Sekunder Pada penelitian iniiData sekuder yang dimaksud adalah sebagai sumber pelengkap teori dari data primer yang telah didapatkan dari berbagai literatur, diantaranya buku perpustakaan dan browsing melalui internet hasil yang didapatkan yaitu berupa pengertian, definisi serta konsep terkait dengan penyusunan laporan Tugas Akhir. 3.3. Metode Pengumpulan Data Sesuai dengan sumber data dan tujuan penyusunan laporan Tugas Akhir, serta untuk mendapatkan hasil data yang akurat , maka dalam pengumpulan data penulis mengguankan beberapa teknik antara lain : 3.3.1. Studi Pustaka Dalam proses penyusunan penelitian ini, penulis menggunakan beberapa study pustaka diantaranya literatur yang terdapat pada 25 perpustakaan serta jurnal dan buku yang yang ada diinternet yang berkaitan dengan sistem penilaian karyawan dan metode Naive Bayes. 3.3.2. Wawancara Wawancara dilakukan penulis kepada orang yang berkompeten serta yang mengerti tentang sifat – sifat karyawan, dalam hal ini penulis melakukan wawancara terhadap HRD resto Ibarbo dikarenakan proses penerimaan serta penilaian karyawan dilakukan oleh HRD, wawancara yang dilakukan meliputi atribut apa saja yang digunakan untuk melakukan proses penilaian kinerja karyawan, skema penilaian kinerja karyawan, dan waktu pelaksanaan penilaian kinerja karyawan, proses wawancara dilakukan dengan waktu yang tidak terbatas selama penulis melakukan observasi diresto tersebut. 3.3.3. Observasi Observasi dilakukan dengan cara mengamati dan mencatat pola perilaku seluruh karyawan ibarbo baik itu bagian hot, pizza, cashier, dan captain, adapun proses observasi yang penulis amati yaitu dengan cara mencoba menjadi karyawan resto ibarbo, hal ini dilakukan supaya penulis lebih tahu tentang karakter setiap karyawan. 3.4. Metode Atau Model Yang Diusulkan 26 Metode yang digunakan dalam penelitian ini yaitu RAD (Rapid Application Development). Dalam penelitian ini, RAD digunakan karena pemodelan ini berfokus pada penggunaan kembali sumber daya sehingga membutuhkan waktu yang singkat, pendek, dan cepat.berikut adalah gambar metode pengembangan perangkat lunak tersebut : Gambar 3. 1 Model RAD (Rapid Application Development) Berikut tahapan model RAD yang diterapkan dalam metode ini : 3.4.1. Analisis Dan Perancangan Untuk perencanaan dan pemodelan data pada penelitian ini menggunakan metode CRISP-DM, dengan tahapan sebagai berikut : a. Business Understanding Phase (Fase Pemahaman Bisnis) - Penelitian ini memiliki tujuan untuk menganalisis hasil dari poin penilaian kinerja karyawan yang sudah dirata – rata, menggunakan algoritma Naive Bayes untuk membantu pihak HRD dalam menilai kinerja karyawan. - Mengelola kembali data dan menghasilkan data klasifikasi yang terbentuk dari penelitian tersebut. - Strategi awal adalah mengumpulkan data set baru. b. Data Understanding Phase (Fase Pemahaman Data) 27 Pada penelitian ini menggunakan data set resto Ibarbo yang sudah ada, dengan beberapa modifikasi data yang berjumlah 300 data dengan beberapa atribut. c. Data Preparation Phase (Fase Pengolahan Data) Untuk mendapatkan data yang berkualitas dilakukan beberapa tahapan untuk mengolah data, karena tidak semua atribut didalam dataset yang didapatkan dapat diolah, oleh karena itu dalam fase ini dilakukan beberapa tahapan seperti berikut : 1. Cleaning Data Data karyawan yang telah terkumpul kemudian dilakukan proses perbaikan data, berikut adalah langkah – langkah perbaikan data : a. Kemungkinan pada data karyawan Ibarbo terdapat beberapa data outliers (data yang menyimpang terlalu jauh dengan data yang lainnya) atau data nois (data yang mengandung error) untuk itu dilakukan identifikasi dan penghilangan atau penghapusan data supaya pada saat dilakukan proses data mining menjadi lebih optimal. b. Nilai – nilai yang hilang dan data yang kurang lengkap pada data karyawan dilakukan penghapusan atau pengisian data tambahan disamakan dengan data - data yang lain. Algoritma naive bayes mempunyai keunggulan tersendiri yaitu menangani data yang tidak lengkap atau missing value. c. Data karyawan yang tidak konsisten dilakukan perbaikan serta data karyawan yang mengalami redudansi yang di sebabkan oleh integrasi data maka dilakukan pemecahan data. 2. Integration Data Berikutnya dilakukan integrasi data dengan menganalisis data korelasi, atribut yang redudan dan duplikat untuk meningkatkan akurasi dan efisien pengolahan algoritma. Integrasi dilakukan 28 pada atribut Identitas Karyawan dengan hasil prediksi yang dilakukannya, agar atribut yang diperlukan dalam proses data mining bias berjalan dengan baik dan optimal. 3. Reduction Data Untuk mendapatkan hasil pengolahan data yang maksimal dilakukan reduksi data set dengan cara melakukan pengurangan jumlah atribut serta record yang tidak dibutuhkan namun data tersebut masih bersifat informatif. Walaupun volume data berkurang namun hasil analisis masih sama atau serupa. Berikut atribut awal sebelum mengalami direduksi : Tabel 3. 2 Atribut karyawan sebelum dilakukan reduction data No 1 2 3 4 5 6 7 Atribut Id_karyawan Nik Nama Alamat Agama Jenis Kelamin Umur 8 9 10 11 Status Divisi Gaji Kontrak 12 Ket. Kinerja Data yang sudah dilakukan proses reduction data, atau dengan cara pengurangan atribut data tetapi masih menghasilkan nilai analisis yang sama atau serupa, dalam pemilihan data dibagian menjadi dua jenis tipe atribut yaitu atribut kategorikal yaitu salah satu tipe atribut yang domainnya merupakan sebuah himpunan, nilai 29 modelnya yaitu nama, jenis kelamin, status dan bagian. Dan yang kedua adalah atribut numerik adalah atribute yang domainnya bilangan riil atau integer, nilai modelnya yaitu umur, gaji (perbulan), dan masa kerja yang merupakan label target. Berikut atribut yang sudah mengalami reduksi : Tabel 3. 3 Atribut karyawan setelah dilakukan reduction data No 1 2 3 4 5 6 7 8 Atribut Id_Karyawan Jenis kelamin Umur Status Divisi Gaji Kontrak Keterangan Kinerja 4. Transformation data Dalam upaya untuk mendapatkan akurasi yang maksimal dan efesiensi dalam pengolahan algoritma maka perlukan tahap transformasi data. Data yang akan ditransaformasi yaitu jenis data numeric antara lain umur, gaji, masa kerja. d. Modeling Phase (Fase Pemodelan) Dilihat dari hasil penelitian yang dilakukan Dio Ariadi dan Kartika Fithriasari (2015) dapat dilihat pada metode Naive Bayes yang hasil akurasinya paling rendah sebesar 88,1% serta paling tinggi adalah 96,7% , dari penelitian tersebut dapat disimpulkan kelemahan metode Naive Bayes yaitu apabila dataset dibuat secara asal (tanpa batasan ditiap atribut) maka data yang dihasilkan akan kurang akurat. 30 Berikut adalah alur metode Naive Bayes yang diusulkan : Input Hitung π(ππ ) Hitung π(π₯|ππ ) Hitung π(π₯|ππ ) ∗ π(ππ ) Seleksi Hasil π(π₯|ππ ) ∗ π(ππ ) terbesar Hasil prediksi terbesar Output Gambar 3. 2 Model yang Diusulkan Berikut adalah keterangannya : Input : Data set. Output : Hasil prediksi pada data uji . Langkah 1 : Menentukan probabilitas hipotesis π(ππ ) Langkah 2 : Mencari nilai probabilitas masing-masing atribut π(π₯|ππ ). 31 Langkah 3 : Menyimpan data yang memiliki nilai probabilitas π(π₯|ππ ) > 0. Langkah 4 : Menghitung perkalian antara hasil hipotesis π(ππ ) dan hasil probabilitas dari atribut π(π₯|ππ ) e. Evaluation Phase (Fase Evaluasi) Pada tahap ini dilakukan test keakurataniiefesiensi penggunaan algoritma pada tahapiisebelumnya. Evaluasi pada penelitian ini memakai Cros Confussion Matrix untukiimenentukan kinerja dari modeliiklasifikasi Naïve Bayesidan CrossiiValidation untuk mengukuriierror rate memakai hasil akurasi menggunakani10-fold cross validation. f. Deployment (Fase Penyebaran) Setelah fase eveluasi pada tahapianalisis, kemudian model dapat disebarkan sehingga dapat digunakan untukiditerapkan. 3.4.2. Software Development Beberapa tahap dalam pembuatan perangkat lunak meliputi : 1. Desain alur dari program yang merupakan desain alur bisnis yangiidibuat,Desainiiiniiimenggunakaniiperancanganiiberor ientasiiiobjekiiyaitu menggunakan bahasa pemodelan UML. 2. Desain tatap muka (user interface) dari perangkat lunak yang akan dibuat. Desain yangiiakan dibuat sesederhana mungkin agar memudahkan penggguna dalam pemakaian. 3. Penyisipan algoritma padaiiperangkat lunak yang dibuatiiakan menangani tugas analisis dan mining data. 3.4.3. Pengujian Hasil Penelitian Untuk menghasilkan perangkat lunak yang berkualitas, dilakukan pengujian perangkat lunak agas software yang dibuat dapat digunakan dengan baik serta dapat dengan mudah dipahami oleh pemakai. 32 Pengujian perangkat lunak pada penelitian ini dilakukan dengan cara Acceptance Test. Pengujian dengan cara Acceptance Test yaitu pengujian perangkat lunak berdasarkan fungsionalitas dari suatu perangkat lunak yang diuji, pengujian pada penelitian ini bertujuan supaya dapat mengetahui kesalahan dalam beberapa kategori seperti fungsi salah atau hilang, kesalahan interface serta kesalahan inisialisasi. Prediksi pada penelitian ini diuji menggunakan Cross Vallidation dan Confussion Matrix, untuk mrnghasilkan accuracy, presisi dan recall, berikut rumus masing – masing untuk menentukan accuracy, presisi dan recall. Tabel 3. 4 Rumus precision, recall, dan accuracy 33 BAB IV RANCANGAN SISTEM DAN IMPLEMENTASI 4.1. Identifikasi Masalah dan Identifikasi Sumber Masalah Dalam merancang suatuiisistem diperlukan beberapa analisis diantaranya adalah identifikasi masalah serta pemecahan masalah, supaya sistem yangiidibuat mempunyai tujuan yang jelas dan digunakan dengan tepat. Berikut merupakanipenjelasan tentang masalah, sumber masalah sertaiipemecahan solusi pada penelitian ini : 4.1.1. Identifikasi Masalah Penilaian kinerja karyawan pada restoran Ibarbo masih berdasarkan pedoman dari penilaian khusus penerapan dari perusahaan pusat, yaitu dengan cara dinilai dari satu aspek saja (dilihat dari jam kedatangan karyawan), selain itu proses penilaian kinerja karyawan terkadang dilakukan namun juga kadang pula tidak diterapkan, serta data karyawan masih belum digunakan untuk analisis penilaian kinerja, sehingga hasil penilaian kinerja menjadi kurang efisien. 4.1.2. Identifikasi Sumber Masalah Untuk memaksimalkan prosesianalisis penilaian kinerja karyawan dibutuhkan beberapa perangkat lunakitambahan yang berguna untuk proses klasifikasi data set yang tersedia. Sehingga sistem tersebut nantinya dapat memberikan rekomendasi kepada HRD restoran Ibarbo, apakah karyawan dengan data tersebut mempunyai kinerja sangat baik, baik, cukup baik, ataupun buruk. 4.1.3. Pemecahan Masalah Dengan memanfaatkaniiteknik dataiimining menggunakan metode Naïve Bayes, penulis merancang sebuah sistem perangkat lunak yang dapat digunakan untuk klasifikasi data set seluruh karyawan restoran Ibarbo. Mengenai tujuan dari sistem tersebut adalah untuk memproses data karyawan restoran sehingga 33 34 diperoleh hasil prediksi penilaian kinerja karyawan yang hasilnya berupa karyawan tersebut produktif atau tidak produktif dan menghasilkan jumlah prosentase dari data set yang sudah diolah tersebut. Selain itu sistem ini diharapkaniidapat mempermudah dalam proses pengolahan data untuk penilaian kinerja karyawan secara otomatis, yang sebelumnya dilakukan dengan cara manual. 4.2. Analisis Kebutuhan Sistem Sistem yang akan dibentuk yaitu berupa aplikasi berbasis desktop yang di dalamnya terdapat data-data karyawan dengan atribut yang telah diseleksi. Pemilihan desktop sebagai dari basis sistem dikarenakan sistem yang dibuat agar memudahkan pengguna dalam pengoperasian aplikasi dan data masukan tersimpan lebih aman. Pengguna sistem yang dibutuhkan mempunyai dua jenis user yaitu Staf HRD dan Boss (owner). Staf HRD dapat meng-handle semua data karyawan, sementara Boss atau owner hanya dapat melakukan persetujuan data karyawan. 4.3. Analisis Sistem dengan UML Pada tahap analisis dalam systemiini menggunakan model perancangan sistem UML dengan bentukidiagram useicase untuk dapat mengetahui fungsi yang sekiranya dibutuhkan oleh user serta harus disediakan pula didalam sistem. 4.3.1.Diagram Use Case Merupakan diagram suatu yang menggambarkan setiap aktor yang terlibat dalam penggunaan sistem dan use case juga menggambarkan proses apa sajakah yang terdapat didalam suatu sistem tersebut, use case yang diusulkan adalah sebagai berikut : 35 uc Use Case Model Sistem Prediksi Kinerja Karyawan Mengeloh Data Karyaw an «include» HRD Proses perhitungan prediksi Naiv e Bayes Boss «include» Lihat Hasil Prediksi Gambar 4.1 Use Case Sistem Prediksi Penilaian Kinerja Pada sistem prediksi kinerja karyawan ini mempunyai dua aktor yaitu HRD dan Boss, terdapat tiga use case utama yaitu mengelola data karyawan, memproses perhitungan Naive Bayes dan melihat hasil prediksi. HRD akan mengelola data karyawan yang sudah terkumpul, pada data itu akan dicek apakah atributnya lengkap atau tidak, setelah itu dilakukan proses klasifikasi data dengan metode Naive Bayes dan yang terakhir akan terlihat hasil dari prediksinya yang akan dilihat pula oleh boss atau owner. Berikut penjelasan secara detail dari setiap use case : 36 a. Mengelola Data Karyawan 1. Skenario Mengelola Data Tabel 4.1 Skenario Mengelola Data Karyawan Use Case Name Related Requirements Goal In Context Preconditions Successful End Condition Failed End Condition Primary Actors Secondary Actors Trigger Main Flow Extensions Mengelola Data Karyawan Data karyawan tersimpan HRD menginput data karyawan ibarbo Data karyawan masuk/update kedalam database Inputan tidak dapat divalidasi sitem HRD Step 1 2 3.1 Step 3.2 Action HRD membuka menu Data Karyawan HRD menginput data karyawan ibarbo Data karyawan masuk/update kedalan database Branching Action Inputan tidak dapat divalidasi sitem 2. Diagram Activity Mengelola Data Menggambarkan HRD melakukan input data karyawan 37 act Activ ity Mengelola Data karyaw an HRD Sistem Mulai HRD meninput/edit/hapus data karyaw an Sistem memv alidasi data Sistem Menampilkan Data Selesai Gambar 4.2 Diagram Activity Mengelola Data Karyawan 3. Diagram Sequence Mengelola Data Menunjukan interaksi komunikasi yang terjadi pada saat HRD Menunjukan interaksi komunikasi yang terjadi pada HRD menginputkan data karyawan. 38 sd Interaction Mengelola Data karyaw an Halaman Prediksi Data Karyawan <<Controller>> Data Karyawan <<Database>> HRD call halaman data karyawan() call menu data karyawan() show menu data karyawan() input data karyawan() get inputan() get new data karyawan() set new data karyawan() show datas karyawan() Gambar 4.3 Diagram Sequence Melihat Data Karyawan. b. Proses Perhitungan Naive Bayes 1. Skenario Proses Perhitungan Naive Bayes Tabel 4.2 Skenario Proses Perhitungan Naive Bayes Use Case Name Related Requirements Goal In Context Preconditions Successful End Condition Failed End Condition Primary Actors Secondary Actors Trigger Main Flow Extensions Login Mendapatkan hasil rekomendasi dan akurasi dari data karyawan HRD menginput data karyawan Sistem menampilkan hasil rekomendasi Sistem gagal memproses data karyawan HRD Step 1 2 2 3 4 Step 3.1 Action Membuka halaman utama HRD menginput data karyawan pada form Klik button Proses NB Sistem melakukan proses prediksi Sistem menampilkan hasil rekomendasi Branching Action Sistem gagal memproses prediksi 39 2. Diagram Activity Proses Perhitungan Naive Bayes Menggambarkan proses pengolahan data karyawan menggunakan teknik data mining. act Activ ity Perhitungan Start HRD Sistem menampilkan_data_karyaw an buka_halaman_prediksi memilih_kriteria membaca_data_karyaw an proses_Naiv eBayes_hitungP (Ci) hitung_Naiv eByes_P (xβci ) Naiv eBayes_hitung_P (xβci )*P(ci) Naiv eBayes_Ambil_Hasil_Terbesar Menampilkan_Hasil_Prediksi End Gambar 4.4 Diagram Activity Proses Perhitungan Naive Bayes 40 3. Diagram Sequence Proses Perhitungan Naïve Bayes Menunjukan interaksi komunikasi yang terjadi pada saat HRD menginginkan sistem memproses data karyawan dengan menggunakan sd get_data_karyaw an Halaman_form_prediksi Data_karyawan <<controller>> Data_karyawan <<database>> User call_halaman_proses_prediksi () call_proses_prediksi() show_menu_prediksi () input_kriteria_prediksi() get_data_karyawan() get_data_karyawan() set_data_karyawan() NB_hitung_P(cl)_P(x|cl)_hitung P(x|cl) *P(cl) show_hasil_perhitungan_terbesar() show_hasil_prediksi() teknik data mining, yang sebelumnya data karyawan baru diinputkan pada form data karyawan. Gambar 4.5 Diagram Sequence Proses Perhitungan Prediksi c. Lihat Hasil Prediksi 1. Skenario Lihat Hasil Prediksi Tabel 4.3 Skenario Lihat Hasil Use Case Name Related Requirements Goal In Context Preconditions Successful End Condition Failed End Condition Primary Actors Login Boss dapat memantau siapa daftar karyawannya Boss memilih menu halaman laporan karyawan Boss melihat hasil prediksi Daftar data karyawan gagal ditampilkan Boss 41 Secondary Actors Trigger Main Flow Step 1 2 3.1 Extensions Step 3.2 Action Boss memilih menu halaman data karyawan Sistem menampilkan semua daftar karyawan Boss melihat daftar hasil prediksi data karyawan Branching Action Daftar data karyawan gagal ditampilkan 2. Diagram Activity Lihat Hasil Prediksi Menggambarkan Lihat Hasil Prediksi yang dapat dilakukan HRD dan Boss. act Activ ity Lihat Prediksi Boss Sistem Mulai Membuka halaman utama Membuka menu laporan prediksi Menampilkan data laporan prediksi Selesai Gambar 4.6 Diagram Activity Lihat Hasil Prediksi 42 3. Diagram Sequence Lihat Hasil Prediksi sd lihat_prediksi Halaman_laporan_prediksi data_karyawan<<controller>> Data_karyawan<<database>> User halaman_laporan_prediksi () call_menu_laporan_prediksi() get_daftar_laporan_prediksi() output_daftar_laporan() tampilkan_laporan_prediksi() Gambar 4.7 Diagram Sequence Hasil Prediksi 4.3.2.Class Diagram Pemodelan pada sistem dilakukan dengan merelasikan beberapa class menjadi satu kesatuan manajemen sistem. Adapun relasi dari setiap class yang menjadi suatu kesatuan class diagram yang utuh, sebagai berikut : class Class Model proses prediksi Kinerj a Data Karyaw an (Training) - agama_Karyawan: char alamat_Karyawan: char divisi_Karyawan: char gaji_Karyawan: char Hasil_Karyawan: char * jk_Karyawan: char konntrak_Karyawan: char nama_Karyawan: char nik_Karyawan: int status_Karyawan: char umur_Karyawan: char + + + * + + + HRD akurasiPrediksi: int hslPrediksi: char Nik_karyawab: int getData() hpsData() lhtdata() prosesPrediksi(): int tambahData() updateData() 1 - * id_staf: int nama_staf: char password_staf: char username_staf: char * Boss 1 Gambar 4.8 Class Diagram Keseluruhan - id_boss: int nama_boss: int password_boss: int username_boss: int 43 Adapun daftar tabel yang terdapat pada sistem ini yaitu sebagai berikut: a. Tabel Akun User (HRD dan Boss) Tabel 4.4 Tabel User Akun Nama Atribut Tipe Panjang Keterangan Id_user Integer 10 Primary Key Nama Varchar 30 Nama pengguna Username Varchar 20 Username pengguna Password Varchar 20 Password pengguna Jabatan Varchar 20 Jabatan sebagai HRD kreditur/pimpinan b. Tabel Karyawan Tabel 4.5 Tabel Karyawan Nama Atribut Tipe Panjang Keterangan NIK Integer 20 NIK (Primary Key) Nama Varchar 30 Nama Karyawan Alamat Varchar 30 Alamat Karyawan Agama Varchar 10 Agama Karyawan Jenis Kelamin Varchar 10 Jenis kelamin (L/P) Umur Varchar 3 Umur dalam tahun Status Varchar 11 Status keluarga Divisi Varchar 10 Divisi saat ini Gaji Varchar 10 Gaji perbulan Kontrak Varchar 5 Kontrak Karyawan Hasil_Kinerja Varchar 15 Hasil keterangan kinerja (Lancar/Macet) 44 4.4. Desain Antar Muka (User Interface) Perancangan desain tampilan antarmuka sistem dilakukan setelah melakukan perangcangan fungsional. Perancangan antarmuka sistem ini didasarkan pada bentuk interaksi manusia dan komputer. Dalam perancangan interface ini, pengguna dibagi menjadi dua jenis yaitu User HRD dan User Boss. User HRD dapat mengolah data Karyawan (Tambah, Edit, Hapus) dan menginput data karyawan untuk mendapatkan hasil prediksi. Sementara User Boss dapat melihat hasil dari perhitungan prediksi,. Adapun desain antar muka sebagai berikut : a. Halaman Login Gambar 4.9 Halaman Login Pada halaman ini, user (HRD dan Boss) harus melakukan login terlebih dahulu menggunakan username dan password untuk masuk pada halaman utama. 45 b. Halaman Utama Gambar 4.10 Halaman Utama Setelah melakukan login user, sistem akan mengarahkan tampilan kehalaman utama. Untuk HRD, pada halaman utama terdiri dari menu diantaranya Data Karyawan dan Perhitungan Prediksi Karyawan. Sementara untuk Boss terdiri dari menu Data Karyawan, Laporan Prediksi Karyawan dan Daftar HRD. 46 c. Halaman Data Karyawan Gambar 4.11 Halaman Data Karyawan Pada halaman ini, pengguna dapat melakukan pengolahan data karyawan seperti menambah, mengedit, update maupun menghapus data karyawan. Dan dibagian bawah berisi isi list atau daftar karyawan yang bekerja diIbarbo. 47 d. Proses Prediksi-Data Mining Gambar 4.12 Halaman Perhitungan Prediksi Pada halaman Proses DM, terdiri dari tiga bagian yaitu Input Data Karyawan, Hasil Proses NB dan List Data Karyawan. Penjelasan disetiap sub halaman sebagai berikut : 1) Input Data Karyawan Pada sub halaman ini terdapat form – form mengenai informasi karyawan yang nantinya dapat diinputkan oleh pengguna (HRD) melalui button ‘Tambah’, serta dapat juga dilakukan proses perhitungan data mining melalu button ‘Prediksi 2) Hasil Proses Prediksi Naïve Bayes Setelah user melakukan inputan pada sub halaman input data karyawan. Sistem akan menampilkan hasil rekomendasi pada form. 48 3) List Data Karyawan Menampilakan daftar Karyawan yang pernah dilakukan proses prediksi Data Mining oleh Sistem. 4.5. Implementasi Setelah melalui tahapan perancangan sistem, selanjutnya adalah implementasi sistem. Peneliti mengunakan Microsoft Visual Basic 6.0 dan Mysql untuk mengimplementasikan penelitian yang telah dilakukan peneliti dengan algoritma Naïve Bayes. Adapun implementasi antarmuka sebagai berikut: a. Form Login Gambar 4.13 Form Login Untuk melakukan login, seorang user harus menginputkan username dan password. Setelah itu user akan disuguhkan tampilan halaman utama sesuai jabatan user yaitu HRD atau Boss. 49 b. Form Halaman Utama Gambar 4.14 Form Utama User Setelah Login Pada Gambar diatas, form halaman utama dibagi menjadi 2 sesuai jabatan user yaitu untuk user HRD dan user Boss. 50 c. Form Kinerja Karyawan Gambar 4.15 Form Data Karyawan Pada Gambar diatas, form ini berisi tampilan data karyawan yang pernah melakukan bekerja diResto Ibarbo dengan hasil akhir kinerjanya. Data dikelola oleh HRD. 51 d. Form Prediksi Kinerja Karyawan Gambar 4.16 Form Prediksi Kinerja Karyawan Pada Gambar diatas, aplikasi dijalankan dengan memasukkan inputan yang ada. Pada form ini menampilkan hasil output dari penginputan data karyawan yang telah diproses dengan algoritma Naive Bayes. Proses klasifikasi dipengaruhi oleh atribut-atribut terpilih yang mendukung untuk menentukan kelas kinerja karyawan. 4.6. Pengujian Perangkat Lunak Sistem yang akan diuji berupa perangkat lunak berbasis dekstop yang di dalamnya terdapat data-data karyawan. Pengujian dilakukan dengan Acceptance Test perangkat lunak berdasarkan fungsionalitas perangkat lunak. Pengujian dilakukan dengan cara menguji tampilan dan fungsi sistem dengan beberapa 52 contoh kasus. Adapun contoh kasus yang akan diujikan tersebut adalah sebagai berikut : a. Login Tabel 4.6 Pengujian Acceptance Test pada form Login Skenario Pengujian Login window HRD dengan mengiput username dan password HRD Text Case Hasil yang diharapkan Sistem akan menampilkan window HRD Hasil Pengujian Keterangan Hasil Valid, sistem menampilakan window HRD 53 b. Proses Prediksi Kinerja Pengujian prediksi pengajuan dilakukan oleh user HRD dengan memasukkan data karyawan sesuai form yang disediakan oleh sistem. Dan kemudian data tersebut akan diproses oleh sistem untuk menghasilkan prediksi Kinerja. Tabel 4.7 Pengujian Acceptance Test pada form Prediksi Kinerja Skenario Pengujian HRD menginputkan data pengajuan sesuai form yang tersedia Text Case Hasil yang diharapkan Sistem akan memproses data karyawan dan menampilkan hasil prediksi Hasil Pengujian Keterangan Hasil Valid, sistem menampilakan hasil prediksi Naïve Bayes. 54 c. Laporan Karyawan Laporan hasil pengujian kinerja karyawan dapat dilihat oleh boss dan HRD. Tabel 4.8 Pengujian Acceptance Test pada form laporan Skenario Pengujian Proses perhitungan Naive Bayes sudah dilakukan Text Case Hasil yang diharapkan Sistem akan menampilkan laporan hasil dari perhitungan Naive Bayes dalam bentuk format PDF, dari laporan tersebut dapat dilihat apakah kriteria yang dimasukkan akan diprediksi, buruk, cukup, baik, dan sangat baik. Hasil Pengujian Keterangan Hasil buruk, cukup, baik, atau sangat baik karena dipengaruhi oleh hasil perhitungan Naive Bayes. 55 BAB V HASIL PENELITIAN DAN PEMBAHASAN 5.1. Data Penelitian Data yang digunakan pada penelitian ini berasal dari data Resto Ibarbo dengan jumlah data sebanyak 726 record. Terdiri dari 12 atribut yaitu No, Cabang, Nama, Alamat, Jenis Kelamin, Umur, Agama, Status, Divisi, Gaji, Kontrak dan Kinerja. Tabel 5.1 Data awal yang belum mengalami preparation data 5.2. Pengolahan Data (Data Preparation) Pada data yang hilang atau tidak lengkap menyebabkan ketidak benaran ataupun bahkan menyesatkan, maka untuk mendapatkan data yang berkualitas dilakukan tahap preparation data, beberapa teknik yang dilakukan pada tahap preparation data sebagai berikut: 55 56 5.2.1. Cleaning Data Terdapat 30 record data yang tidak lengkap/incomplete, nilai attribute yang hilang, dan terdapat data outliers dan data nois. Sehingga dilakukan penghapusan data tersebut. Yang menghasilkan sisa data sebanyak 670 record. 5.2.2. Integrasi Data Langkah selanjutnya yaitu integration teknik yang dipakai menganalisis data korelasi, atribut yang redudan dan duplikat data untuk meningkatkan akurasi dan efisien algoritma. Atribut No_Karyawan dan NIK diintegrasikan atau digabungkan. Kedua data (tabel) tersebut diintegrasikan karena dibutuhkan dalam proses perhitungan prediksi nantinya. 5.2.3. Reduksi Data Mereduksi data set dengan mengurangi jumlah atribut dan record agar lebih sedikit namun bersifat informatif. Mendapatkan representasi dalam volume data yang sudah dikurangi tetapi masih menghasilkan analitis yang sama ataupun serupa dan deskritasi data merupakan bagian dari reduksi data, bagian penting untuk data numerik. Atribut yang dihapus adalah atribut No, Nama, Alamat dan Agama, karena tidak akan memberikan informasi yang dibutuhkan dalam proses mining dan akan adanya kemungkinan pengulangan cabang, nama, alamat dan agama (tidak unik). Dari hasil reduksi, didapatkan 670 data/record dan 7 attribut yaitu jenis kelamin, umur, status, divisi, gaji, kontrak dan keterangan kinerja. Serta kinerja yang merupakan label target. 5.3. Transformasi Data (Transformation) Setelah dilakukan reduksi data, kemudian dilakukan data konversi yaitu dilakukan perubahan terhadap data dalam bentuk nominal untuk memudahkan proses mining. 57 Data dengan atribut yang yang telah dipilih kemudian dikonversikan untuk memudahkan proses mining, karena data akan diolah dengan tools bantu data mining, berikut adalah atribut yang dilakukan proses konversi : Tabel 5.2 Transformasi data kedalam bentuk nomial Attb/Value JK Umur Status Divisi Gaji Kontrak Hasil prediksi 1 2 L 18–21 KAWI th Chasier N < 1 jt 6 bln BURU P 22–26 th BELUM KAWIN Pizza 1 – 1,5 jt 1 thn CUKUP 3 4 27–30 th >30 th Cooker 1,5 – 2 jt 2 thn BAIK 2 – 2,5 jt >2 thn SANGAT BAIK 5 >2,5 jt K Berikut hasil dari tahap preparation data (cleaning data, integrasi data, reduksi data) dan tranformation data: Tabel 5.3 Hasil Data dari Tahap Preparation Data 5.4. Validasi dan Evaluasi Pada tahap pengujian model, data yang digunakan telah melewati tahap preprocessing terlebih dahulu. Dan akurasi yang akan digunakan dari algoritma Naïve Bayes menggunakan teknik 10-fold validation(Validation) dan confusion 58 matrix (Performance). Berikut adalah desain model algoritma pada RapidMiner Studio 7.0.001. Gambar 5.1 Model Pada Rapid Miner Penjelasan parameter dan operator yang digunakan pada model : 1. Retrieve Data : Operator ini digunakan untuk memasukkan dataset yang akan digunakan. Data tersebut diimport dari file excel sheet. 2. Validation : Metode validasi yang akan digunakan yaitu split validation, di sini dataset akan dibagi menjadi data training dan data testing yang disesuaikan dengan ratio yang telah ditentukan Kemudian hasil akhir dari proses ini adalah akurasi dari model. 3. NaiveBayes : Merupakan metode klasifikasi yang digunakan dalam penelitian. 4. Apply Model : Operator yang digunakan untuk menjalankan metode sesuai dengan yang digunakan pada penelitian. 5. Performance : Operator yang digunakan untuk mengukur akurasi dari model yang digunakan. 59 5.5. Hasil Pengujian Percobaan pertama yang akan dilakukan menggunakan data karyawan Resto Ibarbo yang belum melalui pengolahan data. Jumlah data sebanyak 726 record Terdiri dari 12 atribut yaitu No, Cabang, Nama, Alamat, Jenis Kelamin, Umur, Agama, Status, Divisi, Gaji, Kontrak dan Kinerja. Di bawah ini adalah hasil dari pengujian akurasi data awal menggunakan algoritma naive bayes yang dapat dilihat pada gambar tabel confusion matrix berikut. Gambar 5.2 Percobaan Pertaman - Hasil akurasi data awal Dari percobaan pertama menghasilkan akurasi 83.96%. Percobaan pertama dilakukan tanpa melakukan preparation data. Setelah itu pada data awal dilakukan preprocessing yaitu pemilihan data dengan dan dilakukan pemilihan atribut yang digunakan pada penelitian. Kemudian di dapatkan Jumlah data sebanyak 670 data/record dan 7 attribut yaitu jenis kelamin, umur, status, divisi, gaji, kontrak dan keterangan kinerja. Untuk hasil akurasi pada pengujian data setelah dilakukan pemilihan data dan atribut menggunakan algoritma naïve bayes pada rapid miner dapat dilihat pada gambar berikut: 60 Gambar 5.3 Percobaan Kedua - Hasil Akurasi setelah melalui preparation data Untuk hasil akurasi percobaan pertama 83.96% dapat dikategorikan dalam Good classification (Paling Rendah), dan percobaan kedua dengan hasil akurasi 89.24% sudah termasuk dalam good classification. Akan tetapi akan dilakukan percobaan selanjutnya dengan data yang sudah melalui tahap pemilihan data, atribut, dan juga konversi/di klasifikasikan data kedalam data kategorikal/nominal. Dengan data sebanyak 670 data/record dan terdiri dari 8 attribut yang sudah dikonversi isi setiap record di dalamnya, Berikut adalah hasil confusion matrix dengan metode naïve bayes. Gambar 5.4 Percobaan Ketiga - Hasil Akurasi setelah melalui preparation dan transformation data Akurasi pada percobaan terakhir dengan data yang sudah di konversi ternyata diperoleh akurasi tertinggi yaitu 93.13% dan merupakan rentang akurasi Excellent classification. 61 5.6. Pembahasan Proses Perhitungan Prediksi Untuk membuktikan hasil prediksi yang dilakukan melalui perangkat lunak benar, maka dilakukan perbandingan hasil prediksi perangkat lunakan yang dibuat dengan perhitungan manual. a. Hasil Prediksi dari Perangkat Lunak Berikut adalah contoh inputan dan hasil prediksi dari perangkat lunak dengan menggunakan sampel satu data testing: Gambar 5.5 Contoh inputan data pengajuan dan output yang dihasilkan Input : JK=L, Umur=(22-26th), Status=Belum Kawin, Divisi=Cashier, Gaji=Rp(1,5-2juta), Kontrak=1thn Output : Prediksi Kinerja BAIK, Probabilitas BURUK 0.0004, Probabilitas CUKUP 0, Probabilitas BAIK 0.0085, Probabilitas SANGAT BAIK 0.0001. 62 b. Hasil Prediksi dari Perhitungan Berikut ini proses perhitungan untuk memprediksi kinerja karyawan sesuai dengan data yang sudah ada, dengan mengambil sampel satu data testing. Data testing : JK=L, Umur=(22-26th), Status=Belum Kawin, Divisi=Cashier, Gaji=Rp(1,52juta), Kontrak=1thn; keterangan kinerja=?. Data Training : Tabel 5.4 Data Taining index 1 2 3 4 … … 667 668 669 670 Jk P L L P … … L L P L umur 22 - 26 22 - 26 27 - 30 18 - 21 … … 18 - 21 22 - 26 22 - 26 18 - 21 status BELUM KAWIN BELUM KAWIN BELUM KAWIN BELUM KAWIN … … BELUM KAWIN BELUM KAWIN BELUM KAWIN BELUM KAWIN divisi Cashier Cashier Cashier Cashier … … Pizza Pizza Pizza Pizza gaji 1 - 1,5 jt 1,5 - 2 jt 1 - 1,5 jt 1 - 1,5 jt kontrak > 2 thn 6 bln 2 thn 2 thn … … … … 1 - 1,5 jt 2 thn 1,5 - 2 jt 1 thn 1,5 - 2 jt > 2 thn 1,5 - 2 jt 1 thn ketkinerja BAIK BAIK BAIK BURUK … … BAIK BAIK BAIK BAIK 63 Gambar 5.6 Hasil Aplikasi Running 64 BAB VI KESIMPULAN DAN SARAN Pada bab ini akan dipaparkan kesimpulan dari hasil penelitian yang diperoleh serta saran yang dapat digunakan sebagai acuan untuk menyempurnakan sistem pada proses pengembangan berikutnya. 6.1 Kesimpulan Pada tahap penelitian membuktikan bahwa algoritma Naive Bayes dapat diterapkan untuk menilai kinerja karyawan pada Resto Ibarbo dan untuk pengolahan data (preparation data) dan transformasi data merupakan tahapan yang sangat mempengaruhi hasil akurasi yang baik sehingga akurasi akhir yang dihasilkan termasuk kategori Excellent. Tahap pengolahan data sangat mempengaruhi nilai hasil Akurasi (Confusion Matrix) dan Evaluasi (Cross Validation) dengan menggunakan algoritma Naive Bayes menghasilkan akurasi dengan data awal yang belum dilakukan preparation data sebesar 83.96%, sedangkan data yang sudah melalui tahap pengolahan data preprocessing yaitu sebesar 89.24%, dan terakhir data yang sudah melalui pengolahan data dan konversi data memiliki accuracy paling tinggi yaitu 93.13%, jadi prediksi kinerja karyawan menggunakan algoritma naïve bayes pada data karyawan Resto Ibarbo akan lebih tinggi jika di lakukan pengolahan data (preparation data) dan konversi data Dengan adanya sistem ini maka mempermudah HRD dalam memperkirakan kinerja karyawan resto ibarbo, sehingga pihak resto dapat lebih cepat dalam mengambil keputusan untuk menentukan apakah karyawan tersebut layak dipertahankan atau diberi peringatan. 6.2. Saran Berdasarkan proses penelitian yang telah dilakukan, saran dari peneliti untuk pengembangan yang dapat dilakukan pada penelitian di masa yang akan datang ialah sebagi berikut: 64 65 a. Pada penelitian ini dapat dikembangkan dengan metode klasifikasi data mining lainnya agar bisa dilakukan perbandingan. b. Untuk mengembangkan penelitian ini juga bisa dilakukan penambahan record data ataupun atribut yang berbeda untuk mendapatkan nilai akurasi yang lebih baik. c. Diharapkan pada penelitian selanjutnya dapat menggunakan model komputasi paralel agar dapat mempercepat tahap pemrosesan data (Data Mining). 66 DAFTAR PUSTAKA [1] Jimmy Sugianto dan Sugiono Sugiharto, “Analisa Pengaruh Service Quality, Food Quality, dan Price Terhadap Kepuasan Pelanggan Restoran Yung Ho Surabaya,” Jurnal Manajemen Pemasaran Petra, Vol. 1, No. 2, 2013. [2] Boston Surya Iskandar dan Sugiono Sugiharto, “Analisa Pengaruh Faktor-faktor Service Quality Terhadap Customer Satisfaction di Restoran Mr. Pancake Surabaya, “Jurnal Manajemen Pemasaran Vol. 1, No. 1, 2013. [3] Eka Fachrizal dan Abadi Ginting, “Penilaian Kinerja Karyawan Menggunakan Metode 360 Degree Feedback Pada Hotel XYZ Medan, “e-Jurnal Teknik Industri FT USU Vol 3, No. 1, pp. 7-14, 2013. [4] Bustami, “Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi, “Jurnal Informatika, Vol. 8, No. 1, 2014. [5] Tina R. Patil and Mrs. S. S. Sherekar, “Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification, “International Journal Of Computer Science And Applications, Vol. 6, No.2, ISSN: 0974-1011, 2013. [6] Shadab Adam Pattekari and Asma Parveen, “ Prediction System For Heart Disease Using Naive Nayes, “International Journal of Advanced Computer and Mathematical Sciences, Vol 3, Issue 3, pp 290-294, ISSN 2230-9624, 2012. [7] Mujib Ridwan, Hadi Suyono, dan M. Sarosa, “Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier, “Jurnal EECCIS Vol.7, No. 1,2013. [8] Hera Wasiati dan Dwi Wijayanti, “ Sistem Pendukung Keputusan Penentuan Kelayakan Calon Tenaga Kerja Indonesia Menggunakan Metode Naive Bayes (Studi Kasus: Di P.T. Karyatama Mitra Sejati 67 Yogyakarta), Indonesian Journal on Networking and Security, Vol. 3 No 2, 2014. [9] Amelia Yusnita dan Rosiana Handini, “Sistem Pendukung Keputusan Menentukkan Lokasi Rumah Makan Strategis Menggunakan Metode Naive Bayes, “Seminar Nasional Teknologi Informasi & Komunikasi Terapan, ISBN 979 - 26 – 0255, 2012. [10] Nia Esti Karina dan Yuni Kamasari, “Aplikasi Diagnosa Kanker Kandungan Dengan Menggunakan Metode Naïve Bayes, “Jurnal Manajemen Informatika, Vol. 02, No. 02, 2013. [11] Hadari Nawawi, et.al. Kepemimpinan yang Efektif. Yogyakarta : UGM Press, 2006. [12] D. C. Mahendra, "Data Classification to Deyermine Credit Feasibility of Debitor using Naive Bayes Method," 2015. [13] S. B. M. &. P. M. Shazmeen, " Performance Evaluation of Different Data Mining Classification Algorithm and Predictive Analysis, “ Journal of Computer Engineering, No. 10 (6), pp. 1-6, 2013. [14] H. S. S. &. G. S. Sahu, “A Brief Overview on Data Mining Survey, “ International Journal of Computer Technology and Electronics Engeneering, pp. 14-21, 2011. [15] Universitas Sumatera Utara," [Online]. Available: http://repository.usu.ac.id/bitstream/123456789/17756/3/Chapter%20II.p df?. [Accessed 6 November 2016]. [16] J. H. a. M. Kimber, in Data Mining Concepts and Techniques, 2 ed., San Fransisco, Mofgan Kaufhann, 2006. [17] B. Santoso, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Surabaya, Graha Ilmu, 2007.