BAB III METODOLOGI PENELITIAN Proses yang dilakukan dalam proyek data mining ini adalah sebagai berikut. 1. Data Acquisition 2. Data Preparation 3. Modelling 4. Validation 5. Implementation 1. Data Acquisition Pada proyek ini persiapan data merupakan tahap yang membutuhkan waktu yang paling lama. Persiapan dan penyediaan data yang baik akan menghasilkan hasil data analisa yang baik. Persiapan data terdiri dari beberapa tahap yaitu : 1. Tahap pengumpulan data (data gathering) 2. Tahap pembersihan data (data Cleaning) 3. Tahap transformasi data (data transformation) Metodologi yang digunakan dalam data mining akan dijelaskan sebagai berikut : 37 38 Data Mining Project Building & Implementation Knowledge Interpretation & Evaluation Data Preparation Model Building Data Cleaning and Transformation Data Collection Database Gambar 3.1 Proyek Data Mining Variabel yang digunakan dalam melakukan prediksi resiko kredit pada proyek ini terdiri atas 14 variabel input dan 1 variabel output yaitu : 1. Nomor Rekening 2. Jenis Kelamin 3. Jumlah Penghasilan 4. Golongan Penjamin 5. Jenis Pinjaman 6. Sifat Pinjaman 7. Sandi Instansi 8. Plafon 39 9. Bunga pinjaman 10. Jumlah paymen. 11. Jumlah Cicilan 12. Golongan Debitur 13. Sektor Ekonomi 14. Sandi Lokasi 15. Nilai Jaminan Penjelasan dari variable diatas adalah sebagai berikut 1. Nomor Rekening yaitu nomor rekening pinjaman nasabah yang unik untuk setiap pinjaman. 2. Jenis Kelamin yaitu jenis kelamin nasabah 3. Penghasilan yaitu penghasilan nasabah sebarannya dipresentasikan dibagi rata dengan membagi data dari nilai minimum penghasilan dan nilai maksimum penghasilan. 4. Golongan Penjamin, merupakan sandi dari golongan penjamin: sandi keterangan 860 Pihak tidak terkait dengan BPR Pelapor a.Perusahaan - Perusahaan 870 Pihak tidak terkait dengan BPR Pelapor b.Koperasi 872 Pihak tidak terkait dengan BPR Pelapor c.Kelompok 874 Pihak tidak terkait dengan BPR Pelapor d.perorangan 875 Pihak terkait dengan BPR pelapor c.Perorangan 880 Asuransi Jiwa 881 Pihak terkait dengan BPR pelapor a.Perusahaan-perusahaan 883 Pihak terkait dengan BPR Pelapor c. Kelompok 40 885 Pihak terkait dengan BPR pelapor b. Koperasi 5. Jenis Pinjaman merupakan sandi dari : Sandi Keterangan 10 Modal Kerja 20 Investasi 31 Konsumsi a. KPR yang dijamin dengan hak tanggungan pertama dengan tujuan untuk dihuni 35 Konsumsi b. Kredit pemilikan kendaraan bermotor 39 Kredit konsumsi lainnya 6. Sifat Pinjaman dengan sandi : Sandi Keterangan 0 Gabungan 1 Kredit dengan perjanjian a. dalam rangka pembiayaan bersama 2 Kredit dengan perjanjian b. kredit melalui bank/lembaga keuangan lain 3 Kredit dengan perjanjian c. kepada debitur BPR yang bersangkutan 6 Kredit dengan perjanjian d. lainnya 9 Kredit tanpa perjanjian 7. Instansi, terdiri dari sandi instansi 8. Plafon yaitu jumlah pinjaman yang direalisasikan. 9. Bunga Pinjaman yaitu bunga yang diberikan 10. Paymen yaitu jumlah angsuran perbulan yang dibayar. 11. Jumlah Cicilan yaitu berapa kali angsuran 12. Golongan Debitur 41 sandi keterangan 860 Pihak tidak terkait dengan BPR Pelapor a. perusahaan usaha mikro kecil (UMK) 861 Pihak tidak terkait dengan BPR Pelapor b. perusahaan non UMK 870 Pihak tidak terkait dengan BPR Pelapor c. koperasi UMK 871 Pihak tidak terkait dengan BPR Pelapor d. koperasi non UMK 872 Pihak tidak terkait dengan BPR Pelapor e.kelompok UMK 873 Pihak tidak terkait dengan BPR Pelapor f.kelompok non UMK 874 Pihak tdk terkait dengan BPR Pelapor a.1.Perorangan Pegawai/Pensiunan(PNS,TNI/POLRI,BUMN,BUMD) 875 Pihak terkait dengan BPR pelapor a1.Pegawai/Pensiunan (PNS,TNI/POLRI,BUMN/BUMD) 876 Pihak tidak terkait dengan BPR pelapor a.2 perorangan UMK 877 Pihak tidak terkait dengan BPR pelapor a.3. perorangan Non UMK 878 Pihak terkait dengan BPR pelapor a.2 perorangan UMK 879 Pihak terkait dengan BPR pelapor a.3. perorangan Non UMK 881 Pihak terkait dengan BPR pelapor d.1. Perusahaan-perusahaan UMK 882 Pihak terkait dengan BPR pelapor d.2. Perusahaan-perusahaan Non UMK 883 Pihak terkait dengan BPR pelapor c.1. kelompok UMK 884 Pihak terkait dengan BPR pelapor c.2. kelompok Non UMK 885 Pihak terkait dengan BPR pelapor b.1. Koperasi UMK 886 Pihak terkait dengan BPR pelapor b.2. Koperasi Non UMK 13. Sektor Ekonomi 42 sandi Keterangan 1000 Pertanian 3000 Perindustrian 6000 Perdagangan, Restoran & Hotel 8000 Jasa-Jasa 9990 Lain-Lain 14. Lokasi yaitu sandi lokasi dimana nasabah bertempat tinggal. 15. Nilai Jaminan yaitu jumlah jaminan yang ditanggungkan 16. Sifat Pinjaman Sandi Keterangan • 0 Gabungan 1 Kredit dengan perjanjian a. dalam rangka pembiayaan bersama 2 Kredit dengan perjanjian b. kredit melalui bank/lembaga keuangan lain 3 Kredit dengan perjanjian c. kepada debitur BPR yang bersangkutan 6 Kredit dengan perjanjian d. lainnya 9 Kredit tanpa perjanjian Cleaning and integration Pada tahap ini data – data akan diambil dari database dan “dibersihkan” sehingga dapat mengurangi noise dan informasi yang tidak relevan dari Dataset. Tujuan transformasi data adalah untuk memodifikasi sumber data ke format yang berbeda dalam hal jenis dan nilai data. 43 • Data mining Pada tahap ini ada dua hal besar yang perlu dilakukan, yaitu melakukan training data dan testing data. Subjek penelitian adalah bagaimana memprediksi kredit-kredit yang berisiko dengan pendekatan jaringan syaraf tiruan backpropagation. Data yang digunakan sebagai dasar prediksi risiko kredit adalah data-data historis peminjam yang telah diketahui risiko kreditnya. Pada penelitian ini akan melakukan proses sesuai dengan yang digambarkan sebagai berikut. Hasil Prediksi (resiko Kredit) Attribut Neurar Network Database Business Intellegent System User Interface Gambar 3.2 Flow Chart Proses Prediksi Level 0 Database Data training dan testing Neural Network Model User Parameter (Learning rate, momentum, jumlah hidden unit, epoch) & faktor (data resiko kredit) Neural Network Processing Executes Neural Network prediction Output Prediction User Interface Gambar 3.3 Flow Chart Proses Prediksi Level 1 44 Pada Flow Chart level 0 (Gambar 3.2) terlihat ada 2 proses utama yaitu database dan proses business intellenge sistem. Pada Flow Chart level 0 dapat digambarkan bahwa data yang terdapat dalam database akan masuk ke dalam business intellenge system yang outputnya berupa data prediksi yang diterima oleh user. Pada Flow Chart level 1 (Gambar 3.3) terlihat suatu penjabaran proses-proses dan alir data yang dijabarkan dari flow chart level 0. Dari diagram tersebut terlihat bahwa proses dalam sistem peramalan terdiri atas 2 proses, yaitu proses pembentukan neural network dan proses peramalan. Proses pembentukan neural network memerlukan data faktor dan parameter yang diberikan oleh user serta data. training dan testing dari database, kemudian dari proses tersebut diperoleh neural network yang tergeneralisasi yang kemudian dipakai dalam proses prediksi. Dalam proses prediksi ini selain menggunakan neural network dari pembentukan neural network juga menggunakan data prediksi, kemudian hasil prediksi dihasilkan oleh proses prediksi ini untuk diberikan kepada user. Pada proses prediksi terdapat dua proses yaitu proses menghitung keluaran hidden layer dan proses menghitung keluaran utput layer yang juga merupakan keluaran sistem prediksi. Pertama data prediksi dari file diolah oleh proses dalam hidden layer, kemudian keluaran proses ini digunakan pada proses penghitungan keluaran output yang menghasilkan output neural network yang merupakan hasil prediksi. Kemudian untuk proses training dan testing terdiri dari dua proses yaitu proses forward pass dan backward pass. Proses training dimulai dengan proses forward pass dengan menggunakan data training dari file yang menghasilkan nilai Error (E), 45 kemudian nilai Error digunakan proses backward pass untuk menetapkan bobot yang baru (updated weight). Output dari proses ini yaitu bobot baru yang didapat dari proses diferensiasi fungsi Error. Proses training dan testing pada dasarnya sama, perbedaannya hanya pada data masukannya, pada proses testing data masukannya merupakan data diluar data training, data testing bukan merupakan subset data training Data training (input atribute & resiko kredit) forward pass error (E) Database backward pass User Interface Gambar 3.4 Flow Chart Proses Training Arsitektur jaringan yang digunakan dalam penelitian ini ditunjukkan pada Gambar 3.5 Untuk mendapatkan nilai m dan n neuron pada lapisan tersembunyi dilakukan melalui trial and error hingga mendapatkan keluaran yang paling optimal. 46 Gambar 3.5 Arsitektur JST Prediksi Resiko Kredit • Evaluation and presentation Pada tahap ini akan dilakukan evaluasi terhadap model yang telah didapat dari hasil training dan testing data. Evaluasi keakurasian dilihat dalam bentuk lift chart. Dari lift cart akan dapat dilihat berapa baik model neural network yang telah di bentuk dan seberapa besar data yang dibutuhkan untuk mencapai keakuratan data.