BAB III METODOLOGI PENELITIAN

advertisement
BAB III METODOLOGI PENELITIAN
Proses yang dilakukan dalam proyek data mining ini adalah sebagai berikut.
1. Data Acquisition
2. Data Preparation
3. Modelling
4. Validation
5. Implementation
1. Data Acquisition
Pada proyek ini persiapan data merupakan tahap yang membutuhkan waktu yang paling lama. Persiapan dan
penyediaan data yang baik akan menghasilkan hasil data analisa yang baik.
Persiapan data terdiri dari beberapa tahap yaitu :
1. Tahap pengumpulan data (data gathering)
2. Tahap pembersihan data (data Cleaning)
3. Tahap transformasi data (data transformation)
Metodologi yang digunakan dalam data mining akan dijelaskan sebagai berikut :
37
38
Data Mining Project
Building & Implementation
Knowledge
Interpretation &
Evaluation
Data Preparation
Model Building
Data Cleaning and
Transformation
Data Collection
Database
Gambar 3.1 Proyek Data Mining
Variabel yang digunakan dalam melakukan prediksi resiko kredit pada proyek ini terdiri atas 14
variabel input dan 1 variabel output yaitu :
1. Nomor Rekening
2. Jenis Kelamin
3. Jumlah Penghasilan
4. Golongan Penjamin
5. Jenis Pinjaman
6. Sifat Pinjaman
7. Sandi Instansi
8. Plafon
39
9. Bunga pinjaman
10. Jumlah paymen.
11. Jumlah Cicilan
12. Golongan Debitur
13. Sektor Ekonomi
14. Sandi Lokasi
15. Nilai Jaminan
Penjelasan dari variable diatas adalah sebagai berikut
1. Nomor Rekening yaitu nomor rekening pinjaman nasabah yang unik untuk setiap
pinjaman.
2. Jenis Kelamin yaitu jenis kelamin nasabah
3. Penghasilan yaitu penghasilan nasabah sebarannya dipresentasikan dibagi rata dengan
membagi data dari nilai minimum penghasilan dan nilai maksimum penghasilan.
4. Golongan Penjamin, merupakan sandi dari golongan penjamin:
sandi keterangan
860
Pihak tidak terkait dengan BPR Pelapor a.Perusahaan - Perusahaan
870
Pihak tidak terkait dengan BPR Pelapor b.Koperasi
872
Pihak tidak terkait dengan BPR Pelapor c.Kelompok
874
Pihak tidak terkait dengan BPR Pelapor d.perorangan
875
Pihak terkait dengan BPR pelapor c.Perorangan
880
Asuransi Jiwa
881
Pihak terkait dengan BPR pelapor a.Perusahaan-perusahaan
883
Pihak terkait dengan BPR Pelapor c. Kelompok
40
885
Pihak terkait dengan BPR pelapor b. Koperasi
5. Jenis Pinjaman merupakan sandi dari :
Sandi Keterangan
10
Modal Kerja
20
Investasi
31
Konsumsi a. KPR yang dijamin dengan hak tanggungan pertama dengan tujuan
untuk dihuni
35
Konsumsi b. Kredit pemilikan kendaraan bermotor
39
Kredit konsumsi lainnya
6. Sifat Pinjaman dengan sandi :
Sandi Keterangan
0
Gabungan
1
Kredit dengan perjanjian a. dalam rangka pembiayaan bersama
2
Kredit dengan perjanjian b. kredit melalui bank/lembaga keuangan lain
3
Kredit dengan perjanjian c. kepada debitur BPR yang bersangkutan
6
Kredit dengan perjanjian d. lainnya
9
Kredit tanpa perjanjian
7. Instansi, terdiri dari sandi instansi
8. Plafon yaitu jumlah pinjaman yang direalisasikan.
9. Bunga Pinjaman yaitu bunga yang diberikan
10. Paymen yaitu jumlah angsuran perbulan yang dibayar.
11. Jumlah Cicilan yaitu berapa kali angsuran
12. Golongan Debitur
41
sandi keterangan
860
Pihak tidak terkait dengan BPR Pelapor a. perusahaan usaha mikro kecil (UMK)
861
Pihak tidak terkait dengan BPR Pelapor b. perusahaan non UMK
870
Pihak tidak terkait dengan BPR Pelapor c. koperasi UMK
871
Pihak tidak terkait dengan BPR Pelapor d. koperasi non UMK
872
Pihak tidak terkait dengan BPR Pelapor e.kelompok UMK
873
Pihak tidak terkait dengan BPR Pelapor f.kelompok non UMK
874
Pihak tdk terkait dengan BPR Pelapor a.1.Perorangan
Pegawai/Pensiunan(PNS,TNI/POLRI,BUMN,BUMD)
875
Pihak terkait dengan BPR pelapor a1.Pegawai/Pensiunan
(PNS,TNI/POLRI,BUMN/BUMD)
876
Pihak tidak terkait dengan BPR pelapor a.2 perorangan UMK
877
Pihak tidak terkait dengan BPR pelapor a.3. perorangan Non UMK
878
Pihak terkait dengan BPR pelapor a.2 perorangan UMK
879
Pihak terkait dengan BPR pelapor a.3. perorangan Non UMK
881
Pihak terkait dengan BPR pelapor d.1. Perusahaan-perusahaan UMK
882
Pihak terkait dengan BPR pelapor d.2. Perusahaan-perusahaan Non UMK
883
Pihak terkait dengan BPR pelapor c.1. kelompok UMK
884
Pihak terkait dengan BPR pelapor c.2. kelompok Non UMK
885
Pihak terkait dengan BPR pelapor b.1. Koperasi UMK
886
Pihak terkait dengan BPR pelapor b.2. Koperasi Non UMK
13. Sektor Ekonomi
42
sandi Keterangan
1000
Pertanian
3000
Perindustrian
6000
Perdagangan, Restoran & Hotel
8000
Jasa-Jasa
9990
Lain-Lain
14. Lokasi yaitu sandi lokasi dimana nasabah bertempat tinggal.
15. Nilai Jaminan yaitu jumlah jaminan yang ditanggungkan
16. Sifat Pinjaman
Sandi Keterangan
•
0
Gabungan
1
Kredit dengan perjanjian a. dalam rangka pembiayaan bersama
2
Kredit dengan perjanjian b. kredit melalui bank/lembaga keuangan lain
3
Kredit dengan perjanjian c. kepada debitur BPR yang bersangkutan
6
Kredit dengan perjanjian d. lainnya
9
Kredit tanpa perjanjian
Cleaning and integration
Pada tahap ini data – data akan diambil dari database dan “dibersihkan” sehingga dapat
mengurangi noise dan informasi yang tidak relevan dari Dataset. Tujuan transformasi
data adalah untuk memodifikasi sumber data ke format yang berbeda dalam hal jenis dan
nilai data.
43
•
Data mining
Pada tahap ini ada dua hal besar yang perlu dilakukan, yaitu melakukan training data dan
testing data. Subjek penelitian adalah bagaimana memprediksi kredit-kredit yang berisiko
dengan pendekatan jaringan syaraf tiruan backpropagation. Data yang digunakan sebagai
dasar prediksi risiko kredit adalah data-data historis peminjam yang telah diketahui risiko
kreditnya. Pada penelitian ini akan melakukan proses sesuai dengan yang digambarkan
sebagai berikut.
Hasil Prediksi
(resiko Kredit)
Attribut Neurar Network
Database
Business Intellegent System
User
Interface
Gambar 3.2 Flow Chart Proses Prediksi Level 0
Database
Data training dan testing
Neural Network Model
User
Parameter (Learning rate, momentum, jumlah
hidden unit, epoch) & faktor (data resiko kredit)
Neural Network
Processing
Executes Neural Network
prediction
Output Prediction
User Interface
Gambar 3.3 Flow Chart Proses Prediksi Level 1
44
Pada Flow Chart level 0 (Gambar 3.2) terlihat ada 2 proses utama yaitu database dan
proses business intellenge sistem. Pada Flow Chart level 0 dapat digambarkan bahwa
data yang terdapat dalam database akan masuk ke dalam business intellenge system yang
outputnya berupa data prediksi yang diterima oleh user.
Pada Flow Chart level 1 (Gambar 3.3) terlihat suatu penjabaran proses-proses dan alir
data yang dijabarkan dari flow chart level 0. Dari diagram tersebut terlihat bahwa proses
dalam sistem peramalan terdiri atas 2 proses, yaitu proses pembentukan neural network
dan proses peramalan. Proses pembentukan neural network memerlukan data faktor dan
parameter yang diberikan oleh user serta data. training dan testing dari database,
kemudian dari proses tersebut diperoleh neural network yang tergeneralisasi yang
kemudian dipakai dalam proses prediksi. Dalam proses prediksi ini selain menggunakan
neural network dari pembentukan neural network juga menggunakan data prediksi,
kemudian hasil prediksi dihasilkan oleh proses prediksi ini untuk diberikan kepada user.
Pada proses prediksi terdapat dua proses yaitu proses menghitung keluaran hidden layer
dan proses menghitung keluaran utput layer yang juga merupakan keluaran sistem
prediksi. Pertama data prediksi dari file diolah oleh proses dalam hidden layer, kemudian
keluaran proses ini digunakan pada proses penghitungan keluaran output yang
menghasilkan output neural network yang merupakan hasil prediksi.
Kemudian untuk proses training dan testing terdiri dari dua proses yaitu proses forward
pass dan backward pass. Proses training dimulai dengan proses forward pass dengan
menggunakan data training dari file yang menghasilkan nilai Error (E),
45
kemudian nilai Error digunakan proses backward pass untuk menetapkan bobot yang
baru (updated weight). Output dari proses ini yaitu bobot baru yang didapat dari proses
diferensiasi fungsi Error. Proses training dan testing pada dasarnya sama,
perbedaannya hanya pada data masukannya, pada proses testing data masukannya
merupakan data diluar data training, data testing bukan merupakan subset data training
Data training
(input atribute & resiko kredit)
forward pass
error (E)
Database
backward pass
User Interface
Gambar 3.4 Flow Chart Proses Training
Arsitektur jaringan yang digunakan dalam penelitian ini ditunjukkan pada Gambar 3.5
Untuk mendapatkan nilai m dan n neuron pada lapisan tersembunyi dilakukan melalui
trial and error hingga mendapatkan keluaran yang paling optimal.
46
Gambar 3.5 Arsitektur JST Prediksi Resiko Kredit
•
Evaluation and presentation
Pada tahap ini akan dilakukan evaluasi terhadap model yang telah didapat dari hasil
training dan testing data. Evaluasi keakurasian dilihat dalam bentuk lift chart. Dari lift
cart akan dapat dilihat berapa baik model neural network yang telah di bentuk dan
seberapa besar data yang dibutuhkan untuk mencapai keakuratan data.
Download