bab 2 landasan teori

advertisement
BAB 2
LANDASAN TEORI
2.1
TINJAUAN PUSTAKA
Sebuah perusahaan multifinance akan selalu dihadapkan pada
risiko kemungkinan nasabah tidak dapat mengembalikan sejumlah dana
yang telah ia pinjam sesuai dengan jangka waktu yag telah disepakati.
Tools yang paling penting digunakan oleh seorang credit analyst untuk
melakukan penilaian resiko adalah tools credit scoring. Credit scoring
berupaya untuk meringkas sejarah kredit nasabah/peminjam dengan
menggunakan credit scoring model (Fabozzi, Davis et al. 2006). Credit
scoring model adalah sistem pendukung keputusan yang membutuhkan
satu set variable predictor sebagai masukan dan memberikan nilai
sebagai output. Kreditur menggunakan model ini untuk mengetahui kredit
mana yang dapat di setujui dan tidak dapat disetujui (Jentzsch 2007).
Credit scoring model menggunakan sebuah set algoritma rumit yang
digunakan oleh kreditor untuk mengevaluasi kelayakan kredit dari
nasabah secara spesifik.
Secara teoritis, cara penilaian credit scoring berkerja dengan
sederhana. Menurut Jentzsch (2007), prosedur dasar penilaian kredit
dapat dijelaskan dengan cara berikut : Variable dependent (Y) merupakan
status kredit (kemungkinan pembayaran) sedangkan variable indepent
(variable predictor atau Xi) yang digunakan untuk menjelaskan variable
dependent. Variable-variable independent yang dapat digunakan untuk
5
memprediksi resiko kredit dapat mencakup jumlah keterlambatan
pembayaran pinjaman dalam jangka waktu teretentu, jumlah waktu kredit
(tenor) yang telah ditetapkan, jumlah kredit yang digunakan berbanding
dengan jumlah kredit yang tersedia, lama menetap pada suatu wilayah
tempat tinggal, riwayat pekerjaan, dan informasi kredit negatif seperti
pernah mengalami kebangkrutan, kredit macet, dan penyitaan (Fabozzi,
Davis et al. 2006).
Diantara model credit scoring terdapat empat pendekatan yang
digunakan diantara nya adalah Linear Discriminant Analysis, Logistic
Regression and Probit, K-nearest Neighbor Classifier, Support Vector
Machine Classifier (Servigny dan Renault, 2004). Ke-empat algoritma
tersebut memiliki 1 kesamaan yaitu memiliki parameter yang didefinisikan
dengan variable dan variable-variable tersebut diperoleh dari credit report
atau form aplikasi pengajuan kredit. Dilain sisi, beberapa model statistic
tersebut memiliki keterbatasan (statistical restrictions), menurut Anderloni,
Braga dan Carluccio
(2006) pada metode discriminant analyst, uji
normalitas, uji linearitas dan uji homogenitas harus terpenuhi, jika ketiga
persyaratan analisis tersebut tidak terpenuhi maka akan memicu masalah
akurasi prediksi.
Beberapa tahun terakhir telah dikembangkan model baru dari
matematika dan statistik untuk menunjang risiko kredit dalam perspektif
yang berbeda, diantara nya linear programming, integer programming dan
neural network. Menurut penelitian terdahulu yang telah dilakukan oleh
Samsul Islam, Lin Zhou dan Fee Li (2009) di German, Artificial Neural
6
Networks (ANN) dapat menjadi alternatif yang baik untuk menunjang
analisa credit scoring. Pada hasil penelitian tersebut terlihat bahwa analisa
menggunakan ANN memberikan nilai tingkat kesuksesan yang lebih baik
yaitu 83.86% dibandingkan dengan discriminant analysis dan logistic
regression yang hanya memiliki tingkat kesuksesan sebesar 76.4%.
Tabel 2.1 Predictive Models Comparison
Sumber : Islam, Zhou & Li (2009)
Pada penelitian lain yang dilakukan oleh Sutikno, Pujiantara, &
Supanti (2007) ANN dibangun dengan multilayer backpropagation dimana
dari pengujian tersebut di dapatkan persentase hasil prediksi terbaik
adalah menggunakan ANN backpropagation dengan 2 layer dengan
jumlah neuron pada hidden layer pertama sebanyak 100 neuron dan
jumlah neuron pada hidden layer kedua sebanyak 300 neuron, dengan
kombinasi
fungsi
aktivasi
logsig-satlin
akan
memberikan
tingkat
keberhasilan 100%.
ANN dinilai efektif dalam memprediksi dan meklasifikasikan data
melalui proses pembelajaran sejumlah besar data hystorical, hinggan
menghasilkan sebuah pola/model yang mampu memprediksikan output
dari data yang tidak terlihat sebelumnya. Tabel 2.2 berikut ini merupakan
rangkuman dari sejumlah literatur yang berhubungan dengan penelitian.
7
Tabel 2.2 Ringkasan Hasil Penelitian Terdahulu
No
Judul Penelitian
1. Application of Artificial
Intelligence
(Artificial
Neural
Network)
to
Assess Credit Risk: A
Predictive Model For
Credit Card Scoring.
(Islam, Zhou dan Li)
2.
Prediksi Risiko Kredit
Dengan Jaringan Syaraf
Tiruan Backpropagation.
(Sutikno, Pujiantara, &
Supanti)
3.
Analisa Klasifikasi Kredit
Menggunakan Regresi
Logistik Biner dan Radial
Basis Function Network
di Bank 'X' Cabang
Kediri. (Diaprina dan
Suhartono)
Predicting Credit Card
Customer Loyalty Using
Artificial
Neural
Networks. (Zhang,Yuan
& Liu)
4.
5.
8
Hasil Penelitian
Neural network memberikan hasil
penerimaan data “Bad accepted”
terendah yaitu 61 nasabah, sedangkan
logistic regression sebanyak 140
nasabah dan discriminant analysis
sebanyak 143 nasabah. Dengan ANN
dapat
memperkecil
kemungkinan
kerugian
yang
akan
di
alami
perusahaan.
- ANN Backpropagation dengan 1
hidden layer (jumlah sel 100) dan
fungsi
aktivasi
satlin
mampu
memprediksi risiko kredit dengan
prosentase kebenaran 70%
- ANN backpropagation dengan 2
hidden layer (jumlah sel pertama 100
dan sel kedua 300) dan kombinasi
fungsi aktivasi logsig-satlin mampu
memprediksi risiko kredit dengan
prosentase kebenaran 100%.
Metode regresi logistik lebih baik dalam
melakukan klasifikasi dengan tingkat
ketepatan klasifikasi sebesar 99,76%
dibandingkan dengan metode Radial
Basis Function Network dengan nilai
ketepatan klasifikasi sebesar 98,51%
Neural
Network
mampu
mengklasifikasikan
dengan
tepat
67.97% pelanggan dengan loyalitas
tinggi dan rendah. Akan tetapi menurut
peneliti penilaian secara objectif yang
dilakukan menggunakan parameter
jumlah transaksi perlu ditunjang juga
dengan analisa tradisional seperti
questioner
untuk
membantu
meningkatkan akurasi prediksi neural
network.
Measuring Credit Risk Analisa
neural
network
untuk
Of Bank Customers
Using Artificial Neural
Network.
Jurnal
of
Management Research.
(Mohsen)
2.2
mengklasifikasikan nasabah dalam
kategori
“baik”
dan
“buruk”,
menggunakan 1 hidden layer dan 12
neuron pada hidden layer menghasilkan
nilai akurasi sebesar 87.9% pada data
training. Sedangkan hasil akurasi model
terhadap data yang belum pernah
dilatih sebesar 77.9%. Fungsi aktivasi
yang digunakan pada penelitian ini
adalah Hyperbolic tangent.
LANDASAN TEORI
2.2.1
DECISION SUPPORT SYSTEM
Decision
Support
System
(DSS)
atau
sistem
pendukung
pengambilan keputusan merupakan suatu system informasi berbasis
komputer yang menghasilkan berbagai alternatif keputusan untuk
membantu manajemen dalam menangani berbagai permasalahan yang
terstruktur ataupun tidak terstruktur dengan menggunakan data dan
model. (Dadan Umar Dhani, 2001 : 55).
Akan tetapi perlu untuk ditekankan bahwa peran DSS tidak untuk
menggantikan tugas-tugas para manajer dalam mengambil keputusan,
tetapi untuk menjadi penunjang (tool) bagi mereka untuk menentukan
keputusan. DSS berperan pada mengelolah data menjadi informasi,
informasi menjadi pengetahuan dan pengetahuan menjadi aksi-aksi yang
relevan.
Tujuan dibangun nya DSS secara umum adalah sebagai berikut :
1) Membantu approver mengambil keputusan atas masakag terstruktur
maupun tidak terstruktur. Dalam penelitian ini pengambil keputusan
9
dilakukan oleh seorang credit analyst untuk menentukan menerima
atau menolak pengajuan kredit oleh calon nasabah
2) Memberikan
dukungan
atas
pertimbangan
approver.
Bukan
menggantikan fungsi approver dalam memberikan keputusan
3) Menjadikan dasar atau pertimbangan pengambilan keputusan yang
diambil approver
4) Kecepatan komputasi suatu sistem yang dapat mengambil suatu
kesimpulan atau saran atau suatu keputusan secara cepat dan tepat
sehingga dapat meminimalisir human error dengan jumlah data yang
banyak
5) Peningkatan produktifitas
6) Dukungan kualitas, berdaya saing dan dapat mengatasi keterbatasan
kognitif dalam memproses dan penyimpanan.
2.2.1.1
KOMPONEN-KOMPONEN
SISTEM
PENDUKUNG
KEPUTUSAN
Menurut Turban (2005) sistem pendukung keputusan terdiri dari
empat komponen utama, antara lain adalah sebagai berikut :
1) Subsistem manajemen data (database managemen subsystem),
Kumpulan data yang tersusun secara terstruktur dan dalam format
elektronik yang mudah diolah oleh program computer. Data yang
digunakan adalah data yang relevan dengan permasalahan yang
hendak dipecahkan melalui simulasi.
10
2) Subsistem manajemen model (Model base management subsystem).
Melibatkan model financial, statistical, manajement sains (science
management) atau berbagai model kuantitatif lainnya, sehingga
mampu memberikan kemampuan analisa yang baik kepada sistem
dan manajemen perangkat lunak (software) yang dibutuhkan.
3) Subsistem manajemen dialog (User sisten interface)
Pengguna dapat berkomunikasi dan memberikan perintah pada DSS
melalui subsistem ini, yang menyediakan halaman antarmuka (user
interface).
4) Subsistem manajemen berbasis pengetahuan (knowledge-based
management subsystem)
Subsistem opsional yang dapat mendukung subsistem lain atau
bertindak sebagai komponen yang berdiri sendiri.
Gambar 2.1 Arsitektur Sistem Pendukung Keputusan
11
2.2.1.2
KLASIFIKASI DSS
Steven L. Alter (1976) telah melakukan studi terhadap 56 sistem
penunjang keputusan. Dari studi tersebut dihasilkan pengklasifikasian
terhadap sistem penunjang keputusan menjadi 6 kategori, yaitu :
1) File drawer system
Sistem File Drawer adalah jenis DSS yang paling sederhana, yang
dapat
menyediakan
akses
menuju
elemen-elemen
data
yang
terperinci. Semua data digunakan untuk mengambil keputusan. Contoh
yang paling nyata adalah mesin ATM, dimana saldo pada rekening
dapat digunakan untuk mengambil keputusan untuk melakukan
transfer dana ke rekening lain
2) Data analysis system
Sistem analisa data mampu memberikan akses terhadap data, dan
juga memungkinkan dilakukannya manipulasi data
3) Analysis information system
Pada sistem informasi ini, informasi dari beberapa berkas/file
digabungkan menjadi satu. Berkas yang digabungkan bisa saja
berasal dari sumber eksternal/dari luar sistem, dan juga bisa dari suatu
basis data/database tertentu.
4) Accounting models
Model akuntansi ini adalah tipe sistem pendukung keputusan yang
menggunakan sumber yaitu data akuntansi internal perusahaan, bisa
berupa data General Ledger/buku besar, data neraca laba rugi, dan
12
sebagainya yang terdapat dalam sistem akuntansi yang digunakan
sehari-hari oleh bagian keuangan/akunting perusahaan.
5) Representational models
Model Representasional dapat memperbaiki ketidakpastian pada data
mentah yang tersedia, dengan menggunakan beberapa macam model
untuk memecahkan berbagai masalah pengambilan keputusan dengan
menggunakan perkiraan (forecast). Model ini dapat digunakan untuk
menambah kemampuan model akuntansi yang telah dibahas diatas.
Contoh penerapannya adalah dengan menggunakan data permintaan
konsumen untuk memperkirakan/membuat prediksi terhadap jumlah
permintaan yang akan muncul tahun berikutnya.
6) Optimization system
Model optimisasi adalah sistem pendukung keputusan yang digunakan
untuk memperkirakan dampak dari berbagai pilihan keputusan yang
berbeda, berdasarkan pada model-model optimisasi. Model ini juga
dapat memperbaiki ketidakpastian yang tergambar pada data mentah
yang diperoleh, untuk membantu pengambilan keputusan.
7) Suggestion system
Sistem Suggestion atau Pemberian saran adalah tipe DSS yang
berbentuk model deskriptif dan juga preskriptif (detail/terperinci) yang
digunakan untuk mengajukan saran pengambilan keputusan terhadap
manajemen perusahaan. Sistem ini mampu mendayagunakan Sistem
Pakar yang mungkin dimiliki suatu perusahaan.
13
Berdasarkan ketujuh klasifikasi DSS yang telah dijabarkan diatas,
dapat kita ambil kesimpulan bahwa sistem penunjang keputusan credit
scoring dengan menggunakan model ANN dan Logit pada penelitian ini
adalah merupakan sistem DSS dengan tipe suggestion system. Dimana
hasil yang diberikan oleh DSS akan membantu oleh seorang credit analyst
untuk menentukan apakah menerima pengajuan kredit calon nasabah
atau menolaknya.
2.2.2
KONSEP ARTIFICIAL NEURAL NETWORK
Artificial Neural Networ (jaringan syaraf tiruan) merupakan suatu
metode pembelajaran yang diinspirasi dari cara kerja otak mahluk hidup.
Dengan melakukan proses pembelajaran, otak dapat mengatur respon
yang sesuai dan konsisten terhadap suatu kondisi. Respon manusia
terhadap suatu kondisi / peristiwa merupakan hasil kompleksitas proses
pengelolahan informasi di dalam otak. Seperti halnya otak manusia
ataupun hewan, otak terdiri dari sel-sel yang disebut neuron.
14
Gambar 2.2 Model Neuron Biologis
Neuron pada otak manusia berfungsi sebagai pusat pemprosesan
informasi yang dikirimkan melalui dendrite dan mengeluarkan hasil proses
teresbut melalui axon, untuk kemudian di teruskan ke dendrit dari sel saraf
lain. Sinapsis adalah unit fungsional antara 2 buah sel saraf. Sinapsis
merupakan titik temu antara axon salah satu neuron dengan dendit
neuron lainnya. Kekuatan sinapsis bisa menurun/meningkat tergantung
seberapa besar tingkat propagasi (penyiaran) sinyal yang diterimanya.
Informasi akan diterima oleh neuron lain jika memenuhi batasan tertentu,
yang sering disebut dengan nilai ambang (threshold).
Berkembang dari analogi sistim kerja otak manusia tersebut, desain
arsitektur ANN secara umum diperlihatkan pada Gambar 2.2. Pada
gambar tersebut diperlihatkan layer input (sumber data) terdiri dari
sejumlah nilai yang diberikan sebagai nilai masukan pada ANN. Pada
gambar tersebut layer input memiliki tiga nilai (x1,x2,x3), masing-masing
layer input akan melewati hubungan dengan bobot w. Kemudian, bobot
tersebut akan digabungkan pada neuron pemproses dan dikelolah oleh
15
fungsi aktivasi untuk menghasilkan sinyal y sebagai keluaran (output
layer). Fungsi aktivasi memiliki sebuah nilai ambang batas (threshold)
untuk membatasi nilai keluaran yang dihasilkan oleh neuron pemproses
agar selalu dalam batas nilai yang telah ditetapkan.
x1
x2
w1
w2
Neuron
Pemproses
Sinyal
Keluaran
∑
ƴ
w3
x3
T
Gambar 2.3 Desain umum ANN
Menurut Nazari (2013), lapisan atau layer-layer penyusun ANN
dapat dibagi menjadi 3 komponen utama, yaitu :
1) Lapisan input (input layer)
Lapisan ini terdiri dari data-data yang akan dikelolah oleh ANN yang
merupakan gambaran dari suatu permasalahan.
2) Lapisan tersembunyi (hidden layer)
Lapisan tersembunyi tidak dapat diamati secra langsung. Pada lapisan
ini berisi dua proses : fungsi penjumlahan bobot dan fungsi
transformasi.
3) Lapisan output (output layer)
Lapisan yang terhubung secara langsung dengan lapisan tersembunyi
yang akan menghasilkan suatu nilai keluaran (sinyal keluaran).
16
Seperti hal nya analogi otak manusia, otak manusia selalu
memperoleh pembelajaran dari lingkungan sekitar agar dapat mengelolah
lingkungan nya dengan baik sesuai dengan pembelajaran yang didapat
ataupun pengalaman nya. ANN dianggap sebagai pemodelan yang
digunakan untuk melakukan suatu prediksi, akan tetapi ANN juga
membutuhkan pelatihan agar dapat melakukan prediksi terhadap suatu
data uji yang ingin diprediksikan hasilnya. Proses pelatihan dalam ANN
dapat
menggunakan
Backpropagation,
algoritma-algoritma
Self-Organizing
Map
seperti
(SOM),
Delta,
Perceptron,
Associative
Memory, Learning Vector Quantization, dan sebagainya.
Pada dasarnya karakteristik ANN ditentukan oleh :
1) Pola hubungan antara neruron (disebut dengan arsitektur jaringan)
2) Metode penentuan bobot-bobot sambungan (disebut dengan pelatiha
atau proses belajar jaringan)
3) Fungsi aktivasi
2.2.3
ARSITEKTUR ANN
Pada ANN, neuron-neuron akan dikumpulkan dalam lapisan-
lapisan (layer) yang disebut dengan lapisan neuron (neuron layer).
Masing-masing neuron pada suatu layer akan dihubungkan dengan
lapisan sebelum dan sesudahnya. Informasi yang diberikan pada jaringan
syaraf akan dirambatkan mulai dari lapisan input sampai kelapisan output
melalui lapisan tersembunyi (hidden layer). Terdapat 2 macam jenis
arsitektur ANN, yaitu jaringan dengan lapisan tunggal atau single layer
17
dan jaringan dengan lapisan multi atau multilayer. Pada sub bab berikut
nya kita akan membahas lebih detail mengenai arsitektur jaringan ANN.
2.2.3.1
JARINGAN DENGAN LAPISAN TUNGGAL (SINGLE LAYER)
Pada
susunan
jaringan
single
layer,
neuron-neuron
dapat
dikelompokan menjadi dua bagian, yaitu layer input dan layer output.
Pada jaringan ini bobot-bobot akan langsung terhubung dengan layer
output. Jaringan ini hanya menerima input kemudian secara langsung
akan mengelolahnya menjadi output tanpa melalui lapisan tersembunyi.
Contoh ANN dengan arsitektur single layer akan ditunjukan pada gambar
dibawah ini :
Gambar 2.4 Single Layer Neural Network Architecture
2.2.3.2
JARINGAN DENGAN MULTI LAPISAN (MULTILAYER)
Memiliki satu atau lebih lapisan tersembunyi yang terletak diantara
lapisan input dan lapisan output. Pada umumnya diantara 2 lapisan yang
bersebelahan akan dihubungkan dengan bobot-bobot tertentu. Seperti
diantara lapisan input dan lapisan tersembunyi dan dari lapisan
18
tersembunyi ke lapisan output. Jumlah hidden layer tergantung pada
kebutuhan. Semakin kompleks jaringan, hiden layer yang dibutuhkan akan
semakin banyak. Contoh ANN dengan arsitektur multi layer akan
ditunjukan pada gambar dibawah ini :
Gambar 2.5 Multi Layer Neural Network Architecture
2.2.4
PARADIGMA PEMBELAJARAN ANN
Berdasarkan cara memodifikasi bobotnya, terdapat dua jenis
metode pembelajaran pada ANN, yaitu :
1) Supervised Training (dengan pengawasan)
Proses
belajar
supervised
adalah
proses
belajar
dengan
memberikan latihan untuk mencapai suatu target keluaran yang
ditentukan. ANN mendapatkan latihan untuk mengenal pola-pola
tertentu. Dengan memberikan target keluaran, perubahan masukan
akan
diadaptasi
interkoneksinya
oleh
mengikuti
keluaran
algoritma
dengan
belajar
mengubah
yang
bobot
ditentukan.
Perbedaan antara output dengan hasil yang diharapkan disebut nilai
19
error. ANN akan mencari eror terkecil, sehingga bentuk fungsi keluaran
mendekati target yang diinginkan.
Pelatihan dilakukan dengan memberikan pasangan pola-pola
masukan dan keluaran. Untuk keperluan pengendalian, pasangan pola
tidak mengikuti rumusan tertentu. ANN harus dapat mengadaptasi
masukan yang acak supaya keluaran tetap mengikuti target. Lebih
lanjut, proses pelatihan dilakukan dengan memberikan pola yang
menggunakan masukan acak dan bobot interkoneksi yang besar.
Dengan pemberian bobot yang besar, perbedaan target dan keluaran
berkurang lebih cepat, sehingga proses adaptasi akan lebih cepat
pula. Beberapa contoh proses belajar dengan pengawasan adalah
proses belajar menggunakan algoritma Hebb Rule, Perceptron, Delta
Rule,
Backpropagation,
Heteroassociative
Memory,
Bidirectional
Associative Memory (BAM), Learning Vector Quantization (LVQ).
2) Unsupervised Training (tanpa pengawasan)
Pada pembelajaran tanpa pengawasan jaringan tidak mendapatkan
target, sehingga ANN mengatur bobot interkoneksi sendiri. Pada
proses belajar tanpa pengawasan, ANN akan mengklasifikasikan
contoh pola-pola masukan yang tersedia ke dalam kelompok yang
berbeda-beda.
2.2.5
FUNGSI AKTIVASI
ANN memiliki fungsi aktivasi yang digunakan untuk membatasi
keluaran dari neuron agar sesuai dengan batasan sinyal/nilai keluarannya.
20
Secara umum terdapat empat macam fungsi aktivasi yang dipakai di
berbagai jenis ANN, yaitu :
1) Fungsi aktivasi linear
Fungsi aktivasi ini biasanya digunakan untuk ANN dengan nilai
keluaran bertipe diskret. Jika nilai v adalah nilai gabungan dari semua
vector oleh penambah, sinyal keluaran y didapatkan dengan
menambah nilai v apa adanya untuk menjadi nilai keluaran. Nilai y
diformulasikan dengan :
=
=
Gambar 2.6 Fungsi Aktivasi Linear
2) Fungsi aktivasi undak (step)
Jika v adalah nilai gabungan dari semua vector dari penambah,
keluaran
y
didapatkan
dengan
melakukan
pengambangan
(theresholding) pada nilai v berdasarkan nilai T yang diberikan. Nilai y
diformulasikan dengan :
=
={
−
≥
<
21
Gambar 2.7 Fungsi Aktivasi Thereshold Bipolar
Bentuk
diatas
disebut
juga
step/thereshold
bipolar,
bentuk
step/threshold biner diformulasikan sebagai berikut :
=
≥
<
={
Gambar 2.8 Fungsi Aktivasi Thereshold Biner
3) Fungsi aktivasi sigmoid biner
ANN dengan nilai keluarn kontinu biasanya menggunakan fungsi
aktivasi sigmoid. Nilai sinyal keluaran y dihitung dengan fungsi kurva
sigmoid dengan interval nilai keluaran mulai dari 0 hingga 1. Nilai y
diformulasikan sebagai berikut :
=
22
=
+ e−av
Gambar 2.9 Fungsi Aktivasi Sigmoid Biner
Parameter a adalah parameter kemiringan (slope) pada kurva sigmoid
yang dihasilkan. Semakin besar nilai a, semakin tegak kurva yang
diberikan, begitu juga sebaliknya jika semakin kecil nilai a maka akan
semakin landai kurva yang diberikan. Umumnya nilai a yang digunakan
adalah 1 sehingga formula yang umum digunakan menjadi
=
+ e−v
4) Fungsi aktivasi sigmoid bipolar
Fungsi aktivasi ini sebenarnya sama dengan sigmoid biner, hanya saja
batas nilai keluaran yang diberikan adalah -1 sampai 1. Fungsi aktivasi
ini sangat baik digunakan untuk proses klasifikasi karena lebih tangguh
dalam menangani data-data yang banyak didominasi oleh nilai nol.
Nilai y diformulasikan sebagai berikut :
=
=
+
−��
−
23
Gambar 2.10 Fungsi Aktivasi Sigmoid Bipolar
2.2.6
MULTILAYER PERCEPTRON
Multilayer
Perceptron
(MLP)
atau
disebut
juga
multilayer
feedforward network merupakan perluasan dari model perceptron dengan
penambahan hidden layer yang memiliki fungsi transfer nonlinear dalam
neuron tersembunyi. Biasanya, jaringan MLP terdiri atas satu layer input,
satu layer komputasi (tersembunyi) dan sebuah layer output. Sinyal
keluaran dirambatkan dengan arah maju pada layer-per-layer. Sebuah
lapisan jaringan yang hanya terdiri dari satu input layer dan satu output
layer disebut dengan perceptron1. Berikut ini merupakan contoh arsitektur
Multilayer perceptron.
Principe, J.C. “Artificial Neural Network”. The Elektrical Engineering Handbook. Boca
Raton : CR Press LLC, 2000
1
24
Hidden
Layer
Output
Layer
Input
Layer
Gambar 2.11 Arsitektur Perceptron Layar Jamak (MLP)
Pada gambar arsitektur perceptron layar jamak diatas terdapat satu
layer tersembunyi dengan empat neuron, dan juga satu layer output
dengan tiga neuron. Setiap layer dalam MLP mempunyai fungsi khusus.
Layer masukan berfungsi menerima sinyal dari luar dan mendistribusikan
nya ke semua neuron pada layer tersembunyi. Layer keluaran menerima
siyal keluaran dari layer tersembunyi dan menghasilkan sinyal/nilai/kelas
keluaran dari seluruh jaringan.
2.2.7
ARTIFICIAL NEURAL NETWORK METHODOLOGY
Merujuk pada jurnal penelitian yang dipublikasikan oleh Kaastra
dan Boyd (1996), langkah penelitian ANN dibagi menjadi 8 tahapan
utama, berikut ini 8 tahapan utama dalam pembuatan ANN model :
1) Variable selection
Pada
tahap
ini
kita
akan
menentukan
variable
independent/predictor dan variable dependent yang sesuai dengan
penelitian ANN.
2) Data collection
25
Pada tahap ini peneliti perlu mengumpulkan data-data dari
berbagai sumber sesuai dengan variable yang telah di tentukan
pada tahapan sebelumnya.
3) Data Preprocessing
Mengubah data mentah yang telah dikumpulkan kedalam skala
yang telah di tentukan. Pada tahap ini data akan di normalisasi
agar sesuai dengan fungsi aktivasi yang digunakan.
4) Training, validation and testing sets
Pada tahap ini kita akan membagi data yang sudah dikumpulkan
dan di normalisasi kedalam 3 set, yaitu data training, validasi dan
testing. Data training adalah himpunan data terbesar dari
keseluruhan data, data ini akan digunakan oleh ANN untuk
mempelajarai atau menemukan pola-pola yang ingin diketahui
dalam data. Data validasi merupakan data yang akan digunakan
untuk mengevaluasi kemampuan generalisasi jaringan yang sudah
dilatih. Kemudian set data yang ke 3 adalah data testing yang akan
digunakan untuk me-validasi keakuratan model ANN yang
terbentuk jika diuji pada data diluar sample.
5) Neural network paradigms
Pada tahapan ini kita akan memilih berapakah lapisan tersembunyi,
neuron output, neuron tersembunyi, dan transfer function.
6) Evaluation criteria
Pada tahap ini peniliti akan membandingkan tingkat keakuratan
model ANN menggunakan rasio-rasio error. Error dihitung dengan
26
membandingkan
hasil prediksi ANN dengan
status debitur
sebenarnya. Semakin kecil kesalahan dari model ANN semakin
baik model tersebut dalam melakukan prediksi.
7) Neural network training (number of training iterations, learning rate
and momentum)
Pada tahapan ini kita akan menentukan stop condition dari
pelatihan ANN, dan menentukan learning rate dan momentum.
Pada tahap ini ANN akan divalidasi menggunakan data validation.
8) Implementation.
Variable
selection
Data collection
Data
Preprocessing
Data Spliting
Trained ANN
ANN Training
Train & test
data
Model
Selection
Optimal ANN
Trial ANN
ANN Validation
Validation
Model
Implementation
Validation data
Gambar 2.12 Langkah-langkah pembuatan ANN Model
2.2.8
BACKPROPAGATION NEURAL NETWORK (BPNN)
Algortima pelatihan backpropagation merupakan suatu algoritma
yang diterapkan pada multilayer perceptron dan merupakan algoritma
pelatihan terbimbing (supervised learning). BPNN
diperlukan sejumlah
masukan dan target yang berfungsi untuk melatih network hingga
27
diperoleh bobot yang diinginkan. Pada setiap kali dilakukannya pelatihan,
jaringan akan menghasilkan suatu output. Selisih antara output yang
dihasilkan oleh jaringan dengan target yang diinginkan disebut dengan
error output. BPNN akan menggunakan error output tersebut untuk
memodifikasi nilai bobot-bobot dalam arah mundur (backward).
Algoritma pelatihan pada backpropagation memiliki tiga fase, yaitu
fase maju (feedforward propagation), fase mundur (back propagation) dan
fase modifikasi bobot. Dalam fase
feedforward, pola masukan dihitung
maju dari layer input hingga layer output. Pada fase back propagation,
tiap-tiap unit output yang dikeluarkan jaringan akan dihitung nilai error
output nya, kemudian error output tersebut akan dipropagasikan mundur.
Pada fase backpropagation tersebut bobot dimodifikasi untuk menurunkan
error output hinga kondisi penghentian terpenuhi.
28
Output
Layer
y1
ym
yk
w1k
wj1
wp1
wpk
w1m
wjm
wjk
wpm
w11
w0k
w01
Hidden
Layer
Z1
Zj
w0m
1
Zp
v0p
v0j
v11
vnp
v1j
vi1
v01
vnj
vij
v1p
1
vip
vn1
Input
Layer
x1
xn
xi
Gambar 2.13 Arsitektur Backpropagation
(Sumber : Fausset, 1994)
2.2.9
PROSEDUR
PELATIHAN
BACKPROPAGATION
NEURAL
NETWORK
Sebelum kita mengetahui prosedur pelatihan backpropagation
neural network, sebaiknya kita mengetahui terlabih dahulu notas-notasi
apakah yang umum digunakan pada backpropagation neural network.
Berikut merupakan notasi backpropagation dikutip dari Laurence Fausett
(1994) :
x
Data training untuk input (x = x1,…,xi,…,xn)
t
Data training untuk output (target/desired output)
29
α Learning rate, yaitu parameter yang mengontrol perubahan bobot
selama proses pelatihan. Jika learning rate besar, jaringan akan
semakin cepat belajar akan tetapi outpt yang dihasilkan kurang akurat,
begitu juga sebaliknya. Learning rate biasanya ditetapkan antara 0 dan
1
xi Unit input ke-i. Untuk unit input, sinyal yang masuk dan keluar pada
suatu unit dilambangkan dengan variable yang sama, yaitu xi
Zj
Hidden unit ke-j. Sinyal input pada Z j dilambangkan dengan Zinj.
voj
Bias untuk hidden unit ke-j
vij
Bobot antara unit input ke-I dan hidden unit ke-j.
yk
Unit output ke-k. sinyal input ke yk dilambangkan yink.
wok Bias untuk unit output ke-k
wjk
Bobot antara hidden unit ke-j dan unit output ke-k
Faktor koreksi error untuk bobot wjk
Faktor koreksi error untuk bobot vij
Berikut ini merupakan langkah-langkah pelatihan backpropagation
secara lebih detail (Fausett:1994, p294) :
Langkah 0
: Inisialisasi bobot (gunakan nilai acak yang kecil)
Langkah 1
: Jika stop condition belum tercapai, lakukan step 2 – 9
Langkah 2
: Untuk tiap training pair, lakukan langkah 3 – 8
Fase Feedforward Propagation
Langkah 3
: Tiap unit input (xi, i = 1,…, n) menerima sinyal xi dan
menyebarkan sinyal ini ke seluruh unit lapisan di atasnya
(hidden unit).
30
Langkah 4
: Setiap hidden unit (zj, j = 1,…, p) akan menjumlahkan
bobot sinyal masukannya berserta dengan biasnya,
=
+ ∑=
Kemudian aplikasikan fungsi aktivasi yang telah ditentukan
untuk menghitung sinyal output dari hidden unit yang
bersangkutan;
=
lalu kirimkan sinyal output ini keseluruh unit pada lapisan
diatasnya (output unit).
Langkah 5
: Tiap unit ouput (yk, k = 1,…, m) akan menjumlahkan bobot
sinyal masukannya berserta dengan biasnya,
+ ∑
=
=
kemudian aplikasikan fungsi aktivasi yang telah ditentukan
untuk menghitung sinyal output dari unit output yang
bersangkutan;
=
lalu kirimkan sinyal output ini keseluruh unit pada lapisan
diatasnya (output unit).
Fase backward Propagation
Langkah 6
: Tiap unit ouput (yk, k = 1,…, m) menerima pola target
(desired output) yang sesuai dengan pola input (input
training pattern) untuk menghitung kesalahan (error) antara
target dengan output yang dihasilkan jaringan
� =
−
′
31
Dimana : � = error pada node ke-k
= target ke-k
f’(x) = f(x) [1-f(x)]
Gunakan faktor �
untuk menghitung koreksi bobotnya
(digunakan untuk memperbarui wjk nantinya) ;
∆
=
�
Hitung koreksi biasnya (digunakan untuk memperbarui wok
nantinya)
∆
=
�
Kirimkan faktor � ini ke unit-unit pada lapisan dibawahnya
(layer pada langkah 7);
Langkah 7
: Setiap hidden unit (zj, j = 1,…, p) menjumlahkan input delta
dari unit-unit lapisan diatasnya (yang dikirim dari layer
pada langkah 6) yang sudah berbobot;
�
=∑
�
=
Kalikan hasilnya dengan turunan dari fungsi aktivasi yang
digunakan untuk menghasilkan faktor koreksi error �
dimana :
� = �
′
Faktor ini � digunakan untuk menghitung koreksi error
(∆
) (digunakan untuk memperbaharui vij nanti), dimana;
∆
=
�
Selain itu juga dihitung koreksi bias ∆
memperbaharui voj nantinya), dimana;
32
(digunakan untuk
∆
=
�
Pembaruan bobot (adjustment) dan bias
Langkah 8 :
Tiap unit output (yk, k = 1,…, m) akan mengupdate bias
dan bobotnya dari setiap hidden unit (j = 0,…, p) ;
=
+ ∆
Tiap unit hidden unit (zj, j = 1,…, p) akan mengupdate bias
dan bobotnya dari setiap unit input (i = 0,…,n) :
Langkah 9
2.2.10
=
: Test stop condition.
+ ∆
LOGISTIC REGRESSION
Regresi logistik atau yang biasa disebut dengan model logistik atau
model logit, dalam statistika digunakan untuk prediksi probabilitas kejadian
suatu peristiwa dengan mencocokkan data pada fungsi logit kurva logistik.
Metode regresi logistic dapat dibedakan menjadi 2, yaitu :
1) Binary Logistic Regression (Regresi logistik biner).
Regresi logistic biner digunakan ketika hanya ada 2 kemungkinan
variabel respon (Y), contoh nya sukses dan gagal, baik dan buruk.
2) Multinomial Logistic Regression (Regresi Logistik Multinomial).
Regresi Logistik Multinomial digunakan ketika pada variabel respon
(Y) terdapat lebih dari 2 kategorisasi.
Dalam penelitian kali ini, model regresi logistik yang digunakan
adalah regresi logistik biner dimana dalam variabel respon atau output
yaitu status kredit terdapat dua kemungkinan output baik (good) yang
33
dilambangkan dengan angka “1” dan buruk (bad) yang dilambangkan
dengan angka “0”.
Regresi logistik biner adalah salah satu metode statistika
yang
sering
digunakan
untuk
mengklasifikasikan
sejumlah
pengamatan dengan respon biner ke dalam beberapa kelompok
berdasarkan satu atau lebih variabel prediktor. Melalui metode ini
akan dihasilkan peluang dari masing-masing kategori respon yang
akan dijadikan sebagai pedoman pengklasifikasian.
Secara umum model probabilitas regresi logistik dengan
melibatkan beberapa variabel predictor( ) dapat di formulasikan
sebagai berikut :
Estimate probability of an event of an interest
=
+
� + � � + � � +⋯+ � �
� + � � + � � +⋯+ � �
Keterangan :
= estimasi peluang nilai default
,
,
,
,…,
= koefisien regresi
,…,
= variabel-variabel bebas
Selanjutnya,
untuk
menjadikan
model
tersebut
linier
dibutuhkan nya transformasi logit. Perlu diketahui sebelumnya,
logit(p) merupakan log atau ln odds ratio. Odd ratio merupakan
representasi dari probabilitas hasil yang muncul dibagi dengan
probabilitas kejadian yang tidak terjadi.
�
34
=
�
− �
Sehingga diperoleh persamaan linear untuk logistik regresi
adalah sebagai berikut ini :
(
2.2.11
�
− �
)=
+
+
+ ⋯+
UJI KELAYAKAN MODEL PERSAMAAN REGRESI LOGISTIK
Uji ini sering disebut dengan uji ketepatan model. Uji ini digunakan
untuk mengetahui apakah model regresi logistik sudah sesuai dengan
data observasi yang diperoleh. Untuk menilai kelayakan model regresi
logistik dalam penelitian ini diukur dengan nilai chi square dengan uji
Hosmer dan Lemeshow. Pengujian ini akan melihat nilai goodness of fit
test terhadap tingkat signifikasi (5%). Jika nilai Hosmer and Lemeshow’s
goodness of fit test statistik sama dengan atau kurang dari 5%, yang
berarti ada perbedaan signifikan antara model dengan nilai observasinya
atau goodness fit model tidak baik, karena model tidak dapat memprediksi
nilai observasinya. Jika nilai statistik Hosmer and Lemeshow’s goodness
of fit lebih besar dari 5%, yang berarti bahwa model mampu
memprediksikan nilai obsevasinya atau dapat dikatakan model cocok
dengan observasinya (Ghozali, 2001:218).
2.2.12
UJI SIGNIFIKASI PARAMETER
Uji signifikasi parameter adalah pengujian terhadap peranan
parameter pada model secara keseluruhan. Menurut Hosmer-Lemeshow,
(1989) suatu statistik uji rasio likelihood G adalah fungsi dari
dan
35
yang berdistribusi �
(Chi-square) dengan derajat bebas yang p
didefenisikan sebagai:
� = − log ( ) = − [
keterangan:
−
]= −
−
= nilai maksimum fungsi kemungkinan untuk model di bawah H0
= nilai maksimum fungsi kemungkinan untuk model di bawah H 1
= nilai maksimum fungsi log kemungkinan untuk model di bawah H 0
= nilai maksimum fungsi log kemungkinan untuk model di bawah H 1
Nilai −
−
mengikuti distribusi Chi-square dengan df = k.
Jika menggunakan taraf nyata sebesar α, maka kriteria ujinya adalah jika
−
−
≥�
atau p-value ≤ α maka tidak ada perbedaan antara
model dengan data, dan juga sedikitnya terdapat 1 variabel independent
yang mempengaruhi variabel dependen, sehingga model dapat dikatakan
baik.
2.2.13
ODDS RASIO
Regresi logistik juga menghasilkan rasio peluang (odds ratio) terkait
dengan nilai setiap independen variabel. Peluang dari suatu kejadian
diartikan
sebagai
probabilitas
hasil
yang
muncul
dibagi
dengan
probabilitas suatu kejadian tidak terjadi. Rasio peluang bagi independen
pariabel diartikan sebagai jumlah relatif dimana hasil peluang meningkat
(rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel
independen meningkat sebesar 1 unit. Pada kasus penelitian dengan
36
regresi logistik, nilai ini dapat dilihat dari nilai Exp(B) pada hasil analisis
data. Hasil tersebut akan menunjukkan pengaruh setiap variabel-variabel
independen terhadap variabel dependen.
2.2.14
PENGERTIAN CREDIT SCORING
Credit scoring adalah kegiatan untuk menilai keadaan calon
debitur. Credit scoring atau penilaian kredit sangat mempengaruhi kualitas
portfolio kredit bank. Analisa kredit yang kurang akurat pada akhirnya
akan menyebabkan timbulnya kredit bermasalah. (Martono 2002).
Menrut Colquitt (2007) credit scoring dilakuakan melalui “Credit
Risk Assessment”, sedangkan credit risk assessment sendiri memiliki 3
tujuan utama. Tujuan pertama dari credit risk assessment dan yang paling
penting
adalah
menilai
kemungkinan
peminjam
(debitur)
dapat
mengembalikan dana yang telah ia pinjam dengan cara menilai
penghasilannya, karakter, kapasitas dan kecukupan modal debitur. Selain
itu, credit risk assessment juga menyangkut mengidentifikasi sumber
utama pembayaran pinjaman (pekerjaan atau usaha yang debitur geluti)
dan sumber sekunder pembayaran untuk mengantisipasi bilamana
sumber utama pembayaran menjadi tidak tersedia.
Sehingga dapat penulis simpulkan bahwa credit scoring adalah
usaha yang dilakukan oleh kreditur untuk menilai kelayakan calon debitur
37
dengan melakukan credit risk assessment, sehingga risiko kredit
bermasalah dapat diminimalisir.
2.2.15
FAKTOR-FAKTOR PENILAIAN KREDIT
Menurut Martono (2002) dalam melakukan credit scoring terdapat
beberapa faktor yang harus dipertimbangkan, antara lain : prinsip-prinsip
perkreditan, aspek penilaian kredit, dan teknik penyelesaian kredit macet.
Prinisp perkreditan disebut juga sebagai konsep 5C. Pada
dasarnya konsep 5C ini akan dapat memberikan informasi mengenai
etikad baik (willingness to pay) dan kemampuan membayar (ability to pay)
nasabah untuk melunasi kembali peminjaman berserta dengan bunga
nya. Prinsip-prinsip 5C tersebut adalah sebagai berikut :
1) Character
Pada prinsip ini memperhatikan dan meniliti tentang kebiasaankebiasaan, sifat-sifat pribadi, cara hidup (style of living), keadaan
keluarganya, hobi dan social standing calon debitur. Prinsip ini
merupakan ukuran tentang kemauan untuk membayar (willingness to
pay).
2) Capacity
Penilaian terhadap capacity debitur dilakukan untuk mengetahui
sejauh mana kemampuan debitur mengembalikan pokok pinjaman
serta bunga pinjaman nya. Pemberi pinjaman biasanya menilai laporan
laba rugi pemohon, dividend an jenis-jenis pendapatan. Biaya rutin
pemohon juga dipertimbangkan dalam pengukuran.
38
3) Capital
Mengukur nilai bersih asset debitur. Pemberi pinjaman / kreditur ingin
mengenali kapasitas cadangan jika situasi tidak menguntungkan
berkembang. Modal biasanya dinilai dalam kasus kredit konsumen
yang besar, misalnya, kapal dan pesawat terbang dll.
4) Collateral
Penilaian tehadap barang jaminan yang diserahkan debitur sebagai
jaminan atas kredit yang diperolehnya. Tujuan nya adalah menilai
sejauh mana nilai jaminan dapat menutupi resiko kegagalan
pengembalian kewajiban-kewajiban debitur.
5) Condition
Menilai kondisi ekonomi secara umum serta kondisi pada sektor usaha
calon debitur yang akan mempengaruhi kemampuan calon debitur
untuk membayar kembali pinjaman nya. Menilai aspek kondisi dapat
berupa
penilaian
terhadap
jenis
pekerjaan
debitur
dan
sifat
perusahaan dimana debitur melakukan pekerjaan.
2.2.16
KREDIT BERMASALAH
Kredit bermasalah adalah resiko terbesar yang sangat dihindari
oleh perusahaan-perusahaan peminjaman seperti multifinance dan bank.
Kredit bermasalah disebabkan oleh debitur dalam memenuhi kewajiban
nya yaitu membayar angsuran kredit berikut dengan bunganya tidak
sesuai dengan kesepakatan yang telah disetujui dalam perjanjian kredit.
39
Bank Indonesia sebagai bank central telah membuat ketentuan
mengenai status kolektivitas kredit. Adapun status kolektivitas kredit
tersebut antara lain :
1) Kredit Lancar, yaitu kredit yang pembayaran pokok pinjaman dan
bunganya tepat waktu, perkembangan rekening baik dan tidak ada
tunggakan serta sesuai dengan persyaratan kredit.
2) Kredit dalam perhatian khusus, yaitu kredit yang pengembalian pokok
pinjaman atau bunganya terdapat tunggakan sampai 90 hari.
3) Kredit kurang lancar, yaitu kredit yang pengembalian pokok pinjaman
dan pembayaran bunganya terdapat tunggakan telah melampaui 90
hari sampai dengan 180 hari dari waktu yang telah disepakati.
4) Kredit diragukan, yaitu kredit yang pengembalian pokok pinjaman dan
pembayaran bunganya terdapat tunggakan telah melampaui 180 hari
sampai dengan 270 hari dari waktu yang telah disepakati.
5) Kredit macet, yaitu kredit yang pengembalian pokok pinjaman dan
pembayaran bunganya terdapat tunggakan telah melampaui 270 hari.
Persentase jumlah kredit bermasalah (dengan kriteria kurang
lancar, diragukan, dan macet) terhadap total kredit yang dikeluarkan oleh
multifinance disebut dengan Non Performing Loans (NPL). NPL
merupakan salah satu indikator dari kesehatan keuangan sebuah
perusahaan multifinance dan bank, semakin tinggi rasio NPL maka tingkat
likuiditas multifinance terhadap dana pihak ketiga (DPK) akan semakin
rendah.
40
2.2.17
ROOT MEAN SQUARE ERROR (RMSE)
Root Mean Square Error (RMSE) merupakan parameter yang
digunakan untuk mengevaluasi nilai hasil dari pengamatan/pengukuran
terhadap nilai sebenarnya atau nilai aktual. Semakin besar nilai RMSE
maka semakin model yang dihasilkan tidak akurat. Berikut ini formula
untuk menghitung RMSE :
�= √
� ………………………………………………………………()
Dimana MSE atau Mean Square Error adalah :
�=
�
�=∑=
…………………………………………………………………….()
Keterangan :
SSE
− ̂
− ̂
……………………………………………………..()
= nilai perbandingan antara nilai prediksi dan aktual.
= kuadrat nilai actual dikurangi nilai prediksi
= jumlah data sample
41
Download