BAB 2 LANDASAN TEORI 2.1 TINJAUAN PUSTAKA Sebuah perusahaan multifinance akan selalu dihadapkan pada risiko kemungkinan nasabah tidak dapat mengembalikan sejumlah dana yang telah ia pinjam sesuai dengan jangka waktu yag telah disepakati. Tools yang paling penting digunakan oleh seorang credit analyst untuk melakukan penilaian resiko adalah tools credit scoring. Credit scoring berupaya untuk meringkas sejarah kredit nasabah/peminjam dengan menggunakan credit scoring model (Fabozzi, Davis et al. 2006). Credit scoring model adalah sistem pendukung keputusan yang membutuhkan satu set variable predictor sebagai masukan dan memberikan nilai sebagai output. Kreditur menggunakan model ini untuk mengetahui kredit mana yang dapat di setujui dan tidak dapat disetujui (Jentzsch 2007). Credit scoring model menggunakan sebuah set algoritma rumit yang digunakan oleh kreditor untuk mengevaluasi kelayakan kredit dari nasabah secara spesifik. Secara teoritis, cara penilaian credit scoring berkerja dengan sederhana. Menurut Jentzsch (2007), prosedur dasar penilaian kredit dapat dijelaskan dengan cara berikut : Variable dependent (Y) merupakan status kredit (kemungkinan pembayaran) sedangkan variable indepent (variable predictor atau Xi) yang digunakan untuk menjelaskan variable dependent. Variable-variable independent yang dapat digunakan untuk 5 memprediksi resiko kredit dapat mencakup jumlah keterlambatan pembayaran pinjaman dalam jangka waktu teretentu, jumlah waktu kredit (tenor) yang telah ditetapkan, jumlah kredit yang digunakan berbanding dengan jumlah kredit yang tersedia, lama menetap pada suatu wilayah tempat tinggal, riwayat pekerjaan, dan informasi kredit negatif seperti pernah mengalami kebangkrutan, kredit macet, dan penyitaan (Fabozzi, Davis et al. 2006). Diantara model credit scoring terdapat empat pendekatan yang digunakan diantara nya adalah Linear Discriminant Analysis, Logistic Regression and Probit, K-nearest Neighbor Classifier, Support Vector Machine Classifier (Servigny dan Renault, 2004). Ke-empat algoritma tersebut memiliki 1 kesamaan yaitu memiliki parameter yang didefinisikan dengan variable dan variable-variable tersebut diperoleh dari credit report atau form aplikasi pengajuan kredit. Dilain sisi, beberapa model statistic tersebut memiliki keterbatasan (statistical restrictions), menurut Anderloni, Braga dan Carluccio (2006) pada metode discriminant analyst, uji normalitas, uji linearitas dan uji homogenitas harus terpenuhi, jika ketiga persyaratan analisis tersebut tidak terpenuhi maka akan memicu masalah akurasi prediksi. Beberapa tahun terakhir telah dikembangkan model baru dari matematika dan statistik untuk menunjang risiko kredit dalam perspektif yang berbeda, diantara nya linear programming, integer programming dan neural network. Menurut penelitian terdahulu yang telah dilakukan oleh Samsul Islam, Lin Zhou dan Fee Li (2009) di German, Artificial Neural 6 Networks (ANN) dapat menjadi alternatif yang baik untuk menunjang analisa credit scoring. Pada hasil penelitian tersebut terlihat bahwa analisa menggunakan ANN memberikan nilai tingkat kesuksesan yang lebih baik yaitu 83.86% dibandingkan dengan discriminant analysis dan logistic regression yang hanya memiliki tingkat kesuksesan sebesar 76.4%. Tabel 2.1 Predictive Models Comparison Sumber : Islam, Zhou & Li (2009) Pada penelitian lain yang dilakukan oleh Sutikno, Pujiantara, & Supanti (2007) ANN dibangun dengan multilayer backpropagation dimana dari pengujian tersebut di dapatkan persentase hasil prediksi terbaik adalah menggunakan ANN backpropagation dengan 2 layer dengan jumlah neuron pada hidden layer pertama sebanyak 100 neuron dan jumlah neuron pada hidden layer kedua sebanyak 300 neuron, dengan kombinasi fungsi aktivasi logsig-satlin akan memberikan tingkat keberhasilan 100%. ANN dinilai efektif dalam memprediksi dan meklasifikasikan data melalui proses pembelajaran sejumlah besar data hystorical, hinggan menghasilkan sebuah pola/model yang mampu memprediksikan output dari data yang tidak terlihat sebelumnya. Tabel 2.2 berikut ini merupakan rangkuman dari sejumlah literatur yang berhubungan dengan penelitian. 7 Tabel 2.2 Ringkasan Hasil Penelitian Terdahulu No Judul Penelitian 1. Application of Artificial Intelligence (Artificial Neural Network) to Assess Credit Risk: A Predictive Model For Credit Card Scoring. (Islam, Zhou dan Li) 2. Prediksi Risiko Kredit Dengan Jaringan Syaraf Tiruan Backpropagation. (Sutikno, Pujiantara, & Supanti) 3. Analisa Klasifikasi Kredit Menggunakan Regresi Logistik Biner dan Radial Basis Function Network di Bank 'X' Cabang Kediri. (Diaprina dan Suhartono) Predicting Credit Card Customer Loyalty Using Artificial Neural Networks. (Zhang,Yuan & Liu) 4. 5. 8 Hasil Penelitian Neural network memberikan hasil penerimaan data “Bad accepted” terendah yaitu 61 nasabah, sedangkan logistic regression sebanyak 140 nasabah dan discriminant analysis sebanyak 143 nasabah. Dengan ANN dapat memperkecil kemungkinan kerugian yang akan di alami perusahaan. - ANN Backpropagation dengan 1 hidden layer (jumlah sel 100) dan fungsi aktivasi satlin mampu memprediksi risiko kredit dengan prosentase kebenaran 70% - ANN backpropagation dengan 2 hidden layer (jumlah sel pertama 100 dan sel kedua 300) dan kombinasi fungsi aktivasi logsig-satlin mampu memprediksi risiko kredit dengan prosentase kebenaran 100%. Metode regresi logistik lebih baik dalam melakukan klasifikasi dengan tingkat ketepatan klasifikasi sebesar 99,76% dibandingkan dengan metode Radial Basis Function Network dengan nilai ketepatan klasifikasi sebesar 98,51% Neural Network mampu mengklasifikasikan dengan tepat 67.97% pelanggan dengan loyalitas tinggi dan rendah. Akan tetapi menurut peneliti penilaian secara objectif yang dilakukan menggunakan parameter jumlah transaksi perlu ditunjang juga dengan analisa tradisional seperti questioner untuk membantu meningkatkan akurasi prediksi neural network. Measuring Credit Risk Analisa neural network untuk Of Bank Customers Using Artificial Neural Network. Jurnal of Management Research. (Mohsen) 2.2 mengklasifikasikan nasabah dalam kategori “baik” dan “buruk”, menggunakan 1 hidden layer dan 12 neuron pada hidden layer menghasilkan nilai akurasi sebesar 87.9% pada data training. Sedangkan hasil akurasi model terhadap data yang belum pernah dilatih sebesar 77.9%. Fungsi aktivasi yang digunakan pada penelitian ini adalah Hyperbolic tangent. LANDASAN TEORI 2.2.1 DECISION SUPPORT SYSTEM Decision Support System (DSS) atau sistem pendukung pengambilan keputusan merupakan suatu system informasi berbasis komputer yang menghasilkan berbagai alternatif keputusan untuk membantu manajemen dalam menangani berbagai permasalahan yang terstruktur ataupun tidak terstruktur dengan menggunakan data dan model. (Dadan Umar Dhani, 2001 : 55). Akan tetapi perlu untuk ditekankan bahwa peran DSS tidak untuk menggantikan tugas-tugas para manajer dalam mengambil keputusan, tetapi untuk menjadi penunjang (tool) bagi mereka untuk menentukan keputusan. DSS berperan pada mengelolah data menjadi informasi, informasi menjadi pengetahuan dan pengetahuan menjadi aksi-aksi yang relevan. Tujuan dibangun nya DSS secara umum adalah sebagai berikut : 1) Membantu approver mengambil keputusan atas masakag terstruktur maupun tidak terstruktur. Dalam penelitian ini pengambil keputusan 9 dilakukan oleh seorang credit analyst untuk menentukan menerima atau menolak pengajuan kredit oleh calon nasabah 2) Memberikan dukungan atas pertimbangan approver. Bukan menggantikan fungsi approver dalam memberikan keputusan 3) Menjadikan dasar atau pertimbangan pengambilan keputusan yang diambil approver 4) Kecepatan komputasi suatu sistem yang dapat mengambil suatu kesimpulan atau saran atau suatu keputusan secara cepat dan tepat sehingga dapat meminimalisir human error dengan jumlah data yang banyak 5) Peningkatan produktifitas 6) Dukungan kualitas, berdaya saing dan dapat mengatasi keterbatasan kognitif dalam memproses dan penyimpanan. 2.2.1.1 KOMPONEN-KOMPONEN SISTEM PENDUKUNG KEPUTUSAN Menurut Turban (2005) sistem pendukung keputusan terdiri dari empat komponen utama, antara lain adalah sebagai berikut : 1) Subsistem manajemen data (database managemen subsystem), Kumpulan data yang tersusun secara terstruktur dan dalam format elektronik yang mudah diolah oleh program computer. Data yang digunakan adalah data yang relevan dengan permasalahan yang hendak dipecahkan melalui simulasi. 10 2) Subsistem manajemen model (Model base management subsystem). Melibatkan model financial, statistical, manajement sains (science management) atau berbagai model kuantitatif lainnya, sehingga mampu memberikan kemampuan analisa yang baik kepada sistem dan manajemen perangkat lunak (software) yang dibutuhkan. 3) Subsistem manajemen dialog (User sisten interface) Pengguna dapat berkomunikasi dan memberikan perintah pada DSS melalui subsistem ini, yang menyediakan halaman antarmuka (user interface). 4) Subsistem manajemen berbasis pengetahuan (knowledge-based management subsystem) Subsistem opsional yang dapat mendukung subsistem lain atau bertindak sebagai komponen yang berdiri sendiri. Gambar 2.1 Arsitektur Sistem Pendukung Keputusan 11 2.2.1.2 KLASIFIKASI DSS Steven L. Alter (1976) telah melakukan studi terhadap 56 sistem penunjang keputusan. Dari studi tersebut dihasilkan pengklasifikasian terhadap sistem penunjang keputusan menjadi 6 kategori, yaitu : 1) File drawer system Sistem File Drawer adalah jenis DSS yang paling sederhana, yang dapat menyediakan akses menuju elemen-elemen data yang terperinci. Semua data digunakan untuk mengambil keputusan. Contoh yang paling nyata adalah mesin ATM, dimana saldo pada rekening dapat digunakan untuk mengambil keputusan untuk melakukan transfer dana ke rekening lain 2) Data analysis system Sistem analisa data mampu memberikan akses terhadap data, dan juga memungkinkan dilakukannya manipulasi data 3) Analysis information system Pada sistem informasi ini, informasi dari beberapa berkas/file digabungkan menjadi satu. Berkas yang digabungkan bisa saja berasal dari sumber eksternal/dari luar sistem, dan juga bisa dari suatu basis data/database tertentu. 4) Accounting models Model akuntansi ini adalah tipe sistem pendukung keputusan yang menggunakan sumber yaitu data akuntansi internal perusahaan, bisa berupa data General Ledger/buku besar, data neraca laba rugi, dan 12 sebagainya yang terdapat dalam sistem akuntansi yang digunakan sehari-hari oleh bagian keuangan/akunting perusahaan. 5) Representational models Model Representasional dapat memperbaiki ketidakpastian pada data mentah yang tersedia, dengan menggunakan beberapa macam model untuk memecahkan berbagai masalah pengambilan keputusan dengan menggunakan perkiraan (forecast). Model ini dapat digunakan untuk menambah kemampuan model akuntansi yang telah dibahas diatas. Contoh penerapannya adalah dengan menggunakan data permintaan konsumen untuk memperkirakan/membuat prediksi terhadap jumlah permintaan yang akan muncul tahun berikutnya. 6) Optimization system Model optimisasi adalah sistem pendukung keputusan yang digunakan untuk memperkirakan dampak dari berbagai pilihan keputusan yang berbeda, berdasarkan pada model-model optimisasi. Model ini juga dapat memperbaiki ketidakpastian yang tergambar pada data mentah yang diperoleh, untuk membantu pengambilan keputusan. 7) Suggestion system Sistem Suggestion atau Pemberian saran adalah tipe DSS yang berbentuk model deskriptif dan juga preskriptif (detail/terperinci) yang digunakan untuk mengajukan saran pengambilan keputusan terhadap manajemen perusahaan. Sistem ini mampu mendayagunakan Sistem Pakar yang mungkin dimiliki suatu perusahaan. 13 Berdasarkan ketujuh klasifikasi DSS yang telah dijabarkan diatas, dapat kita ambil kesimpulan bahwa sistem penunjang keputusan credit scoring dengan menggunakan model ANN dan Logit pada penelitian ini adalah merupakan sistem DSS dengan tipe suggestion system. Dimana hasil yang diberikan oleh DSS akan membantu oleh seorang credit analyst untuk menentukan apakah menerima pengajuan kredit calon nasabah atau menolaknya. 2.2.2 KONSEP ARTIFICIAL NEURAL NETWORK Artificial Neural Networ (jaringan syaraf tiruan) merupakan suatu metode pembelajaran yang diinspirasi dari cara kerja otak mahluk hidup. Dengan melakukan proses pembelajaran, otak dapat mengatur respon yang sesuai dan konsisten terhadap suatu kondisi. Respon manusia terhadap suatu kondisi / peristiwa merupakan hasil kompleksitas proses pengelolahan informasi di dalam otak. Seperti halnya otak manusia ataupun hewan, otak terdiri dari sel-sel yang disebut neuron. 14 Gambar 2.2 Model Neuron Biologis Neuron pada otak manusia berfungsi sebagai pusat pemprosesan informasi yang dikirimkan melalui dendrite dan mengeluarkan hasil proses teresbut melalui axon, untuk kemudian di teruskan ke dendrit dari sel saraf lain. Sinapsis adalah unit fungsional antara 2 buah sel saraf. Sinapsis merupakan titik temu antara axon salah satu neuron dengan dendit neuron lainnya. Kekuatan sinapsis bisa menurun/meningkat tergantung seberapa besar tingkat propagasi (penyiaran) sinyal yang diterimanya. Informasi akan diterima oleh neuron lain jika memenuhi batasan tertentu, yang sering disebut dengan nilai ambang (threshold). Berkembang dari analogi sistim kerja otak manusia tersebut, desain arsitektur ANN secara umum diperlihatkan pada Gambar 2.2. Pada gambar tersebut diperlihatkan layer input (sumber data) terdiri dari sejumlah nilai yang diberikan sebagai nilai masukan pada ANN. Pada gambar tersebut layer input memiliki tiga nilai (x1,x2,x3), masing-masing layer input akan melewati hubungan dengan bobot w. Kemudian, bobot tersebut akan digabungkan pada neuron pemproses dan dikelolah oleh 15 fungsi aktivasi untuk menghasilkan sinyal y sebagai keluaran (output layer). Fungsi aktivasi memiliki sebuah nilai ambang batas (threshold) untuk membatasi nilai keluaran yang dihasilkan oleh neuron pemproses agar selalu dalam batas nilai yang telah ditetapkan. x1 x2 w1 w2 Neuron Pemproses Sinyal Keluaran ∑ ƴ w3 x3 T Gambar 2.3 Desain umum ANN Menurut Nazari (2013), lapisan atau layer-layer penyusun ANN dapat dibagi menjadi 3 komponen utama, yaitu : 1) Lapisan input (input layer) Lapisan ini terdiri dari data-data yang akan dikelolah oleh ANN yang merupakan gambaran dari suatu permasalahan. 2) Lapisan tersembunyi (hidden layer) Lapisan tersembunyi tidak dapat diamati secra langsung. Pada lapisan ini berisi dua proses : fungsi penjumlahan bobot dan fungsi transformasi. 3) Lapisan output (output layer) Lapisan yang terhubung secara langsung dengan lapisan tersembunyi yang akan menghasilkan suatu nilai keluaran (sinyal keluaran). 16 Seperti hal nya analogi otak manusia, otak manusia selalu memperoleh pembelajaran dari lingkungan sekitar agar dapat mengelolah lingkungan nya dengan baik sesuai dengan pembelajaran yang didapat ataupun pengalaman nya. ANN dianggap sebagai pemodelan yang digunakan untuk melakukan suatu prediksi, akan tetapi ANN juga membutuhkan pelatihan agar dapat melakukan prediksi terhadap suatu data uji yang ingin diprediksikan hasilnya. Proses pelatihan dalam ANN dapat menggunakan Backpropagation, algoritma-algoritma Self-Organizing Map seperti (SOM), Delta, Perceptron, Associative Memory, Learning Vector Quantization, dan sebagainya. Pada dasarnya karakteristik ANN ditentukan oleh : 1) Pola hubungan antara neruron (disebut dengan arsitektur jaringan) 2) Metode penentuan bobot-bobot sambungan (disebut dengan pelatiha atau proses belajar jaringan) 3) Fungsi aktivasi 2.2.3 ARSITEKTUR ANN Pada ANN, neuron-neuron akan dikumpulkan dalam lapisan- lapisan (layer) yang disebut dengan lapisan neuron (neuron layer). Masing-masing neuron pada suatu layer akan dihubungkan dengan lapisan sebelum dan sesudahnya. Informasi yang diberikan pada jaringan syaraf akan dirambatkan mulai dari lapisan input sampai kelapisan output melalui lapisan tersembunyi (hidden layer). Terdapat 2 macam jenis arsitektur ANN, yaitu jaringan dengan lapisan tunggal atau single layer 17 dan jaringan dengan lapisan multi atau multilayer. Pada sub bab berikut nya kita akan membahas lebih detail mengenai arsitektur jaringan ANN. 2.2.3.1 JARINGAN DENGAN LAPISAN TUNGGAL (SINGLE LAYER) Pada susunan jaringan single layer, neuron-neuron dapat dikelompokan menjadi dua bagian, yaitu layer input dan layer output. Pada jaringan ini bobot-bobot akan langsung terhubung dengan layer output. Jaringan ini hanya menerima input kemudian secara langsung akan mengelolahnya menjadi output tanpa melalui lapisan tersembunyi. Contoh ANN dengan arsitektur single layer akan ditunjukan pada gambar dibawah ini : Gambar 2.4 Single Layer Neural Network Architecture 2.2.3.2 JARINGAN DENGAN MULTI LAPISAN (MULTILAYER) Memiliki satu atau lebih lapisan tersembunyi yang terletak diantara lapisan input dan lapisan output. Pada umumnya diantara 2 lapisan yang bersebelahan akan dihubungkan dengan bobot-bobot tertentu. Seperti diantara lapisan input dan lapisan tersembunyi dan dari lapisan 18 tersembunyi ke lapisan output. Jumlah hidden layer tergantung pada kebutuhan. Semakin kompleks jaringan, hiden layer yang dibutuhkan akan semakin banyak. Contoh ANN dengan arsitektur multi layer akan ditunjukan pada gambar dibawah ini : Gambar 2.5 Multi Layer Neural Network Architecture 2.2.4 PARADIGMA PEMBELAJARAN ANN Berdasarkan cara memodifikasi bobotnya, terdapat dua jenis metode pembelajaran pada ANN, yaitu : 1) Supervised Training (dengan pengawasan) Proses belajar supervised adalah proses belajar dengan memberikan latihan untuk mencapai suatu target keluaran yang ditentukan. ANN mendapatkan latihan untuk mengenal pola-pola tertentu. Dengan memberikan target keluaran, perubahan masukan akan diadaptasi interkoneksinya oleh mengikuti keluaran algoritma dengan belajar mengubah yang bobot ditentukan. Perbedaan antara output dengan hasil yang diharapkan disebut nilai 19 error. ANN akan mencari eror terkecil, sehingga bentuk fungsi keluaran mendekati target yang diinginkan. Pelatihan dilakukan dengan memberikan pasangan pola-pola masukan dan keluaran. Untuk keperluan pengendalian, pasangan pola tidak mengikuti rumusan tertentu. ANN harus dapat mengadaptasi masukan yang acak supaya keluaran tetap mengikuti target. Lebih lanjut, proses pelatihan dilakukan dengan memberikan pola yang menggunakan masukan acak dan bobot interkoneksi yang besar. Dengan pemberian bobot yang besar, perbedaan target dan keluaran berkurang lebih cepat, sehingga proses adaptasi akan lebih cepat pula. Beberapa contoh proses belajar dengan pengawasan adalah proses belajar menggunakan algoritma Hebb Rule, Perceptron, Delta Rule, Backpropagation, Heteroassociative Memory, Bidirectional Associative Memory (BAM), Learning Vector Quantization (LVQ). 2) Unsupervised Training (tanpa pengawasan) Pada pembelajaran tanpa pengawasan jaringan tidak mendapatkan target, sehingga ANN mengatur bobot interkoneksi sendiri. Pada proses belajar tanpa pengawasan, ANN akan mengklasifikasikan contoh pola-pola masukan yang tersedia ke dalam kelompok yang berbeda-beda. 2.2.5 FUNGSI AKTIVASI ANN memiliki fungsi aktivasi yang digunakan untuk membatasi keluaran dari neuron agar sesuai dengan batasan sinyal/nilai keluarannya. 20 Secara umum terdapat empat macam fungsi aktivasi yang dipakai di berbagai jenis ANN, yaitu : 1) Fungsi aktivasi linear Fungsi aktivasi ini biasanya digunakan untuk ANN dengan nilai keluaran bertipe diskret. Jika nilai v adalah nilai gabungan dari semua vector oleh penambah, sinyal keluaran y didapatkan dengan menambah nilai v apa adanya untuk menjadi nilai keluaran. Nilai y diformulasikan dengan : = = Gambar 2.6 Fungsi Aktivasi Linear 2) Fungsi aktivasi undak (step) Jika v adalah nilai gabungan dari semua vector dari penambah, keluaran y didapatkan dengan melakukan pengambangan (theresholding) pada nilai v berdasarkan nilai T yang diberikan. Nilai y diformulasikan dengan : = ={ − ≥ < 21 Gambar 2.7 Fungsi Aktivasi Thereshold Bipolar Bentuk diatas disebut juga step/thereshold bipolar, bentuk step/threshold biner diformulasikan sebagai berikut : = ≥ < ={ Gambar 2.8 Fungsi Aktivasi Thereshold Biner 3) Fungsi aktivasi sigmoid biner ANN dengan nilai keluarn kontinu biasanya menggunakan fungsi aktivasi sigmoid. Nilai sinyal keluaran y dihitung dengan fungsi kurva sigmoid dengan interval nilai keluaran mulai dari 0 hingga 1. Nilai y diformulasikan sebagai berikut : = 22 = + e−av Gambar 2.9 Fungsi Aktivasi Sigmoid Biner Parameter a adalah parameter kemiringan (slope) pada kurva sigmoid yang dihasilkan. Semakin besar nilai a, semakin tegak kurva yang diberikan, begitu juga sebaliknya jika semakin kecil nilai a maka akan semakin landai kurva yang diberikan. Umumnya nilai a yang digunakan adalah 1 sehingga formula yang umum digunakan menjadi = + e−v 4) Fungsi aktivasi sigmoid bipolar Fungsi aktivasi ini sebenarnya sama dengan sigmoid biner, hanya saja batas nilai keluaran yang diberikan adalah -1 sampai 1. Fungsi aktivasi ini sangat baik digunakan untuk proses klasifikasi karena lebih tangguh dalam menangani data-data yang banyak didominasi oleh nilai nol. Nilai y diformulasikan sebagai berikut : = = + −�� − 23 Gambar 2.10 Fungsi Aktivasi Sigmoid Bipolar 2.2.6 MULTILAYER PERCEPTRON Multilayer Perceptron (MLP) atau disebut juga multilayer feedforward network merupakan perluasan dari model perceptron dengan penambahan hidden layer yang memiliki fungsi transfer nonlinear dalam neuron tersembunyi. Biasanya, jaringan MLP terdiri atas satu layer input, satu layer komputasi (tersembunyi) dan sebuah layer output. Sinyal keluaran dirambatkan dengan arah maju pada layer-per-layer. Sebuah lapisan jaringan yang hanya terdiri dari satu input layer dan satu output layer disebut dengan perceptron1. Berikut ini merupakan contoh arsitektur Multilayer perceptron. Principe, J.C. “Artificial Neural Network”. The Elektrical Engineering Handbook. Boca Raton : CR Press LLC, 2000 1 24 Hidden Layer Output Layer Input Layer Gambar 2.11 Arsitektur Perceptron Layar Jamak (MLP) Pada gambar arsitektur perceptron layar jamak diatas terdapat satu layer tersembunyi dengan empat neuron, dan juga satu layer output dengan tiga neuron. Setiap layer dalam MLP mempunyai fungsi khusus. Layer masukan berfungsi menerima sinyal dari luar dan mendistribusikan nya ke semua neuron pada layer tersembunyi. Layer keluaran menerima siyal keluaran dari layer tersembunyi dan menghasilkan sinyal/nilai/kelas keluaran dari seluruh jaringan. 2.2.7 ARTIFICIAL NEURAL NETWORK METHODOLOGY Merujuk pada jurnal penelitian yang dipublikasikan oleh Kaastra dan Boyd (1996), langkah penelitian ANN dibagi menjadi 8 tahapan utama, berikut ini 8 tahapan utama dalam pembuatan ANN model : 1) Variable selection Pada tahap ini kita akan menentukan variable independent/predictor dan variable dependent yang sesuai dengan penelitian ANN. 2) Data collection 25 Pada tahap ini peneliti perlu mengumpulkan data-data dari berbagai sumber sesuai dengan variable yang telah di tentukan pada tahapan sebelumnya. 3) Data Preprocessing Mengubah data mentah yang telah dikumpulkan kedalam skala yang telah di tentukan. Pada tahap ini data akan di normalisasi agar sesuai dengan fungsi aktivasi yang digunakan. 4) Training, validation and testing sets Pada tahap ini kita akan membagi data yang sudah dikumpulkan dan di normalisasi kedalam 3 set, yaitu data training, validasi dan testing. Data training adalah himpunan data terbesar dari keseluruhan data, data ini akan digunakan oleh ANN untuk mempelajarai atau menemukan pola-pola yang ingin diketahui dalam data. Data validasi merupakan data yang akan digunakan untuk mengevaluasi kemampuan generalisasi jaringan yang sudah dilatih. Kemudian set data yang ke 3 adalah data testing yang akan digunakan untuk me-validasi keakuratan model ANN yang terbentuk jika diuji pada data diluar sample. 5) Neural network paradigms Pada tahapan ini kita akan memilih berapakah lapisan tersembunyi, neuron output, neuron tersembunyi, dan transfer function. 6) Evaluation criteria Pada tahap ini peniliti akan membandingkan tingkat keakuratan model ANN menggunakan rasio-rasio error. Error dihitung dengan 26 membandingkan hasil prediksi ANN dengan status debitur sebenarnya. Semakin kecil kesalahan dari model ANN semakin baik model tersebut dalam melakukan prediksi. 7) Neural network training (number of training iterations, learning rate and momentum) Pada tahapan ini kita akan menentukan stop condition dari pelatihan ANN, dan menentukan learning rate dan momentum. Pada tahap ini ANN akan divalidasi menggunakan data validation. 8) Implementation. Variable selection Data collection Data Preprocessing Data Spliting Trained ANN ANN Training Train & test data Model Selection Optimal ANN Trial ANN ANN Validation Validation Model Implementation Validation data Gambar 2.12 Langkah-langkah pembuatan ANN Model 2.2.8 BACKPROPAGATION NEURAL NETWORK (BPNN) Algortima pelatihan backpropagation merupakan suatu algoritma yang diterapkan pada multilayer perceptron dan merupakan algoritma pelatihan terbimbing (supervised learning). BPNN diperlukan sejumlah masukan dan target yang berfungsi untuk melatih network hingga 27 diperoleh bobot yang diinginkan. Pada setiap kali dilakukannya pelatihan, jaringan akan menghasilkan suatu output. Selisih antara output yang dihasilkan oleh jaringan dengan target yang diinginkan disebut dengan error output. BPNN akan menggunakan error output tersebut untuk memodifikasi nilai bobot-bobot dalam arah mundur (backward). Algoritma pelatihan pada backpropagation memiliki tiga fase, yaitu fase maju (feedforward propagation), fase mundur (back propagation) dan fase modifikasi bobot. Dalam fase feedforward, pola masukan dihitung maju dari layer input hingga layer output. Pada fase back propagation, tiap-tiap unit output yang dikeluarkan jaringan akan dihitung nilai error output nya, kemudian error output tersebut akan dipropagasikan mundur. Pada fase backpropagation tersebut bobot dimodifikasi untuk menurunkan error output hinga kondisi penghentian terpenuhi. 28 Output Layer y1 ym yk w1k wj1 wp1 wpk w1m wjm wjk wpm w11 w0k w01 Hidden Layer Z1 Zj w0m 1 Zp v0p v0j v11 vnp v1j vi1 v01 vnj vij v1p 1 vip vn1 Input Layer x1 xn xi Gambar 2.13 Arsitektur Backpropagation (Sumber : Fausset, 1994) 2.2.9 PROSEDUR PELATIHAN BACKPROPAGATION NEURAL NETWORK Sebelum kita mengetahui prosedur pelatihan backpropagation neural network, sebaiknya kita mengetahui terlabih dahulu notas-notasi apakah yang umum digunakan pada backpropagation neural network. Berikut merupakan notasi backpropagation dikutip dari Laurence Fausett (1994) : x Data training untuk input (x = x1,…,xi,…,xn) t Data training untuk output (target/desired output) 29 α Learning rate, yaitu parameter yang mengontrol perubahan bobot selama proses pelatihan. Jika learning rate besar, jaringan akan semakin cepat belajar akan tetapi outpt yang dihasilkan kurang akurat, begitu juga sebaliknya. Learning rate biasanya ditetapkan antara 0 dan 1 xi Unit input ke-i. Untuk unit input, sinyal yang masuk dan keluar pada suatu unit dilambangkan dengan variable yang sama, yaitu xi Zj Hidden unit ke-j. Sinyal input pada Z j dilambangkan dengan Zinj. voj Bias untuk hidden unit ke-j vij Bobot antara unit input ke-I dan hidden unit ke-j. yk Unit output ke-k. sinyal input ke yk dilambangkan yink. wok Bias untuk unit output ke-k wjk Bobot antara hidden unit ke-j dan unit output ke-k Faktor koreksi error untuk bobot wjk Faktor koreksi error untuk bobot vij Berikut ini merupakan langkah-langkah pelatihan backpropagation secara lebih detail (Fausett:1994, p294) : Langkah 0 : Inisialisasi bobot (gunakan nilai acak yang kecil) Langkah 1 : Jika stop condition belum tercapai, lakukan step 2 – 9 Langkah 2 : Untuk tiap training pair, lakukan langkah 3 – 8 Fase Feedforward Propagation Langkah 3 : Tiap unit input (xi, i = 1,…, n) menerima sinyal xi dan menyebarkan sinyal ini ke seluruh unit lapisan di atasnya (hidden unit). 30 Langkah 4 : Setiap hidden unit (zj, j = 1,…, p) akan menjumlahkan bobot sinyal masukannya berserta dengan biasnya, = + ∑= Kemudian aplikasikan fungsi aktivasi yang telah ditentukan untuk menghitung sinyal output dari hidden unit yang bersangkutan; = lalu kirimkan sinyal output ini keseluruh unit pada lapisan diatasnya (output unit). Langkah 5 : Tiap unit ouput (yk, k = 1,…, m) akan menjumlahkan bobot sinyal masukannya berserta dengan biasnya, + ∑ = = kemudian aplikasikan fungsi aktivasi yang telah ditentukan untuk menghitung sinyal output dari unit output yang bersangkutan; = lalu kirimkan sinyal output ini keseluruh unit pada lapisan diatasnya (output unit). Fase backward Propagation Langkah 6 : Tiap unit ouput (yk, k = 1,…, m) menerima pola target (desired output) yang sesuai dengan pola input (input training pattern) untuk menghitung kesalahan (error) antara target dengan output yang dihasilkan jaringan � = − ′ 31 Dimana : � = error pada node ke-k = target ke-k f’(x) = f(x) [1-f(x)] Gunakan faktor � untuk menghitung koreksi bobotnya (digunakan untuk memperbarui wjk nantinya) ; ∆ = � Hitung koreksi biasnya (digunakan untuk memperbarui wok nantinya) ∆ = � Kirimkan faktor � ini ke unit-unit pada lapisan dibawahnya (layer pada langkah 7); Langkah 7 : Setiap hidden unit (zj, j = 1,…, p) menjumlahkan input delta dari unit-unit lapisan diatasnya (yang dikirim dari layer pada langkah 6) yang sudah berbobot; � =∑ � = Kalikan hasilnya dengan turunan dari fungsi aktivasi yang digunakan untuk menghasilkan faktor koreksi error � dimana : � = � ′ Faktor ini � digunakan untuk menghitung koreksi error (∆ ) (digunakan untuk memperbaharui vij nanti), dimana; ∆ = � Selain itu juga dihitung koreksi bias ∆ memperbaharui voj nantinya), dimana; 32 (digunakan untuk ∆ = � Pembaruan bobot (adjustment) dan bias Langkah 8 : Tiap unit output (yk, k = 1,…, m) akan mengupdate bias dan bobotnya dari setiap hidden unit (j = 0,…, p) ; = + ∆ Tiap unit hidden unit (zj, j = 1,…, p) akan mengupdate bias dan bobotnya dari setiap unit input (i = 0,…,n) : Langkah 9 2.2.10 = : Test stop condition. + ∆ LOGISTIC REGRESSION Regresi logistik atau yang biasa disebut dengan model logistik atau model logit, dalam statistika digunakan untuk prediksi probabilitas kejadian suatu peristiwa dengan mencocokkan data pada fungsi logit kurva logistik. Metode regresi logistic dapat dibedakan menjadi 2, yaitu : 1) Binary Logistic Regression (Regresi logistik biner). Regresi logistic biner digunakan ketika hanya ada 2 kemungkinan variabel respon (Y), contoh nya sukses dan gagal, baik dan buruk. 2) Multinomial Logistic Regression (Regresi Logistik Multinomial). Regresi Logistik Multinomial digunakan ketika pada variabel respon (Y) terdapat lebih dari 2 kategorisasi. Dalam penelitian kali ini, model regresi logistik yang digunakan adalah regresi logistik biner dimana dalam variabel respon atau output yaitu status kredit terdapat dua kemungkinan output baik (good) yang 33 dilambangkan dengan angka “1” dan buruk (bad) yang dilambangkan dengan angka “0”. Regresi logistik biner adalah salah satu metode statistika yang sering digunakan untuk mengklasifikasikan sejumlah pengamatan dengan respon biner ke dalam beberapa kelompok berdasarkan satu atau lebih variabel prediktor. Melalui metode ini akan dihasilkan peluang dari masing-masing kategori respon yang akan dijadikan sebagai pedoman pengklasifikasian. Secara umum model probabilitas regresi logistik dengan melibatkan beberapa variabel predictor( ) dapat di formulasikan sebagai berikut : Estimate probability of an event of an interest = + � + � � + � � +⋯+ � � � + � � + � � +⋯+ � � Keterangan : = estimasi peluang nilai default , , , ,…, = koefisien regresi ,…, = variabel-variabel bebas Selanjutnya, untuk menjadikan model tersebut linier dibutuhkan nya transformasi logit. Perlu diketahui sebelumnya, logit(p) merupakan log atau ln odds ratio. Odd ratio merupakan representasi dari probabilitas hasil yang muncul dibagi dengan probabilitas kejadian yang tidak terjadi. � 34 = � − � Sehingga diperoleh persamaan linear untuk logistik regresi adalah sebagai berikut ini : ( 2.2.11 � − � )= + + + ⋯+ UJI KELAYAKAN MODEL PERSAMAAN REGRESI LOGISTIK Uji ini sering disebut dengan uji ketepatan model. Uji ini digunakan untuk mengetahui apakah model regresi logistik sudah sesuai dengan data observasi yang diperoleh. Untuk menilai kelayakan model regresi logistik dalam penelitian ini diukur dengan nilai chi square dengan uji Hosmer dan Lemeshow. Pengujian ini akan melihat nilai goodness of fit test terhadap tingkat signifikasi (5%). Jika nilai Hosmer and Lemeshow’s goodness of fit test statistik sama dengan atau kurang dari 5%, yang berarti ada perbedaan signifikan antara model dengan nilai observasinya atau goodness fit model tidak baik, karena model tidak dapat memprediksi nilai observasinya. Jika nilai statistik Hosmer and Lemeshow’s goodness of fit lebih besar dari 5%, yang berarti bahwa model mampu memprediksikan nilai obsevasinya atau dapat dikatakan model cocok dengan observasinya (Ghozali, 2001:218). 2.2.12 UJI SIGNIFIKASI PARAMETER Uji signifikasi parameter adalah pengujian terhadap peranan parameter pada model secara keseluruhan. Menurut Hosmer-Lemeshow, (1989) suatu statistik uji rasio likelihood G adalah fungsi dari dan 35 yang berdistribusi � (Chi-square) dengan derajat bebas yang p didefenisikan sebagai: � = − log ( ) = − [ keterangan: − ]= − − = nilai maksimum fungsi kemungkinan untuk model di bawah H0 = nilai maksimum fungsi kemungkinan untuk model di bawah H 1 = nilai maksimum fungsi log kemungkinan untuk model di bawah H 0 = nilai maksimum fungsi log kemungkinan untuk model di bawah H 1 Nilai − − mengikuti distribusi Chi-square dengan df = k. Jika menggunakan taraf nyata sebesar α, maka kriteria ujinya adalah jika − − ≥� atau p-value ≤ α maka tidak ada perbedaan antara model dengan data, dan juga sedikitnya terdapat 1 variabel independent yang mempengaruhi variabel dependen, sehingga model dapat dikatakan baik. 2.2.13 ODDS RASIO Regresi logistik juga menghasilkan rasio peluang (odds ratio) terkait dengan nilai setiap independen variabel. Peluang dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul dibagi dengan probabilitas suatu kejadian tidak terjadi. Rasio peluang bagi independen pariabel diartikan sebagai jumlah relatif dimana hasil peluang meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel independen meningkat sebesar 1 unit. Pada kasus penelitian dengan 36 regresi logistik, nilai ini dapat dilihat dari nilai Exp(B) pada hasil analisis data. Hasil tersebut akan menunjukkan pengaruh setiap variabel-variabel independen terhadap variabel dependen. 2.2.14 PENGERTIAN CREDIT SCORING Credit scoring adalah kegiatan untuk menilai keadaan calon debitur. Credit scoring atau penilaian kredit sangat mempengaruhi kualitas portfolio kredit bank. Analisa kredit yang kurang akurat pada akhirnya akan menyebabkan timbulnya kredit bermasalah. (Martono 2002). Menrut Colquitt (2007) credit scoring dilakuakan melalui “Credit Risk Assessment”, sedangkan credit risk assessment sendiri memiliki 3 tujuan utama. Tujuan pertama dari credit risk assessment dan yang paling penting adalah menilai kemungkinan peminjam (debitur) dapat mengembalikan dana yang telah ia pinjam dengan cara menilai penghasilannya, karakter, kapasitas dan kecukupan modal debitur. Selain itu, credit risk assessment juga menyangkut mengidentifikasi sumber utama pembayaran pinjaman (pekerjaan atau usaha yang debitur geluti) dan sumber sekunder pembayaran untuk mengantisipasi bilamana sumber utama pembayaran menjadi tidak tersedia. Sehingga dapat penulis simpulkan bahwa credit scoring adalah usaha yang dilakukan oleh kreditur untuk menilai kelayakan calon debitur 37 dengan melakukan credit risk assessment, sehingga risiko kredit bermasalah dapat diminimalisir. 2.2.15 FAKTOR-FAKTOR PENILAIAN KREDIT Menurut Martono (2002) dalam melakukan credit scoring terdapat beberapa faktor yang harus dipertimbangkan, antara lain : prinsip-prinsip perkreditan, aspek penilaian kredit, dan teknik penyelesaian kredit macet. Prinisp perkreditan disebut juga sebagai konsep 5C. Pada dasarnya konsep 5C ini akan dapat memberikan informasi mengenai etikad baik (willingness to pay) dan kemampuan membayar (ability to pay) nasabah untuk melunasi kembali peminjaman berserta dengan bunga nya. Prinsip-prinsip 5C tersebut adalah sebagai berikut : 1) Character Pada prinsip ini memperhatikan dan meniliti tentang kebiasaankebiasaan, sifat-sifat pribadi, cara hidup (style of living), keadaan keluarganya, hobi dan social standing calon debitur. Prinsip ini merupakan ukuran tentang kemauan untuk membayar (willingness to pay). 2) Capacity Penilaian terhadap capacity debitur dilakukan untuk mengetahui sejauh mana kemampuan debitur mengembalikan pokok pinjaman serta bunga pinjaman nya. Pemberi pinjaman biasanya menilai laporan laba rugi pemohon, dividend an jenis-jenis pendapatan. Biaya rutin pemohon juga dipertimbangkan dalam pengukuran. 38 3) Capital Mengukur nilai bersih asset debitur. Pemberi pinjaman / kreditur ingin mengenali kapasitas cadangan jika situasi tidak menguntungkan berkembang. Modal biasanya dinilai dalam kasus kredit konsumen yang besar, misalnya, kapal dan pesawat terbang dll. 4) Collateral Penilaian tehadap barang jaminan yang diserahkan debitur sebagai jaminan atas kredit yang diperolehnya. Tujuan nya adalah menilai sejauh mana nilai jaminan dapat menutupi resiko kegagalan pengembalian kewajiban-kewajiban debitur. 5) Condition Menilai kondisi ekonomi secara umum serta kondisi pada sektor usaha calon debitur yang akan mempengaruhi kemampuan calon debitur untuk membayar kembali pinjaman nya. Menilai aspek kondisi dapat berupa penilaian terhadap jenis pekerjaan debitur dan sifat perusahaan dimana debitur melakukan pekerjaan. 2.2.16 KREDIT BERMASALAH Kredit bermasalah adalah resiko terbesar yang sangat dihindari oleh perusahaan-perusahaan peminjaman seperti multifinance dan bank. Kredit bermasalah disebabkan oleh debitur dalam memenuhi kewajiban nya yaitu membayar angsuran kredit berikut dengan bunganya tidak sesuai dengan kesepakatan yang telah disetujui dalam perjanjian kredit. 39 Bank Indonesia sebagai bank central telah membuat ketentuan mengenai status kolektivitas kredit. Adapun status kolektivitas kredit tersebut antara lain : 1) Kredit Lancar, yaitu kredit yang pembayaran pokok pinjaman dan bunganya tepat waktu, perkembangan rekening baik dan tidak ada tunggakan serta sesuai dengan persyaratan kredit. 2) Kredit dalam perhatian khusus, yaitu kredit yang pengembalian pokok pinjaman atau bunganya terdapat tunggakan sampai 90 hari. 3) Kredit kurang lancar, yaitu kredit yang pengembalian pokok pinjaman dan pembayaran bunganya terdapat tunggakan telah melampaui 90 hari sampai dengan 180 hari dari waktu yang telah disepakati. 4) Kredit diragukan, yaitu kredit yang pengembalian pokok pinjaman dan pembayaran bunganya terdapat tunggakan telah melampaui 180 hari sampai dengan 270 hari dari waktu yang telah disepakati. 5) Kredit macet, yaitu kredit yang pengembalian pokok pinjaman dan pembayaran bunganya terdapat tunggakan telah melampaui 270 hari. Persentase jumlah kredit bermasalah (dengan kriteria kurang lancar, diragukan, dan macet) terhadap total kredit yang dikeluarkan oleh multifinance disebut dengan Non Performing Loans (NPL). NPL merupakan salah satu indikator dari kesehatan keuangan sebuah perusahaan multifinance dan bank, semakin tinggi rasio NPL maka tingkat likuiditas multifinance terhadap dana pihak ketiga (DPK) akan semakin rendah. 40 2.2.17 ROOT MEAN SQUARE ERROR (RMSE) Root Mean Square Error (RMSE) merupakan parameter yang digunakan untuk mengevaluasi nilai hasil dari pengamatan/pengukuran terhadap nilai sebenarnya atau nilai aktual. Semakin besar nilai RMSE maka semakin model yang dihasilkan tidak akurat. Berikut ini formula untuk menghitung RMSE : �= √ � ………………………………………………………………() Dimana MSE atau Mean Square Error adalah : �= � �=∑= …………………………………………………………………….() Keterangan : SSE − ̂ − ̂ ……………………………………………………..() = nilai perbandingan antara nilai prediksi dan aktual. = kuadrat nilai actual dikurangi nilai prediksi = jumlah data sample 41