implementasi algoritma clasification and regression tree (cart)

advertisement
IMPLEMENTASI ALGORITMA CLASIFICATION AND REGRESSION TREE
(CART) UNTUK KLASIFIKASI BANTUAN USAHA MIKRO KECIL MENENGAH
(UMKM) JASA TELEMATIKA INDONESIA
Fadlan Amirudin, Eneng Tita Tosida,Irma Anggraeni.
Email : [email protected]
Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor
ABSTRAK
Telematika salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu
pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang
telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia. Berdasarkan hal
tersebut akan dilakukan penelitian dan pengimplementasian untuk menentukan badan usaha
jasa telematika yang layak menerima bantuan dari permenkop UKM dari data yang sesuai
dari Susenas (Sensus Nasional) Badan Pusat Statistik 2006, dengan menerapkan algoritma
CART yang merupakan salah satu algoritma data mining dalam pengolahan data yang
menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi,
sehingga memudahkan permenkop dalam menentukan badan usaha yang layak menerima
bantuan. Hasil penelitian uji coba validasi berdasarkan confusion matrix algoritma CART ini
mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data
uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk
implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan
confusion matrix dari proses mining yang membandingkan 2 skenario model.
Kata Kunci : UMKM, Telematika, Klasifikasi, Data Mining, Algoritma CART,
PENDAHULUAN
Bidang telematika adalah salah satu
bidang prioritas bagi pembangunan
Indonesia. Oleh karena itu pemerintah
terus melakukan berbagai upaya untuk
meningkatkan
daya
saing
bidang
telematika, terutama dalam menghadapi
perdagangan bebas lingkup Asia pada
tahun 2015. Dasar penilitian ini bertujuan
menentukan kelayakan UMKM untuk
menerima bantuan atau tidak menerima
bantuan dari Kemenkop UKM Indonesia.
Beberapa penelitian terkait tentang kondisi
telematika Indonesia baik berupa model
klasifikasi usaha jasa telematika (Tosida et
al. , 2012)
Penelitian yang relevan berkaitan
dengan telematika telah dilakukan oleh
peneliti terdahulu Hardiani, (2015),
melakukan
clustering
usaha
kecil
menengah jasa telematika Indonesia sesuai
dengan data Susenas (Sensus Nasional)
Badan Pusat Statistik tahun 2006 yang
tersebar di seluruh wilayah provinsi,
kabupaten atau kota di Indonesia. Selain
itu Tosida et al.(2015) meneliti dan
mengembangkan visualisasi data UMKM
Jasa Telematika yang memiliki 8 atribut
menjadi 21 atribut sesuai data Susenas
tahun 2006. Berdasarkan dua penelitian
tersebut sudah menghasilkan beberapa
atribut namun belum ada atribut kelas yang
telah ditentukan sehingga tidak bisa
melakukan klasifikasi, maka dari itu perlu
dikembangkan agar bisa menjadi machine
learning. Data penelitian ini sudah melalui
tahap praproses data sehingga data tersebut
sudah bisa di ujicoba pada algoritma yang
digunakan. Pengembangan yang akan
dilakukan dari hasil kedua penelitian
tersebut adalah menentukan atribut kelas
dan menerapkan data pada algoritma
CART.
Algoritma CART ini menggunakan
pendekatan nonparametic yang tidak
membutuhkan asumsi distribusi, lalu akan
mengidentifikasi variable secara otomatis
yang
berpengaruh
dan
mereduksi
kompleksitas
data,
mudah
dalam
mengatasi data outlier, dan mudah dalam
interpretasi.
Untuk
itu
diterapkan
algoritma CART dengan tujuan mampu
menghasilkan klasifikasi berdasarkan
informasi data yang ada.
Pembuatan sistem ini menggunakan
Adobe Dreamweaver cs6, perancangan
database menggunakan MySQL dan
klasifikasi data menggunakan algoritma
CART. Sistem ini ditujukan untuk
mempermudah penentuan UMKM yang
layak untuk diberikan bantuan dan juga
dapat mudah dimengerti penggunaanya
agar bisa digunakan sebaik mungkin.
Tujuan
penelitian
ini
adalah
mengimplementasikan algoritma CART
untuk model klasifikasi pemberian bantuan
UMKM Jasa Telematika Indonesia dengan
menggunakan bahasa pemrograman R,
PHP 5 dan database MySQL.
Penelitian tentang kredit Scoring juga
telah dilakukan oleh Saputro, D (2010)
dengan judul Model kredit Scoring untuk
proses analisa kelayakan fasilitas kredit
motor menggunakan metode classification
and regression tree (Cart). Di PT.X finance
cabang mauk. Aplikasi ini memiliki tujuan
adalah Membantu pihak kredit untuk
mengetahui parameter dan klasifikasi
kredit pada PT.X Finance.
Menurut Susanto dan Suryadi (2010),
pada
klasifikasi
algoritma
CART
(Classification and Regression Trees),
sebuah record akan diklasifikasikan ke
dalam salah satu dari sekian klasifikasi
yang tersedia pada variable tujuan
berdasarkan
nilai-nilai
variabel
prediktornya.Langkah-langkah Algoritma
CART:
a. Susunlah calon cabang (candidate split)
yang dilakukan terhadap seluruh
variabel prediktor. Daftar yang berisi
calon cabang disebut calon cabang
mutakhir.
b.Berikan penilaian keseluruhan calon
cabang mutakhir dengan menghitung
besaran (s|t)
c.Tentukan cabang yang memiliki
kesesuaian (s|t). Setelah noktah
keputusan tidak ada lagi, algoritma
CART
dihentikan.
Kesesuaian
(goodness) (s|t) dari calon cabang s
pada noktah keputusan t, didefiniskan
sebagai persamaan – persamaan berikut :
( |)
LPRQ(s|t)
( |) ∑
( | )…....... (2)
…….. (1)
| (| )
tl= Cabang kiri dari noktah keputusan t
tr= Cabang kanan dari noktah keputusan t
………………. (3)
(| )
…………. (4)
………….... (5)
(| )
……..(6)
METODE PENELITIAN
Metode Peneitian yang diterapkan ini
menggunakan tahapan data mining atau
disebut juga Knowledge Discovery and
Data Mining (KDD) (Han et al .2006)
suatu rangkaian proses data mining dapat
dibagi menjadi beberapa tahap yang
diilustrasikan pada Gambar 1. Tahaptahap tersebut bersifat interaktif, pemakai
terlibat langsung atau dengan perantaraan
knowledge base.
CLEANING &
INTEGRATION
DATA MINING
SELECTION &
TRANSFORMATION
KNOWLEDGE
EVALUATION &
PRESENTATION
Gambar 1. Tahap-Tahap Data Mining
(Han et al.2006)
Tahap-tahap data mining ada 5 yaitu :
1. Pembersihan data dan Integrasi
data (Cleaning And Integration
Data)
Pembersihan
data
merupakan
proses menghilangkan noise dan
data yang tidak konsisten atau data
tidak relevan. Hasil pembersihan
data set usaha jasa telematika yang
diperoleh dari Susenas tahun 2006
melalui pengisian data kosong
dengan nilai mean (untuk data
numerik), modus (untuk data
kategorik), menghapus data yang
tidak konsisten serta outlier sesuai
dengan ketentuan (UU No 20
Tahun 2008) menyebabkan reduksi
data dari 12541 menjadi 8798.
(Tosida et al.2015)
2. Seleksi Data dan Transformasi data
(Data
Selection
and
Data
Transformation)
Data yang ada pada database sering
kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai
untuk dianalisis yang akan diambil
dari database. Data diubah atau
digabung ke dalam format yang
sesuai untuk diproses dalam data
mining. Beberapa metode data
mining membutuhkan format data
yang
khusus
sebelum
bisa
diaplikasikan. Sebagai contoh
beberapa metode standar seperti
analisis asosiasi dan clustering
hanya bisa menerima input data
kategorikal. (Tosida et al.2015)
3. Proses mining
Merupakan suatu proses utama saat
metode
diterapkan
untuk
menemukan pengetahuan berharga
dan tersembunyi dari data.Untuk
proses
mining
menggunakan
algoritma
CART
dalam
menentukan keputusan kelayakan
bantuan UMKM.
4. Evaluasi pola (pattern evaluation),
Untuk mengidentifikasi pola-pola
menarik kedalam knowledge based
yang ditemukan. Dalam tahap ini
hasil dari teknik data mining
berupa pola-pola yang khas
maupun model prediksi dievaluasi
untuk menilai apakah hipotesa
yang
ada
memang
tercapai.Evaluasi dari penelitian ini
menggunakan confusion matrix.
5. Presentasi pengetahuan (knowledge
presentation)
Merupakan
visualisasi
dan
penyajian pengetahuan mengenai
metode yang digunakan untuk
memperoleh pengetahuan yang
diperoleh pengguna. Tahap terakhir
dari proses data mining adalah
bagaimana
memformulasikan
keputusan atau aksi dari hasil
analisis yang didapat. Ada kalanya
hal ini harus melibatkan orangorang yang tidak memahami data
mining. Karenanya presentasi hasil
data
mining
dalam
bentuk
pengetahuan yang bisa dipahami
semua orang adalah satu tahapan
yang diperlukan dalam proses data
mining. Dalam presentasi ini, hasil
berupa decission tree yang berisi
beberapa kaidah dan rule yang
akan diimplementasikan ke dalam
bentuk sistem berbasis web.
HASIL DAN PEMBAHASAN
Hasil
Hasil yang didapat dari penelitian ini
adalah pembuatan sistem klasifikasi
bantuan usaha jasa telematika di Indonesia
dengan mengunakan fungsi algoritma
CART yang digunakan dalam machine
learning pada aplikasi Rstudio, data di
olah menjadi 2 bagian yaitu data latih
sebesar 80% dan data uji sebesar 20%
dengan keseluruhan 8798 data, sehingga
akan menghasilkan klasifikasi berupa
pohon keputusan badan usaha yang layak
atau tidak untuk menerima bantuan.
Setelah data selesai diolah dalam
aplikasi
Rstudio
maka
akan
diimplementasikan dengan web yang
dirangcang
menggunakan
adobe
dreamweaver kemudian diterapkan dalam
framework yii dan database dibuat dalam
aplikasi MySQL. Dalam web klasifikasi
ini di bedakan menjadi 2 akses pengguna,
yaitu penguna umum untuk melakukan
klasifikasi informasi UMKM dan admin
untuk mengolah data klasifikasi UMKM.
Pembahasan
1.
Cleaning and Integration
Data untuk klasifikasi ini telah
mengalami tahapan praproses data mining
seperti pembersihan data dan integrasi data
yang dilakukan penelitian sebelumnya oleh
Tosida et al (2015).
2.
Selection Data
Data set usaha Jasa Telematika
diperoleh dari Susenas (Sensus Nasional)
pada tahun 2006 terdiri dari 8798 UMKM
Jasa Telematika dengan atribut sebanyak
21 atribut (4 atribut numerik dan 17 atribut
kategorik).
Agar data lebih ringkas efektif
dilakukan seleksi data yang tujuan lainnya
juga untuk menentukan kelas kemudian
dipilihlah atribut pernah menerima bantuan
sebagai kelas. Berikut adalah deskripsi
data yang telah dan diseleksi.
Tabel 1. Deskripsi Data UMKM Jasatelematika
No.
Atribut
A. Keterangan Umum
1.
Provinsi
Tipe
K
2.
Pendidikan pemilik
K
3.
Bentuk badan hokum
K
4.
5.
6.
Tahun Mulai Operasi
Pengguna computer
Pengguna internet
K
K
K
7.
Kelompok Usaha
K
Rentang Nilai
1.
1.
2.
3.
4.
1.
2.
3.
4.
1.
1.
1.
1.
2.
3.
Jawa, 2. Sumatera,
3.Kalimantan,
SMA sederajat
D4-S1atau lebih
D1-D3
< SMA
CV
Firma
Ijin Khusus Instansi
Koperasi
≤ 3 tahun
Ya
Ya
Jasa telekomunikasi
Konsultasi Hardware
Konsultasi Software
1.
2.
1.
2.
1.
1.
2.
1.
Mikro
Kecil
Mikro
Kecil
Modal sendiri
Kecil
Mikro
Sedang 2. Banyak
4. Papua
5. Bali&Nusra
5.
6.
7.
Perorangan
PT
Yayasan
2.
2.
2.
4.
> 3 tahun
Tidak
Tidak
Lainnya
B. Finansial
1.
Penjualan
N
2.
Total asset
N
3.
Modal
K
4.
tenaga kerja
N
5.
balas jasa
N
3.
Menengah
3. Menengah
2.
Modal Pihak lain
3.
Menengah
3.menengah
C. Kendala & Propek Usaha
1
Kesulitan
K
2
3
4
Koperasi
Kemitraan
Menerima pelatihan
5
Pemasaran
6
Kondisi perusahaan 3 bulan
lalu
7
Perkiraan prospek usaha 3 bln
akan datang
K
K
K
K
K
K
K
8
Rencana
1. bahan
baku/barang
dagangan
2. BBM/energy
3. ketrampilan
tenaga kerja
4. Lainnya
1. Ya
1. Ya
1. Ya
1. Ekspor
2. Kabupaten
1. Sama baik
2. Sama buruk
3. Lebih baik
1. Lebih baik
2. Lebih buruk
3. Sama baik
1. Tidak
2. Ya,
Memperluas usaha
3. Ya, membuka
cabang
5. Pemasaran
6.
Permodalan
7.
Tidak ada kesulitan
8.
9.
2.
2.
2.
3.
4.
4.
5.
Transportasi
Upah buruh
Tidak
Tidak
Tidak
Luar Provinsi
Provinsi
Lebih buruk
Tidak dapat dibandingkan
4.
5.
Sama buruk
Tidak dapat dibandingkan
4.
Ya, meningkatkan keahlian
5.
Ya,lainnya
Tabel 2. Atribut Kelas yang telah di seleksi
No.
1
Rentang Nilai
Atribut
Menerima bantuan
1. Tidak Menerima
Bantuan
2. Menerima Bantuan
2. Proses Mining
2.1 Algortima CART
Data ini dimasukan kedalam proses
mining menggunakan algoritma CART
yang akan mengeluarkan hasil
decission tree. Data di bagi menjadi 2
yaitu data latih 80% yang nantinya
dimasukan dalam proses mining dan
data uji 20% digunakan sebagai
validasi decission tree yang telah
dibuat pola data aslinya. Berikut
flowchart untuk algoritma CART.
Gambar 2. Flowchart algoritma CART
Fathurahman et.al 2014.
Berikut merupakan penjelasan dari
flowchart
algoritma
CART
untuk
membangun pohon keputusan :
1. Masukan data latih.
2. Tentukan calon cabang yang akan di
bentuk (Kandidat Split).
3. Lakukan split pada data dan membuat
interval sehingga didapatkan nilaisplit
dari setiap atribut.
4. Lakukan perhitungan Prior Length (PL)
dan Prior Right (PR).
5. Dari hasil menghitung PL dan PR bisa
dilanjutkan untuk menghitung nilai
goodness
6. Setelah semua nilai goodness dihitung
dari setiap cabang, kita mencari nilai
goodness yang paling besar .
7. Cek apakah semua atribut sudah
dibentuk pada pohon. Jika belum,
ulangi dari langkah ke 5
8. Generate pohon keputusan
9. Selesai.
Tabel 3. Contoh Implementasi
bentuk_badan_
hukum
Perorangan
Koperasi
Firma
Perorangan
CV
CV
Ijin Khusus
dari instansi
terkait
Perorangan
Perorangan
Perorangan
kelompok_usaha
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Warung
telekomunikasi
Jasa
telekomunkasi
lainnya
Jasa
telekomunkasi
lainnya
Modal
modal
sendiri
modal
sendiri
modal
sendiri
modal
sendiri
model
pihak
lain
modal
sendiri
modal
sendiri
modal
sendiri
model
pihak
lain
modal
sendiri
Cabang Kiri
M= Pihak Lain
M = sendiri
P = Mikro
P = Kecil
11
P = Kecil
P = Mikro
12
Ta = Mikro
Ta = Kecil
13
Ta = Kecil
Ta = Mikro
Kemudian dihitung nilai Candidate
split purity left PL dan purity right PR
menggunakan
rumus
yang
sudah
ditentukan.
Berikut adalah perhitungan dari tiap
Candidate Split, PL, PR, P(j|tl), P(j|tr) yang
memungkinkan “ya” atau “tidak” dan
perhitungan nilai kesesuaian (goodnees)
pada atribut bentuk badan hukum.disajikan
pada tabel 5,6,7.
Tabel 5. Perhitungan PL, PR
,
Bentuk
badan
hukum
Perorangan
Total
Y
T
Jumlah
Data
PL
PR
5
2
3
10
0.5
0.5
Koperasi
1
0
1
10
0.1
0.9
Firma
1
0
1
10
0.1
0.9
CV
2
2
0
10
0.2
0.8
Ijin khusus
instansi
terkait
1
0
1
10
0.1
0.9
penjualan
total_aset
menerima_
bantuan
Mikro
Mikro
Tidak
Mikro
Mikro
Tidak
Tabel 6. perhitungan P(j|tl) dan P(j|tr)
Mikro
Mikro
Tidak
Y
T
Mikro
Kecil
Ya
Kecil
Kecil
Ya
2
Mikro
Mikro
Ya
Bentuk
badan
hukum
Peroranga
n
Koperasi
Mikro
Kecil
Tidak
Mikro
Kecil
Mikro
Mikro
P(j|tl
) Y
P(j|tl
) T
P(j|tr
)Y
P(j|tr
)T
3
Jumla
h
Data
10
0.4
0.6
0.4
0.6
0
1
10
0
1
Firma
0
1
10
0
1
Tidak
CV
2
0
10
1
0
0.44
4
0.44
4
0.25
0.55
5
0.55
5
0.75
Kecil
Ya
0
1
10
0
1
0.44
4
0.55
5
Kecil
Tidak
Ijin
khusus
instansi
terkait
Tabel 4. Daftar Calon Mutakhir
No
9
10
Cabang Kanan
BBH = k , f , cv , ijin khusus dari instansi
terkait
BBH = p, f , cv , ijin khusus dari instansi
terkait
BBH = k , p , cv , ijin khusus dari instansi
terkait
BBH = k , f , p , ijin khusus dari instansi
terkait
1
BBH = Perorangan
2
BBH = koperasi
3
BBH = Firma
4
5
BBH = CV
BBH = ijin khusus dari instansi
terkait
6
KU = warung telekomunikasi
KU = Jasa telekomunikasi
7
KU = Jasa telekomunikasi
KU = Warung telekomunikasi
8
M = sendiri
M = Pihak Lain
BBH = k , f , cv , p
Tabel 7. kesesuaian calon cabang
Bentuk badan
hokum
Perorangan
2(Pl Pr)
Q(s|t)
phi (s|t)
0.5
0
0
Koperasi
0.18
0.888
0.16
Firma
0.18
0.888
0.16
CV
0.32
1.5
0.48
Ijin khusus
instansi terkait
0.18
0.888
0.16
2.1. Hasil Mining
Proses mining data UMKM jasa
telematika ini menggunakan algoritma
CART dalam menentukan kelayakan
badan usaha untuk menerima bantuan.
Beberapa hasil percobaan dari penelitian
ini dengan 2 skenario model yang berbeda
agar dapat diketahui tingkat akurasi yang
tercipta. Berikut di sajikan pada gambar
10, dan 11 :
pada data latih dan 63,92% pada data
uji.Maka dipilihlah model B pada
penelitian kali ini dengan akurasi yang
paling tinggi.
3.
Evaluasi Pola
Dalam evaluasi pola klasifikasi ini
memakai confusion matrix dengan
menggunakan persamaan (7) sebagai
berikut :
3.1. Confusion Matrix Data Latih 21
Atribut Tetap
Akurasi Data Latih
63.00%
62.00%
61.00%
60.00%
Akurasi
A
B
21 (Tetap)
21
(Reduksi)
Gambar 5. Hasil Summary Data Latih
Menggunakan Aplikasi Rstudio
Dari Gambar 5 Diketahui :
Model
Atribut
Gambar 3. Chart Nilai Akurasi Data
Latih dengan 2 model.
a.
b.
c.
d.
e.
True Positive (TP) = 2274
True Negative (TN) = 2105
False Positive (FP) = 1258
False Negative (FN) = 1401
Jumlah Data
= 7038
Akurasi Data Uji
80.00%
70.00%
60.00%
50.00%
Akurasi
A
B
Model
21 (Tetap)
21
(Reduksi)
Atribut
Gambar 4. Chart Nilai Akurasi Data
Latih dengan 2 model
Berdasarkan Gambar 10,11 dapat
disimpulkan bahwa model A dengan 21
atribut tetap adalah yang paling baik nilai
akurasinya yaitu 62,21% pada data latih
dan 73,97% pada data uji. sedangkan
model B dengan 21 yang direduksi
menghasilkan nilai akurasi yaitu 61,18%
a. True Positive (TP) = 2434
b. True Negative (TN) = 1872
c. False Positive (FP) = 1098
d. False Negative (FN) = 1634
Dari perhitungan Confusion matrix
tersebut bahwa tingkat akurasi yang
dimiliki oleh klasifikasi ini adalah
62,21% sesuai data latih yang digunakan
dengan jumlah 7038 data.
3.2. Confusion Matrix Data Latih 21
Atribut Reduksi
Gambar 6. Hasil Summary Data Latih
Menggunakan Aplikasi Rstudio
Dari Gambar 6 Diketahui :
e.
Jumlah Data
= 7038
yang dimiliki oleh klasifikasi ini
adalah 73,97% sesuai data latih yang
digunakan dengan jumlah 1760 data.
Dari perhitungan Confusion
matrix tersebut bahwa tingkat akurasi
yang dimiliki oleh klasifikasi ini
adalah 61,18% sesuai data latih yang
digunakan dengan jumlah 7038 data.
3.3. Confusion Matrix Data Uji 21
Atribut Tetap
3.4. Confusion Matrix Data Uji 21
Atribut Reduksi
Gambar 8. Hasil Summary Data Uji
Menggunakan Aplikasi Rstudio
Dari Gambar 8 Diketahui :
a.
b.
c.
d.
e.
Gambar 7. Hasil Summary Data Uji
Menggunakan Aplikasi Rstudio
True Positive (TP) = 766
True Negative (TN) = 359
False Positive (FP) = 149
False Negative (FN) = 486
Jumlah Data = 1760
Dari Gambar 7 Diketahui :
a.
b.
c.
d.
e.
True Positive (TP) = 678
True Negative (TN) = 324
False Positive (FP) = 237
False Negative (FN) = 221
Jumlah Data = 1760
Dari perhitungan Confusion
matrix tersebut bahwa tingkat akurasi
yang dimiliki oleh klasifikasi ini
adalah 61,93% sesuai data latih yang
digunakan dengan jumlah 1760 data.
4.
Dari perhitungan Confusion
matrix tersebut bahwa tingkat akurasi
Presentasi Pengetahuan
Berikut ini adalah decission tree
hasil dari skenario model yang dipilih
sebelumnya yaitu dengan model 21 atribut
tetap, disajikan pada gambar 9 :
Gambar 9. Hasil Decission tree
Dari gambar 9 tersebut algoritma
CART hanya mengeluarkan atribut yang
paling mempengaruhi dalam klasifikasi
pemberian bantuan pada UMKM. Atribut
Menerima Pelatiahan terpilih sebagai
noktah dasar. Kondisi ini sesuai dengan
Kemenkop UKM apabila UMKM yang
sudah melakukan pelatihan dengan benar
akan menerima bantuan.
4.3. Form Klasifikasi
Pada tampilan ini berisi form isian
data badan usaha yang akan diklasifikasi
berikut dengan tombol klasifikasinya
kemudian menghasilkan output berupa
kelayakan badan usaha tersebut dalam
menerima bantuan atau tidak, berikut
disajikan pada Gambar 12 dan 13 untuk
hasil keputusan.
UMKM yang salah dalam mengikuti
pelatihan akan di proses kembali
berdasarkan Rencana, apabila UMKM
telah mempunyai rencana maka akan di
berikan bantuan. UMKM akan terus
diproses berdasarkan noktah keputusan
atribut seterusnya.
4.1. Tampilan Index / Halaman Utama
Pada halaman ini berisi menu awal
dalam sistem klasifikasi ini dimana kita
bisa memulai klasifikasi bantuan usaha
jasa telematika, berikut disajikan pada
Gambar 10.
Gambar 10. Tampilan Index
4.2. Tampilan Login
Tampilan ini berfungsi sebagai
autentikasi user yang berhak menghapus
atau mengedit data yang ada pada web
tersebut. Berikut disajikan pada Gambar
11.
Gambar 12. Tampilan Form Klasifikasi
Gambar 11. Tampilan Login
Gambar 13. Tampilan Hasil Keputusan
4.4. Tampilan Data Klasifikasi
Pada tampilan ini berisi data yang
telah masuk kedalam sistem klasifikasi
yang telah di input sebelumnya dan bagi
admin bisa langsung mengedit atau
menghapus data tersebut. Berikut disajikan
pada Gambar 14.
Gambar 14. Tampilan Data Klasifikasi
KESIMPULAN
Klasifikasi bantuan UMKM jasa
telematika Indonesia dengan menggunakan
algoritma CART ini dibuat untuk
mengetahui UMKM yang akan menerima
bantuan atau tidak, dan juga untuk
pengguna sistem ini mencakup admin staf
kemenkop UKM mengetahui informasi
data UMKM jasa telematika yang ada di
Indonesia. klasifikasi ini diolah dalam
machine learning mengunakan aplikasi
Rstudio, setelah menghasilkan pohon
keputusan
lalu
diimplementasikan
memakai
website
yang
dirancang
menggunakan
aplikasi
Adobe
Dreamweaver CS6 dengan bahasa
pemograman PHP yang tersimpan pada
framework Yii untuk desain template
memakai
Bootstrap
dan
database
menggunakan MySQL.
Tahap Implementasi dan pembuatan
klasifikasi usaha jasa telematika ini
dilakukan dari data susenas 2006. yang
sebelumnya sudah dilakukan pembersihan
data noise,integrasi data dari setiap data
dan seleksi atribut yang di pilih menjadi 21
atribut oleh (Tosida et.al, 2015) yang
masih dalam tahap visualisasi maka perlu
dikembangkan
untuk
menunjang
pemilihan dalam pemberian bantuan pada
UMKM jasa telematika.sehingga dibuatlah
website klasifikasi ini dengan fitur yang
didalamnya berupa proses klasifikasi
atribut menggunakan algoritma CART dan
menampilkan decission tree untuk
mengetahui UMKM yang layak diberi
bantauan atau tidak .
Jumlah data keseluruhan yang di
klasifikasikan adalah 8798 data. Data di
bagi menjadi 2 yaitu 80% data latih dan
20% data uji. Dalam penelitian ini data
menggunakan 2 model dengan 21 atribut
tetap model (A) dan 21 atribut yang di
reduksi model (B). Reduksi atribut
merupakan penyederhanan rentang nilai
yang ada pada setiap atribut, maka atribut
yang memiliki nilai rentang yang banyak
maka akan di reduksi menjadi lebih
sederhana dan sedikit. hasil uji coba
validasi berdasarkan confusion matrix
algoritma CART ini mencapai 62% data
latih dan 73% data uji dengan model (A).
61% data latih dan 63% data uji dengan
model (B). Maka dipilihlah model (A)
dengan
21
atribut
tetap
untuk
implementasinya karena memiliki nilai
akurasi
lebih
tinggi
berdasarkan
perhitungan confusion matrix dari proses
mining yang membandingkan 2 skenario
model.
DAFTAR PUSTAKA
.
Fathurahman et al. 2014. Analisis Dan
Implementasi Algoritma ID3 Dan
CART Pada Penilaian Kinerja
Pegawai. Fakultas Informatika,
Universitas Telkom, Bandung.
Han et al. 2006. Data Mining: Concepts
and
Techniques.
Morgan
Kaufmann Publishers Inc, San
Francisco.
Hardiani,
2015.
Implementasi
Self
Organizing Maps (SOM) Untuk
Clustering Usaha Jasa Telematika
Indonesia Menggunakan Matlab.
Skripsi. Fakultas Matematika dan
Ilmu
Pengetahuan
Alam,
Universitas Pakuan, Bogor.
Larose, 2006. Data mining merupakan
analisis dari peninjauan kumpulan
data untuk menemukan hubungan
yang tidak diduga dan meringkas
data dengan cara yang berbeda
dengan sebelumnya, yang dapat
dipahami dan bermanfaat bagi
pemilik data.
Saputro, D. 2010. Model kredit Scoring
untuk proses analisa kelayakan
fasilitas kredit motor menggunakan
metode
classification
and
regression tree (Cart). Universitas
Islam Syarief Hidayatullah, Jakarta
Tosida et al , 2012. Strategi Peningkatan
Daya Saing Melalui Framework
Rantai Nilai Untuk Kompetensi
Usaha Jasa Telematika Indonesia.
Program Studi Ilmu Komputer,
FMIPA, Universitas Pakuan
Tosida, E. T. 2015. Pengembangan Model
Data Mining Kelayakan Bantuan
Usaha Bagi Usaha Mikro Kecil
Menengah
Jasa
Telematika
Indonesia.
Tesis.
Sekolah
Pascasarjana Institut Pertanian
Bogor, Bogor.
Winesett, J. 2012. Web Application
Development with Yii and PHP.
Packt Publishing, Birmingham,
Inggris.
Download