analisa kinerja algoritma c.45 dalam memprediksi pencapaian profit

advertisement
ANALISA KINERJA ALGORITMA C.45 DALAM MEMPREDIKSI
PENCAPAIAN PROFIT
Rika Nofitri, Muhammad Ardiansyah Sembiring
Sekolah Tinggi Manajemen Informatika Dan Komputer Royal Kisaran
Jl. Prof. M. Yamin 173 Kisaran, Sumatera Utara 21222
Email : [email protected], [email protected]
Abstrak
Penelitian ini dilakukan untuk mengatahui kinerja algoritma C.45 dalam menemukan New
Knowledge (pengetahuan baru) berupa rule dalam memprediksi pencapaian profit pada perusahaan
distributor. Rule yang ditemukan melalui proses algoritma C.45 terhadap data pencapaian profit
kemudian akan diuji melalui tools yang ditentukan yaitu Rapidminer 5 sebagai bahan perbandingan.
Selanjutnya melalui Rapidminer 5 akan diukur tingkat akurasi dari rule yang dihasilkan sebagai
informasi tambahan bagi pengelola perusahaan pada saat menggunakan rule sebagai alat dalam
memprediksi pencapaian profit. Proses penelitian ini mengahasilkan 6 buah rule sebagai landasan
dalam memprediksi pencapaian profit dengan tingkat akurasi i sebesar 92,60%+/- 1,36%.
Kata Kunci : Algoritma C.45, Akurasi, Profit.
1. PENDAHULUAN
Perkembangan teknologi dan informasi ternyata membawa perubahan dalam segala bidang
termasuk kepada perkembangan dunia industri. Perkembangan teknologi yang pesat saat ini banyak
menarik perhatian masyarakat luas. Perkembangan komputer yang dinamis diiringi perkembangan
zaman dapat menghasilkan informasi yang cepat dan akurat dan tidak memerlukan waktu
yang lama dalam menggali informasi yang dibutuhkan.
Perusahaan
distributor
adalah
perusahaan
yang
membeli
produk
barang
dari
pabrikan (manufacturer) secara langsung kemudian disalurkan kepada retailer. Namun biasanya
pabrikan memiliki beberapa distributor disuatu wilayah sehingga tingkat persaingan di dalam dunia
usaha tersebut begitu ketat.
Hal ini harus disikapi oleh manajemen perusahaan untuk terus
berinovasi dalam memperbaiki kinerja perusahaan salah satunya pemanfaatan teknologi informasi.
Selama ini perusahaan memiliki sekumpulan data terkait percapaian kinerja perusahaan yang
telah menghabiskan banyak biaya namun data tersebut belum dapat dimanfaatkan dengan baik.
Melalui penerapan teknologi data mining, sekumpulan data yang belum dimanfaatkan tersebut akan
diproses dan menghasilkan new knowlage (pengetahuan baru) yang
menjadi sesuatu yang
berhargadan berguna bagi perusahaan.
Maka dari itu peneliti tertarik untuk melakukan proses data mining pada data pencapaian
profit prusahaan yang berasal dari laporan laba/rugi perusahan guna mendapatkan informasi yang
dapat digunakan untuk memprediksi kertercapaian profit. Metode yang peneliti gunakan adalah
metode Klasifikasi dengan Algoritma C.45 yang merupakan cabang dalam data mining. Melalui
metode klasifikasi Algoritma C.45 dengan aplikasi Rapidminer 5 yang digunakan untuk mengukur
akurasi daeri kinerja Algoritma C.45 dalam meghasilkan rule sebagai landasan dalam prediksi
ketercapaian proft.
Pada penerapannya didunia industri, algoritma C.45 bannyak dimanfaatkan dalam beberapa
penelitian. Salah satunya penelitian yang berjudul Algoritma C4.5 Dalam Menganalisa Kelayakan
Kredit (Studi Kasus di Koperasi Pegawai Republik Indonesia Lengayang Pesisir Selatan, Painan,
Sumatera Barat) [1].
Pada penelitian tersebut metode data mining yang digunakan untuk
membantu pihak Koperasi dalam menentukan anggota kredit yang akan disetujui pengajuan
kreditnya, dan mentukan jumlah kredit yang akan dicairkan.
METODE PENELITIAN
2.1 Kerangka Kerja
Pembahasan dimulai dari mengidentifikasi permasalahan sampai melakukan pengujian terhadap
analisa laba/rugi dengan tools
yang digunakan untuk dapat menentukan pencapaian target profit.
Kerangka kerja yang akan dilakukan dalam rangka penyelesaian masalah ini adalah sebagai berikut :
1. Mengidentifikasi Masalah
Masalah yang diidentifikasi dalam penelitian ini adalah kesulitan menganalisa hasil laporan
laba/rugi yang memenuhi pencapaian target atau tidak sehingga dapat digunakan sebagai acuan
perusahaan dalam mengambil keputusan yang tepat untuk masa depan.
2. Mengumpulkan Data
Metode pengumpulan data dilakukan dengan cara melakukan pengamatan. Kemudian melakukan
pengambilan sampel database keuangan yang akan diolah pada penelitian ini.
3. Menganalisis Data
Pada tahap ini data yang telah dikumpulkan akan dianalisis. Analisis yang dilakukan adalah
mencari kecenderungan-kecenderungan pada data (database) yang sesuai untuk diterapkan
dengan metode klasifikasi algoritma C.45 dengan tujuan untuk mendapatkan pengetahuan
(knowledge) yang baru berupa informasi
pencapaian target dari variabel- variabel yang
menyusun laporan laba/rugi.
4. Mengimplementasikan Sistem
Pada tahapan ini, rancangan sistem yang telah ada
akan diimplementasikan dengan metode
klasifikasi algoritma C.45. Dimulai dengan menyiapkan
data dalam bentuk Decision System /
Information System, menentukan node akar dengan cara menghitung nilai entropy dan
menghitung nilai gain, menentukan cabang pada tiap-tiap node akar.
5. Pengujian Sistem
Pada tahap ini, hasil dari analisis diuji lagi menggunakan sistem data mining
guna
mendapatkan perbandingan dan akurasi. Tools yang digunakan sebagai pengujian sistem
adalah Rapidminer 5. Di mana software Rapid Miner memiliki pilihan decision tree untuk
keputusan algoritma C4.5.
2.2 Data Mining
Data mining merupakan proses analisa data untuk menemukan suatu pola dari kumpulan
data tersebut. Data mining mampu menganalisa data yang besar menjadi informasi berupa
pola yang mempunyai arti bagi pendukung keputusan [2][6]. Data mining atau sering
disebut sebagai knowledge discovery in database (KDD) adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau
hubungan dalam data berukuran besar. Keluaran data mining ini bisa dipakai untuk
membantu pengambilan keputusan di masa depan [3] Tahapan data mining dapat dilihat pada
gambar 1 berikut :
Gambar 1. Tahapan Data Mining
2.3 Algoritma C.45
Algoritma C4.5 merupakan bagian metode klasifikasi pengembangan dari algoritma ID3.
Algoritma C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdasan buatan bernama
j. Rose
Quinlan
pada
akhir
tahun
1970-an.
Algoritma C4.5 membuat pohon keputusan
dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan
daun [4].
Gambar 2. Pohon Keputusan Algoritma C.45
Adapun langkah-langkan menjalankan algoritma
C4.5
untuk
membangun
sebuah
pohon
keputusan adalah sebagai berikut:
1. Hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan syarat tertentu.
Untuk proses pertama syaratnya masih kosong.
2. Pilih atribut sebagai Node.
3. Bentukcabang pada setiap anggota dari Node.
4. Periksa apakah
tentukan daun
nilai entropy dari anggota Node ada
yang
bernilai nol.
Jika ada,
yang terbentuk. Jika seluruh nilai entropy anggota Node adalah nol, maka
proses pun berhenti.
5. Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol, ulangi lagi proses
dari awal dengan Node sebagai syarat sampai semua anggota dari Node bernilai nol.
Node adalah atribut yang mempunyai nilai gain tertinggi dari atribut-aribut yang ada. Untuk
menghitung nilai gain suatu atribut digunakan rumus seperti yang tertera dalam persamaan
berikut :
(1)
Sementara itu, untuk menghitung nilai Entropy dapat dilihat pada persamaan berikut :
(2)
2.4 Laporan Profit (Laba/Rugi)
Laporan laba rugi merupakan laporan utama untuk melaporkan kinerja dari suatu perusahaan selama
suatu perioda tertentu. Informasi tentang kinerja perusahaan, terutama tentang profitabilitas,
dibutuhkan untuk mengambil keputusan tentang sumber ekonomi yang akan dikelola oleh suatu
perusahaan di masa depan (Meythi, 2012). Laba rugi erdiri beberapa variabel yang menyusunnya
antara lain pembelian, penjualan (omset), stok dan biaya. Dari definisi di atas dapat disimpulkan
bahwa laba/rugi merupakan laporan menyajikan hasil usaha berupa data keuntungan maupun kerugian
perusahaan yang dikeluarkan sebagai akibat dari pencapaian tujuan dalam suatu periode tertentu.
3. HASIL DAN PEMBAHASAN
Berikut ini adalah sampel data yang berupa tabel yang kemudian akan ekstraksi melalui aplikasi
Rapidminer 5 untuk mendapatkan New Knowladge berupa rule dalam bentuk kondisi If-Then.
Tabel 1. Sampel Data Test
PEMBELIAN
OMSET
BIAYA
STOK BARANG
PROFIT
KURANG
RENDAH
TINGGI
SEDIKIT
TIDAK TERCAPAI
KURANG
RENDAH
EFISIEN
PENUH
TERCAPAI
BANYAK
SEDANG
TINGGI
PENUH
TIDAK TERCAPAI
BANYAK
TINGGI
EFISIEN
PENUH
TERCAPAI
KURANG
RENDAH
TINGGI
SEDIKIT
TIDAK TERCAPAI
BANYAK
SEDANG
TINGGI
PENUH
TIDAK TERCAPAI
BANYAK
SEDANG
EFISIEN
PENUH
TERCAPAI
..........
..........
..........
..........
..........
KURANG
RENDAH
EFISIEN
PENUH
TERCAPAI
BANYAK
SEDANG
EFISIEN
PENUH
TERCAPAI
Tabel 1 di atas menerangkan bahwa yang menjadi attribute keputusan adalah variabel profit..
Sedangkan yang menjadi
attribute kondisi yakni pembelian, omset, biaya dan stok barang.
Selanjutnya dilakukan tahapan algoritma C. 45 untuk mendapatkan node akar melalui gain tertinggi.
Dari proses iterasi yang dilakukan maka didapatkan pohon keputusan sebagai berikut :
Gambar 3. Pohon Keputusan Yang Dihasilkan
Berdasarkan pohon keputusan di atas terdapat 6 rule yang mempengaruhi profit dengan attribute
kondisi yang menjadi node akar tertinggi adalah biaya. Kemudian melalui pohon keputusan tersebut
tampak attribute pembelian tidak menjadi attribute yang mempengaruhi profit. Langkah selanjutnya
adalah melakukan proses pengujian terhadap data test melalui tools Rapidminer 5 yang dimulai dari
proses koneksi antara basis data, operator, dan validasi seperti gambar berikut ini:
Gambar 4. Koneksi Proses Rapidminer 5
Dari proses koneksi pada gambar 4 di atas didapatkan pohon keputusan yang sama dengan gambar 3
dan hasil pegukuran akurasi. Berikut adalah screenshot hasil pengukuran akurasi terhadap kinerja
algoritma C.45 dalam memprediksi pencapaian target profit yaitu sebesar 92,60 % +/- 1.36% :
Gambar 5. Screenshot Akurasi Kinerja Algoritma C.45
Selanjutnya setelah proses ini dilakukan penarikan informasi yang akan menjadi pengetahuan baru
berdasarkan pohon keputusan pada Rapidminer 5.
Gambar 6. Pengetahuan baru yang dihasilkan melalui Rapidminer 5
4. KESIMPULAN
Melalui proses data mining yang telah dilakukan menggunakan Algoritma C.45 dengan aplikasi
Rapidminer 5 diketahui informasi sebagai pengetahuan baru berupa 6 rule/aturan dengan tingkat
kinerja algoritma C.45 sebesar 92,60%+/- 1,36%. Rule yang ditemukan yang dapat dijadikan landasan
bagi pengelola perusahaan dalam melakukan prediksi pencapaian target profit ehingga pengelola
perusahan dapat mengantisipasi dengan mengambil langkah - langkah bisnis yang tepat dalam
mengupayakan tercapainya profit.
5. SARAN
Disarankan kepada peneliti yang selanjutnya untuk melakukan perbandingan dengan 1 metode atau
lebih selain algoritma C.45 yang merupakan bagian dari data mining metode klasifikasi guna
mendapatkan hasil yang berbeda dan lebih baik dengan tingkat akurasi yang lebih besar.
6. UCAPAN TERIMA KASIH
Ucapan terima kasih sebesar-besarnya atas pendanaan penelitian dan pubilkasi yang dibiayai oleh
Direktorat Riset dan Pengabdian Masyarakat Direktorat Jenderal Penguatan Riset dan Pengembangan
Kementerian Riset, Teknologi dan Pendidikan Tinggi Sesuai dengan Kontrak Penelitian Tahun
Anggaran 2017
REFERENCES
[1] Lusinia, Armonitha. 2014. Algoritma C4.5 Dalam Menganalisa Kelayakan Kredit (Studi Kasus
di Koperasi Pegawai Republik Indonesia Lengayang Pesisir Selatan, Painan, Sumatera Barat).
Jurnal KomTekInfo. Vol 1. No 2. Hal 6-10.
[2] Gunadi Goldie.dkk. 2012. Penerapan Metode Data Mining Market Basket Analysis Terhadap
Data Penjualan Produk Buku Dengan Menggunakan Algoritma Apriori dan Frequent
Pattern Growth (FP-Growth) Studi Kasus Percetakan PT. Gramedia. Jurnal Telematika..
Volume 4. Hal 118 – 132.
[3] Subekti Mujiasih. 2011. Pemanfaatan Data Mining untuk Prakiraan Cuaca. Volume 12. 189 –
195.
[4] Fitria Harahap. 2015. Penerapan Data Mining dalam Memprediksi Pembelian cat. Konferensi
Nasional Sistem & Informatika 2015. Bali: STMIK STIKOM.
[5] Meythi dan Selvy Hartono. 2012. Pengaruh Informasi Laba dan Arus Kas Terhadap Harga
Saham. Jurnal Akuntansi. 57– 59.
[6] E. Buulolo, N. Silalahi, F. F and R. Rahim, "C4.5 Algorithm To Predict the Impact of the
Earthquake," International Journal of Engineering Research & Technology (IJERT), vol. 6, no.
2, pp. 10-15, 2017.
Download