ANALISA KINERJA ALGORITMA C.45 DALAM MEMPREDIKSI PENCAPAIAN PROFIT Rika Nofitri, Muhammad Ardiansyah Sembiring Sekolah Tinggi Manajemen Informatika Dan Komputer Royal Kisaran Jl. Prof. M. Yamin 173 Kisaran, Sumatera Utara 21222 Email : [email protected], [email protected] Abstrak Penelitian ini dilakukan untuk mengatahui kinerja algoritma C.45 dalam menemukan New Knowledge (pengetahuan baru) berupa rule dalam memprediksi pencapaian profit pada perusahaan distributor. Rule yang ditemukan melalui proses algoritma C.45 terhadap data pencapaian profit kemudian akan diuji melalui tools yang ditentukan yaitu Rapidminer 5 sebagai bahan perbandingan. Selanjutnya melalui Rapidminer 5 akan diukur tingkat akurasi dari rule yang dihasilkan sebagai informasi tambahan bagi pengelola perusahaan pada saat menggunakan rule sebagai alat dalam memprediksi pencapaian profit. Proses penelitian ini mengahasilkan 6 buah rule sebagai landasan dalam memprediksi pencapaian profit dengan tingkat akurasi i sebesar 92,60%+/- 1,36%. Kata Kunci : Algoritma C.45, Akurasi, Profit. 1. PENDAHULUAN Perkembangan teknologi dan informasi ternyata membawa perubahan dalam segala bidang termasuk kepada perkembangan dunia industri. Perkembangan teknologi yang pesat saat ini banyak menarik perhatian masyarakat luas. Perkembangan komputer yang dinamis diiringi perkembangan zaman dapat menghasilkan informasi yang cepat dan akurat dan tidak memerlukan waktu yang lama dalam menggali informasi yang dibutuhkan. Perusahaan distributor adalah perusahaan yang membeli produk barang dari pabrikan (manufacturer) secara langsung kemudian disalurkan kepada retailer. Namun biasanya pabrikan memiliki beberapa distributor disuatu wilayah sehingga tingkat persaingan di dalam dunia usaha tersebut begitu ketat. Hal ini harus disikapi oleh manajemen perusahaan untuk terus berinovasi dalam memperbaiki kinerja perusahaan salah satunya pemanfaatan teknologi informasi. Selama ini perusahaan memiliki sekumpulan data terkait percapaian kinerja perusahaan yang telah menghabiskan banyak biaya namun data tersebut belum dapat dimanfaatkan dengan baik. Melalui penerapan teknologi data mining, sekumpulan data yang belum dimanfaatkan tersebut akan diproses dan menghasilkan new knowlage (pengetahuan baru) yang menjadi sesuatu yang berhargadan berguna bagi perusahaan. Maka dari itu peneliti tertarik untuk melakukan proses data mining pada data pencapaian profit prusahaan yang berasal dari laporan laba/rugi perusahan guna mendapatkan informasi yang dapat digunakan untuk memprediksi kertercapaian profit. Metode yang peneliti gunakan adalah metode Klasifikasi dengan Algoritma C.45 yang merupakan cabang dalam data mining. Melalui metode klasifikasi Algoritma C.45 dengan aplikasi Rapidminer 5 yang digunakan untuk mengukur akurasi daeri kinerja Algoritma C.45 dalam meghasilkan rule sebagai landasan dalam prediksi ketercapaian proft. Pada penerapannya didunia industri, algoritma C.45 bannyak dimanfaatkan dalam beberapa penelitian. Salah satunya penelitian yang berjudul Algoritma C4.5 Dalam Menganalisa Kelayakan Kredit (Studi Kasus di Koperasi Pegawai Republik Indonesia Lengayang Pesisir Selatan, Painan, Sumatera Barat) [1]. Pada penelitian tersebut metode data mining yang digunakan untuk membantu pihak Koperasi dalam menentukan anggota kredit yang akan disetujui pengajuan kreditnya, dan mentukan jumlah kredit yang akan dicairkan. METODE PENELITIAN 2.1 Kerangka Kerja Pembahasan dimulai dari mengidentifikasi permasalahan sampai melakukan pengujian terhadap analisa laba/rugi dengan tools yang digunakan untuk dapat menentukan pencapaian target profit. Kerangka kerja yang akan dilakukan dalam rangka penyelesaian masalah ini adalah sebagai berikut : 1. Mengidentifikasi Masalah Masalah yang diidentifikasi dalam penelitian ini adalah kesulitan menganalisa hasil laporan laba/rugi yang memenuhi pencapaian target atau tidak sehingga dapat digunakan sebagai acuan perusahaan dalam mengambil keputusan yang tepat untuk masa depan. 2. Mengumpulkan Data Metode pengumpulan data dilakukan dengan cara melakukan pengamatan. Kemudian melakukan pengambilan sampel database keuangan yang akan diolah pada penelitian ini. 3. Menganalisis Data Pada tahap ini data yang telah dikumpulkan akan dianalisis. Analisis yang dilakukan adalah mencari kecenderungan-kecenderungan pada data (database) yang sesuai untuk diterapkan dengan metode klasifikasi algoritma C.45 dengan tujuan untuk mendapatkan pengetahuan (knowledge) yang baru berupa informasi pencapaian target dari variabel- variabel yang menyusun laporan laba/rugi. 4. Mengimplementasikan Sistem Pada tahapan ini, rancangan sistem yang telah ada akan diimplementasikan dengan metode klasifikasi algoritma C.45. Dimulai dengan menyiapkan data dalam bentuk Decision System / Information System, menentukan node akar dengan cara menghitung nilai entropy dan menghitung nilai gain, menentukan cabang pada tiap-tiap node akar. 5. Pengujian Sistem Pada tahap ini, hasil dari analisis diuji lagi menggunakan sistem data mining guna mendapatkan perbandingan dan akurasi. Tools yang digunakan sebagai pengujian sistem adalah Rapidminer 5. Di mana software Rapid Miner memiliki pilihan decision tree untuk keputusan algoritma C4.5. 2.2 Data Mining Data mining merupakan proses analisa data untuk menemukan suatu pola dari kumpulan data tersebut. Data mining mampu menganalisa data yang besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung keputusan [2][6]. Data mining atau sering disebut sebagai knowledge discovery in database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar. Keluaran data mining ini bisa dipakai untuk membantu pengambilan keputusan di masa depan [3] Tahapan data mining dapat dilihat pada gambar 1 berikut : Gambar 1. Tahapan Data Mining 2.3 Algoritma C.45 Algoritma C4.5 merupakan bagian metode klasifikasi pengembangan dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdasan buatan bernama j. Rose Quinlan pada akhir tahun 1970-an. Algoritma C4.5 membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun [4]. Gambar 2. Pohon Keputusan Algoritma C.45 Adapun langkah-langkan menjalankan algoritma C4.5 untuk membangun sebuah pohon keputusan adalah sebagai berikut: 1. Hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan syarat tertentu. Untuk proses pertama syaratnya masih kosong. 2. Pilih atribut sebagai Node. 3. Bentukcabang pada setiap anggota dari Node. 4. Periksa apakah tentukan daun nilai entropy dari anggota Node ada yang bernilai nol. Jika ada, yang terbentuk. Jika seluruh nilai entropy anggota Node adalah nol, maka proses pun berhenti. 5. Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol, ulangi lagi proses dari awal dengan Node sebagai syarat sampai semua anggota dari Node bernilai nol. Node adalah atribut yang mempunyai nilai gain tertinggi dari atribut-aribut yang ada. Untuk menghitung nilai gain suatu atribut digunakan rumus seperti yang tertera dalam persamaan berikut : (1) Sementara itu, untuk menghitung nilai Entropy dapat dilihat pada persamaan berikut : (2) 2.4 Laporan Profit (Laba/Rugi) Laporan laba rugi merupakan laporan utama untuk melaporkan kinerja dari suatu perusahaan selama suatu perioda tertentu. Informasi tentang kinerja perusahaan, terutama tentang profitabilitas, dibutuhkan untuk mengambil keputusan tentang sumber ekonomi yang akan dikelola oleh suatu perusahaan di masa depan (Meythi, 2012). Laba rugi erdiri beberapa variabel yang menyusunnya antara lain pembelian, penjualan (omset), stok dan biaya. Dari definisi di atas dapat disimpulkan bahwa laba/rugi merupakan laporan menyajikan hasil usaha berupa data keuntungan maupun kerugian perusahaan yang dikeluarkan sebagai akibat dari pencapaian tujuan dalam suatu periode tertentu. 3. HASIL DAN PEMBAHASAN Berikut ini adalah sampel data yang berupa tabel yang kemudian akan ekstraksi melalui aplikasi Rapidminer 5 untuk mendapatkan New Knowladge berupa rule dalam bentuk kondisi If-Then. Tabel 1. Sampel Data Test PEMBELIAN OMSET BIAYA STOK BARANG PROFIT KURANG RENDAH TINGGI SEDIKIT TIDAK TERCAPAI KURANG RENDAH EFISIEN PENUH TERCAPAI BANYAK SEDANG TINGGI PENUH TIDAK TERCAPAI BANYAK TINGGI EFISIEN PENUH TERCAPAI KURANG RENDAH TINGGI SEDIKIT TIDAK TERCAPAI BANYAK SEDANG TINGGI PENUH TIDAK TERCAPAI BANYAK SEDANG EFISIEN PENUH TERCAPAI .......... .......... .......... .......... .......... KURANG RENDAH EFISIEN PENUH TERCAPAI BANYAK SEDANG EFISIEN PENUH TERCAPAI Tabel 1 di atas menerangkan bahwa yang menjadi attribute keputusan adalah variabel profit.. Sedangkan yang menjadi attribute kondisi yakni pembelian, omset, biaya dan stok barang. Selanjutnya dilakukan tahapan algoritma C. 45 untuk mendapatkan node akar melalui gain tertinggi. Dari proses iterasi yang dilakukan maka didapatkan pohon keputusan sebagai berikut : Gambar 3. Pohon Keputusan Yang Dihasilkan Berdasarkan pohon keputusan di atas terdapat 6 rule yang mempengaruhi profit dengan attribute kondisi yang menjadi node akar tertinggi adalah biaya. Kemudian melalui pohon keputusan tersebut tampak attribute pembelian tidak menjadi attribute yang mempengaruhi profit. Langkah selanjutnya adalah melakukan proses pengujian terhadap data test melalui tools Rapidminer 5 yang dimulai dari proses koneksi antara basis data, operator, dan validasi seperti gambar berikut ini: Gambar 4. Koneksi Proses Rapidminer 5 Dari proses koneksi pada gambar 4 di atas didapatkan pohon keputusan yang sama dengan gambar 3 dan hasil pegukuran akurasi. Berikut adalah screenshot hasil pengukuran akurasi terhadap kinerja algoritma C.45 dalam memprediksi pencapaian target profit yaitu sebesar 92,60 % +/- 1.36% : Gambar 5. Screenshot Akurasi Kinerja Algoritma C.45 Selanjutnya setelah proses ini dilakukan penarikan informasi yang akan menjadi pengetahuan baru berdasarkan pohon keputusan pada Rapidminer 5. Gambar 6. Pengetahuan baru yang dihasilkan melalui Rapidminer 5 4. KESIMPULAN Melalui proses data mining yang telah dilakukan menggunakan Algoritma C.45 dengan aplikasi Rapidminer 5 diketahui informasi sebagai pengetahuan baru berupa 6 rule/aturan dengan tingkat kinerja algoritma C.45 sebesar 92,60%+/- 1,36%. Rule yang ditemukan yang dapat dijadikan landasan bagi pengelola perusahaan dalam melakukan prediksi pencapaian target profit ehingga pengelola perusahan dapat mengantisipasi dengan mengambil langkah - langkah bisnis yang tepat dalam mengupayakan tercapainya profit. 5. SARAN Disarankan kepada peneliti yang selanjutnya untuk melakukan perbandingan dengan 1 metode atau lebih selain algoritma C.45 yang merupakan bagian dari data mining metode klasifikasi guna mendapatkan hasil yang berbeda dan lebih baik dengan tingkat akurasi yang lebih besar. 6. UCAPAN TERIMA KASIH Ucapan terima kasih sebesar-besarnya atas pendanaan penelitian dan pubilkasi yang dibiayai oleh Direktorat Riset dan Pengabdian Masyarakat Direktorat Jenderal Penguatan Riset dan Pengembangan Kementerian Riset, Teknologi dan Pendidikan Tinggi Sesuai dengan Kontrak Penelitian Tahun Anggaran 2017 REFERENCES [1] Lusinia, Armonitha. 2014. Algoritma C4.5 Dalam Menganalisa Kelayakan Kredit (Studi Kasus di Koperasi Pegawai Republik Indonesia Lengayang Pesisir Selatan, Painan, Sumatera Barat). Jurnal KomTekInfo. Vol 1. No 2. Hal 6-10. [2] Gunadi Goldie.dkk. 2012. Penerapan Metode Data Mining Market Basket Analysis Terhadap Data Penjualan Produk Buku Dengan Menggunakan Algoritma Apriori dan Frequent Pattern Growth (FP-Growth) Studi Kasus Percetakan PT. Gramedia. Jurnal Telematika.. Volume 4. Hal 118 – 132. [3] Subekti Mujiasih. 2011. Pemanfaatan Data Mining untuk Prakiraan Cuaca. Volume 12. 189 – 195. [4] Fitria Harahap. 2015. Penerapan Data Mining dalam Memprediksi Pembelian cat. Konferensi Nasional Sistem & Informatika 2015. Bali: STMIK STIKOM. [5] Meythi dan Selvy Hartono. 2012. Pengaruh Informasi Laba dan Arus Kas Terhadap Harga Saham. Jurnal Akuntansi. 57– 59. [6] E. Buulolo, N. Silalahi, F. F and R. Rahim, "C4.5 Algorithm To Predict the Impact of the Earthquake," International Journal of Engineering Research & Technology (IJERT), vol. 6, no. 2, pp. 10-15, 2017.