Tugas Akhir - 2008 IMPLEMENTASI RIPPLE DOWN RULE LEARNER PADA DATA PELELANGAN Rochman Ridloh¹, Moch. Arif Bijaksana², Endro Ariyanto³ ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Abstrak Saat ini platform pelelangan telah menjadi bagian yang penting dari komunitas internet. Nama seperti eBay sudah pasti menjadi sinonim bagi kesuksesan ini. Terkait dengan pencapaiannya yang hebat, platform pelelangan internet paling sukses di dunia menarik minat bagi penawar individu maupun bisnis. Apa yang mereka lakukan pada umumnya bertujuan agar penjualan dari pelelangan mencapai harga yang sesuai. Yang menjadi pertanyaan: “Bagaimana untuk mendapatkan harga yang optimal (maksimal)?” Untuk itu, lebih banyak lagi para ahli pelelangan yang kompeten merekomendasikan untuk menentukan durasi pendek atau panjang, harga awal rendah atau tinggi, pembatalan pelelangan pada akhir minggu atau hari minggu, dan banyak lagi varian yang akan menjamin kesuksesannya. Implementasi yang akan dilakukan dengan metode Ripple-Down-Rules. Ripple-Down-Rules (RDR), adalah rules dengan hierarchical exception, digunakan pada penerimaan knowledge karena menyediakan representasi yang pintar dan bisa di modifikasi bahkan untuk sistem pakar yang besar. Semantik yang digunakan RDR mengcover first order rule sebaik rule berbasis attributevalue. Secara aljabar yang akan dilakukan pada RDR meliputi simplifikasi RDR dan transformasi RDR menjadi flat list of rule dan ripple down rule set, karena itu skema reperesentasi knowledge dimasukkan ke dalam perspektif. Telah ditunjukkan bahwa RDR mempunyai panjang deskripsi yang pendek daripada ekuivalen decision list. Induksi dari rule dengan exception dikarakterisasi sebagai bidirectional movement pada hipotesis space, sementara algoritma yang diketahui untuk pembelajaran rule atau decision tree dilakukan spesialisasi top-down dari yang paling umum atau generalisasi bottom-up dari hipotesis yang paling utama. Kata Kunci : Ripple-Down-Rules(RDR), hierarchical exception, knowledge, first order rule, rule, attribute-value, flat list of rule, ripple down rule set. Abstract Nowadays auction platform has become an important part for internet community. The likes of eBay surely become synonym for this success. Due to great achievement, internet auction platform most success in the world has withdrawn interested many of individual bargain or business. Commonly what they do is to achieve auction sale with an acceptable price or even more. What become question: “How to achieve optimal price?” Therefore, much more auction competent expert recommended to determine short or long duration, high or low start price, auction cancellation at weekend or Sunday, and many more variant to guarantee succession. Implementation using Ripple-Down-Rule Learner Methods. Ripple-Down-Rules (RDR), is rules with hierarchical exception, used to knowledge achievement because provide smart representation and can be modified even for large expert system. Semantics used by RDR covered first order rule as good as rule based attribute value. By algebraic which will be executed by RDR including RDR simplification and RDR transformation to flat list of rule and ripple down rule set, therefore schema knowledge representation included at perspective. As known that RDR have short description than decision list equivalent. Induction rule with exception characterized as bidirectional movement to hypothesis space, meanwhile known algorithm for rule learning or decision tree doing by top-down specialization from the most common or bottom up generalization from main hypothesis. Keywords : Ripple-Down-Rules(RDR), hierarchical exception, knowledge, first order rule, rule, attribute-value, flat list of rule, ripple down rule set. Fakultas Teknik Informatika Powered by TCPDF (www.tcpdf.org) Program Studi S1 Teknik Informatika Tugas Akhir - 2008 BAB I PENDAHULUAN 1.1 Latar Belakang Tidak terhitung lagi jumlah metode yang telah diimplementasikan pada data mining dan juga semakin besar pula kuantitas data yang diolah di dunia nyata. Salah satu permasalahan pada database biasanya dikarenakan tidak lengkapnya informasi yang disediakan oleh data untuk menemukan informasi yang diinginkan. Salah satu metode yang paling sering digunakan untuk mengatasi hal ini pada data mining menggunakan klasifikasi. Beberapa permasalahan yang saat ini sering muncul sebagian besar berhubungan dengan internet. E-commerce yang sudah booming menarik berbagai kalangan pebisnis untuk melakukan investasi. Salah satu bagian transaksi yang mulai mencuat selain dari jual-beli langsung yaitu pelelangan (auction). Melalui pelelangan ini diharapkan oleh kalangan pebisnis dapat mengoptimalkan keuntungan berdasarkan perilaku pasar. Letak permasalahannya bagaimana menentukan agar untuk produk tertentu dapat terjual minimal dengan keuntungan meskipun tidak maksimal. Dengan data yang semakin berkembang pesat dari segi kuantitas dan kualitas maka diperlukan metode yang bisa melakukan klasifikasi, seiring dengan meningkatnya popularitas pelelangan melalui internet. Metode Ripple-Down-Rule (RDR) ini penulis gunakan karena bisa mengklasifikasikan data yang besar [1] dengan jumlah node yang dihasilkan simpel dan mudah dianalisa dengan hanya melihat model [9]. Dengan diterapkannya pembelajaran pada data transaksi yang sudah terjadi diharapkan bisa mengetahui perilaku pasar berdasarkan atribut tertentu yang berpengaruh. 1.2 Rumusan Masalah Dari latar belakang permasalahan yang ada maka masalah yang ada dirumuskan sebagai berikut: 1 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika Tugas Akhir - 2008 1. Bagaimana menghasilkan data dari hasil transaksi menjadi data training yang representatif terhadap lingkup permasalahan yang akan dianalisa dan mendukung pembentukan model yang akurat? 2. Bagaimana mengklasifikasikan data menggunakan metode Ripple Down Rule sehingga bisa didapatkan nilai class yang optimal? 3. Bagaimana langkah-langkah pembelajaran terhadap data transaksi yang sudah terjadi untuk kemudian bisa didapatkan model untuk dilakukan pengujian dan analisa? 1.3 Tujuan Penulisan Berdasarkan rumusan masalah di atas, maka tujuan dari tugas akhir ini adalah : 1. Menganalisis langkah-langkah implementasi metode Ripple Down Rule. 2. Membandingkan akurasi instances yang diklasifikasikan dari metode Ripple Down Rule dengan metode C5.0 dan C&R Tree (Classification & Regression Tree) yang terdapat di Clementine 9.0. 1.4 Batasan Masalah Dalam pembuatan tugas akhir ini, untuk mengatasi permasalahan yang ada maka penyusun membatasi permasalahan sebagai berikut : 1. Dataset yang digunakan adalah dataset Data Mining Cup 2006 berupa data pelelangan Audio&Hi-Fi:MP3-Player:Apple iPod dengan jumlah recordset 8000 yang berformat CSV, atribut lengkapnya terdapat pada Lampiran A. 2. Implementasi yang dilakukan yaitu sampai pada tahap pembangunan model dan juga ditentukannya keakurasian instances yang diklasifikasikan. 3. Pengujian menggunakan data testing yang diambil berdasarkan prosentase perbandingan secara manual dari dataset kemudian hasil evaluasi dibandingkan dengan metode C5.0 dan C&R Tree (Classification & Regression Tree) yang terdapat di Clementine 9.0. 2 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika Tugas Akhir - 2008 4. Dalam pembangunan Model Ripple Down Rule digunakan bantuan tools data mining yaitu WEKA (Waikato Environment for Knowledge Analysis). 1.5 Metode Penyelesaian Masalah Metode yang digunakan dalam penyelesaian tugas akhir ini adalah : 1. Studi Pustaka Tahapan untuk menambah wawasan dari buku-buku, artikel dan sumber-sumber lain yang layak, seperti informasi-informasi yang tersedia di internet untuk menunjang pembahasan tugas akhir ini. 2. Analisis dan perancangan Tahapan untuk menentukan kebutuhan sistem, seperti identifikasi input, identifikasi output, identifikasi spesifikasi hardware maupun perancangan software yang akan dibangun dalam bentuk diagram yang akan memudahkan pemahaman terhadap perangkat lunak tersebut. 3. Implementasi perangkat lunak Tahapan untuk membangun data set dan training serta implementasi dari metode Ripple Down Rule 4. Pengujian perangkat lunak Menguji perangkat lunak yang dihasilkan menggunakan data set untuk kemudian dilakukan perbandingan dengan metode C5.0 dan C&R Tree (Classification & Regression Tree) yang terdapat di Clementine 9.0. 5. Pengambilan kesimpulan dan penyusunan makalah Mengambil kesimpulan dari hasil pengujian dan pengukuran yang dilakukan serta menyusun makalah. 1.6 Sistematika Penulisan Tugas Akhir ini disusun dengan sistematika pembahasan sebagai berikut : BAB I PENDAHULUAN Bab ini memaparkan latar belakang masalah, perumusan masalah yang akan dibahas, pembatasan masalah, tujuan yang ingin dicapai melalui riset ini, metode penyelesaian masalah dan sistematika pembahasan. 3 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika Tugas Akhir - 2008 BAB II DASAR TEORI Bab ini berisi uraian mengenai landasan teori yang akan digunakan dalam penyusunan tugas akhir meliputi metode Ripple Down Rule dan pemilihan atribut. BAB III ANALISIS DAN PERANCANGAN SISTEM Berisi analisis perangkat lunak yang akan dibuat mencakup analisis kebutuhan sistem, perancangan proses dan aliran data sehingga proses dapat dipahami secara jelas. BAB IV IMPLEMENTASI DAN PENGUJIAN Berisi tentang deskripsi implementasi dari analisis dan perancangan aplikasi serta evaluasi dari aplikasi yang telah dibuat. BAB V KESIMPULAN DAN SARAN Berisi kesimpulan dari hasil penelitian tugas akhir ini serta saransaran untuk pengembangan lebih lanjut. 4 Fakultas Teknik Informatika Powered by TCPDF (www.tcpdf.org) Program Studi S1 Teknik Informatika Tugas Akhir - 2008 BAB V KESIMPULAN DAN SARAN 5.1 1. Kesimpulan RDR Learner merupakan metode yang berbasiskan rule, dimana rule disimpan pada tree. Dengan implementasi yang sudah dilakukan induksi bisa dinyatakan model yang dihasilkan cukup simpel sehingga bisa digunakan untuk data yang jauh lebih besar dari yang penulis pakai pada TA ini. 2. Dengan melakukan pengujian pada metode C5.0 dan C&RT pada tools Clementine 9.0 didapatkan tree yang cukup banyak nodenya, tetapi pada metode RDR Learner sangat ringkas dengan waktu build yang tidak berbeda jauh. 3. Rata-rata akurasi RDR Learner dari hasil pengujian memang tidak lebih baik dari algoritma C5.0 dan C&RT pada tools Clementine 9.0. Oleh sebab itu diperlukan kejelian dalam menggunakan attribute selection yang akan diimplementasikan dan juga pada penentuan parameter learning Ripple Down Rule 5.2 Saran 1. Sebaiknya dilakukan preprosesing yang sesuai dengan data yang akan diklasifikasikan kemudian disesuaikan juga data yang bisa dimanfaatkan secara maksimal untuk metode Ripple Down Rule ini. 2. Dengan memanfaatkan proses learning yang sudah ada pada perangkat lunak ini maka bisa dikembangkan lebih lanjut untuk mencari nilai class pada data yang belum diketahui nilai classnya. 38 Fakultas Teknik Informatika Powered by TCPDF (www.tcpdf.org) Program Studi S1 Teknik Informatika Tugas Akhir - 2008 DAFTAR PUSTAKA [1] Compton, Paul, Brian R. “Gaines, Induction of Ripple-Down Rules Applied to Modelling Large Databases”, University of Calgary, Knowledge Science Institute, Alberta, Canada, University of South Wales, Department of Computer Science, Sydney, Australia. [2] Compton, Paul, Debbie Richards, “Extending Ripple-Down Rules”, School of Computer Science and Engineering, University of New South Wales, Department of Computing, Division of Information and Communication Sciences, Macquarie University, Australia, 1999. [3] Compton, Paul, Debbie Richards, “Generalising Ripple-Down Rules”, School of Computer Science and Engineering, University of New South Wales, Department of Computing, Division of Information and Communication Sciences, Macquarie University, Australia. [4] Frank, Eibe, “Machine Learning Technique for Data Mining,” University of Waikato : Morgan Kaufmann, 2000. [5] Han, Jiawai., Micheline Kamber, “Data Mining : Concepts and Techniques,” Simon Fraser University : Morgan Kaufmann, 2001. [6] Pramudiono, Iko, “Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data,” Ilmu Komputer.com, 2003. [7] Pressman, Roger S, “Software Engineering A Practitioner’s Approach Fouth Edition”, McGraw-Hill, 1997. [8] Richards, Debbie, Vijaletchmee Chellen, dan Paul Compton , “The Reuse of Ripple Down Rule Knowledge Bases: Using Machine Learning to Remove Repetition,” Department of Artificial Intelligence, School of Computer Science and Engineering, University of New South Wales, Australia. [9] Scheffer, Tobias, “Algebraic Foundation and Improved Methods of Induction of Ripple Down Rules,” Technische Universitat Berlin, Artificial Intelligence Research Group (KI), 1996. [10] -, Data set Data Mining Cup 2006, http://www.data-mining-cup.de 39 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika Tugas Akhir - 2008 [11] -, Modul dan Jurnal Praktek Data Mining, DMC Crews, TA 2004/2005 40 Fakultas Teknik Informatika Powered by TCPDF (www.tcpdf.org) Program Studi S1 Teknik Informatika