Data mining Data mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaanperusahaan menemukan informasi yang sangat penting dari data warehouse yang dimiliki. Data mining dapat meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah banyak digunakan. Data mining dapat menjawab pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu untuk menjawabnya. Data mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi prediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka. Definisi data mining berdasarkan [Buku Data mining: Concepts and Techniques, Han Jiawei, and M. Kamber. 2006] adalah proses mengekstraksi pola-pola yang menarik (implisit, belum diketahui sebelumnya, dan berpotensi untuk bermanfaat) dari data yang berukuran besar. Ada beberapa istilah yang mempunyai kemiripan dengan data mining, yaitu ekstraksi pengetahuan, analisis pola, pengerukan data, dan lain-lain. Ada yang berpendapat data mining merupakan sinonim dari istilah knowledge discovery in database (KDD). Data mining yang mempunyai arti yang luas sehingga ada banyak jenis fungsi yang dapat digolongkan dalam data mining. Contoh-contoh fungsi data mining antara lain Association Rule dan Classification. 2.1.1 Association Rule Association Rule merupakan salah satu task data mining yang sangat penting, karena task ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data. Pengetahuan yang dihasilkan juga sangat berguna untuk klasifikasi, clustering, dan task data mining yang lain. Selain Association Rule, masih ada Sequential Pattern, dan Structured Pattern yang termasuk dalam Frequent Pattern Mining. Association Rule Mining dapat juga disebut Frequent Itemset Mining karena pola yang dihasilkan adalah pola item yang sering muncul bersamaan dalam sebuah basis data. Contoh klasik yang sering digunakan untuk menjelaskan Association Rule adalah market basket analysis. 2.1.2 Classification Classification adalah proses data mining untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Decision tree adalah salah satu metode classification yang paling populer karena mudah untuk diinterpretasi oleh manusia. Proses classification biasanya dibagi menjadi dua fase yaitu fase learning dan fase test. Pada fase learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan. Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model data tersebut. Bila akurasinya mencukupi, model ini dapat dipakai untuk prediksi kelas data yang belum diketahui.