TI415-041035-711-8 27KB Jan 09 2012 09:21

advertisement
Data mining
Data mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaanperusahaan menemukan informasi yang sangat penting dari data warehouse yang dimiliki. Data mining
dapat meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan
keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining melebihi yang dilakukan
oleh sistem pendukung keputusan tradisional yang sudah banyak digunakan. Data mining dapat
menjawab pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu untuk
menjawabnya. Data mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi,
mencari informasi prediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar
ekspektasi mereka.
Definisi data mining berdasarkan [Buku Data mining: Concepts and Techniques, Han
Jiawei, and M. Kamber. 2006] adalah proses mengekstraksi pola-pola yang menarik (implisit, belum
diketahui sebelumnya, dan berpotensi untuk bermanfaat) dari data yang berukuran besar. Ada beberapa
istilah yang mempunyai kemiripan dengan data mining, yaitu ekstraksi pengetahuan, analisis pola,
pengerukan data, dan lain-lain. Ada yang berpendapat data mining merupakan sinonim dari istilah
knowledge discovery in database (KDD). Data mining yang mempunyai arti yang luas sehingga ada
banyak jenis fungsi yang dapat digolongkan dalam data mining. Contoh-contoh fungsi data mining antara
lain Association Rule dan Classification.
2.1.1 Association Rule
Association Rule merupakan salah satu task data mining yang sangat penting, karena
task ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data. Pengetahuan yang
dihasilkan juga sangat berguna untuk klasifikasi, clustering, dan task data mining yang lain.
Selain Association Rule, masih ada Sequential Pattern, dan Structured Pattern yang termasuk
dalam Frequent Pattern Mining. Association Rule Mining dapat juga disebut Frequent Itemset
Mining karena pola yang dihasilkan adalah pola item yang sering muncul bersamaan dalam
sebuah basis data. Contoh klasik yang sering digunakan untuk menjelaskan Association Rule
adalah market basket analysis.
2.1.2 Classification
Classification adalah proses data mining untuk menemukan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Decision tree adalah salah
satu metode classification yang paling populer karena mudah untuk diinterpretasi oleh manusia.
Proses classification biasanya dibagi menjadi dua fase yaitu fase learning dan fase test.
Pada fase learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk
membentuk model perkiraan. Kemudian pada fase test model yang sudah terbentuk diuji dengan
sebagian data lainnya untuk mengetahui akurasi dari model data tersebut. Bila akurasinya
mencukupi, model ini dapat dipakai untuk prediksi kelas data yang belum diketahui.
Download