Data mining

advertisement
DATA MINING
PENGANTAR DATA MINING
THE ORIGIN OF DATA MINING
APA ITU DATA MIINING?
 Penggalian data (data mining) adalah ekstraksi pola yang menarik,
dari data dalam jumlah besar.
 Suatu pola dikatakan menarik apabila pola tersebut tidak sepele,
implisit, tidak diketahui sebelumnya, dan berguna.
 Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang
akan diprediksi dengan derajat kepastian tertentu, berguna, dan
baru.
APA ITU DATA MINING?
 Data mining memiliki beberapa nama alternatif, meskipun
definisi eksaknya berbeda, seperti:
 KDD (knowledge discovery in database),
 analisis pola,
 arkeologi data,
 pemanenan informasi,
 intelegensia bisnis.
KENAPA BUTUH DATA MINING
 Perkembangan yang pesat di bidang pengumpulan data dan teknologi
penyimpanan di berbagai bidang, menghasilkan basis data yang terlampau
besar.
 Namun, data yang dikumpulkan jarang dilihat lagi, karena terlalu panjang,
membosankan, dan tidak menarik.
 Dan intuisi yang yang digunakan untuk pembuatan keputusan sudah tidak
dapat diterapkan.
KENAPA BUTUH DATA MINING SECARA KOMERSIAL
 Banyak data yang sudah dikumpulkan dan disimpan
 Web data, e-commerce
 Data penjualan dan pembelian dan toko retail
 Transaksi bank dan kartu kredit
 Komputer lebih murah lebih powerful
 Tekanan kompetisi sangat kuat
KENAPA BUTUH DATA MINING DARI SISI SAINS
 Data dikumpulkan dan disimpan dalam kecepatan tinggi
 Sensor remote pada satelit
 Telescop scanner untuk langit
 Simulasi sains penghasil data Terabytes
 Membantu sains
 Klasifikasi dan segmentasi data
 Formasi hipotesis
PENGAPLIKASIAN DATA MINING DALAM GAMES
PENGAPLIKASIAN DATA MINING DALAM INDUSTRI BISNIS
PENGAPLIKASIAN DATA MINING DALAM TEKNOLOGI MEDIS
DIMANAKAH LETAK DATAMINING?
APA TUGAS DATA MINING?
 Klasifikasi
 Kluster
 Asociation Rule
 Sequential Pattern
 Regressing
 Deviation Detection
TUGAS
 Buat dengan anggota berjumlah 5-7 orang / kelompok. Dikepalai oleh teman yang sering kali membawa
laptop. Sebisa mungkin setiap orang membawa.
 Cari software yang dapat digunakan untuk melakukan proses data mining boleh bersifat opensource,
freeware, atau berbayar.
 Misalnya: Rapid Mind, R, Tanagra, SPSS, Oracle, Wika (tidak boleh sama antar kelompok)
 Cari data yang berkaitan / dapat diolah dengan data mining menurut anda.
 Misalnya: data perusahaan atau bank atau kartu kredit, saham, medical record, gambar medis atau gambar scene,
data kependudukan, data properti (tidak boleh sama antar kelompok)
 Setiap minggunya data tersebut harus dibawa bersama laptop yang sudah diinstall perangkat lunak yang
telah ditentukan.
 Dipertemuan ke-9 dipresentasikan hasilnya
 Pertemuan ke-12 laporan dikumpulkan, berupa modul tahap-tahap yang sudah dilakukan berdasarkan
praktik sehari-hari.
Download