Konsep dan Teknologi Data Mining.

advertisement
Aplikasi dan Kecenderungan dalam
Data Mining
■ Aplikasi data mining
■ Sistem produk dan protetipe riset data mining
■ Tema tambahan pada data mining
■ Dampak tentang data mining
■ Kecenderungan yang terdapat pada data mining
■ Ringkasan
12 Oktober 2006
Data Mining : Konsep dan Teknologi
1
Aplikasi Data Mining
■ Data Mining adalah suatu aplikasi terbaru yang berbeda
dan lebih luas
■ Masih adanya perbedaan pendapat antara prinsip umum dan
pembagian wilayah secara khusus pada aplikasi data mining,
khususnya pada keefektifan alat bantu data mining untuk
aplikasi tertentu
■ Beberapa aplikasi domein (yang tercantum pada bab ini)
■ Biomedical dan analisa data DNA
■ Analisa data keuangan
■ Industri penjualan eceran
■ Industri telekomunikasi
12 Oktober 2006
Data Mining : Konsep dan Teknologi
2
Biomedical dan Analisa Data DNA
■ Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A),
cytosine ( C), guanine ( G), dan thymine ( T)
■ Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara
tertentu
■ Manusia mempunyai sekitar 30,000 gen
■ Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides
sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang
terpisah
■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database
Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA
secara luas
Metoda pembersihan dan pengintegrasian data yang dikembangkan dalam Data
Mining akan sangat membantu
12 Oktober 2006
Data Mining : Konsep dan Teknologi
3
Contoh Analisa DNA
Pencarian persamaan dan perbandingan antar urutan DNA
Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit)
Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit
Analisa asosiasi: identifikasi dari co-occurring urutan gen
Kebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi
gen yang bertindak bersama-sama
Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi
bersama-sama dalam target percontohan
Analisa alur: menghubungkan gen pada masa pengembangan penyakit lain
Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda
Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang
berbeda secara terpisah
Penggambaran alat bantu dan analisa data genetik
12 Oktober 2006
Data Mining : Konsep dan Teknologi
4
Data Mining pada Analisa Data
Keuangan
Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan
relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi
Disain dan konstruksi dari gudang data untuk multidimensional analisa
data dan data mining
Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain
Mengakses informasi statistik seperti maximum, minimum, total, rata-rata,
kecenderungannya, dan lain lain
Analisa pembayaran peminjaman kebijakan kredit secara prediksi per
pelanggan
Seleksi di masa depan dan perlunya penggolongan secara atribut
Pencapaian pembayaran peminjaman
Nilai kredit konsumen
12 Oktober 2006
Data Mining : Konsep dan Teknologi
5
Keuangan Data Mining
Penggolongan dan pengelompokan pelanggan untuk target
pemasaran
Segmentasi multidimensional berdasarkan metode terdekat,
penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi
penggolongan persediaan sekelompok pelanggan atau pelanggan
baru
Mendeteksi pencucian uang dan kejahatan keuangan lain
pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank,
DBs sejarah kejahatan federal/negara)
Alat bantu: data gambar, analisa pertalian, penggolongan, alat
penggabungan, analisa orang asing, dan analisa pola alat
percontohan (ditemukan urutan akses secara tidak biasa)
12 Oktober 2006
Data Mining : Konsep dan Teknologi
6
Data Mining pada Industri Retail
Industri Retail: besarnya data penjualan, sejarah
belanja pelanggan, dan lain-lain
Aplikasi dari Retail data mining
Mengidentifikasi perilaku pembelian pelanggan
Menentukan kecenderungan pola belanja pelanggan
Meningkatkan mutu dari layanan pelanggan
Mencapai kepuasan pelanggan
Tingkatkan perbandingan konsumsi barang-barang
Mendisain keefektifan distribusi dan transportasi barang
12 Oktober 2006
Data Mining : Konsep dan Teknologi
7
Contoh Data Mining pada Industri
Retail
Disain dan konstruksi dari gudang data yang didasarkan
keuntungan penggunaan data mining
Analisa multidimensional dari penjualan, pelanggan, produk, waktu,
dan daerah
Analisa dari efektivitas dari kampanye penjualan
Ingatan pelanggan: Analisa dari kesetiaan pelanggan
Menggunakan informasi kartu kesetiaan pelanggan untuk
mendaftarkan urutan dari pembelian dari pelanggan tertentu
Menggunakan pola mining untuk menyelidiki perubahan dalam
konsumsi atau kesetiaan pelanggan
Menyarankan penyesuaian penetapan harga dan variasi barangbarang
Referensi pembelian dan perbandingan materi
12 Oktober 2006
Data Mining : Konsep dan Teknologi
8
Data Mining pada Industri
Telekomunikasi ( 1)
Perkembangan yang sangat cepat dan industri
yang sangat kompetitif dan permintaan yang besar
untuk data mining
Memahami bisnis yang terlibat
Mengidentifikasi pola telekomunikasi
Menangkap aktivitas curang
Mempergunaan sumber daya secara lebih baik
Meningkatkan mutu dari layanan
Analisa multidimensional dari data telekomunikasi
Hakekat multidimensional: tempo pemanggilan, jangka
waktu, lokasi dari pemanggil, jenis panggilan, dan lain
lain
12 Oktober 2006
Data Mining : Konsep dan Teknologi
9
Data Mining pada Industri
Telekomunikasi ( 2)
Analisa pola kecurangan dan identifikasi pola yang tidak
lazim
Mengidentifikasi pola para pengguna yang berpotensi curang dan
penggunaan yang tidak lazim
Mendeteksi usaha kecurangan masukan ke dalam rekening
pelanggan
Menemukan pola yang tidak biasa memerlukan perhatian khusus
Multidimensional asosiasi dan percontohan pola analisa
Temukan pola satu set jasa komunikasi berdasarkan kelompok
pelanggan, bulan, dan lain lain
Mempromosikan penjualan dari jasa spesifik
Meningkatkan ketersediaan dari jasa tertentu pada suatu daerah
Penggunaan alat bantu penggambaran dalam analisa data
telekomunikasi
12 Oktober 2006
Data Mining : Konsep dan Teknologi
10
Bagaimana cara memilih suatu
Sistem Data Mining?
Secara komersil sistem data mining mempunyai sedikit
kesamaan
Perbedaan kemampuan atau metodologi Data Mining
Dapat bekerja dengan bermacam-macam data yang berbeda
Memerlukan berbagai pandangan yang dimensional dalam
pemilihan
Jenis data: relational, tanggapan, teks, urutan waktu, ruang?
Isu sistem
Hanya berjalan pada satu atau beberapa sistem operasi?
Arsitektur client/server?
Menyediakan tampilan berbasis Web dan mengijinkan data XML
sebagai masukan atau keluaran?
12 Oktober 2006
Data Mining : Konsep dan Teknologi
11
Bagaimana cara memilih suatu
Sistem Data Mining? ( 2)
Sumber data
File teks ASCII, berbagai sumber data relational
Mendukung koneksi ODBC ( OLE DB, JDBC)?
Fungsi dan metodologi Data mining
Satu melawan berbagai fungsi data mining
Satu melawan berbagai macam variasi perfungsi
Fungsi lain data mining dan metoda perfungsinya menyediakan
pengguna dengan analisa dan fleksibilitas yang lebih besar
Menggabungkan dengan DB dan/atau sistem data gudang
Empat format penggabungan: tidak ada penggabungan,
penggabungan lepas, penggabungan semi ketat, dan penggabungan
ketat
Idealnya, suatu sistem data mining harus di gabungkan dengan ketat
dengan suatu sistem database
12 Oktober 2006
Data Mining : Konsep dan Teknologi
12
Bagaimana cara memilih suatu
Sistem Data Mining? ( 3)
Scalabilitas
Scalabilitas perbaris ( atau ukuran database)
Scalabilitas perkolom ( atau dimensi)
Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat
suatu skala sistem kolom dari pada skala sistem baris
Alat bantu gambar
"Suatu gambar dapat berharga seribu kata-kata“
Kategori penggambaran: data gambar, hasil gambaran, proses
penggambaran, dan gambaran data mining
Bahasa query pada Data mining dan tampilan grafis
pengguna
Mudah digunakan dan grafis yang berkualitas tinggi
Pentingnya buku pedoman, data mining yang sangat interaktip
12 Oktober 2006
Data Mining : Konsep dan Teknologi
13
Contoh Sistem Data Mining ( 1)
Miner IBM yang cerdas
Suatu cakupan luas dari algoritma data mining
Skala algoritma data mining
Alat bantu: algoritma jaringan neural, metode statistik, persiapan
data, dan alat bantu penggambaran data gambar
Pengintegrasian yang ketat IBM dengan relational sistem database
DB2
Perusahaan SAS miner
Berbagai alat bantu analisa yang statistik
Alat bantu data gudang dan berbagai data algoritma mining
Microsoft SQLServer 2000
Mengintegrasikan DB dan OLAP dengan mining
Mendukung OLEDB untuk DM standard
12 Oktober 2006
Data Mining : Konsep dan Teknologi
14
Contoh Sistem Data Mining ( 2)
Sgi Mineset
Berbagai algoritma dan statistik tingkat lanjut data mining
Alat bantu penggambaran tingkat lanjut
Clementine (SPSS)
Pengembangan lingkungan data mining yang terintegrasi untuk
pengguna akhir dan pengembang
Berbagai algoritma data mining dan alat bantu penggambaran
DBMiner ( DBMiner Teknologi Inc.)
Berbagai modul data mining : analisa OLAP discovery-driven,
asosiasi, penggolongan, dan pengelompokan
efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat
penggolongan visuil
Mining antara database relational dan data gudang
12 Oktober 2006
Data Mining : Konsep dan Teknologi
15
Visuallisasi Data Mining
Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil
yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh
Visualisasi Data mining: proses menemukan kandungan yang tersembunyi dapat
menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan
menggunakan teknik visualisasi
12 Oktober 2006
Data Mining : Konsep dan Teknologi
16
Visualisasi
Tujuan visualisasi
Memperoleh masukan ruang informasi dengan
mempetakan data ke dalam grafis sederhana
Menyediakan ikhtisar yang kwalitatif dari data yang besar
Mencari contoh pola, kecenderungan, struktur,
ketidakteraturan, hubungan antar data.
Bantuan untuk menemukan daerah menarik dan
parameter yang pantas untuk analisis kuantitatif lebih
lanjut.
Menyediakan suatu bukti yang visuil tentang memperoleh
penyajian komputer
12 Oktober 2006
Data Mining : Konsep dan Teknologi
17
Visualisasi Data Mining & Visualisasi
Data
Pengintegrasian dari visualisasi data mining
Visualisasi data
Hasil Visualisasi data mining
Proses visualisasi data mining
Visualisasi data mining yang interaktip
Visualisasi data
Data dalam database atau data gudang terlihat
Pada tingkat abstrak yang berbeda
Sebagai kombinasi yang berbeda tentang atribut atau dimensi
Data dapat dipersentasikan dalam berbagai format visual
12 Oktober 2006
Data Mining : Konsep dan Teknologi
18
Hasil Visualisasi Data Mining
Presentasi dari hasil atau pengetahuan yang
diperoleh dari format visual data mining
Contoh
Menyebar alur cerita dan boxplots (yang diperoleh dari
data mining)
Alur keputusan
Aturan Asosiasi
Kelompok
Asing
Aturan disamaratakan
12 Oktober 2006
Data Mining : Konsep dan Teknologi
19
Boxplots dari Statsoft: Berbagai
Combinasi Variabel
12 Oktober 2006
Data Mining : Konsep dan Teknologi
20
Visualisasi dari Data Mining pada
Perusahaan SAS Miner : Menyebaran
Plots
12 Oktober 2006
Data Mining : Konsep dan Teknologi
21
Visualisasi dari Peraturan Asosiasi
SGI/MineSet 3.0
12 Oktober 2006
Data Mining : Konsep dan Teknologi
22
Download