Aplikasi dan Kecenderungan dalam Data Mining ■ Aplikasi data mining ■ Sistem produk dan protetipe riset data mining ■ Tema tambahan pada data mining ■ Dampak tentang data mining ■ Kecenderungan yang terdapat pada data mining ■ Ringkasan 12 Oktober 2006 Data Mining : Konsep dan Teknologi 1 Aplikasi Data Mining ■ Data Mining adalah suatu aplikasi terbaru yang berbeda dan lebih luas ■ Masih adanya perbedaan pendapat antara prinsip umum dan pembagian wilayah secara khusus pada aplikasi data mining, khususnya pada keefektifan alat bantu data mining untuk aplikasi tertentu ■ Beberapa aplikasi domein (yang tercantum pada bab ini) ■ Biomedical dan analisa data DNA ■ Analisa data keuangan ■ Industri penjualan eceran ■ Industri telekomunikasi 12 Oktober 2006 Data Mining : Konsep dan Teknologi 2 Biomedical dan Analisa Data DNA ■ Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A), cytosine ( C), guanine ( G), dan thymine ( T) ■ Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara tertentu ■ Manusia mempunyai sekitar 30,000 gen ■ Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang terpisah ■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA secara luas Metoda pembersihan dan pengintegrasian data yang dikembangkan dalam Data Mining akan sangat membantu 12 Oktober 2006 Data Mining : Konsep dan Teknologi 3 Contoh Analisa DNA Pencarian persamaan dan perbandingan antar urutan DNA Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit) Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit Analisa asosiasi: identifikasi dari co-occurring urutan gen Kebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi gen yang bertindak bersama-sama Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi bersama-sama dalam target percontohan Analisa alur: menghubungkan gen pada masa pengembangan penyakit lain Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang berbeda secara terpisah Penggambaran alat bantu dan analisa data genetik 12 Oktober 2006 Data Mining : Konsep dan Teknologi 4 Data Mining pada Analisa Data Keuangan Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain Mengakses informasi statistik seperti maximum, minimum, total, rata-rata, kecenderungannya, dan lain lain Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan Seleksi di masa depan dan perlunya penggolongan secara atribut Pencapaian pembayaran peminjaman Nilai kredit konsumen 12 Oktober 2006 Data Mining : Konsep dan Teknologi 5 Keuangan Data Mining Penggolongan dan pengelompokan pelanggan untuk target pemasaran Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru Mendeteksi pencucian uang dan kejahatan keuangan lain pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara) Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa) 12 Oktober 2006 Data Mining : Konsep dan Teknologi 6 Data Mining pada Industri Retail Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain Aplikasi dari Retail data mining Mengidentifikasi perilaku pembelian pelanggan Menentukan kecenderungan pola belanja pelanggan Meningkatkan mutu dari layanan pelanggan Mencapai kepuasan pelanggan Tingkatkan perbandingan konsumsi barang-barang Mendisain keefektifan distribusi dan transportasi barang 12 Oktober 2006 Data Mining : Konsep dan Teknologi 7 Contoh Data Mining pada Industri Retail Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah Analisa dari efektivitas dari kampanye penjualan Ingatan pelanggan: Analisa dari kesetiaan pelanggan Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan Menyarankan penyesuaian penetapan harga dan variasi barangbarang Referensi pembelian dan perbandingan materi 12 Oktober 2006 Data Mining : Konsep dan Teknologi 8 Data Mining pada Industri Telekomunikasi ( 1) Perkembangan yang sangat cepat dan industri yang sangat kompetitif dan permintaan yang besar untuk data mining Memahami bisnis yang terlibat Mengidentifikasi pola telekomunikasi Menangkap aktivitas curang Mempergunaan sumber daya secara lebih baik Meningkatkan mutu dari layanan Analisa multidimensional dari data telekomunikasi Hakekat multidimensional: tempo pemanggilan, jangka waktu, lokasi dari pemanggil, jenis panggilan, dan lain lain 12 Oktober 2006 Data Mining : Konsep dan Teknologi 9 Data Mining pada Industri Telekomunikasi ( 2) Analisa pola kecurangan dan identifikasi pola yang tidak lazim Mengidentifikasi pola para pengguna yang berpotensi curang dan penggunaan yang tidak lazim Mendeteksi usaha kecurangan masukan ke dalam rekening pelanggan Menemukan pola yang tidak biasa memerlukan perhatian khusus Multidimensional asosiasi dan percontohan pola analisa Temukan pola satu set jasa komunikasi berdasarkan kelompok pelanggan, bulan, dan lain lain Mempromosikan penjualan dari jasa spesifik Meningkatkan ketersediaan dari jasa tertentu pada suatu daerah Penggunaan alat bantu penggambaran dalam analisa data telekomunikasi 12 Oktober 2006 Data Mining : Konsep dan Teknologi 10 Bagaimana cara memilih suatu Sistem Data Mining? Secara komersil sistem data mining mempunyai sedikit kesamaan Perbedaan kemampuan atau metodologi Data Mining Dapat bekerja dengan bermacam-macam data yang berbeda Memerlukan berbagai pandangan yang dimensional dalam pemilihan Jenis data: relational, tanggapan, teks, urutan waktu, ruang? Isu sistem Hanya berjalan pada satu atau beberapa sistem operasi? Arsitektur client/server? Menyediakan tampilan berbasis Web dan mengijinkan data XML sebagai masukan atau keluaran? 12 Oktober 2006 Data Mining : Konsep dan Teknologi 11 Bagaimana cara memilih suatu Sistem Data Mining? ( 2) Sumber data File teks ASCII, berbagai sumber data relational Mendukung koneksi ODBC ( OLE DB, JDBC)? Fungsi dan metodologi Data mining Satu melawan berbagai fungsi data mining Satu melawan berbagai macam variasi perfungsi Fungsi lain data mining dan metoda perfungsinya menyediakan pengguna dengan analisa dan fleksibilitas yang lebih besar Menggabungkan dengan DB dan/atau sistem data gudang Empat format penggabungan: tidak ada penggabungan, penggabungan lepas, penggabungan semi ketat, dan penggabungan ketat Idealnya, suatu sistem data mining harus di gabungkan dengan ketat dengan suatu sistem database 12 Oktober 2006 Data Mining : Konsep dan Teknologi 12 Bagaimana cara memilih suatu Sistem Data Mining? ( 3) Scalabilitas Scalabilitas perbaris ( atau ukuran database) Scalabilitas perkolom ( atau dimensi) Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat suatu skala sistem kolom dari pada skala sistem baris Alat bantu gambar "Suatu gambar dapat berharga seribu kata-kata“ Kategori penggambaran: data gambar, hasil gambaran, proses penggambaran, dan gambaran data mining Bahasa query pada Data mining dan tampilan grafis pengguna Mudah digunakan dan grafis yang berkualitas tinggi Pentingnya buku pedoman, data mining yang sangat interaktip 12 Oktober 2006 Data Mining : Konsep dan Teknologi 13 Contoh Sistem Data Mining ( 1) Miner IBM yang cerdas Suatu cakupan luas dari algoritma data mining Skala algoritma data mining Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar Pengintegrasian yang ketat IBM dengan relational sistem database DB2 Perusahaan SAS miner Berbagai alat bantu analisa yang statistik Alat bantu data gudang dan berbagai data algoritma mining Microsoft SQLServer 2000 Mengintegrasikan DB dan OLAP dengan mining Mendukung OLEDB untuk DM standard 12 Oktober 2006 Data Mining : Konsep dan Teknologi 14 Contoh Sistem Data Mining ( 2) Sgi Mineset Berbagai algoritma dan statistik tingkat lanjut data mining Alat bantu penggambaran tingkat lanjut Clementine (SPSS) Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang Berbagai algoritma data mining dan alat bantu penggambaran DBMiner ( DBMiner Teknologi Inc.) Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil Mining antara database relational dan data gudang 12 Oktober 2006 Data Mining : Konsep dan Teknologi 15 Visuallisasi Data Mining Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh Visualisasi Data mining: proses menemukan kandungan yang tersembunyi dapat menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan menggunakan teknik visualisasi 12 Oktober 2006 Data Mining : Konsep dan Teknologi 16 Visualisasi Tujuan visualisasi Memperoleh masukan ruang informasi dengan mempetakan data ke dalam grafis sederhana Menyediakan ikhtisar yang kwalitatif dari data yang besar Mencari contoh pola, kecenderungan, struktur, ketidakteraturan, hubungan antar data. Bantuan untuk menemukan daerah menarik dan parameter yang pantas untuk analisis kuantitatif lebih lanjut. Menyediakan suatu bukti yang visuil tentang memperoleh penyajian komputer 12 Oktober 2006 Data Mining : Konsep dan Teknologi 17 Visualisasi Data Mining & Visualisasi Data Pengintegrasian dari visualisasi data mining Visualisasi data Hasil Visualisasi data mining Proses visualisasi data mining Visualisasi data mining yang interaktip Visualisasi data Data dalam database atau data gudang terlihat Pada tingkat abstrak yang berbeda Sebagai kombinasi yang berbeda tentang atribut atau dimensi Data dapat dipersentasikan dalam berbagai format visual 12 Oktober 2006 Data Mining : Konsep dan Teknologi 18 Hasil Visualisasi Data Mining Presentasi dari hasil atau pengetahuan yang diperoleh dari format visual data mining Contoh Menyebar alur cerita dan boxplots (yang diperoleh dari data mining) Alur keputusan Aturan Asosiasi Kelompok Asing Aturan disamaratakan 12 Oktober 2006 Data Mining : Konsep dan Teknologi 19 Boxplots dari Statsoft: Berbagai Combinasi Variabel 12 Oktober 2006 Data Mining : Konsep dan Teknologi 20 Visualisasi dari Data Mining pada Perusahaan SAS Miner : Menyebaran Plots 12 Oktober 2006 Data Mining : Konsep dan Teknologi 21 Visualisasi dari Peraturan Asosiasi SGI/MineSet 3.0 12 Oktober 2006 Data Mining : Konsep dan Teknologi 22