Topik-Topik Lanjutan Sistem Informasi 06-PFM/01 Data Mining Johanes Kevin Lumadi 1501151501 Deny Setiawan 1501152580 Machliza Devi Sasmita 1501169511 Silvia Line 1501171466 Billie Enceil 1501171951 Data mining merupakan suatu proses yang digunakan untuk mendapatkan informasi dan pengetahuan yang bermanfaat dimana informasi tersebut didapatkan dari data-data yang telah dikumpulkan. Data mining seringkali digunakan untuk melakukan praktek profil seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Data mining menjadi suatu alat yang penting karena selain dapat digunakan untuk mengubah data menjadi informasi, data mining juga dapat digunakan untuk penelitian perilaku. menganalisis kumpulan Kemampuan Data Mining yaitu kemampuan untuk mereduksi data. Dapat dilakukan dengan Katalogisasi klasifikasi Segementasi Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu : Sudut pandang komersial Sudut pandang keilmuan Manfaatnya yaitu : Menangani meledaknya volume data (menyimpan, mengestrak serta memanfaaatkan) Menghasilkan informasi yang dapat menjadi asset untuk meningkatkan daya saing suatu institusi. Menggudangkan data tanpa kehilangan informasi yang penting (warehousing) Menyelesaikan permasalahan kebutuhan bisnis itu sendiri atau menjawab Manfaatnya yaitu : Mengcapture, menganalisis serta menyimpan data yang bersifat real-time dan sangat besar Kelebihan Data Mining : Kemampuan dalam mengolah data dalam jumlah yang besar. Pencarian Data secara otomatis. Kekurangan Data Mining : Kendala Tidak Database ( Garbage in garbage out ). bisa melakukan analisa sendiri. Berikut adalah cara kerja dalam data mining : 1. Identify the business problems Pada tahap pertama ini, kita harus mengidentifikasi masalah bisnis yang terjadi karena data tidak bisa diolah apabila kita tidak mengetahui dihadapi. permasalahan Setelah yang mengetahui sedang masalah tersebut, maka kita dapat menentukan datadata apa saja yang diperlukan. 2. Mine the data for afectionable information setelah mengetahui masalah yang dihadapi dan data apa saja yang diperlukan maka pada tahap ini akan dilakukan analisa pada datadata tersebut. Melalui tahap analisa ini, kita mendapatkan pengetahuan(knowledge) baru yang akan digunakan dalam mengambil suatu keputusan. 3. Take the action Dari keputusan yang telah diambil tersebut, maka kita akan melakukan implementasi yang berupa sebuah tindakan yang konkrit ke dalam suatu proses bisnis. 4. Measure the results tahap ini merupakan tahap terakhir dalam proses data mining. Pada tahap ini, kita akan memantau hasil dari implementasi tersebut apakah hasil tersebut sudah mencapai target yang diinginkan atau belum dan apakah hasil tersebut dapat menjadi solusi pemecahan masalah atau dapat mengatasi masalah-masalah yang sedang dihadapi. 1. Market Basket analysis Merupakan teknik data mining yang digunakan untuk melakukan analisis pada kebiasaan pelanggan yang menyimpan produk yang diinginkannya kedalam cart/keranjang belanja. Teknik ini juga menganalisis data transaksi penjualan untuk mencari pola dari Produk yang terdapat dalam suatu transaksi kemudian pola tersebut akan digunakan untuk merancang strategi penjualan maupun pemasaran agar menjadi lebih efektif. 2. Memory-based reasoning Merupakan suatu penalaran menggunakan teknik berbasis yang melakukan memori sekumpulan data mengasumsikan pembuatan objek baru. dengan untuk 3. Cluster detection Dalam teknik ini terdapat 2 pendekatan , yaitu: - Memberikan asumsi bahwa kumpulan cluster sudah disimpan ke dalam data. Tujuan pendekatan ini adalah untuk membagi data kedalam bentuk cluster. -Clustering agglomerative, pendekatan ini melakukan penggabungan pada cluster meskipun menggunakan proses komputasi yang sama dan proses tersebut dilakukan secara berulang-ulang. 4. Link analysis Merupakan suatu teknik yang mengidentifikasi dan membangun hubungan suatu objek dengan sekumpulan data berhubungan serta menganilisis sifat yang antara kedua objek tersebut. Teknik ini biasanya digunakan untuk mengambil suatu kesimpulan dengan mengandalkan teori grafik dan sering juga dipakai untuk melakukan proses optimasi. 5. Rule induction Teknik yang digunakan untuk mengidentifikasi aturanaturan bisnis yang telah disimpan kedalam data. 6. Neural Networks Merupakan sebuah teknik yang berbentuk struktur jaringan neural dan berguna dalam mengubah data yang rumit/sulit dipahami oleh manusia menjadi data yang dapat dimengerti selain itu juga dapat digunakan untuk mendeteksi tren yang rumit tetapi sering didiskusikan/dicari. Classification Membagi data menjadi beberapa bagian/kelas kemudian mengecek atribut-atribut dari objek setelah itu memutuskan objek tersebut masuk ke kelas yang mana. Estimation Melakukan estimasi/memperkirakan nilai numerik secara terus menerus. Dapat dikatakan sebagai bagian dari klasifikasi. Prediction prediksi ini berbeda dengan klasifikasi maupun estimasi karena dalam prediksi, objek akan dibagi sesuai dengan behaviour yang telah ditetapkan/ diinginkan dari candidate behaviour. Affinity Grouping Melakukan evaluasi hubungan atau mengelompokkan unsur-unsur data yang terdiri dari atribut/behaviour yang akan menunjukkan tingkat afinitas antar objek tersebut. Clustering Sering disebut Hampir sama dengan dengan segmentasi/pembagian. klasifikasi namun dalam clustering, data dibagi menjadi beberapa bagian kemudian dilakukan indentifikasi setelah itu data akan dikelompokkan sesuai dengan atribut yang sama. Description Mendeskripsikan atau memberikan gambaran secara umum mengenai hasil akhir dari proses data mining. https://fairuzelsaid.files.wordpress.com/2009/10/ data-mining-bab-01.pdf http://irwan- manullang.blogspot.com/2011/04/dasar-datamining.html