Data Mining - Machliza Devi Portfolio

advertisement
Topik-Topik Lanjutan Sistem Informasi
06-PFM/01
Data Mining
Johanes Kevin Lumadi
1501151501
Deny Setiawan
1501152580
Machliza Devi Sasmita
1501169511
Silvia Line
1501171466
Billie Enceil
1501171951
 Data
mining
merupakan suatu
proses
yang
digunakan untuk mendapatkan informasi dan
pengetahuan yang bermanfaat dimana informasi
tersebut didapatkan dari data-data yang telah
dikumpulkan.
 Data
mining
seringkali
digunakan
untuk
melakukan praktek profil seperti pemasaran,
pengawasan, penipuan deteksi dan penemuan
ilmiah.
 Data
mining menjadi suatu alat yang penting
karena selain dapat digunakan untuk mengubah
data menjadi informasi, data mining juga dapat
digunakan
untuk
penelitian perilaku.
menganalisis
kumpulan
Kemampuan Data Mining yaitu kemampuan untuk
mereduksi data.
Dapat dilakukan dengan
 Katalogisasi
 klasifikasi
 Segementasi
Pemanfaatan data mining dapat dilihat dari dua
sudut pandang, yaitu :
 Sudut
pandang komersial
 Sudut
pandang keilmuan
Manfaatnya yaitu :

Menangani meledaknya volume data (menyimpan,
mengestrak serta memanfaaatkan)

Menghasilkan informasi yang dapat menjadi asset
untuk meningkatkan daya saing suatu institusi.

Menggudangkan data tanpa kehilangan informasi
yang penting (warehousing)

Menyelesaikan
permasalahan
kebutuhan bisnis itu sendiri
atau
menjawab
Manfaatnya yaitu :
 Mengcapture,
menganalisis serta menyimpan
data yang bersifat real-time dan sangat besar
Kelebihan Data Mining :
 Kemampuan
dalam mengolah data dalam jumlah
yang besar.
 Pencarian
Data secara otomatis.
Kekurangan Data Mining :
 Kendala
 Tidak
Database ( Garbage in garbage out ).
bisa melakukan analisa sendiri.
Berikut adalah cara kerja dalam data mining :
1. Identify the business problems
Pada
tahap
pertama
ini,
kita
harus
mengidentifikasi masalah bisnis yang terjadi
karena data tidak bisa diolah apabila kita tidak
mengetahui
dihadapi.
permasalahan
Setelah
yang
mengetahui
sedang
masalah
tersebut, maka kita dapat menentukan datadata apa saja yang diperlukan.
2. Mine the data for afectionable information
setelah mengetahui masalah yang dihadapi
dan data apa saja yang diperlukan maka pada
tahap ini akan dilakukan analisa pada datadata tersebut. Melalui tahap analisa ini, kita
mendapatkan pengetahuan(knowledge) baru
yang akan digunakan dalam mengambil suatu
keputusan.
3. Take the action
Dari keputusan yang telah diambil tersebut,
maka kita akan melakukan implementasi yang
berupa sebuah tindakan yang konkrit ke dalam
suatu proses bisnis.
4. Measure the results
tahap ini merupakan tahap terakhir dalam
proses data mining. Pada tahap ini, kita akan
memantau hasil dari implementasi tersebut
apakah hasil tersebut sudah mencapai target
yang diinginkan atau belum dan apakah hasil
tersebut
dapat
menjadi
solusi
pemecahan
masalah atau dapat mengatasi masalah-masalah
yang sedang dihadapi.
1. Market Basket analysis
Merupakan teknik data mining yang digunakan untuk
melakukan analisis pada kebiasaan pelanggan yang
menyimpan produk yang diinginkannya kedalam
cart/keranjang belanja. Teknik ini juga menganalisis
data transaksi penjualan untuk mencari pola dari
Produk
yang
terdapat
dalam
suatu
transaksi
kemudian pola tersebut akan digunakan untuk
merancang strategi penjualan maupun pemasaran
agar menjadi lebih efektif.
2. Memory-based reasoning
Merupakan
suatu
penalaran
menggunakan
teknik
berbasis
yang
melakukan
memori
sekumpulan
data
mengasumsikan pembuatan objek baru.
dengan
untuk
3. Cluster detection
Dalam teknik ini terdapat 2 pendekatan , yaitu:
- Memberikan asumsi bahwa kumpulan cluster
sudah disimpan ke dalam data. Tujuan pendekatan
ini adalah untuk membagi data kedalam bentuk
cluster.
-Clustering
agglomerative,
pendekatan
ini
melakukan penggabungan pada cluster meskipun
menggunakan proses komputasi yang sama dan
proses tersebut dilakukan secara berulang-ulang.
4. Link analysis
Merupakan suatu teknik yang mengidentifikasi
dan membangun hubungan suatu objek dengan
sekumpulan data
berhubungan
serta menganilisis sifat yang
antara
kedua
objek
tersebut.
Teknik ini biasanya digunakan untuk mengambil
suatu kesimpulan dengan mengandalkan teori
grafik dan sering juga dipakai untuk melakukan
proses optimasi.
5. Rule induction
Teknik yang digunakan untuk mengidentifikasi aturanaturan bisnis yang telah disimpan kedalam data.
6. Neural Networks
Merupakan sebuah teknik yang berbentuk struktur
jaringan neural dan berguna dalam mengubah data
yang rumit/sulit dipahami oleh manusia menjadi data
yang
dapat
dimengerti
selain
itu
juga
dapat
digunakan untuk mendeteksi tren yang rumit tetapi
sering didiskusikan/dicari.

Classification
Membagi data menjadi beberapa bagian/kelas
kemudian mengecek atribut-atribut dari objek
setelah itu memutuskan objek tersebut masuk ke
kelas yang mana.
 Estimation
Melakukan estimasi/memperkirakan nilai numerik
secara terus menerus. Dapat dikatakan sebagai
bagian dari klasifikasi.

Prediction
prediksi ini berbeda dengan klasifikasi maupun
estimasi karena dalam prediksi, objek akan dibagi
sesuai dengan behaviour yang telah ditetapkan/
diinginkan dari candidate behaviour.

Affinity Grouping
Melakukan evaluasi hubungan atau mengelompokkan
unsur-unsur data yang terdiri dari atribut/behaviour
yang akan menunjukkan tingkat afinitas antar objek
tersebut.

Clustering
Sering
disebut
Hampir
sama
dengan
dengan
segmentasi/pembagian.
klasifikasi
namun
dalam
clustering, data dibagi menjadi beberapa bagian
kemudian dilakukan indentifikasi setelah itu data
akan dikelompokkan sesuai dengan atribut yang
sama.

Description
Mendeskripsikan atau memberikan gambaran secara
umum mengenai hasil akhir dari proses data mining.
https://fairuzelsaid.files.wordpress.com/2009/10/
data-mining-bab-01.pdf
http://irwan-
manullang.blogspot.com/2011/04/dasar-datamining.html
Download