Laporan PDF

advertisement
BAB 1
PENDAHULUAN
A. Latar Belakang
Selama dua decade terakhir telah terjadi
peningkatan yang dramatis terhadap jumlah informasi
atau data yang disimpan secar a elektronis. Telah
diperkirakan sebelumnya bahwa jumlah informasi di
dunia akan berlipat ganda setiap 20 bulan dan jumlah
ukuran basis data akan bertambah lebih cepat lagi dari
itu. Teknologi database saat ini memungkinkan untuk
menyimpan sejumlah data dalam jumlah yang sangat
besar dan terakumulasi.
Disinilah awal timbulnya
persoalan ledakan data (jumlah data yang tiba-tiba begitu
sangat besar). Data perlu disimpan, tapi yang lebih
penting dari itu adalah proses penemuan pengetahuan
(knowledge) dari data yang disimpan ! Oleh karenanya
data yang tersimpan dalam sebuah gudang data yang
disebut dengan data warehouses perlu dianalisa.
Permasalahannya kemudian adalah apa yang harus
dilakukan dengan data-data itu. Sudah diketahui secara
umum bahwa informasi merupakan hal yang sangat
penting dalam menunjang oper asi-operasi bisnis dan
membantu
para
pengambil
keputusan untuk
mendapatkan gambaran lebih tentang bisnis mereka.
Sistem manajemen basis data memberikan akses
terhadap data namun hanya sebagian kecil
1
kontribusinya terhadap apa yang seharusnya dapat
dihasilkan dari data-data itu. Sistem pemrosesan
transaksi online (OLPT) tradisional sangat baik dalam
menyimpan data secara cepat, aman, dan efisien ke
dalam basis data namun tidak cukup baik dalam hal
kemampuan melakukan analisa terhadap data-data
yang ada, padahal analisa terhadap data memberikan
pengetahuan lebih mendalam tentang bisnis
yang
dilakukan. Solusi
untuk persoalan
penemuan
pengetahuan dalam database berukuran besar adalah
dengan menggunakan Data warehousing dan data
mining. Disinilah peran Data Mining akan memberikan
konstribusi besar bagi setiap perusahaan yang
mengimplementasikannya.
B. Tujuan
1.
2.
3.
Untuk memenuhi tugas mata kuliah Sistem
Manajemen Basis Data.
Untuk mengetahui lebih luas tentang Data Mining.
Untuk menambah pengetahuan.
C. Rumusan Masalah
1.
2.
3.
Apa yang dimaksud dengan Data Mining ?
Apa fungsi dan tujuan dari Data Mining ?
Bagaimana penerapan Data Mining
kehidupan?
dalam
2
BAB II
PEMBAHASAN
A. Pengertian data Mining
Ada beberapa definisi dari Data mining. Secara
umum data mining dapat
didefinisikan sebagai berikut :
• Proses penemuan pola yang menarik dari data yang
tersimpan dalam jumlah besar.
Merupakan evolusi
alami dari teknologi database, dan merupakan metode
yang paling banyak dibutuhkan, dengan aplikasi yang
sangat luas.
• Ekstraksi dari suatu
menarik
(non-trivial,
diketahui,
potensial
pengetahuan dari data
besar.
informasi yang berguna atau
implisit, sebelumnya
belum
kegunaannya)
pola
atau
yang disimpan dalam jumlah
• Ekplorasi dari analisa secara
otomatis atau
semiotomatis terhadap data-data dalam jumlah besar
untuk mencari pola dan aturan yang berarti.Pada
dasarnya data mining berhubungan erat dengan
analisa data dan penggunaan perangkat lunak untuk
mencari pola dan kesamaan dalam sekumpulan data. Ide
dasarnya sangat menggali sumber yang berharga dari
tempat yang sama sekali tidak diduga seperti perangkat
3
lunak data mining mengekstrasi pola yang sebelumnya
tidak terlihat atau tigak begitu jelas sehingga tidak
seorang pun yang memperhatikan sebeumnya. Analisa
data mining berjalan pada data yang cenderung terus
membesar dan teknik terbaik yang digunakan kemudian
beorientasi kepada data beukur an sangat besar untuk
mendapatkn kesimpulan dan keputusan paling layak.
Data mining memiliki beberapa sebutan atau nama
lain yaitu : Knowledge discovery (mining) in databases
(KDD), ekstraksi pengetahuan (knowledge extraction),
Analisa
data/pola,
kecerdasan bisnis (business
intelligence), dll.
Meskipun sebagian besar teknik data mining seperti yang
akan dijelaskan pada bagian- lain laporan tugas akhir ini sudah
ada sejak lama, namun hanya pada beberapa tahun terakhir
ini data mining benar-benar berperan yaitu sejak dilakukan
komersialisasi data mining. Beberapa faktor yang mendukung
perlunya dilakukan data mining adalah :
1. Data telah mencapai jumlah dan ukuran yang sangat
besar Hasil dan proses data mining merupakan
suatu informasi yang akan mendasari tindakan
tertentu sehingga tingkat kebenaran informasi
tersebut menjadi sangat signifikan, dan makin besar
serta makin banyak data yang digunakan maka
4
akan semakin valid hasilnya. Perkembangan data
dalam
hal jumlah dan ukuran telah mencapai
kecepatan yang sangat cepat, sehingga ukuran basis
data yang dimiliki oleh sebuah perusahaan bisa
mencapai kisaran gigabyte atau bahkan terabyte.
2. Telah dilakukan proses data warehousing Untuk
mencapai hasil yang memuaskan, maka sumber
data yang digunakan dalam proses data mining
seringkali merupakan data gabungan dari banyak
departemen, daerah operasi bahkan dari sumbersumber lain seper ti data kependudukan. Oleh karena
itu maka disarankan perlunya proses data
warehousing untuk menjaga konsistensi, memberikan
prespektif yang lebih baik terhadap data dan menjaga
integritas data.
3. Kemampuan Komputasi yang semakin terjangkau Pada
dasarnya proses data mining melakukan banyak akses
terhadap data yang sangat besar. Selain itu juga
melakukan proses komputasi yang membutuhkan
sumber daya sangat besar. Penurunan harga yang
cukup cepat terhadap perangkat keras computer serta
semakin tingginya kinerja yang berhasil dicapai oleh
perangkat computer maupun teknologi pengolahan
data
seperti teknologi pararel proses saat ini,
menjadikan proses saat ini, menjadikan proses data
5
mining suduh cukup layak untuk dilakukan secara
komersial.
4. Persaingan bisnis yang semakin ketat Tekanan
persaingan bisnis yang semakin ketat mendorong
perusahaan- perusahaan untuk selalu berinovasi
agar mampu meningkatkan daya saingnya dipasar
global. Beberapa tren yang berkembang saat ini adalah
a. Setiap bisnis adalah bisnis pelayanan
b. Adanya fenomena kustomisasi produk oleh
masyarakat
c. Informasi adalah produk
B. Model dalam Data Mining
Terdapat dua tipe atau mode operasi yang bisa
digunakan untuk mencari informasi yang dibutuhkan
user lewat proses data mining, yaitu model verifikasi
dan knowledge discover y. Model
verifikasi
menggunakan
pendekatan
top
down
dengan
mengambil hipotesa dari user dan memeriksa
validitasnya dengan data sehingga bisa dibuktikan
kebenaran hipotesa tersebut. Model
Knowledge
Discovery menggunakan pendekatan bottom up untuk
mendapatkan informasi yang sebelumnya tidak diketahui.
Model ini terbagi menjadi dua directed knowledge
discovery dan undirected knowledge discovery. Pada
6
directed knowledge discovery data mining akan
mencoba mencari penjelasan nilai target field tertentu
(seperti penghasilan, respons, usia, dan lain-lain)
terhadap field-field yang lain. Sedangkan pada undirected
knowledge discovery tidak ada target field karena
komputer akan mencari pola yang ada pada data. Jadi
undirected knowledge discovery digunakan untuk
mengenali hubungan / relasi yang ada pada data
sedangkan
directed knowledge discovery akan
menjelaskan hubungan / relasi tersebut.
C. Tahapan Proses Dalam Data Minning
Ada beberapa tahapan proses dalam data mining.
Diagram dibawah menggambarkan beberapa tahap /
proses yang berlangsung dalam data mining. Fase awal
dimulai dari data sumber dan berakhir dengan adanya
informasi yang dihasilkan dari bebrapa tahapan, yaitu :
Gambar 1.1 Fase-fase Dalam Data Mining
7
Tahapan proses dalam Data Mining dapat dijelaskan
sebagai berikut :
1. Seleksi Data
Pemilihan (seleksi) data daru sekumpulan data
operasional perlu dilakukan sebelum tahap penggalian
informasi dalam KDD dimulai. Data hasil seleksi yang
akan digunakan untuk proses data mining, disimpan
dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/ Cleaning ( pemilihan data )
Sebelum proses data mining dapat dilaksanakan,
perlu dilakukan proses cleaning pada data yang menjadi
fokus KDD. Proses cleaning mencakup antara lain
membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data,
seperti kesalahan cetak (tipografi). Juga dilakukan proses
enrichment, yaitu proses “memperkaya” data yang sudah
ada dengan data atau informasi lain yang relevan dan
diperlukan untuk KDD, seperti data atau informasi
eksternal.
3. Transformasi
Coding adalah proses transformasi pada data yang
telah dipilih, sehingga data tersebut sesuai untuk proses
data mining. Proses coding dalam KDD merupakan proses
8
kreatif dan sangat tergantung pada jenis
informasi yang akan dicari dalam basis data
atau pola
4. Data mining
Data mining adalah proses mencari pola atau
informasi
menarik
dalam
data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik,
metode, atau algoritma dalam data mining sangat
bervariasi. Pemilihan metode atau algoritma yang tepat
sangat bergantung pada tujuan dan proses KDD secara
keseluruhan.
5. Interpretasi / Evaluasi
Pola informasi yang dihasilkan dari proses data mining
perlu ditampilkan dalam bentuk yang mudah dimengerti
oleh pihak yang berkepentingan. Tahap ini merupakan
bagian
dari proses KDD yang disebut dengan
interpretation. Tahap ini
mencakup
pemeriksaan
apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesa yang ada
sebelumnya.
Proses KDD secara garis besar memang terdiri dari 5
tahap seperti yang telah dijelaskan sebelumnya. Akan
tetapi, dalam proses KDD yang sesungguhnya, dapat saja
terjadi iterasi atau pengulangan pada tahap tahap
9
tertentu. Pada setiap tahap dalam proses KDD, seorang
analis dapat saja kembali ke tahap sebelumnya. Sebagai
contoh, pada saat coding atau data mining, analis
menyadari proses cleaning belum dilakukan dengan
sempurna, atau mungkin saja analis menemukan data atau
informasi baru untuk “memperkaya” data yang sudah ada.
D. Metode Data Minning
Data mining model dibuat berdasarkan salah satu dari
dua jenis pembelajaran supervised dan unsupervised.
Fungsi pembelajaran Supervised digunakan untuk
memprediksi suatu nilai. Fungsi pembelajaran Unsupervised
digunakan untuk mencari struktur intrinsik, relasi dalam
suatu data yang tidak memerlukan class atau label
sebelum dilakukan proses pembelajaran. Contoh dari
algoritma pembelajaran unsupervised, diantaranya k-means
clustering dan Apriori association rules. Contoh dari
algoritma pembelajaran supervised yaitu NaiveBayes untuk
klasifikasi. Metode data mining dapat diklasifikasikan
berdasarkan fungsi yang dilakukan atau berdasarkan jenis
aplikasi yang menggunakannya:
 Klasifikasi (supervised)
Pada persoalan klasifikasi, kita memiliki
sejumlah kasus (sampel data) dan ingin memprediksi
beberapa class yang ada pada sampel data tersebut.
Tiap instan data berisi banyak atribut, dimana
10
masing-masing atribut memiliki satu dari beberapa
kemungkinan nilai. Hanya satu atribut diantara
banyak atribut tersebut yang disebut dengan
atribut target, sedangkan atribut yang lain disebut
sebagai atribut prediktor. Tiap kemungkinan nilai
yang dimiliki oleh atribut target menunjukkan class
yang diprediksi berdasarkan nilai-nilai dari atribut
prediktor.
Klasifikasi digunakan untuk segmentasi customer,
pemodelan bisnis, analisa kartu kredit, dan banyak
aplikasi yang lain. Sebagai contoh, perusahaan kartu
kredit ingin memprediksi customer berdasarkan tipe
pembayaran.
 Clustering (unsupervised)
Clustering adalah teknik yang berguna untuk
mengeksplorasi data. Digunakan pada saat banyak
kasus dan tidak memiliki pengelompokan secara
alami. Dalam hal ini algoritma data mining dapat
digunakan untuk mencari pengelompokan yang ada
pada data.. Analisa Clustering mengidentifikasi
cluster yang ada pada data. Cluster adalah kumpulan
obyek data yang mirip satu sama lain. Metode
clustering yang bagus menghasilkan cluster yang
berkualitas untuk memastikan kesamaan pada
datadata yang ada dalam satu cluster. Clustering
model berbeda dari model pr ediktif dikarenakan
11
pada clustering tidak perlu ada atribut target.
Clustering yang diorganisasi ke dalam struktur
hirarkikal akan mendefinisikan taksonomi dari data.
Dalam ODM, suatu cluster dikarakterisasi oleh
centroid, attribute histograms, dan clustering model
hierarchical tree. ODM membentuk hierarchical
clustering dengan menggunakan versi perbaikan dari
algoritma k-means dan O-Cluster.
 Association Rules (unsupervised)
Fungsi Association Rules seringkali disebut
dengan "market basket analysis", yang digunakan
untuk menemukan relasi atau korelasi diantar a
himpunan item2. Fungsi ini paling banyak digunakan
untuk menganalisa data dalam rangka keperluan
strategi pemasaran, desain katalog, dan proses
pembuatan keputusan bisnis. Tipe association rule
bisa dinyatakan sebagai misal : "70% dari orangorang
yang membeli mie, juice dan saus akan membeli juga
roti tawar". Aturan asosiasi mengcapture item atau
kejadian dalam data berukuran besar yang berisi
data transaksi. Dengan kemajuan teknologi, data
penjualan dapat disimpan dalam jumlah besar yang
disebut dengan "basket data." Aturan asosiasi
yang didefinisikan pada basket data, digunakan
untuk keperluan promosi, desain katalog,
segmentasi customer dan target pemasaran.
12
 Attribute Importance (supervised)
Attribute Importance, disebut juga dengan
feature selection, menyediakan solusi otomatis
untuk meningkatkan kecepatan dan akurasi dari
model klasifikasi yang dibangun pada table data
yang memiliki jumlah atribut yang sangat banyak..
Attribute Importance meranking atribut prediktif
dengan melakukan eleminasi nilai yang redundant,
tidak
relevant atau tidak
informative dan
mengidentifikasi
atribut predictor yang banyak
paling berpengaruh dalam pengambilan keputusan.
Dengan menggunakan atribut yang lebih sedikit
akan mereduksi waktu untuk membangun suatu
model, juga dapat meningkatkan akurasi dari
kemampuan prediksi. Jika terlalu banyak atribut yang
dilibatkan maka akan banyak pula noise yang terlibat
yang akan berpengaruh terhadap model karena
dapat menurunkan performansi dan akurasi.
E. Contoh Kasus dan Pembahasan
Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang
dapat digunakan seperti transaksi kartu kredit, kartu anggota
13
club tertentu, kupon diskon, keluhan pembeli, ditambah
dengan studi tentang gaya hidup publik.
Beberapa solusi yang bisa diselesaikan dengan data mining
diantaranya:
• Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering)
dari model-model pembeli dan melakukan klasifikasi terhadap
setiap pembeli sesuai dengan karakteristik yang diinginkan
seperti kesukaan yang sama, tingkat penghasilan yang sama,
kebiasaan membeli dan karakteristik lainnya.
• Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli
seseorang dari waktu ke waktu. Sebagai contoh, ketika
seseorang menikah bisa saja dia kemudian memutuskan
pindah dari single account ke joint account (rekening
bersama) dan kemudian setelah itu pola beli-nya berbeda
dengan ketika dia masih bujangan.
• Cross-Market Analysis
dengan produk lainnya. Berikut ini saya sajikan beberapa
contoh:
 Cari pola penjualan Coca Cola sedemikian rupa
sehingga kita dapat mengetahui barang apa sajakah
14
yang harus kita sediakan untuk meningkatkan
penjualan Coca Cola?
 Cari pola penjualan IndoMie sedemikian rupa sehingga
kita dapat mengetahui barang apa saja yang juga dibeli
oleh pembeli IndoMie. Dengan demikian kita bisa
mengetahui dampak jika kita tidak lagi menjual
IndoMie.
• Profil Customer
Data mining dapat membantu Anda untuk melihat profil
customer/pembeli/nasabah sehingga kita dapat mengetahui
kelompok customer tertentu suka membeli produk apa saja.
• Identifikasi Kebutuhan Customer
Anda dapat mengidentifikasi produk-produk apa saja yang
terbaik untuk tiap kelompok customer dan menyusun faktorfaktor apa saja yang kira-kira dapat menarik customer baru
untuk bergabung/membeli.
• Informasi Summary
Anda juga dapat memanfaatkan data mining untuk membuat
laporan summary yang bersifat multi-dimensi dan dilengkapi
dengan informasi statistik lainnya.
Data Mining – Yang Bisa dan Tidak Bisa Dilakukan
Secara umum, data mining dapat melakukan dua hal yaitu :
15
 Memberikan kesempatan untuk menemukan
informasi menarik yang tidak terduga.
 Dapat menangani data berskala besar.
Dalam menemukan informasi yang menarik ini, ciri khas data
mining adalah kemampuan pencarian secara hampir otomatis.
Mengapa disebut hampir otomatis karena dalam banyak
teknik data mining ada beberapa parameter yang masih harus
ditentukan secara manual atau semi manual. Penelitian untuk
melakukan setting secara adaptif merupakan bidang yang
hangat diteliti. Data mining juga dapat memanfaatkan
pengalaman atau bahkan kesalahan di masa lalu untuk
meningkatkan kualitas dari model maupun hasil analisanya,
salah satunya dengan kemampuan pembelajaran yang dimiliki
beberapa teknik data mining seperti klasifikasi. Data Mining
juga memiliki kemampuan, diantaranya :
 Mampu menangani data dalam jumlah besar.
 Memungkinkan data mining untuk diterapkan
pada
masalah-masalah
kompleks
yang
ukurannya tidak dibatasi lagi oleh otak manusia.
 Selain itu penelitian tentang algoritma parallel
dari data mining juga membuka jalan agar data
mining dapat diterapkan pada program skala
yang lebih besar lagi.
Sebaliknya, disamping memiliki kemampuan ada beberapa hal
yang tidak bisa dilakukan oleh data mining, diantaranya :
16
 Perlu disadari bahwa data mining bukanlah solusi yang
cocok untuk setiap masalah. Ada banyak masalah yang
justru lebih baik diselesaikan dengan statistic yang
sederhana.
 Data mining juga tidak bisa menemukan pengetahuan
yang bermanfaat secara instan.
Beberapa hal yang perlu diperhatikan oleh seorang analis :
 Seorang analis data mining perlu tahu perbedaan,




kelebihan dan kekurangan dari teknik-teknik data
mining yang ada sebelumnya mengaplikasikan yang
paling cocok untuk masalah yang dihadapinya.
Ketika menjalankan teknik data mining itu sendiri, si
analis juga perlu mengarahkan programnya dengan
melakukan persiapan-persiapan dan pemilihan
parameternya.
Setelah data mining dilaksanakan pun si analis harus
melakukan evaluasi terhadap pola-pola yang dihasilkan
sebelumnya bisa merumuskan hasilnya.
Terakhir perlu diingat bahwa data mining tidak bisa
memberikan hasil yang bisa langsung digunakan.
Banyak hasil dari data mining yang tidak bisa langsung
diinterpretasikan dengan mudah.
Hal-hal ini juga disadari oleh perusahaan-perusahaan
yang menerapkan data mining dan OLAP, yang sering
dirangkum dalam istilah business intelligence (BI).
17
Untuk memecahkan masalah ini, mulai banyak
perusahaan yang membuat pusat untuk business
intelligence yang membantu karyawan biasa untuk
menggunakan piranti OLAP maupun data mining
dengan menyediakan pelatihan dan informasi praktis
pemakaian dan aplikasi hasilnya.
Langkah-langkah penerapan data warehouse
 Identifikasi system dan unit bisnis yang membutuhkan




integrasi data.
Menetapkan batasan data dan prioritas yang
dibutuhkan untuk putusan organisasional.
Menampilkan dan memutuskan berbagai alternative
teknologi basis data yang menerapkan konsep data
warehouse.
Merencanakan pemprosesan dan perancangan standar
prosedur operasional implementasi data warehouse
Penerapan teknologi dan produk data warehouse
Penerapan Data Warehouse di Perusahaan

Retailing dan sales, memprediksi penjualan, mencegah
pencuri dan kecurangan, dan menentukan level
inventori yang benar dan mendistribusikan jadwal
sepanjang outlet. Sebagai contoh, penjual seperti
18






AAFES menggunakan Fraud Watch dari Triversity untuk
melawan penipuan oleh pekerja di 1400 toko.
Banking. Level prediksi untuk peminjaman yang buruk
dan kecurangan dalam penggunaan kartu kredit,
prediksi pengeluaran kartu kredit oleh pelanggan yang
baru, dan menentukan jenis mana dari pelanggan yang
memberikan respon yang baik untuk menawarkan
peminjaman.
Manufacturing
dan
production,
memprediksi
kesalahan mesin, dan menemukan faktor kunci yang
dapat mengoptimasi kapasitas produksi.
Insurance. Memprediksi jumlah tagihan dan ongkon
kesehatan, mengklasifikasikan elemen yang paling
penting yang mempengaruhi jaminan kesehatan dan
memoprediksi pelanggan mana yang akan membeli
polis asuransi baru.
Policework. Menemukan pola kejahatan, lokasi, dan
perilaku tindak kejahatan; mengidentifikasi atribut
yang berguna untuk menyelesaikan masalah kriminal.
Healthcare. Korelasi demografis dari pasien yang
memiliki penyakit yang parah, dan memperluas
wawasan yang lebih baik tentang bagaimana
mengidentifikasi
dan
gejala
penyakit
dan
penyebabnya.
Marketing. Mengklasifikasikan demografis pelanggan
yang dapat digunakan untuk memprediksi pelanggan
19
mana yang akan merespon untuk pembelian produk
tertentu.
Analisa Perusahaan dan Manajemen Resiko





Perencanaan Keuangan dan Evaluasi Aset ,data Mining
dapat membantu untuk melakukan analisis dan
prediksi cash flow serta melakukan contingent claim
analysis untuk mengevaluasi aset. Selain itu juga dapat
menggunakannya untuk analisis trend.
Perencanaan Sumber Daya (Resource Planning)
,dengan melihat informasi ringkas (summary) serta
pola pembelanjaan dan pemasukan dari masingmasing resource, dapat memanfaatkannya untuk
melakukan resource planning.
Persaingan (Competition) Sekarang ini banyak
perusahaan yang berupaya untuk dapat melakukan
competitive intelligence. Data Mining dapat
membantu untuk memonitor pesaing-pesaing dan
melihat market direction mereka.
Dapat melakukan pengelompokan customer dan
memberikan variasi harga/layanan/bonus untuk
masing-masing grup.
Menyusun strategi penetapan harga di pasar yang
sangat kompetitif. Hal ini diterapkan oleh perusahaan
minyak REPSOL di Spanyol dalam menetapkan harga
jual gas di pasaran.
20
Contoh Perusahaan Yang Menerapkan Data Warehouse
1. Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data
warehouse dan data mining untuk melihat dari jutaan
transaksi yang masuk, transaksi mana sajakah yang
masih harus ditangani secara manual (dilayani oleh
orang), Tujuannya tidak lain adalah untuk menambah
layanan otomatis khusus untuk transaksi-transaksi
yang masih dilayani secara manual. Dengan demikian
jumlah operator penerima transaksi manual tetap bisa
ditekan minimal
2. Keuangan
Financial Crime Enforcement Network di Amerika
Serikat baru-baru ini menggunakan menggunakan data
minimng untuk menambang trilyunan daru berbagai
subjek seperti property, rekening bank dan transaksi
keuangan lainnya untuk mendeteksi transaksitransaksi keuangan yang mencurigakan seperti money
laundry. Mereka menyatakan bahwa hal tersebut akan
susah dilakukan jika menggunakan analisis standar
3. Asuransi
Australian Health Insurance Commision menggunakan
data mining untuk mengidentifikasi layanan kesehatan
yang sebenarnya tidak perlu tetapi tetap dilakukan
21
oleh peserta asuransi. Hasilnya? mereka berhasil
menghemat satu juta dollar pertahun.
4. Olahraga
IBM Advanced Scout menggunakan data mining untuk
menganalisis statistik permainan NBA (jumlah shots
blocked, assists dan fouls) dalam rangka mencapai
keunggulan bersaing (competitive advantage) untuk
tim New York Knick dan Miami Heat
5. Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena, California
dan Palomar Observartory berhasil menemukan 22
quasar dengan bantuan data mining. Hal ini
merupakan salah satu kesuksesan penerapan data
mining di bidang astronomi dan ilmu ruang angkasa
6. Internet Web Surf-Aid
IBM Surf-Aid menggunakan algoritma data mining
untuk mendata akses halaman web khususnya yang
berkaitan dengan pemasaran guna melihat prilaku dan
minat costumer serta melihat keefektifan pemasaran
melalui web.
7. Penerapan Data Warehouse Pada Perusahaan Berskala
Kecil
22
8. Karena
data warehouse sangat mahal, mereka
biasanya digunakan oleh perusahaan-perusahaan
besar. Beberapa perusahaan yang lebih kecil,
menggunakan data warehouse yang skala nya lebih
kecil, yang biasa disebut data mart. Data mart adalah
data warehouse yang kecil yang didesain untuk
kebutuhan pemakai akhir pada sebuah unit bisnis
strategi (SBU = Strategic Business Unit) atau
departemen. Dalam tahapan sebelumnya, data mart
jauh lebih murah dari pada data warehouse. Data mart
biasanya menghabiskan dana sampai $100,000,
bandingkan
dengan
data
warehouse
yang
menghabiskan $1 juta atau lebih. Ditambah lagi, data
mart dapat diimplementasikan lebih cepat, biasanya
kurang dari 90 hari. Hal ini dikarenakan data mart
hanya berisi lebih sedikit informasi dari pada data
warehouse, data mart juga memiliki respon yang lebih
cepat dan lebih mudah untuk dipelajari. Data mart
mendukung lebih ke lokal dari pada pengontrolan
terpusat oleh manajer suatu departemen. Data mart
juga memberikan hak kepada SBU untuk membuat
sebuah sistem pendukung keputusan tanpa
mengandalkan Data mart memfokuskan hanya pada
kebutuhan-kebutuhan pemakai yang terkait dalam
sebuah departemen atau fungsi bisnis. Data mart
biasanya tidak mengandung operasional yang rinci
23
seperti pada data warehouse. Data mart hanya
mengandung sedikit informasi dibandingkan dengan
data warehouse. Data mart lebih mudah dipahami dan
dinavigasi.
24
BAB III
PENUTUP
A. Kesimpulan
Pada proses Data Mining hal yang paling penting adalah
pada tahap “Data Mining” dengan menggunakan teknikteknik yang diaplikasikan untuk mengekstrak pola-pola
potensial yang berguna.
B. Saran
Berikut adalah saran yang mungkin perlu dilakukan dalam
pengembangan selanjutnya dimasa yang akan datang
terhadap aplikasi data mining dengan metode clustering:

Dimasa yang akan datang dalam pengembangan
selanjutnya, guna lebih memaksimalkan pendukung
keputusan yang akan diambil, misalkan untuk kepentingan
memudahkan kegiatan promosi bisa ditambahkan sebuah
fasilitas berupa fasilitah pengiriman email kepada customer

Dalam studi kasus ini, item yang digunakan sebagai
data proses dalam pembentuk sebuah cluster hanya
didasarkan pada satu item saja yaitu pembacaan frekuensi
id customer yang ada ditabel transaksi berdasarkan id
25
customer yang ada ditabel customer. Pada pengembangan
selanjutnya disarankan untuk pengambilan data proses
tidak hanya berdasarkan satu item saja, mungkin juga bisa
dilakukan dengan pembacaan lebih dari satu item.
Misalnya id barang ataupun total harga yang dibayarkan
untuk transaksinya, sehingga bisa diketahui barang apa saja
yang biasa dibeli customer pada sebuah klaster maupun
besarnya jumlah total harga yang dibayarkan oleh
customer terhadap transaksi yang dilakukannya. Dengan
demikian klaster yang dibentuk tidak hanya tiga klaster tapi
mungkin lebih dari pada itu dan informasi yang
didapatkanpun menjadi lebih banyak.
26
DAFTAR PUSTAKA
http://rezqiwati.wordpress.com/2009/04/24/datamining%E2%80%93-proses-tahapan-dan-penerapannya/
http://harsiti09.files.wordpress.com/2009/10/datawarehouse
-olap-dan-data-mining2.ppt
http://ligarsekarwangi.blogspot.com/2009/10/penerapandata-warehouse-pada.html
http://blog-wilsarbali.blogspot.com/2009/11/perlunya-datawarehouse-pada-perusahaan.html
https://datamining10041.wordpress.com/2012/03/11/contoh
-kasus-penerapan-data-mining/
27
Download