Perkembangan data mining (DM) yang pesat

advertisement
ABSTRAK
Perkembangan data mining (DM) yang pesat tidak dapat lepas dari perkembangan
teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi
sejalan dengan pertumbuhan teknologi informasi. Mining berarti usaha untuk
mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Olehnya
itu, data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan
buatan (artificial intelligent), machine learning, statistik dan database.
Data Mining (DM) sendiri adalah serangkaian proses untuk menggali nilai tambah
berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu
kumpulan data. Seorang analis menerapkan tahapan-tahapan data mining tersebut.
Sebagai prasyarat penerapan data mining, diperlukan pemahaman terhadap data
dan proses diperolehnya data tersebut. Yang lebih mendasar lagi adalah
diperlukannya pemahaman mengapa menerapkan data mining dan target yang
ingin dicapai. Sehingga secara garis besar sudah ada hipotesa mengenai aksi-aksi
yang dapat diterapkan dari hasilnya nanti. Penulis juga mencoba merangkum
perkembangan terakhir dari teknik-teknik DM beserta implikasinya di dunia bisnis.
BAB I
PENDAHULUAN
1. Latar Belakang
Perkembangan data mining (DM) yang pesat tidak dapat lepas dari
perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar
terakumulasi. Sebagai contoh, toko swalayan merekam setiap penjualan barang
dengan memakai alat POS (point of sales). Database data penjualan tsb bisa
mencapai beberapa GB setiap harinya untuk sebuah jaringan toko swalayan
berskala nasional. Perkembangan internet juga punya andil cukup besar dalam
akumulasi data. Tetapi pertumbuhan yang pesat dari akumulasi data itu telah
menciptakan kondisi yang sering disebut sebagai “rich of data but poor of
information” karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi
yang berguna.
Kata ‘mining’ sendiri berarti usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki
akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent),
machine learning, statistik dan database. Beberapa teknik yang sering disebutsebut dalam literatur DM antara lain: clustering, classification, association rule
mining, neural network, genetic algorithm dan lain-lain. Yang membedakan
persepsi terhadap DM adalah perkembangan teknik-teknik DM untuk aplikasi pada
database skala besar yang ternyata penerapan pada data berskala besar
memberikan tantangan-tantangan baru yang akhirnya memunculkan metodologi
baru. Sebelum populernya data mining, teknik-teknik tersebut hanya dapat dipakai
untuk data skala kecil saja.
Bermula dari penerapan di dunia bisnis, sekarang ini data mining juga
diterapkan pada bidang-bidang lain yang memerlukan analisa data berskala besar
seperti bioinformasi dan pertahanan Negara.
2. Tujuan
a. Untuk memenuhi tugas mata kuliah Bussiness Intelegence.
b. Untuk menambah pengetahuan tentang Data Mining.
3. Rumusan Masalah
a. Apa yang dimaksud dengan Data Mining ?
b. Apa konsep dari Data Mining ?
c. Bagaimana pengaplikasian Data Mining?
BAB II
PEMBAHASAN
1. Pengertian Data Mining
Data Mining adalah suatu istilah yang digunakan untuk menguraikan penemuan
pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik
statistik,
matematika,
kecerdasan
buatan
dan
machine
learning
untuk
mengekstraksidan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang
terakit dariberbagai database besar (Turban, dkk., 2005)
Menurut Gatner Group data mining adalah suatu proses menemukan hubungan yang
berarti, pola dan kecenderungan dengan memeriksa dalam sekumpulan besar datayang
tersimpan dalam penyimpanan, dengan menggunakan teknik pengenalan polaseperti teknik
statistik dan matematika (Larose,2005).
“Data mining adalah analisa otomatis dari data yang berjumlah besar atau kompleksdengan
tujuan untuk menemukan pola atau kecenderungan yang penting yangbiasanya tidak disadari
keberadaannya” (Pramudiono, 2006)
2. Konsep Data Mining
Sebagai salah satu bagian dari sistem informasi, data mining menyediakan
perencanaan dari ide hingga implementasi akhir. Komponen-komponen dari
rencana data mining adalah sebagai berikut.
1. Analisa Masalah (Analyzing the Problem)
Data asal atau data sumber harus bisa ditaksir untuk dilihat apakah data
tersebut memenuhi kriteria data mining.
Kualitas kelimpahan data adalah faktor utama untuk memutuskan
apakah data tersebut cocok dan tersedia sebagau tambahan. Hasil yang
diharapkan dari dampak data mining harus dengan hati-hati dimengerti dan
dipastikan bahwa data yang diperlukan membawa informasi yang bisa
diekstrak.
2. Mengekstrak dan Membersihkan Data (Extracting dan Cleansing The Data)
Data pertama kli diekstrak dari data aslinya, seperti dari OLTP basis data,
text file, Microsoft Acces Database, dan bahkan dari spreadsheet, lalu data
tersebut diletakan dalam data warehouse yang mempunyai sruktur yang
sesuai dengan data model secara khas.
Data Transformation Service (DTS) dipakai untuk mengekstrak dan
membersihkan data dari tidak konsistennya dan tidak kompatibelnya
dengan format yang sesuai.
3. Validitas Data (Validating the Data)
Sekali data telah diekstrak dan dibersihkan, ini adalh latihan yang bagus
untuk menelusuri model yang telah kita ciptakan untuk memastikan bahwa
semua data yang ada adalah data sekarang dan tetap.
4. Membuat dan Melatih Model (Creatig and Training the Model)
Ketika algoritma diterapkan pada model, struktur telah dibangun. Hal ini
sangatlah penting pada saat ini untuk melihat data yang telah dibangun
untuk memastikan bahwa data tersebut menyerupai fakta di dalam data
sumber.
5. Query Data dari Model Data Mining (Querying the Model Data)
Ketika model yang telah cocok diciptakan dan dibangun, data yang telah
dibuat tersedia untuk mendukung keputusan. Hal ini biasanya melibatkan
penulisan front end query aplikasi dengan program aplikasi/suatu program
basis data.
6. Evaluasi Validitaas dari Mining Model (Maintaining the Validity of the Data
Mining Model)
Setelah moddel data mining terkumpul, lewat bebrapa waktu,
karakteristik data awal seperti granularitas dan validitas mungkin berubah.
Karena model data mining dapat terus berubah seiring perkembangan
waktu.
3. Pengaplikasian
Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan
seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon,
keluhan pembeli, ditambah dengan studi tentang gaya hidup publik. Beberapa
solusi yang bisa diselesaikan dengan data mining diantaranya:
1.
Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari modelmodel pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai
dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat
penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.
2.
Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu
ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia
kemudian memutuskan pindah dari single account ke joint account
(rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan
ketika dia masih bujangan.
3.
Cross-Market Analysis
Dengan produk lainnya. Berikut ini beberapa contoh:
1.
Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat
mengetahui barang apa sajakah yang harus kita sediakan untuk
meningkatkan penjualan Coca Cola?
2.
Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat
mengetahui barang apa saja yang juga dibeli oleh pembeli IndoMie.
Dengan demikian kita bisa mengetahui dampak jika kita tidak lagi
menjual IndoMie.
3.
4.
Cari pola penjualan
Profil Customer
Data
mining
dapat
membantu
untuk
melihat
profil
customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok
customer tertentu suka membeli produk apa saja.
5.
Identifikasi Kebutuhan Customer
Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap
kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira
dapat menarik customer baru untuk bergabung/membeli.
6.
Menilai Loyalitas Customer
VISA International Spanyol menggunakan data mining untuk melihat
kesuksesan program-program customer loyalty mereka
7.
Informasi Summary
memanfaatkan data mining untuk membuat laporan summary yang bersifat
multi-dimensi dan dilengkapi dengan informasi statistik lainnya.
BAB III
PENUTUP
Kesimpulan
1. Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual, juga diartikan sebagai analisa otomatis dari data yang berjumlah besar
atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan
yang penting yang biasanya tidak disadari keberadaannya
2. Disamping memiliki kemampuan, data mining juga memiliki keterbatasan yang
tidak bisa dilakukannya.
3. Salah satu tuntutan dari data mining ketika diterapkan pada data berskala
besar adalah diperlukan metodologi sistematis tidak hanya ketika melakukan
analisa saja tetapi juga ketika mempersiapkan data dan juga melakukan
interpretasi dari hasilnya sehingga dapat menjadi aksi ataupun keputusan yang
bermanfaat. Karenanya data mining seharusnya dipahami sebagai suatu
proses, yang memiliki tahapan-tahapan tertentu dan juga ada umpan balik dari
setiap tahapan ke tahapan sebelumnya.
DAFTAR PUSTAKA
Indrajani,S.Kom.,MM.(2011).Pengantar
dan
Sistem
Basis
Data.PT
Elex
Komputindo,Jakarta.
Kusrini dan Luthfi, E. T., 2009, Algoritma Data Mining, Andi Offset, Yogyakarta
https://id.wikipedia.org/wiki/Penggalian_data
Media
Download