BAB 1 PENDAHULUAN A. Latar Belakang Selama dua decade terakhir telah terjadi peningkatan yang dramatis terhadap jumlah informasi atau data yang disimpan secar a elektronis. Telah diperkirakan sebelumnya bahwa jumlah informasi di dunia akan berlipat ganda setiap 20 bulan dan jumlah ukuran basis data akan bertambah lebih cepat lagi dari itu. Teknologi database saat ini memungkinkan untuk menyimpan sejumlah data dalam jumlah yang sangat besar dan terakumulasi. Disinilah awal timbulnya persoalan ledakan data (jumlah data yang tiba-tiba begitu sangat besar). Data perlu disimpan, tapi yang lebih penting dari itu adalah proses penemuan pengetahuan (knowledge) dari data yang disimpan ! Oleh karenanya data yang tersimpan dalam sebuah gudang data yang disebut dengan data warehouses perlu dianalisa. Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diketahui secara umum bahwa informasi merupakan hal yang sangat penting dalam menunjang oper asi-operasi bisnis dan membantu para pengambil keputusan untuk mendapatkan gambaran lebih tentang bisnis mereka. Sistem manajemen basis data memberikan akses terhadap data namun hanya sebagian kecil 1 kontribusinya terhadap apa yang seharusnya dapat dihasilkan dari data-data itu. Sistem pemrosesan transaksi online (OLPT) tradisional sangat baik dalam menyimpan data secara cepat, aman, dan efisien ke dalam basis data namun tidak cukup baik dalam hal kemampuan melakukan analisa terhadap data-data yang ada, padahal analisa terhadap data memberikan pengetahuan lebih mendalam tentang bisnis yang dilakukan. Solusi untuk persoalan penemuan pengetahuan dalam database berukuran besar adalah dengan menggunakan Data warehousing dan data mining. Disinilah peran Data Mining akan memberikan konstribusi besar bagi setiap perusahaan yang mengimplementasikannya. B. Tujuan 1. 2. 3. Untuk memenuhi tugas mata kuliah Sistem Manajemen Basis Data. Untuk mengetahui lebih luas tentang Data Mining. Untuk menambah pengetahuan. C. Rumusan Masalah 1. 2. 3. Apa yang dimaksud dengan Data Mining ? Apa fungsi dan tujuan dari Data Mining ? Bagaimana penerapan Data Mining kehidupan? dalam 2 BAB II PEMBAHASAN A. Pengertian data Mining Ada beberapa definisi dari Data mining. Secara umum data mining dapat didefinisikan sebagai berikut : • Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar. Merupakan evolusi alami dari teknologi database, dan merupakan metode yang paling banyak dibutuhkan, dengan aplikasi yang sangat luas. • Ekstraksi dari suatu menarik (non-trivial, diketahui, potensial pengetahuan dari data besar. informasi yang berguna atau implisit, sebelumnya belum kegunaannya) pola atau yang disimpan dalam jumlah • Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti.Pada dasarnya data mining berhubungan erat dengan analisa data dan penggunaan perangkat lunak untuk mencari pola dan kesamaan dalam sekumpulan data. Ide dasarnya sangat menggali sumber yang berharga dari tempat yang sama sekali tidak diduga seperti perangkat 3 lunak data mining mengekstrasi pola yang sebelumnya tidak terlihat atau tigak begitu jelas sehingga tidak seorang pun yang memperhatikan sebeumnya. Analisa data mining berjalan pada data yang cenderung terus membesar dan teknik terbaik yang digunakan kemudian beorientasi kepada data beukur an sangat besar untuk mendapatkn kesimpulan dan keputusan paling layak. Data mining memiliki beberapa sebutan atau nama lain yaitu : Knowledge discovery (mining) in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola, kecerdasan bisnis (business intelligence), dll. Meskipun sebagian besar teknik data mining seperti yang akan dijelaskan pada bagian- lain laporan tugas akhir ini sudah ada sejak lama, namun hanya pada beberapa tahun terakhir ini data mining benar-benar berperan yaitu sejak dilakukan komersialisasi data mining. Beberapa faktor yang mendukung perlunya dilakukan data mining adalah : 1. Data telah mencapai jumlah dan ukuran yang sangat besar Hasil dan proses data mining merupakan suatu informasi yang akan mendasari tindakan tertentu sehingga tingkat kebenaran informasi tersebut menjadi sangat signifikan, dan makin besar serta makin banyak data yang digunakan maka 4 akan semakin valid hasilnya. Perkembangan data dalam hal jumlah dan ukuran telah mencapai kecepatan yang sangat cepat, sehingga ukuran basis data yang dimiliki oleh sebuah perusahaan bisa mencapai kisaran gigabyte atau bahkan terabyte. 2. Telah dilakukan proses data warehousing Untuk mencapai hasil yang memuaskan, maka sumber data yang digunakan dalam proses data mining seringkali merupakan data gabungan dari banyak departemen, daerah operasi bahkan dari sumbersumber lain seper ti data kependudukan. Oleh karena itu maka disarankan perlunya proses data warehousing untuk menjaga konsistensi, memberikan prespektif yang lebih baik terhadap data dan menjaga integritas data. 3. Kemampuan Komputasi yang semakin terjangkau Pada dasarnya proses data mining melakukan banyak akses terhadap data yang sangat besar. Selain itu juga melakukan proses komputasi yang membutuhkan sumber daya sangat besar. Penurunan harga yang cukup cepat terhadap perangkat keras computer serta semakin tingginya kinerja yang berhasil dicapai oleh perangkat computer maupun teknologi pengolahan data seperti teknologi pararel proses saat ini, menjadikan proses saat ini, menjadikan proses data 5 mining suduh cukup layak untuk dilakukan secara komersial. 4. Persaingan bisnis yang semakin ketat Tekanan persaingan bisnis yang semakin ketat mendorong perusahaan- perusahaan untuk selalu berinovasi agar mampu meningkatkan daya saingnya dipasar global. Beberapa tren yang berkembang saat ini adalah a. Setiap bisnis adalah bisnis pelayanan b. Adanya fenomena kustomisasi produk oleh masyarakat c. Informasi adalah produk B. Model dalam Data Mining Terdapat dua tipe atau mode operasi yang bisa digunakan untuk mencari informasi yang dibutuhkan user lewat proses data mining, yaitu model verifikasi dan knowledge discover y. Model verifikasi menggunakan pendekatan top down dengan mengambil hipotesa dari user dan memeriksa validitasnya dengan data sehingga bisa dibuktikan kebenaran hipotesa tersebut. Model Knowledge Discovery menggunakan pendekatan bottom up untuk mendapatkan informasi yang sebelumnya tidak diketahui. Model ini terbagi menjadi dua directed knowledge discovery dan undirected knowledge discovery. Pada 6 directed knowledge discovery data mining akan mencoba mencari penjelasan nilai target field tertentu (seperti penghasilan, respons, usia, dan lain-lain) terhadap field-field yang lain. Sedangkan pada undirected knowledge discovery tidak ada target field karena komputer akan mencari pola yang ada pada data. Jadi undirected knowledge discovery digunakan untuk mengenali hubungan / relasi yang ada pada data sedangkan directed knowledge discovery akan menjelaskan hubungan / relasi tersebut. C. Tahapan Proses Dalam Data Minning Ada beberapa tahapan proses dalam data mining. Diagram dibawah menggambarkan beberapa tahap / proses yang berlangsung dalam data mining. Fase awal dimulai dari data sumber dan berakhir dengan adanya informasi yang dihasilkan dari bebrapa tahapan, yaitu : Gambar 1.1 Fase-fase Dalam Data Mining 7 Tahapan proses dalam Data Mining dapat dijelaskan sebagai berikut : 1. Seleksi Data Pemilihan (seleksi) data daru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional. 2. Pre-processing/ Cleaning ( pemilihan data ) Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. 3. Transformasi Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses 8 kreatif dan sangat tergantung pada jenis informasi yang akan dicari dalam basis data atau pola 4. Data mining Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. 5. Interpretasi / Evaluasi Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Proses KDD secara garis besar memang terdiri dari 5 tahap seperti yang telah dijelaskan sebelumnya. Akan tetapi, dalam proses KDD yang sesungguhnya, dapat saja terjadi iterasi atau pengulangan pada tahap tahap 9 tertentu. Pada setiap tahap dalam proses KDD, seorang analis dapat saja kembali ke tahap sebelumnya. Sebagai contoh, pada saat coding atau data mining, analis menyadari proses cleaning belum dilakukan dengan sempurna, atau mungkin saja analis menemukan data atau informasi baru untuk “memperkaya” data yang sudah ada. D. Metode Data Minning Data mining model dibuat berdasarkan salah satu dari dua jenis pembelajaran supervised dan unsupervised. Fungsi pembelajaran Supervised digunakan untuk memprediksi suatu nilai. Fungsi pembelajaran Unsupervised digunakan untuk mencari struktur intrinsik, relasi dalam suatu data yang tidak memerlukan class atau label sebelum dilakukan proses pembelajaran. Contoh dari algoritma pembelajaran unsupervised, diantaranya k-means clustering dan Apriori association rules. Contoh dari algoritma pembelajaran supervised yaitu NaiveBayes untuk klasifikasi. Metode data mining dapat diklasifikasikan berdasarkan fungsi yang dilakukan atau berdasarkan jenis aplikasi yang menggunakannya: Klasifikasi (supervised) Pada persoalan klasifikasi, kita memiliki sejumlah kasus (sampel data) dan ingin memprediksi beberapa class yang ada pada sampel data tersebut. Tiap instan data berisi banyak atribut, dimana 10 masing-masing atribut memiliki satu dari beberapa kemungkinan nilai. Hanya satu atribut diantara banyak atribut tersebut yang disebut dengan atribut target, sedangkan atribut yang lain disebut sebagai atribut prediktor. Tiap kemungkinan nilai yang dimiliki oleh atribut target menunjukkan class yang diprediksi berdasarkan nilai-nilai dari atribut prediktor. Klasifikasi digunakan untuk segmentasi customer, pemodelan bisnis, analisa kartu kredit, dan banyak aplikasi yang lain. Sebagai contoh, perusahaan kartu kredit ingin memprediksi customer berdasarkan tipe pembayaran. Clustering (unsupervised) Clustering adalah teknik yang berguna untuk mengeksplorasi data. Digunakan pada saat banyak kasus dan tidak memiliki pengelompokan secara alami. Dalam hal ini algoritma data mining dapat digunakan untuk mencari pengelompokan yang ada pada data.. Analisa Clustering mengidentifikasi cluster yang ada pada data. Cluster adalah kumpulan obyek data yang mirip satu sama lain. Metode clustering yang bagus menghasilkan cluster yang berkualitas untuk memastikan kesamaan pada datadata yang ada dalam satu cluster. Clustering model berbeda dari model pr ediktif dikarenakan 11 pada clustering tidak perlu ada atribut target. Clustering yang diorganisasi ke dalam struktur hirarkikal akan mendefinisikan taksonomi dari data. Dalam ODM, suatu cluster dikarakterisasi oleh centroid, attribute histograms, dan clustering model hierarchical tree. ODM membentuk hierarchical clustering dengan menggunakan versi perbaikan dari algoritma k-means dan O-Cluster. Association Rules (unsupervised) Fungsi Association Rules seringkali disebut dengan "market basket analysis", yang digunakan untuk menemukan relasi atau korelasi diantar a himpunan item2. Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan bisnis. Tipe association rule bisa dinyatakan sebagai misal : "70% dari orangorang yang membeli mie, juice dan saus akan membeli juga roti tawar". Aturan asosiasi mengcapture item atau kejadian dalam data berukuran besar yang berisi data transaksi. Dengan kemajuan teknologi, data penjualan dapat disimpan dalam jumlah besar yang disebut dengan "basket data." Aturan asosiasi yang didefinisikan pada basket data, digunakan untuk keperluan promosi, desain katalog, segmentasi customer dan target pemasaran. 12 Attribute Importance (supervised) Attribute Importance, disebut juga dengan feature selection, menyediakan solusi otomatis untuk meningkatkan kecepatan dan akurasi dari model klasifikasi yang dibangun pada table data yang memiliki jumlah atribut yang sangat banyak.. Attribute Importance meranking atribut prediktif dengan melakukan eleminasi nilai yang redundant, tidak relevant atau tidak informative dan mengidentifikasi atribut predictor yang banyak paling berpengaruh dalam pengambilan keputusan. Dengan menggunakan atribut yang lebih sedikit akan mereduksi waktu untuk membangun suatu model, juga dapat meningkatkan akurasi dari kemampuan prediksi. Jika terlalu banyak atribut yang dilibatkan maka akan banyak pula noise yang terlibat yang akan berpengaruh terhadap model karena dapat menurunkan performansi dan akurasi. E. Contoh Kasus dan Pembahasan Analisa Pasar dan Manajemen Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota 13 club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik. Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya: • Menembak target pasar Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya. • Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan. • Cross-Market Analysis dengan produk lainnya. Berikut ini saya sajikan beberapa contoh: Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat mengetahui barang apa sajakah 14 yang harus kita sediakan untuk meningkatkan penjualan Coca Cola? Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat mengetahui barang apa saja yang juga dibeli oleh pembeli IndoMie. Dengan demikian kita bisa mengetahui dampak jika kita tidak lagi menjual IndoMie. • Profil Customer Data mining dapat membantu Anda untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja. • Identifikasi Kebutuhan Customer Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktorfaktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung/membeli. • Informasi Summary Anda juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-dimensi dan dilengkapi dengan informasi statistik lainnya. Data Mining – Yang Bisa dan Tidak Bisa Dilakukan Secara umum, data mining dapat melakukan dua hal yaitu : 15 Memberikan kesempatan untuk menemukan informasi menarik yang tidak terduga. Dapat menangani data berskala besar. Dalam menemukan informasi yang menarik ini, ciri khas data mining adalah kemampuan pencarian secara hampir otomatis. Mengapa disebut hampir otomatis karena dalam banyak teknik data mining ada beberapa parameter yang masih harus ditentukan secara manual atau semi manual. Penelitian untuk melakukan setting secara adaptif merupakan bidang yang hangat diteliti. Data mining juga dapat memanfaatkan pengalaman atau bahkan kesalahan di masa lalu untuk meningkatkan kualitas dari model maupun hasil analisanya, salah satunya dengan kemampuan pembelajaran yang dimiliki beberapa teknik data mining seperti klasifikasi. Data Mining juga memiliki kemampuan, diantaranya : Mampu menangani data dalam jumlah besar. Memungkinkan data mining untuk diterapkan pada masalah-masalah kompleks yang ukurannya tidak dibatasi lagi oleh otak manusia. Selain itu penelitian tentang algoritma parallel dari data mining juga membuka jalan agar data mining dapat diterapkan pada program skala yang lebih besar lagi. Sebaliknya, disamping memiliki kemampuan ada beberapa hal yang tidak bisa dilakukan oleh data mining, diantaranya : 16 Perlu disadari bahwa data mining bukanlah solusi yang cocok untuk setiap masalah. Ada banyak masalah yang justru lebih baik diselesaikan dengan statistic yang sederhana. Data mining juga tidak bisa menemukan pengetahuan yang bermanfaat secara instan. Beberapa hal yang perlu diperhatikan oleh seorang analis : Seorang analis data mining perlu tahu perbedaan, kelebihan dan kekurangan dari teknik-teknik data mining yang ada sebelumnya mengaplikasikan yang paling cocok untuk masalah yang dihadapinya. Ketika menjalankan teknik data mining itu sendiri, si analis juga perlu mengarahkan programnya dengan melakukan persiapan-persiapan dan pemilihan parameternya. Setelah data mining dilaksanakan pun si analis harus melakukan evaluasi terhadap pola-pola yang dihasilkan sebelumnya bisa merumuskan hasilnya. Terakhir perlu diingat bahwa data mining tidak bisa memberikan hasil yang bisa langsung digunakan. Banyak hasil dari data mining yang tidak bisa langsung diinterpretasikan dengan mudah. Hal-hal ini juga disadari oleh perusahaan-perusahaan yang menerapkan data mining dan OLAP, yang sering dirangkum dalam istilah business intelligence (BI). 17 Untuk memecahkan masalah ini, mulai banyak perusahaan yang membuat pusat untuk business intelligence yang membantu karyawan biasa untuk menggunakan piranti OLAP maupun data mining dengan menyediakan pelatihan dan informasi praktis pemakaian dan aplikasi hasilnya. Langkah-langkah penerapan data warehouse Identifikasi system dan unit bisnis yang membutuhkan integrasi data. Menetapkan batasan data dan prioritas yang dibutuhkan untuk putusan organisasional. Menampilkan dan memutuskan berbagai alternative teknologi basis data yang menerapkan konsep data warehouse. Merencanakan pemprosesan dan perancangan standar prosedur operasional implementasi data warehouse Penerapan teknologi dan produk data warehouse Penerapan Data Warehouse di Perusahaan Retailing dan sales, memprediksi penjualan, mencegah pencuri dan kecurangan, dan menentukan level inventori yang benar dan mendistribusikan jadwal sepanjang outlet. Sebagai contoh, penjual seperti 18 AAFES menggunakan Fraud Watch dari Triversity untuk melawan penipuan oleh pekerja di 1400 toko. Banking. Level prediksi untuk peminjaman yang buruk dan kecurangan dalam penggunaan kartu kredit, prediksi pengeluaran kartu kredit oleh pelanggan yang baru, dan menentukan jenis mana dari pelanggan yang memberikan respon yang baik untuk menawarkan peminjaman. Manufacturing dan production, memprediksi kesalahan mesin, dan menemukan faktor kunci yang dapat mengoptimasi kapasitas produksi. Insurance. Memprediksi jumlah tagihan dan ongkon kesehatan, mengklasifikasikan elemen yang paling penting yang mempengaruhi jaminan kesehatan dan memoprediksi pelanggan mana yang akan membeli polis asuransi baru. Policework. Menemukan pola kejahatan, lokasi, dan perilaku tindak kejahatan; mengidentifikasi atribut yang berguna untuk menyelesaikan masalah kriminal. Healthcare. Korelasi demografis dari pasien yang memiliki penyakit yang parah, dan memperluas wawasan yang lebih baik tentang bagaimana mengidentifikasi dan gejala penyakit dan penyebabnya. Marketing. Mengklasifikasikan demografis pelanggan yang dapat digunakan untuk memprediksi pelanggan 19 mana yang akan merespon untuk pembelian produk tertentu. Analisa Perusahaan dan Manajemen Resiko Perencanaan Keuangan dan Evaluasi Aset ,data Mining dapat membantu untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu juga dapat menggunakannya untuk analisis trend. Perencanaan Sumber Daya (Resource Planning) ,dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari masingmasing resource, dapat memanfaatkannya untuk melakukan resource planning. Persaingan (Competition) Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive intelligence. Data Mining dapat membantu untuk memonitor pesaing-pesaing dan melihat market direction mereka. Dapat melakukan pengelompokan customer dan memberikan variasi harga/layanan/bonus untuk masing-masing grup. Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di pasaran. 20 Contoh Perusahaan Yang Menerapkan Data Warehouse 1. Telekomunikasi Sebuah perusahaan telekomunikasi menerapkan data warehouse dan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual (dilayani oleh orang), Tujuannya tidak lain adalah untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara manual. Dengan demikian jumlah operator penerima transaksi manual tetap bisa ditekan minimal 2. Keuangan Financial Crime Enforcement Network di Amerika Serikat baru-baru ini menggunakan menggunakan data minimng untuk menambang trilyunan daru berbagai subjek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksitransaksi keuangan yang mencurigakan seperti money laundry. Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis standar 3. Asuransi Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan 21 oleh peserta asuransi. Hasilnya? mereka berhasil menghemat satu juta dollar pertahun. 4. Olahraga IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knick dan Miami Heat 5. Astronomi Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observartory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa 6. Internet Web Surf-Aid IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat costumer serta melihat keefektifan pemasaran melalui web. 7. Penerapan Data Warehouse Pada Perusahaan Berskala Kecil 22 8. Karena data warehouse sangat mahal, mereka biasanya digunakan oleh perusahaan-perusahaan besar. Beberapa perusahaan yang lebih kecil, menggunakan data warehouse yang skala nya lebih kecil, yang biasa disebut data mart. Data mart adalah data warehouse yang kecil yang didesain untuk kebutuhan pemakai akhir pada sebuah unit bisnis strategi (SBU = Strategic Business Unit) atau departemen. Dalam tahapan sebelumnya, data mart jauh lebih murah dari pada data warehouse. Data mart biasanya menghabiskan dana sampai $100,000, bandingkan dengan data warehouse yang menghabiskan $1 juta atau lebih. Ditambah lagi, data mart dapat diimplementasikan lebih cepat, biasanya kurang dari 90 hari. Hal ini dikarenakan data mart hanya berisi lebih sedikit informasi dari pada data warehouse, data mart juga memiliki respon yang lebih cepat dan lebih mudah untuk dipelajari. Data mart mendukung lebih ke lokal dari pada pengontrolan terpusat oleh manajer suatu departemen. Data mart juga memberikan hak kepada SBU untuk membuat sebuah sistem pendukung keputusan tanpa mengandalkan Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis. Data mart biasanya tidak mengandung operasional yang rinci 23 seperti pada data warehouse. Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami dan dinavigasi. 24 BAB III PENUTUP A. Kesimpulan Pada proses Data Mining hal yang paling penting adalah pada tahap “Data Mining” dengan menggunakan teknikteknik yang diaplikasikan untuk mengekstrak pola-pola potensial yang berguna. B. Saran Berikut adalah saran yang mungkin perlu dilakukan dalam pengembangan selanjutnya dimasa yang akan datang terhadap aplikasi data mining dengan metode clustering: Dimasa yang akan datang dalam pengembangan selanjutnya, guna lebih memaksimalkan pendukung keputusan yang akan diambil, misalkan untuk kepentingan memudahkan kegiatan promosi bisa ditambahkan sebuah fasilitas berupa fasilitah pengiriman email kepada customer Dalam studi kasus ini, item yang digunakan sebagai data proses dalam pembentuk sebuah cluster hanya didasarkan pada satu item saja yaitu pembacaan frekuensi id customer yang ada ditabel transaksi berdasarkan id 25 customer yang ada ditabel customer. Pada pengembangan selanjutnya disarankan untuk pengambilan data proses tidak hanya berdasarkan satu item saja, mungkin juga bisa dilakukan dengan pembacaan lebih dari satu item. Misalnya id barang ataupun total harga yang dibayarkan untuk transaksinya, sehingga bisa diketahui barang apa saja yang biasa dibeli customer pada sebuah klaster maupun besarnya jumlah total harga yang dibayarkan oleh customer terhadap transaksi yang dilakukannya. Dengan demikian klaster yang dibentuk tidak hanya tiga klaster tapi mungkin lebih dari pada itu dan informasi yang didapatkanpun menjadi lebih banyak. 26 DAFTAR PUSTAKA http://rezqiwati.wordpress.com/2009/04/24/datamining%E2%80%93-proses-tahapan-dan-penerapannya/ http://harsiti09.files.wordpress.com/2009/10/datawarehouse -olap-dan-data-mining2.ppt http://ligarsekarwangi.blogspot.com/2009/10/penerapandata-warehouse-pada.html http://blog-wilsarbali.blogspot.com/2009/11/perlunya-datawarehouse-pada-perusahaan.html https://datamining10041.wordpress.com/2012/03/11/contoh -kasus-penerapan-data-mining/ 27