Business Intelligence Hendrik } } Fragmentasi sistem informasi secara vertical Menghasilkan pengembangan sistem operasional yang berbasis aplikasi (pengguna) Sales Planning Suppliers Num. Control Stock Mngmt Debt Mngmt Inventory ... ... ... Sales Administration Finance Manufacturing ... Integration System World Wide Web } } } Digital Libraries Scientific Databases Mengumpulkan dan menggabungkan informasi Menyediakan sudut pandang yang terintegrasi, antaramuka pengguna yang seragam Mendukung berbagi pakai Personal Databases } } Pendekatan Tradisional (Query-Driven/ Lazy/ ondemand approach) Pendekatan Warehousing Clients Integration System Metadata ... Wrapper Source Wrapper Wrapper Source ... Source } Kelemahan ◦ Delay saat pemrosesan query Sumber informasi yang lambat atau tidak tersedia Proses integrasi dan penyaringan data yang kompleks ◦ Untuk penggunaan yang sangat intens, berpotensi tidak efisien dan mahal ◦ Adanya kompetisi pemrosesan pada sumber data Clients ❖ ❖ Informasi terintegrasi di awal Tersimpan pada gudang data (WH) untuk query dan analisis langsung Data Warehouse Integration System Metadata ... Extractor/ Monitor Source Extractor/ Monitor Source Extractor/ Monitor ... Source } } Kinerja query yang tinggi Tidak saling mengganggu saat pemrosesan pada sumber data ◦ Query kompleks dilakukan pada DW ◦ OLTP dilakukan pada sumber informasi } Informasi digandakan pada DW } Banyak digunakan pada dunia industri ◦ Dapat digunakan untuk memodifikasi, mendokumentasi, merangkum dan merestruktutisasi data. ◦ Dapat menyimpan informasi historis } Pendekatan Query-driven tetap lebih baik dalam kasus ◦ Perubahan informasi yang sangat cepat ◦ Perubahan sumber informasi yang sangat cepat ◦ Klien dengan kebutuhan yang sulit diprediksi “A data warehouse is simply a single, complete, and consistent store of data obtained from a variety of sources and made available to end users in a way they can understand and use it in a business context.” -- Barry Devlin, IBM Consultant } } } } Berorientasi subjek Terintegrasi Runtun waktu (time series) Tak berubah (non volatile) } } } Data disimpan dan dikategorisasikan berdasarkan subjek bisnis. Data diorganisir sedemikian rupa sehingga semua elemen data berelasi dengan kejadian atau objek dunia nyata yang dihubungkan bersama Menyediakan pandangan menyeluruh terhadap data } } } Mengambil data dari berbagai sumber data Disajikan dalam format yang konsisten Menangani konflik nama dan satuan Savings Current accounts Loans OLTP Applications Customer Data Warehouse } } Digunakan untuk keperluan analisis trend, deviasi, peramalan, perbandingan, … Waktu: harian, mingguan, bulanan } Data tidak untuk diubah (read-only) Operational Warehouse Load Insert Update Delete Read Read First time load Warehouse Database Operational Database } Perubahan dianggap sebagai data baru Refresh Refresh Refresh Property Operational Data Warehouse Response Time Sub seconds to seconds Seconds to hours Operations DML Primarily read only Nature of Data 30-60 days Snapshots over time Applications Subject, time Small to large Large to very large Data Organization Size Data Source Activities Operational, Internal Processes Operational, Internal, External Analysis } } } } } } Meningkatkan produktivitas knowledge worker mendukung semua kebutuhan data pembuat keputusan Menyediakan akses ke data kritis yang senantiasa siap Memisahkan basisdata operasi dengan adhoc processing Menyediakan rangkuman informasi bagi level manajemen tingkat tinggi Menyediakan kemampuan drill-down } Organisasi yang …. ◦ Memiliki data pada berbagai macam sistem/aplikasi ◦ Menggunakan pendekatan manajemen berbasis informasi ◦ Besar, memiliki pelanggan dengan lokasi yang terpisah atau berbeda-beda ◦ Memiliki data yang sama namun dengen representasi yang berbeda pada berbagai sistem yang berbeda pula } } } } } Data detil kini Detil data lampau Data terangkum tingkat rendah Data terangkum tingkat tinggi Metadata ◦ Merupakan direktori terkait apa yang ada di DW, panduan pemetaan data dari data operasional ke bentuk DW, aturan yang digunakan untuk perangkuman (summarization) } Bagian dari DW yang berisi data yang relevan untuk fungsi bisnis tertentu (fokus pada 1 subjek) ◦ Dependent DM : Subset DW ◦ Independent DM: DW kecil (mis: untuk 1 departemen/unit bisnis) } Memerlukan detil data level rendah Data Warehouse Property Scope Subject Data Source Size(typical) Implementation time Data Warehouse Enterprise Multiple Many 100 GB to>1 TB Months to years Data Mart Data Mart Department Single-subject, LOB Few <100 GB Months Flat Files Operational Systems Marketing Marketing Sales Finance Human Resources Data Warehouse External Data Marketing Marketing Data Marts Flat Files Operational Systems Sale or Marketing External Data External Data Sources Visualisation Extract Clean Transform Load Metadata respository Refresh Operational Databases Data Warehouse Serves OLAP Data Mining } } } } Data Mart Centric Virtual Federated Hub-and-Spoke DW Enterprise DW } Plus ◦ Secara organisasi dan teknis mudah dibangun } Minus ◦ Tidak ada sudut pandang enterprise ◦ Redundansi biaya data ◦ Biaya ETL dan operasional tinggi } Plus ◦ Tidak perlu platform tersendiri } Minus ◦ ◦ ◦ ◦ Cocok hanya untuk volume rendah Kompleksitas tinggi Perlu bandwith besar Masalah pada metadata } Plus ◦ Kustomisasi UI dan laporan mudah } Minus ◦ ◦ ◦ ◦ Tantangan pada sudut pandang enterprise Redundan biaya data Biaya operasi tinggi Data terlambat } Plus ◦ Menyediakan sudut pandang enterprise ◦ Konsistensi data tinggi ◦ Data dapat dipakai ulang (reusable) } Minus ◦ Perlu visi, komitmen dan kepemimpinan enterprise } Inmon Model (pendekatan EDW) ◦ Top-Down ◦ Adaptasi dari basisdata relasional untuk keperluan enterprise } Kimball Model (pendekatan DM) ◦ Bottom-Up ◦ “Plan Big, Build Small”