Business Intelligence

advertisement
Business Intelligence
Hendrik
}
}
Fragmentasi sistem informasi secara vertical
Menghasilkan pengembangan sistem
operasional yang berbasis aplikasi (pengguna)
Sales Planning
Suppliers
Num. Control
Stock Mngmt
Debt Mngmt
Inventory
...
...
...
Sales Administration
Finance
Manufacturing
...
Integration System
World
Wide
Web
}
}
}
Digital Libraries
Scientific Databases
Mengumpulkan dan menggabungkan informasi
Menyediakan sudut pandang yang terintegrasi,
antaramuka pengguna yang seragam
Mendukung berbagi pakai
Personal
Databases
}
}
Pendekatan Tradisional (Query-Driven/ Lazy/ ondemand approach)
Pendekatan Warehousing
Clients
Integration System
Metadata
...
Wrapper
Source
Wrapper
Wrapper
Source
...
Source
}
Kelemahan
◦ Delay saat pemrosesan query
– Sumber informasi yang lambat atau tidak tersedia
– Proses integrasi dan penyaringan data yang kompleks
◦ Untuk penggunaan yang sangat intens, berpotensi
tidak efisien dan mahal
◦ Adanya kompetisi pemrosesan pada sumber data
Clients
❖
❖
Informasi terintegrasi
di awal
Tersimpan pada
gudang data (WH)
untuk query dan
analisis langsung
Data
Warehouse
Integration System
Metadata
...
Extractor/
Monitor
Source
Extractor/
Monitor
Source
Extractor/
Monitor
...
Source
}
}
Kinerja query yang tinggi
Tidak saling mengganggu saat pemrosesan
pada sumber data
◦ Query kompleks dilakukan pada DW
◦ OLTP dilakukan pada sumber informasi
}
Informasi digandakan pada DW
}
Banyak digunakan pada dunia industri
◦ Dapat digunakan untuk memodifikasi,
mendokumentasi, merangkum dan
merestruktutisasi data.
◦ Dapat menyimpan informasi historis
}
Pendekatan Query-driven tetap lebih baik
dalam kasus
◦ Perubahan informasi yang sangat cepat
◦ Perubahan sumber informasi yang sangat cepat
◦ Klien dengan kebutuhan yang sulit diprediksi
“A data warehouse is simply a single, complete,
and consistent store of data obtained from a
variety of sources and made available to end
users in a way they can understand and use it
in a business context.”
-- Barry Devlin, IBM Consultant
}
}
}
}
Berorientasi subjek
Terintegrasi
Runtun waktu (time series)
Tak berubah (non volatile)
}
}
}
Data disimpan dan dikategorisasikan
berdasarkan subjek bisnis.
Data diorganisir sedemikian rupa sehingga
semua elemen data berelasi dengan kejadian
atau objek dunia nyata yang dihubungkan
bersama
Menyediakan pandangan menyeluruh
terhadap data
}
}
}
Mengambil data dari berbagai sumber data
Disajikan dalam format yang konsisten
Menangani konflik nama dan satuan
Savings
Current
accounts
Loans
OLTP Applications
Customer
Data Warehouse
}
}
Digunakan untuk keperluan analisis trend,
deviasi, peramalan, perbandingan, …
Waktu: harian, mingguan, bulanan
}
Data tidak untuk diubah (read-only)
Operational
Warehouse
Load
Insert
Update
Delete
Read
Read
First time load
Warehouse Database
Operational
Database
}
Perubahan
dianggap
sebagai data
baru
Refresh
Refresh
Refresh
Property
Operational
Data Warehouse
Response
Time
Sub seconds to
seconds
Seconds to hours
Operations
DML
Primarily read only
Nature of Data
30-60 days
Snapshots over time
Applications
Subject, time
Small to large
Large to very large
Data Organization
Size
Data Source
Activities
Operational, Internal
Processes
Operational, Internal,
External
Analysis
}
}
}
}
}
}
Meningkatkan produktivitas knowledge
worker
mendukung semua kebutuhan data pembuat
keputusan
Menyediakan akses ke data kritis yang
senantiasa siap
Memisahkan basisdata operasi dengan adhoc processing
Menyediakan rangkuman informasi bagi level
manajemen tingkat tinggi
Menyediakan kemampuan drill-down
}
Organisasi yang ….
◦ Memiliki data pada berbagai macam sistem/aplikasi
◦ Menggunakan pendekatan manajemen berbasis
informasi
◦ Besar, memiliki pelanggan dengan lokasi yang
terpisah atau berbeda-beda
◦ Memiliki data yang sama namun dengen
representasi yang berbeda pada berbagai sistem
yang berbeda pula
}
}
}
}
}
Data detil kini
Detil data lampau
Data terangkum tingkat rendah
Data terangkum tingkat tinggi
Metadata
◦ Merupakan direktori terkait apa yang ada di DW,
panduan pemetaan data dari data operasional ke
bentuk DW, aturan yang digunakan untuk
perangkuman (summarization)
}
Bagian dari DW yang berisi data yang relevan
untuk fungsi bisnis tertentu (fokus pada 1
subjek)
◦ Dependent DM : Subset DW
◦ Independent DM: DW kecil (mis: untuk 1
departemen/unit bisnis)
}
Memerlukan detil data level rendah
Data
Warehouse
Property
Scope
Subject
Data Source
Size(typical)
Implementation time
Data Warehouse
Enterprise
Multiple
Many
100 GB to>1 TB
Months to years
Data
Mart
Data Mart
Department
Single-subject, LOB
Few
<100 GB
Months
Flat Files
Operational
Systems
Marketing
Marketing
Sales
Finance
Human Resources
Data
Warehouse
External Data
Marketing
Marketing
Data Marts
Flat Files
Operational
Systems
Sale or Marketing
External Data
External Data
Sources
Visualisation
Extract Clean
Transform Load
Metadata
respository
Refresh
Operational
Databases
Data Warehouse
Serves
OLAP
Data Mining
}
}
}
}
Data Mart Centric
Virtual Federated
Hub-and-Spoke DW
Enterprise DW
}
Plus
◦ Secara organisasi dan teknis mudah dibangun
}
Minus
◦ Tidak ada sudut pandang enterprise
◦ Redundansi biaya data
◦ Biaya ETL dan operasional tinggi
}
Plus
◦ Tidak perlu platform tersendiri
}
Minus
◦
◦
◦
◦
Cocok hanya untuk volume rendah
Kompleksitas tinggi
Perlu bandwith besar
Masalah pada metadata
}
Plus
◦ Kustomisasi UI dan laporan mudah
}
Minus
◦
◦
◦
◦
Tantangan pada sudut pandang enterprise
Redundan biaya data
Biaya operasi tinggi
Data terlambat
}
Plus
◦ Menyediakan sudut pandang enterprise
◦ Konsistensi data tinggi
◦ Data dapat dipakai ulang (reusable)
}
Minus
◦ Perlu visi, komitmen dan kepemimpinan enterprise
}
Inmon Model (pendekatan EDW)
◦ Top-Down
◦ Adaptasi dari basisdata relasional untuk keperluan
enterprise
}
Kimball Model (pendekatan DM)
◦ Bottom-Up
◦ “Plan Big, Build Small”
Download