Rancang Bangun Data Warehouse i

advertisement
Rancang Bangun Data Warehouse
i
ii
Rancang Bangun Data Warehouse
Rancang Bangun Data Warehouse
iii
iv
Rancang Bangun Data Warehouse
RANCANG BANGUN DATA WAREHOUSE
Oleh
: Muhammad Yazdi Pusadan, S.Kom., M.Eng.
Edisi Pertama
Cetakan Pertama, 2013
Hak Cipta  2013 pada penulis,
Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau memindahkan
sebagian atau seluruh isi buku ini dalam bentuk apa pun, secara elektronis maupun
mekanis, termasuk memfotokopi, merekam, atau dengan teknik perekaman lainnya,
tanpa izin tertulis dari penerbit.
Ruko Jambusari No. 7A
Yogyakarta 55283
Telp.
: 0274-889836; 0274-889398
Fax.
: 0274-889057
E-mail : [email protected]
Pusadan, Muhammad Yazdi, S.Kom., M.Eng.
RANCANG BANGUN DATA WAREHOUSE/Muhammad Yazdi Pusadan,
S.Kom., M.Eng.
-Edisi Pertama – Yogyakarta; Graha Ilmu, 2013
viii + 60 hlm, 1 Jil. : 23 cm.
ISBN:
978-602-262-079-2
1. Komputer
I. Judul
Rancang Bangun Data Warehouse
v
KATA PENGANTAR
P
ertama-tama, penulis mengucapkan terima kasih kepada Allah SWT, yang telah
memberikan anugerah dan kesehatan sehingga penulis bisa menyelesaikan
buku ini.
Buku ini merupakan buku perdana yang buat oleh penulis, dengan
menitiberatkan pada keiilmuan manajemen pengolahan data. Data warehouse
merupakan kajian lanjutan dari basis data, hanya saja lingkup data yang diolah
dalam skala besar dengan mengintegrasikan beberapa data transaksi (basis data)
menjadi satu sistem data.
Di samping itu, Data warehouse dibangun dalam rangka untuk memisahkan
data history dari operasional, secara kontinu melakukan update data history dari
transaksi, lebih bersifat statis, dan data dikumpulkan untuk analisis bisnis.
Pada akhir buku, penulis mengajak pembaca untuk menerapkan konsep data
warehouse pada suatu sistem pengolahan data, serta dilakukan dibuatkan program
untuk mengakses data warehuse yang telah dibangun.
Akhir kata, penulis berharap agar buku ini memberikan manfaat terutama
sehingga acuan dalam pengembangan sistem informasi dan basis data untuk
kebutuhan pengambilan keputusan dan manajerial.
Palu, April 2013
Penulis
vi
Rancang Bangun Data Warehouse
Rancang Bangun Data Warehouse
vii
DAFTAR ISI
KATA PENGANTAR
DAFTAR ISI
BAB I
v
vii
PENGENALAN DATA WAREHOUSE, SQL SERVER 2008,
DAN VB.NET
1
1.1. Data Warehouse
1
1.2. SQL Server 2008
7
1.3. Microsoft Visual Basic 2008 (VB.Net)
22
BAB II LINGKUP DATA WAREHOUSE (ETL, STAR SCHEMA, OLAP,
& CUBE)
2.1. Extraction Tranformation Loading (ETL)
2.2. Star Schema
2.3. Online Analythical Processing (OLAP)
2.4. Cube 25
25
27
28
30
BAB III PENGENALAN TOOLS IMPLEMENTASI DATA WAREHOUSE (SQL Server Integration Service (SSIS) & SQL Server
Analysis Service (SSAS))
33
1.1. SQL Server Integration Service (SSIS) sebagai tool ETL
33
1.2. SQL Server Analisis Service (SSAS) sebagai tool OLAP 36
viii
Rancang Bangun Data Warehouse
BAB IV MEMBANGUN DATA WAREHOUSE 4.1. Menentukan Subyek Data Warehouse
4.2. Mendefinisikan Kebutuhan Sumber Data dan Informasi
1.3. Merancang Star Schema 4.4. Desain ETL 4.5. Membuat Cube dan Dimensional Data
4.6. Analisis Data Warehouse 37
37
37
41
42
44
45
DAFTAR PUSTAKA
55
TENTANG PENULIS
59
Pengenalan Data Warehouse, SQL Server 2008, Dan VB.net
BAB I
1
PENGENALAN DATA
WAREHOUSE, SQL SERVER
2008, DAN VB.NET
1.1. Data Warehouse
D
efinisi data warehouse adalah data warehouse merupakan kumpulan data
yang berorientasi subyek, terintegrasi, tidak dapat di update, memiliki
dimensi waktu, yang digunakan untuk mendukung proses manajemen pengambilan
keputusan dan kecerdasan bisnis (Inmon, 2002, h.31-35). Jadi dengan definisi
tersebut, maka data warehouse memiliki karakteristik, sebagai berikut :
1. Berorientasi subjek
Data diorganisasi oleh subjek detail (misal berdasarkan pelanggan, jenis
kebijakan, dan klaim dalam perusahaan asuransi), yang berisi informasi yang
relevan untuk mendukung keputusan. Data warehouse berbeda dengan database
operasional. Pada umumnya, database operasional mempunyai sebuah
orientasi produk untuk menangani transaksi yang memperbarui database.
2. Terintegrasi
Data pada sumber berbeda dapat di enkode dengan cara yang berbeda. Sebagai
contoh, data jenis kelamin dapat di enkode sebagai 0 dan 1 di satu tempat
dan ”m” dan ”f” di tempat lain. Di dalam data warehouse, enkode tersebut
dibersihkan atau dibuat ke dalam satu format sehingga mereka distandarisasi
dan konsisten. Banyak organisasi menggunakan terminologi yang sama untuk
data dari jenis yang berbeda. Sebagai contoh, ”penjualan bersih” bisa berarti
komisi bersih untuk departemen pemasaran, tetapi retur penjualan kotor bagi
departemen akuntansi. Data yang terintegrasi mengatasi inkonsistensi dan
menyediakan istilah yang seragam di organisasi keseluruhan, juga format
waktu dan data yang bervariasi.
2
Rancang Bangun Data Warehouse
3. Time-variant
Data tidak menyediakan status saat ini. Mereka disimpan untuk lima
atau sepuluh tahun atau lebih dan digunakan untuk tren, peramalan, dan
perbandingan. Ada kualitas sementara pada sebuah data warehouse. Waktu
adalah dimensi penting yang harus didukung oleh semua data warehouse.
Data untuk analisis dari berbagai sumber berisi berbagai poin waktu (misal
harian, mingguan, bulanan).
4. Nonvolatile
Sekali dimasukkan ke dalam data warehouse, data adalah read only, mereka
tidak bisa diubah atau dibarui. Data usang dibuang, dan perubahan direkam
sebagai data baru. Ini memungkinkan data warehouse untuk disesuaikan
hampir secara ekslusif untuk akses data. Sebagai contoh, sejumlah besar
ruang kosong (untuk pertumbuhan data) umumnya tidak diperlukan dan
reorganisasi database dapat dijadwalkan bersama dengan operasi pengisian
sebuah data warehouse.
Data warehouse sebenarnya dapat dianggap sebagai suatu salinan data
transaksional/OLTP (Online Transaction Processing) yang terstruktur untuk
kebutuhan analisis, reporting, dan data mining. Oleh karena itu, sistem transaksi
tidak pernah mengupdate data yang berada di dalam data warehouse melainkan
hanya menambahkan data ke dalam data warehouse tersebut. Berikut ini pada tabel
2.1 memperlihatkan perbedaan sistem OLTP (Online Transaction Processing) dan
sistem data warehouse. (Kadir, 2003, h.278).
Tabel 2.1 Perbedaan OLTP dan data warehouse
OLTP
Datawarehouse
 Menangani data saat ini.
 Lebih cenderung menangani data
masa lalu.
 Data bisa saja disimpan pada beberapa platform.
 Data disimpan dalam satu platform.
 Data diorganisasi berdasarkan fungsi
atau operasi, seperti penjualan, produksi, dan pemrosesan pesanan.
 Data diorganisasi menuntut subjek
seperti pelanggan atau produk.
 Pemrosesan bersifat berulang.
 Pemrosesan sewaktu-waktu, tak terstruktur, dan bersifat heuristik.
 Untuk mendukung keputusan hasian
(operasional).
 Untuk mendukung keputusan yang
strategis.
Download