Rancang Bangun Data Warehouse i ii Rancang Bangun Data Warehouse Rancang Bangun Data Warehouse iii iv Rancang Bangun Data Warehouse RANCANG BANGUN DATA WAREHOUSE Oleh : Muhammad Yazdi Pusadan, S.Kom., M.Eng. Edisi Pertama Cetakan Pertama, 2013 Hak Cipta 2013 pada penulis, Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau memindahkan sebagian atau seluruh isi buku ini dalam bentuk apa pun, secara elektronis maupun mekanis, termasuk memfotokopi, merekam, atau dengan teknik perekaman lainnya, tanpa izin tertulis dari penerbit. Ruko Jambusari No. 7A Yogyakarta 55283 Telp. : 0274-889836; 0274-889398 Fax. : 0274-889057 E-mail : [email protected] Pusadan, Muhammad Yazdi, S.Kom., M.Eng. RANCANG BANGUN DATA WAREHOUSE/Muhammad Yazdi Pusadan, S.Kom., M.Eng. -Edisi Pertama – Yogyakarta; Graha Ilmu, 2013 viii + 60 hlm, 1 Jil. : 23 cm. ISBN: 978-602-262-079-2 1. Komputer I. Judul Rancang Bangun Data Warehouse v KATA PENGANTAR P ertama-tama, penulis mengucapkan terima kasih kepada Allah SWT, yang telah memberikan anugerah dan kesehatan sehingga penulis bisa menyelesaikan buku ini. Buku ini merupakan buku perdana yang buat oleh penulis, dengan menitiberatkan pada keiilmuan manajemen pengolahan data. Data warehouse merupakan kajian lanjutan dari basis data, hanya saja lingkup data yang diolah dalam skala besar dengan mengintegrasikan beberapa data transaksi (basis data) menjadi satu sistem data. Di samping itu, Data warehouse dibangun dalam rangka untuk memisahkan data history dari operasional, secara kontinu melakukan update data history dari transaksi, lebih bersifat statis, dan data dikumpulkan untuk analisis bisnis. Pada akhir buku, penulis mengajak pembaca untuk menerapkan konsep data warehouse pada suatu sistem pengolahan data, serta dilakukan dibuatkan program untuk mengakses data warehuse yang telah dibangun. Akhir kata, penulis berharap agar buku ini memberikan manfaat terutama sehingga acuan dalam pengembangan sistem informasi dan basis data untuk kebutuhan pengambilan keputusan dan manajerial. Palu, April 2013 Penulis vi Rancang Bangun Data Warehouse Rancang Bangun Data Warehouse vii DAFTAR ISI KATA PENGANTAR DAFTAR ISI BAB I v vii PENGENALAN DATA WAREHOUSE, SQL SERVER 2008, DAN VB.NET 1 1.1. Data Warehouse 1 1.2. SQL Server 2008 7 1.3. Microsoft Visual Basic 2008 (VB.Net) 22 BAB II LINGKUP DATA WAREHOUSE (ETL, STAR SCHEMA, OLAP, & CUBE) 2.1. Extraction Tranformation Loading (ETL) 2.2. Star Schema 2.3. Online Analythical Processing (OLAP) 2.4. Cube 25 25 27 28 30 BAB III PENGENALAN TOOLS IMPLEMENTASI DATA WAREHOUSE (SQL Server Integration Service (SSIS) & SQL Server Analysis Service (SSAS)) 33 1.1. SQL Server Integration Service (SSIS) sebagai tool ETL 33 1.2. SQL Server Analisis Service (SSAS) sebagai tool OLAP 36 viii Rancang Bangun Data Warehouse BAB IV MEMBANGUN DATA WAREHOUSE 4.1. Menentukan Subyek Data Warehouse 4.2. Mendefinisikan Kebutuhan Sumber Data dan Informasi 1.3. Merancang Star Schema 4.4. Desain ETL 4.5. Membuat Cube dan Dimensional Data 4.6. Analisis Data Warehouse 37 37 37 41 42 44 45 DAFTAR PUSTAKA 55 TENTANG PENULIS 59 Pengenalan Data Warehouse, SQL Server 2008, Dan VB.net BAB I 1 PENGENALAN DATA WAREHOUSE, SQL SERVER 2008, DAN VB.NET 1.1. Data Warehouse D efinisi data warehouse adalah data warehouse merupakan kumpulan data yang berorientasi subyek, terintegrasi, tidak dapat di update, memiliki dimensi waktu, yang digunakan untuk mendukung proses manajemen pengambilan keputusan dan kecerdasan bisnis (Inmon, 2002, h.31-35). Jadi dengan definisi tersebut, maka data warehouse memiliki karakteristik, sebagai berikut : 1. Berorientasi subjek Data diorganisasi oleh subjek detail (misal berdasarkan pelanggan, jenis kebijakan, dan klaim dalam perusahaan asuransi), yang berisi informasi yang relevan untuk mendukung keputusan. Data warehouse berbeda dengan database operasional. Pada umumnya, database operasional mempunyai sebuah orientasi produk untuk menangani transaksi yang memperbarui database. 2. Terintegrasi Data pada sumber berbeda dapat di enkode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat di enkode sebagai 0 dan 1 di satu tempat dan ”m” dan ”f” di tempat lain. Di dalam data warehouse, enkode tersebut dibersihkan atau dibuat ke dalam satu format sehingga mereka distandarisasi dan konsisten. Banyak organisasi menggunakan terminologi yang sama untuk data dari jenis yang berbeda. Sebagai contoh, ”penjualan bersih” bisa berarti komisi bersih untuk departemen pemasaran, tetapi retur penjualan kotor bagi departemen akuntansi. Data yang terintegrasi mengatasi inkonsistensi dan menyediakan istilah yang seragam di organisasi keseluruhan, juga format waktu dan data yang bervariasi. 2 Rancang Bangun Data Warehouse 3. Time-variant Data tidak menyediakan status saat ini. Mereka disimpan untuk lima atau sepuluh tahun atau lebih dan digunakan untuk tren, peramalan, dan perbandingan. Ada kualitas sementara pada sebuah data warehouse. Waktu adalah dimensi penting yang harus didukung oleh semua data warehouse. Data untuk analisis dari berbagai sumber berisi berbagai poin waktu (misal harian, mingguan, bulanan). 4. Nonvolatile Sekali dimasukkan ke dalam data warehouse, data adalah read only, mereka tidak bisa diubah atau dibarui. Data usang dibuang, dan perubahan direkam sebagai data baru. Ini memungkinkan data warehouse untuk disesuaikan hampir secara ekslusif untuk akses data. Sebagai contoh, sejumlah besar ruang kosong (untuk pertumbuhan data) umumnya tidak diperlukan dan reorganisasi database dapat dijadwalkan bersama dengan operasi pengisian sebuah data warehouse. Data warehouse sebenarnya dapat dianggap sebagai suatu salinan data transaksional/OLTP (Online Transaction Processing) yang terstruktur untuk kebutuhan analisis, reporting, dan data mining. Oleh karena itu, sistem transaksi tidak pernah mengupdate data yang berada di dalam data warehouse melainkan hanya menambahkan data ke dalam data warehouse tersebut. Berikut ini pada tabel 2.1 memperlihatkan perbedaan sistem OLTP (Online Transaction Processing) dan sistem data warehouse. (Kadir, 2003, h.278). Tabel 2.1 Perbedaan OLTP dan data warehouse OLTP Datawarehouse Menangani data saat ini. Lebih cenderung menangani data masa lalu. Data bisa saja disimpan pada beberapa platform. Data disimpan dalam satu platform. Data diorganisasi berdasarkan fungsi atau operasi, seperti penjualan, produksi, dan pemrosesan pesanan. Data diorganisasi menuntut subjek seperti pelanggan atau produk. Pemrosesan bersifat berulang. Pemrosesan sewaktu-waktu, tak terstruktur, dan bersifat heuristik. Untuk mendukung keputusan hasian (operasional). Untuk mendukung keputusan yang strategis.