Jurnal_MCIST - Model Data Warehouse Dan Data Mart Untuk

advertisement
MODEL DATA WAREHOUSE DAN DATA MART
UNTUK MENUNJANG PENGAMBILAN
KEPUTUSAN EKSEKUTIF
OLEH:
Ishak Kamil (1412408930)
Donny Novianto(14124129915)
Melya Susanti (1412408956)
Brian Rahmat (1412408994)
Nico Lasmana(1415742409)
Ellen Tantrisna (1412409012)
Rahma Indah Delfiani (1412409555)
Mellisa ()
Santi ()
Kelas/ Kelompok : S2-MMSI/ 3
PROGRAM PASCA SARJANA ILMU KOMPUTER
PROGRAM STUDI MAGISTER MANAJEMEN SISTEM INFORMASI
UNIVERSITAS BINA NUSANTARA
JAKARTA
2014
ABSTRAK
Tuntutan persaingan di dunia usaha sekarang ini sangatlah tinggi dan salah satu faktor
untuk terus berkembangnya perusahaan serta menghadapi persaingan yang ada adalah dengan
adanya perencanaan yang baik. Pihak manajemen perusahaan berkewajiban untuk memiliki
rancangan perencanaan baik untuk dapat mengambil keputusan yang sesuai dengan tujuan awal
perusahaan, dan sumber informasi yang akurat dapat diperoleh dengan pemanfaatan Data
Warehouse.
Secara umum data warehouse berada diluar On-Line Transaction Processing (OLTP)
dan bersifat subjektif berdasarkan kebutuhan pihak pengambil keputusan. Dengan menggunakan
schema architecture Data Marts, data warehouse bisa dijeniskan berdasarkan beberapa jenis
informasi yang dibutuhkan seperti data mart keuangan, penjualan, dan pemeliharaan.
Kata kunci : data warehouse, data mart, pengambilan keputusan
1.
Pendahuluan
Data warehouse adalah sistem yang mengintegrasikan data dari satu atau lebih data dan
mengumpulkannya dalam satu tempat (repository) yang nantinya digunakan untuk keperluan
reporting, data analisis, dan statistik perbandingan. Banyak data, seperti histori, transaksi, dll
dapat disimpan dalam sistem data warehouse ini yang berfungsi sebagai sebagai sentra
penyimpanan data. Data warehouse ini juga bisa diartikan sebagai sistem yang dapat digunakan
dalam perancangan database untuk menunjang DSS (Decission Support Sytem) dan EIS
(Executive Information System).
Data mart adalah bagian dari data warehouse yang difokuskan pada subjek tertentu untuk
keperluan penggunanya. Dalam prakteknya, di sebuah perusahaan yang memiliki atau
mengimplementasikan data warehouse (Enterprise Data Warehouse), data mart digunakan untuk
memberikan informasi kepada segmen fungsional (departemen) dalam perusahaan, seperti
Marketing, HR atau Operational. Informasi yang spesifik inilah yang nantinya dapat menjadi
rujukan untuk pengambilan keputusan.
Arsitektur hubungan antara data warehouse dan data mart dapat dilihat seperti dibawah ini:
gambar 1.1 Arsitektur Data Warehouse
Gambar diatas terdiri dari Sumber Data, yang merupakan data operasional yang disimpan dalam
database, yang kemudian akan diproses (Extract-Transform-Load) dan diintegrasikan kedalam
data warehouse. Sedangkan data mart akan berisi data-data yang mendukung fungsi bisnis.
Secara umum, informasi dalam data warehouse di suatu perusahaan dapat diperuntukkan untuk
tujuan yang spesifik misalnya untuk departemen Marketing, Call Center, HR, dll.
gambar 1.2 EDW
Setiap perusahaan dalam mencapai tujuannya tentunya memerlukan strategi yang jitu, hal ini
membuat jenis data dan tipe data yang dibutuhkan berbeda-beda, sehingga dalam melakukan
perancangan data warehouse, kita harus menentukan arsitektur yang cocok.
Dalam jurnal ini, kita akan mengambil contoh sebuah perusahaan ritel penjualan yang
mengimplementasikan data warehouse dan data mart sebagai acuan dalam strateginya untuk
pengambilan keputusan.
2.
Pembahasan
Data Mart: Pendukung keputusan yang handal
Data mart merupakan ide yang telah tiba waktunya, dimana fokus dan kesederhanaan menyebar
secara cepat dari kemampuan pendukung keputusan dan cepatnya ROI yang dituntut oleh laju
bisnis modern.
Data Mart telah berkembang dari konsep data warehouse, ruang lingkup yang lebih terfokus
karena berkonsentrasi pada suatu subjek tunggal dari suatu perusahana.Hal ini penting, total
investasi pada waktu dan uang secara dramatis berkurang. Risiko yang berkurang sejalan dengan
data mart yang menyampaikan data yang dibutuhkan oleh data warehouse perusahaan dalam
waktu cepat.Sangat jelas bahwa strategi datamart sukses mengurangi risiko, membatasi biaya
dan mengurangi waktu yang dibuuthkan dalam memberikan fungsi data warehouse. Karena
fungsinya scalable, sehingga ketika dilakukan secara benar oleh praktisi yang berpengalaman
data mart dapat bekerja dengan baik untuk organisasi dari berbagai ukuran dan tingkat
kerumitan. Sehingga dapat dipahami mengapa data mart sekarang dipandang sebagai mekanisme
yang paling efektif untuk penyampaian secara cepat dan handal dalam mendukung keputusan.
Karakteristik Data Mart
Data Mart mempunyai karakteristik sebagai berikut :
1.
Data Mart fokus hanya pada kebutuhan kebutuhan-kebutuhan pemakai yang terkait dalam
sebuah department atau fungsi bisnis.
2.
Data Mart biasanya tidak mengandung data operasional yang rinci. data mart hanya
mengandung sedikit informasi, sehingga lebih mudah di pahami.
3.
Data Mart bisa bersifat dependent dan independent.
4.
Merupakan Agregate / Kesimpulan data, bukan data terperinci.
Dependent dan Independent Data Mart
Gambar 2.1 - Langkah-langkah implementasi Data Mart
Dilihat dari sumber data yang dimasukkan pada data mart, ada dua tipe dasar dari data mart, yaitu :
1. Dependent data mart : mengambil data dari pusat data warehouse yang telah dibuat.
2. Independent data mart : sistem yang berdiri sendiri yang dibangun dengan mengambil data
langsung dari sumber operasional atau eksternal data atau keduanya.
Gambar 2.2 - Langkah-langkah implementasi Data Mart
Langkah-langkah dalam implementasi Data Mart
1.
Merancang/desain
Desain adalah langkah pertama dalam proses data mart. Langkah ini mencakup semua tugas
dari memulai permintaan untuk data mart melalui pengumpulan informasi tentang persyaratan,
dan mengembangkan desain logis dan fisik dari data mart. Langkah desain melibatkan tugastugas berikut:
2.
·
Mengumpulkan kebutuhan bisnis dan teknis
·
Mengidentifikasi sumber data
·
Memilih subset data yang sesuai
·
Merancang struktur logis dan fisik dari data mart
Membangun/Constructing
Langkah ini termasuk membuat database fisik dan struktur logis yang terkait dengan data
mart untuk menyediakan akses cepat dan efisien untuk data. Langkah ini melibatkan tugas-tugas
berikut:
·
Membuat database fisik dan struktur penyimpanan, seperti tablespace, terkait dengan
data mart
·
Membuat objek skema, seperti tabel dan indeks yang didefinisikan dalam langkah
desain
· Menentukan cara terbaik untuk mengatur tabel dan struktur akses
3. Mengisi/Populating
Langkah mengisi mencakup semua tugas yang berhubungan untuk mendapatkan data dari
sumber, membersihkannya, memodifikasi ke format yang tepat dan tingkat detail, dan bergerak
ke dalam data mart. Lebih formal menyatakan, langkah mengisi melibatkan tugas-tugas berikut:
· Pemetaan sumber data untuk target struktur data
· penggalian data
· Pembersihan dan transformasi data
· Memuat data ke dalam data mart
· Membuat dan menyimpan metadata
4. Mengakses/Accsessing
Langkah mengakses melibatkan menempatkan data yang akan digunakan: query data,
menganalisanya, membuat laporan, chart, dan grafik, dan penerbitan ini. Biasanya, pengguna
akhir menggunakan alat front-end grafis untuk mengajukan pertanyaan ke database dan
menampilkan hasil dari query tersebut. Langkah mengakses mengharuskan Anda melakukan
tugas berikut:
Mengatur lapisan menengah untuk alat front-end untuk digunakan. Lapisan ini, metalayer itu,
menerjemahkan struktur database dan nama objek ke dalam istilah bisnis, sehingga
pengguna akhir dapat berinteraksi dengan data mart menggunakan istilah-istilah yang
berhubungan dengan fungsi bisnis.
Menjaga dan mengelola interface ini bisnis.
Mengatur dan mengelola struktur database, seperti tabel diringkas, yang membantu queries
disampaikan melalui alat front-end mengeksekusi dengan cepat dan efisien.
5. Mengelola/Managing
Langkah ini melibatkan mengelola data mart selama masa pakai. Pada langkah ini, Anda
melakukan tugas-tugas manajemen seperti berikut:
·
Memberikan akses yang aman ke data
· Mengelola pertumbuhan data
· Mengoptimalkan sistem untuk kinerja yang lebih baik
· Memastikan ketersediaan data bahkan dengan kegagalan sistem
Tahap pembuatan Data Warehouse
Berikut merupakan tahapan pembuatan data warehouse dengan Nine-step Methodology:
1. Choosing the Process
Langkah pertama dalam membuat data warehouse, yaitu menentukan proses dalam perusahaan.
Misalnya; proses penjualan
2. Choosing the Gain
Tahap kedua, yaitu menentukan apa yang akan direcord dalam tabel. Misalnya pada proses
penjualan terdapat total penjualan barang, kombinasi vendor, jenis product, dan periode waktu.
3. Identifying and Conforming the Dimension
Tahap ketiga, yaitu mengidentifikasi dimensi yang diperlukan dalam rancangan data warehouse.
Fakta penjualan; waktu, product, dan vendor.
4. Choosing the Facts
Meliputi; ID_Waktu, ID_Product, ID_Vendor, Total_Penjualan, dan ID_Manager
5. Storing Pre-calculation in the Fact Table
6. Rounding out the Dimension Tables
Dimensi periode waktu, dimensi product, dimensi vendor.
7. Choosing the Duration of Database
Pada tahap ini, yang dilakukan ialah menentukan database apa yang akan digunakan untuk
dijadikan sumber data dalam pembuatan data warehouse.
8. Tracking Slowly Changing Dimension
9. Decide Physical Design
Physical design dapat dilakukan dengan ETL (Extract, Transform, and Loading) setelah itu
melakukan pembuatan star schema.
Langkah-langkah dalam implementasi Data Warehouse
1. Mendesain data warehouse
Desain Data Warehouse ini ada 2 yaitu (Logical dan Physical Design). Dimana proses
mendesain logical ini dapat dilakukan dengan menggunakan ER Diagram, mencari objek-objek
sebagai entitas yang saling terkait, mendefinisikan atribute serta relasi antar entitas . Sedang
Physical desain dapat dibuat dengan cara merubah logical desain yang telah dibuat tadi menjadi
object-object database , kemudian membuat TableSpace, integrity constraint ,dll
2. ETL (Extraction, Transformation and Loading)
ETL adalah suatu proses integrasi atas sumber-sumber atau source data yang ada disuatu
perusahaan biasanya sorce data ini adalah database operasional, database operasional ini
biasanya berdiri sendiri-sendiri di tiap departement. Oleh karena itu perlu dilakukan
penggabungan dengan menggunakan aplikasi ETL yang berfungsi sebagai extractor yaitu
melakukan pengambilan data yang bersifat final (data yang sudah diolah), fungsi kedua yaitu
transformasi yaitu melakukan perubahan data dengan menggunakan standart yang sudah di
tentukan sebelumnya dikarenakan sumber data diambil dari database yang berbeda maka
diperlukan suatu standarisasi yang mana nantinya memudahkan arsitek database untuk menyusun
laporan. Proses Ekstrak dan tranformasi ini lah yang disebut sebagai proses Staging. Selanjutnya
fungsi Load sesuai dengan namanya berfungsi untuk memindahkan/me-load data yang sudah di
transformasi tadi ke Data warehouse akhir. Dimana nantinya aplikasi reporting untuk
mempermudah pengambilan keputusan di ambil dari datawarehouse ini.
3.
Membuat Dimensi
Dimensi yang dimaksud ada sebuah struktur dalam database yang mengkategorikan data
menjadi beberapa kategori yang berfungsi menjawab pertanyaan-pertanyaan bisnis. misalnya
tabel pelanggan dan table produk. Sebagai contoh misalnya di dimensi pelanggan
table
pelanggan memerlukan kota maupun negara . dari situ kita bisa menentukan pelanggan dari kota
/ negara mana yang lebih sering menggunakan produk yang dihasilkan perusahaan.
4.
Membuat Cube
Cube adalah kumpulan data-data yang telah digabungkan untuk memudahkan dan
mempercepat proses query database sehingga diperoleh suatu data yang cepat dan akurat.
sebagai contoh data produk dan waktu digabungkan menjadi sebuah cube akan diperoleh data
penjualan produk order by Month secara cepat. Cube ini masing-masing terbuat dari satu atau
lebih dimension yang telah dibuat dari tahap sebelumnya.
Berikut ini Model untuk Data Warehouse
Berikut di bawah ini adalah penjelasan dari model untuk data warehouse
Model Dimensional
Model dimensional merupakan rancangan logikal yang bertujuan untuk menampilkan data dalam
bentuk standar dan intuitif yang memperbolehkan akses dengan performa yang tinggi.
Model dimensional menggunakan konsep model hubungan antar entity (ER) dengan beberapa
batasan yang penting. Setiap model dimensi terdiri dari sebuah tabel dengan sebuah komposit
primary key, disebut dengan table fakta, dan satu set table yang lebih kecil disebut table
dimensi. Setiap table dimensi memiliki sebuah simple primary key yang merespon tepat pada
satu komponen primary key pada tabel fakta. Dengan kata lain primary key pada table fakta
terdiri dari dua atau lebih foreign key. Struktur karakteristik ini disebut dengan skema bintang
atau join bintang.
Fitur terpenting dalam model dimensional ini adalah semua natural keys diganti dengan kunci
pengganti(surrogate keys). Maksudnya yaitu setiap kali join antar table fakta dengan table
dimensi selalu didasari kunci pengganti. Kegunaan dari kunci pengganti adalah memperbolehkan
data pada data warehouse untuk memiliki beberapa kebebasan dalam penggunaan data, tidak
seperti halnya yang diproduksi oleh sistem OLTP.
Sebuah sistem OLTP memerlukan normalisasi untuk mengurangi redudansi, validasi untuk input
data, mendukung volume yang besar dari transaksi yang bergerak sangat cepat. Model OLTP
sering terlihat seperti jaring laba-laba yang terdiri atas ratusan bahkan ribuan tabel sehingga sulit
untuk dimengerti.
Sebaliknya, dimension model yang sering digunakan pada data warehouse adalah skema bintang
atau snowflake yang mudah dimengerti dan sesuai dengan kebutuhan bisnis, mendukung query
sederhana dan menyediakan performa query yang superior dengan meminimalisasi tabel-tabel
join.
Schema Bintang
Skema bintang merupakan struktuk logikal yang memiliki tabel fakta yang terdiri atas data
faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data Jenis-jenis
Skema Bintang:
Skema bintang sederhana
Dalam skema ini, setiap table harus memiliki primary key yang terdiri dari satu kolom atau lebih.
Primary key dari table fakta terdiri dari satu atau lebih foreign key.Foreign key merupakan
primary key pada table lain. Skema bintang juga bisa terdiri dari satu atau lebih table fakta.
Dikarenakan karena table fakta tersebut ada banyak, misalnya disamping penjualan terdapat table
fakta forecasting dan result. Walaupun terdapat lebih dari satu table fakta, mereka tetap
menggunakan table dimensi bersama-sama
Adapun ketentuan dalam pembacaan skema bintang adalah :
·
Bagian yang ada di bawah judul tabel merupakan kolom-kolom tabel tersebut
·
Primary key dan Foreign key diberi kotak
·
Primary key diarsir sedang Foreign key yang bukan primary tidak
·
Foreign key yang berhubungan ditunjukkan dengan garis yang menghubungkan tabel.
Kolom yang bukan kunci disebut kolom data pada table fakta dan atribut pada table dimensi
Snowflake Schema
Merupakan varian dari skema bintang dimana table-table dimensi tidak terdapat data yang di
denormalisasi. Dengan kata lain satu atau lebih table dimensi tidak bergabung secara langsung
kepada table fakta tapi pada table dimensi lainnya.
Sebagai contoh, sebuah dimensi yang
mendeskripsikan produk dapat dipisahkan menjadi tiga table (snowflaked)
Star atau Snowflake
Keduanya merupakan model-model dimensional, perbedaannya terletak pada implementasi
fisikal. Skema snowflake memberi kemudahan pada perawatan dimensi, dikarenakan strukturnya
yang lebih normalisasi. Sedangkan skema bintang lebih efisien serta sederhana dalam membuat
query dan mudah diakses secara langsung oleh pengguna.
Adapun starflake merupakan gabungan diantara keduanya. Keuntungan menggunakan masingmasing model tersebut dalam data warehouse antara lain :
·
Efisien dalam hal mengakses data
·
Dapat beradaptasi terhadap kebutuhan-kebutuhan user
·
Bersifat fleksibel terhadap perubahan yang terjadi khususnya perubahan yang mengarah
pada perkembangan
·
·
Memiliki kemampuan dalam memodelkan situasi bisnis secara umum
Meskipun skema yang dihasilkan sangat kompleks, tetapi pemrosesan query dapat
diperkirakan, hal ini dikarenakan pada level terendah, setiap table fakta harus di query secara
independen.
Berikut adalah gambar Tabel fact_penjualan bersera Tabel Multidimensional yang dibutuhkan
untuk pembuatan Data Warehouse dengan model schema bintang sesuai dengan point Batasan
masalah diatas.
Skema diatas mengikuti bentuk bintang, dimana terdapat satu tabel fakta (fact table) di pusat
bintang dengan beberapa tabel dimensi (dimensional tables) yang mengelilinginya. Semua tabel
dimensi berhubungan dengan ke tabel fakta. Tabel fakta memiliki beberapa key yang merupakan
kunci indek individual dalam tabel dimensi.
3.
Kesimpulan dan Saran
1.
Kebutuhan informasi yang diperoleh dari proses perancangan datamart ,sangat membantu
para eksekutif dalam mengambil keputusan. dimana informasi ini nantinya dapat juga
digunakan untuk membangun data warehouse
2.
Setelah datamart ini diimplementasikan diharapkan dapat membentuk datawarehouse
yang dapat mengintegrasikan datamart-datamart yang telah dibuat di tiap-tiap departemen
maupun di kantor-kantor cabang. sehingga nantinya datawarehouse ini dapat di minning
knowledge nya guna menentukan keputusan apa yang tepat diambil di masa mendatang
3.
Dengan adanya proses data mining dari data warehouse yang sudah terbentuk diharapkan
dapat mempercepat dan mempermudah para eksekutif dalam mengambil keputusan
dikarenakan data mining hanya akan menampilkan data yang telah ter summary dengan
baik menggunakan algoritma yang sesuai dengan kebutuhan perusahaan
4.
Keberadaan data warehouse sangat penting sebagai salah satu tool dari pengambilan
keputusan, Adanya data warehouse diharapkan dapat membantu perusahaan menjadi
lebih unggul dari saingannya dan jeli melihat peluang pasar.
Daftar Pustaka :
1. article07-Which Data Warehouse Architecture Is Most Successful.pdf
2. article08-Key organizational factors in data warehouse architecture selection.pdf
3. article11-MGI_big_data_exec_summary.pdf
4. Multidimensional Database Technology - article13-I1_pederson_p40.ppdf
5. article15-GIS and Business Intelligence - The Geographic Advantage.pdf
6. article16-BI and GIS Combine for Mapping Nuts and Bolts 41522173.pdf
7. Data Mart Concepts http://gkmc.utah.edu/ebis_class/2003s/Oracle/Cookbook/dm_conce.htm
8. http://en.wikipedia.org/wiki/Data_warehouse
9. http://en.wikipedia.org/wiki/Data_mart
10. From Enterprise Models to Dimensional Models: A Methodology for Data Warehouse
and Data Mart Design - Daniel L. Moody (paper)
Download