MODEL DATA WAREHOUSE DAN DATA MART UNTUK MENUNJANG PENGAMBILAN KEPUTUSAN EKSEKUTIF OLEH: Ishak Kamil (1412408930) Donny Novianto(14124129915) Melya Susanti (1412408956) Brian Rahmat (1412408994) Nico Lasmana(1415742409) Ellen Tantrisna (1412409012) Rahma Indah Delfiani (1412409555) Mellisa () Santi () Kelas/ Kelompok : S2-MMSI/ 3 PROGRAM PASCA SARJANA ILMU KOMPUTER PROGRAM STUDI MAGISTER MANAJEMEN SISTEM INFORMASI UNIVERSITAS BINA NUSANTARA JAKARTA 2014 ABSTRAK Tuntutan persaingan di dunia usaha sekarang ini sangatlah tinggi dan salah satu faktor untuk terus berkembangnya perusahaan serta menghadapi persaingan yang ada adalah dengan adanya perencanaan yang baik. Pihak manajemen perusahaan berkewajiban untuk memiliki rancangan perencanaan baik untuk dapat mengambil keputusan yang sesuai dengan tujuan awal perusahaan, dan sumber informasi yang akurat dapat diperoleh dengan pemanfaatan Data Warehouse. Secara umum data warehouse berada diluar On-Line Transaction Processing (OLTP) dan bersifat subjektif berdasarkan kebutuhan pihak pengambil keputusan. Dengan menggunakan schema architecture Data Marts, data warehouse bisa dijeniskan berdasarkan beberapa jenis informasi yang dibutuhkan seperti data mart keuangan, penjualan, dan pemeliharaan. Kata kunci : data warehouse, data mart, pengambilan keputusan 1. Pendahuluan Data warehouse adalah sistem yang mengintegrasikan data dari satu atau lebih data dan mengumpulkannya dalam satu tempat (repository) yang nantinya digunakan untuk keperluan reporting, data analisis, dan statistik perbandingan. Banyak data, seperti histori, transaksi, dll dapat disimpan dalam sistem data warehouse ini yang berfungsi sebagai sebagai sentra penyimpanan data. Data warehouse ini juga bisa diartikan sebagai sistem yang dapat digunakan dalam perancangan database untuk menunjang DSS (Decission Support Sytem) dan EIS (Executive Information System). Data mart adalah bagian dari data warehouse yang difokuskan pada subjek tertentu untuk keperluan penggunanya. Dalam prakteknya, di sebuah perusahaan yang memiliki atau mengimplementasikan data warehouse (Enterprise Data Warehouse), data mart digunakan untuk memberikan informasi kepada segmen fungsional (departemen) dalam perusahaan, seperti Marketing, HR atau Operational. Informasi yang spesifik inilah yang nantinya dapat menjadi rujukan untuk pengambilan keputusan. Arsitektur hubungan antara data warehouse dan data mart dapat dilihat seperti dibawah ini: gambar 1.1 Arsitektur Data Warehouse Gambar diatas terdiri dari Sumber Data, yang merupakan data operasional yang disimpan dalam database, yang kemudian akan diproses (Extract-Transform-Load) dan diintegrasikan kedalam data warehouse. Sedangkan data mart akan berisi data-data yang mendukung fungsi bisnis. Secara umum, informasi dalam data warehouse di suatu perusahaan dapat diperuntukkan untuk tujuan yang spesifik misalnya untuk departemen Marketing, Call Center, HR, dll. gambar 1.2 EDW Setiap perusahaan dalam mencapai tujuannya tentunya memerlukan strategi yang jitu, hal ini membuat jenis data dan tipe data yang dibutuhkan berbeda-beda, sehingga dalam melakukan perancangan data warehouse, kita harus menentukan arsitektur yang cocok. Dalam jurnal ini, kita akan mengambil contoh sebuah perusahaan ritel penjualan yang mengimplementasikan data warehouse dan data mart sebagai acuan dalam strateginya untuk pengambilan keputusan. 2. Pembahasan Data Mart: Pendukung keputusan yang handal Data mart merupakan ide yang telah tiba waktunya, dimana fokus dan kesederhanaan menyebar secara cepat dari kemampuan pendukung keputusan dan cepatnya ROI yang dituntut oleh laju bisnis modern. Data Mart telah berkembang dari konsep data warehouse, ruang lingkup yang lebih terfokus karena berkonsentrasi pada suatu subjek tunggal dari suatu perusahana.Hal ini penting, total investasi pada waktu dan uang secara dramatis berkurang. Risiko yang berkurang sejalan dengan data mart yang menyampaikan data yang dibutuhkan oleh data warehouse perusahaan dalam waktu cepat.Sangat jelas bahwa strategi datamart sukses mengurangi risiko, membatasi biaya dan mengurangi waktu yang dibuuthkan dalam memberikan fungsi data warehouse. Karena fungsinya scalable, sehingga ketika dilakukan secara benar oleh praktisi yang berpengalaman data mart dapat bekerja dengan baik untuk organisasi dari berbagai ukuran dan tingkat kerumitan. Sehingga dapat dipahami mengapa data mart sekarang dipandang sebagai mekanisme yang paling efektif untuk penyampaian secara cepat dan handal dalam mendukung keputusan. Karakteristik Data Mart Data Mart mempunyai karakteristik sebagai berikut : 1. Data Mart fokus hanya pada kebutuhan kebutuhan-kebutuhan pemakai yang terkait dalam sebuah department atau fungsi bisnis. 2. Data Mart biasanya tidak mengandung data operasional yang rinci. data mart hanya mengandung sedikit informasi, sehingga lebih mudah di pahami. 3. Data Mart bisa bersifat dependent dan independent. 4. Merupakan Agregate / Kesimpulan data, bukan data terperinci. Dependent dan Independent Data Mart Gambar 2.1 - Langkah-langkah implementasi Data Mart Dilihat dari sumber data yang dimasukkan pada data mart, ada dua tipe dasar dari data mart, yaitu : 1. Dependent data mart : mengambil data dari pusat data warehouse yang telah dibuat. 2. Independent data mart : sistem yang berdiri sendiri yang dibangun dengan mengambil data langsung dari sumber operasional atau eksternal data atau keduanya. Gambar 2.2 - Langkah-langkah implementasi Data Mart Langkah-langkah dalam implementasi Data Mart 1. Merancang/desain Desain adalah langkah pertama dalam proses data mart. Langkah ini mencakup semua tugas dari memulai permintaan untuk data mart melalui pengumpulan informasi tentang persyaratan, dan mengembangkan desain logis dan fisik dari data mart. Langkah desain melibatkan tugastugas berikut: 2. · Mengumpulkan kebutuhan bisnis dan teknis · Mengidentifikasi sumber data · Memilih subset data yang sesuai · Merancang struktur logis dan fisik dari data mart Membangun/Constructing Langkah ini termasuk membuat database fisik dan struktur logis yang terkait dengan data mart untuk menyediakan akses cepat dan efisien untuk data. Langkah ini melibatkan tugas-tugas berikut: · Membuat database fisik dan struktur penyimpanan, seperti tablespace, terkait dengan data mart · Membuat objek skema, seperti tabel dan indeks yang didefinisikan dalam langkah desain · Menentukan cara terbaik untuk mengatur tabel dan struktur akses 3. Mengisi/Populating Langkah mengisi mencakup semua tugas yang berhubungan untuk mendapatkan data dari sumber, membersihkannya, memodifikasi ke format yang tepat dan tingkat detail, dan bergerak ke dalam data mart. Lebih formal menyatakan, langkah mengisi melibatkan tugas-tugas berikut: · Pemetaan sumber data untuk target struktur data · penggalian data · Pembersihan dan transformasi data · Memuat data ke dalam data mart · Membuat dan menyimpan metadata 4. Mengakses/Accsessing Langkah mengakses melibatkan menempatkan data yang akan digunakan: query data, menganalisanya, membuat laporan, chart, dan grafik, dan penerbitan ini. Biasanya, pengguna akhir menggunakan alat front-end grafis untuk mengajukan pertanyaan ke database dan menampilkan hasil dari query tersebut. Langkah mengakses mengharuskan Anda melakukan tugas berikut: Mengatur lapisan menengah untuk alat front-end untuk digunakan. Lapisan ini, metalayer itu, menerjemahkan struktur database dan nama objek ke dalam istilah bisnis, sehingga pengguna akhir dapat berinteraksi dengan data mart menggunakan istilah-istilah yang berhubungan dengan fungsi bisnis. Menjaga dan mengelola interface ini bisnis. Mengatur dan mengelola struktur database, seperti tabel diringkas, yang membantu queries disampaikan melalui alat front-end mengeksekusi dengan cepat dan efisien. 5. Mengelola/Managing Langkah ini melibatkan mengelola data mart selama masa pakai. Pada langkah ini, Anda melakukan tugas-tugas manajemen seperti berikut: · Memberikan akses yang aman ke data · Mengelola pertumbuhan data · Mengoptimalkan sistem untuk kinerja yang lebih baik · Memastikan ketersediaan data bahkan dengan kegagalan sistem Tahap pembuatan Data Warehouse Berikut merupakan tahapan pembuatan data warehouse dengan Nine-step Methodology: 1. Choosing the Process Langkah pertama dalam membuat data warehouse, yaitu menentukan proses dalam perusahaan. Misalnya; proses penjualan 2. Choosing the Gain Tahap kedua, yaitu menentukan apa yang akan direcord dalam tabel. Misalnya pada proses penjualan terdapat total penjualan barang, kombinasi vendor, jenis product, dan periode waktu. 3. Identifying and Conforming the Dimension Tahap ketiga, yaitu mengidentifikasi dimensi yang diperlukan dalam rancangan data warehouse. Fakta penjualan; waktu, product, dan vendor. 4. Choosing the Facts Meliputi; ID_Waktu, ID_Product, ID_Vendor, Total_Penjualan, dan ID_Manager 5. Storing Pre-calculation in the Fact Table 6. Rounding out the Dimension Tables Dimensi periode waktu, dimensi product, dimensi vendor. 7. Choosing the Duration of Database Pada tahap ini, yang dilakukan ialah menentukan database apa yang akan digunakan untuk dijadikan sumber data dalam pembuatan data warehouse. 8. Tracking Slowly Changing Dimension 9. Decide Physical Design Physical design dapat dilakukan dengan ETL (Extract, Transform, and Loading) setelah itu melakukan pembuatan star schema. Langkah-langkah dalam implementasi Data Warehouse 1. Mendesain data warehouse Desain Data Warehouse ini ada 2 yaitu (Logical dan Physical Design). Dimana proses mendesain logical ini dapat dilakukan dengan menggunakan ER Diagram, mencari objek-objek sebagai entitas yang saling terkait, mendefinisikan atribute serta relasi antar entitas . Sedang Physical desain dapat dibuat dengan cara merubah logical desain yang telah dibuat tadi menjadi object-object database , kemudian membuat TableSpace, integrity constraint ,dll 2. ETL (Extraction, Transformation and Loading) ETL adalah suatu proses integrasi atas sumber-sumber atau source data yang ada disuatu perusahaan biasanya sorce data ini adalah database operasional, database operasional ini biasanya berdiri sendiri-sendiri di tiap departement. Oleh karena itu perlu dilakukan penggabungan dengan menggunakan aplikasi ETL yang berfungsi sebagai extractor yaitu melakukan pengambilan data yang bersifat final (data yang sudah diolah), fungsi kedua yaitu transformasi yaitu melakukan perubahan data dengan menggunakan standart yang sudah di tentukan sebelumnya dikarenakan sumber data diambil dari database yang berbeda maka diperlukan suatu standarisasi yang mana nantinya memudahkan arsitek database untuk menyusun laporan. Proses Ekstrak dan tranformasi ini lah yang disebut sebagai proses Staging. Selanjutnya fungsi Load sesuai dengan namanya berfungsi untuk memindahkan/me-load data yang sudah di transformasi tadi ke Data warehouse akhir. Dimana nantinya aplikasi reporting untuk mempermudah pengambilan keputusan di ambil dari datawarehouse ini. 3. Membuat Dimensi Dimensi yang dimaksud ada sebuah struktur dalam database yang mengkategorikan data menjadi beberapa kategori yang berfungsi menjawab pertanyaan-pertanyaan bisnis. misalnya tabel pelanggan dan table produk. Sebagai contoh misalnya di dimensi pelanggan table pelanggan memerlukan kota maupun negara . dari situ kita bisa menentukan pelanggan dari kota / negara mana yang lebih sering menggunakan produk yang dihasilkan perusahaan. 4. Membuat Cube Cube adalah kumpulan data-data yang telah digabungkan untuk memudahkan dan mempercepat proses query database sehingga diperoleh suatu data yang cepat dan akurat. sebagai contoh data produk dan waktu digabungkan menjadi sebuah cube akan diperoleh data penjualan produk order by Month secara cepat. Cube ini masing-masing terbuat dari satu atau lebih dimension yang telah dibuat dari tahap sebelumnya. Berikut ini Model untuk Data Warehouse Berikut di bawah ini adalah penjelasan dari model untuk data warehouse Model Dimensional Model dimensional merupakan rancangan logikal yang bertujuan untuk menampilkan data dalam bentuk standar dan intuitif yang memperbolehkan akses dengan performa yang tinggi. Model dimensional menggunakan konsep model hubungan antar entity (ER) dengan beberapa batasan yang penting. Setiap model dimensi terdiri dari sebuah tabel dengan sebuah komposit primary key, disebut dengan table fakta, dan satu set table yang lebih kecil disebut table dimensi. Setiap table dimensi memiliki sebuah simple primary key yang merespon tepat pada satu komponen primary key pada tabel fakta. Dengan kata lain primary key pada table fakta terdiri dari dua atau lebih foreign key. Struktur karakteristik ini disebut dengan skema bintang atau join bintang. Fitur terpenting dalam model dimensional ini adalah semua natural keys diganti dengan kunci pengganti(surrogate keys). Maksudnya yaitu setiap kali join antar table fakta dengan table dimensi selalu didasari kunci pengganti. Kegunaan dari kunci pengganti adalah memperbolehkan data pada data warehouse untuk memiliki beberapa kebebasan dalam penggunaan data, tidak seperti halnya yang diproduksi oleh sistem OLTP. Sebuah sistem OLTP memerlukan normalisasi untuk mengurangi redudansi, validasi untuk input data, mendukung volume yang besar dari transaksi yang bergerak sangat cepat. Model OLTP sering terlihat seperti jaring laba-laba yang terdiri atas ratusan bahkan ribuan tabel sehingga sulit untuk dimengerti. Sebaliknya, dimension model yang sering digunakan pada data warehouse adalah skema bintang atau snowflake yang mudah dimengerti dan sesuai dengan kebutuhan bisnis, mendukung query sederhana dan menyediakan performa query yang superior dengan meminimalisasi tabel-tabel join. Schema Bintang Skema bintang merupakan struktuk logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data Jenis-jenis Skema Bintang: Skema bintang sederhana Dalam skema ini, setiap table harus memiliki primary key yang terdiri dari satu kolom atau lebih. Primary key dari table fakta terdiri dari satu atau lebih foreign key.Foreign key merupakan primary key pada table lain. Skema bintang juga bisa terdiri dari satu atau lebih table fakta. Dikarenakan karena table fakta tersebut ada banyak, misalnya disamping penjualan terdapat table fakta forecasting dan result. Walaupun terdapat lebih dari satu table fakta, mereka tetap menggunakan table dimensi bersama-sama Adapun ketentuan dalam pembacaan skema bintang adalah : · Bagian yang ada di bawah judul tabel merupakan kolom-kolom tabel tersebut · Primary key dan Foreign key diberi kotak · Primary key diarsir sedang Foreign key yang bukan primary tidak · Foreign key yang berhubungan ditunjukkan dengan garis yang menghubungkan tabel. Kolom yang bukan kunci disebut kolom data pada table fakta dan atribut pada table dimensi Snowflake Schema Merupakan varian dari skema bintang dimana table-table dimensi tidak terdapat data yang di denormalisasi. Dengan kata lain satu atau lebih table dimensi tidak bergabung secara langsung kepada table fakta tapi pada table dimensi lainnya. Sebagai contoh, sebuah dimensi yang mendeskripsikan produk dapat dipisahkan menjadi tiga table (snowflaked) Star atau Snowflake Keduanya merupakan model-model dimensional, perbedaannya terletak pada implementasi fisikal. Skema snowflake memberi kemudahan pada perawatan dimensi, dikarenakan strukturnya yang lebih normalisasi. Sedangkan skema bintang lebih efisien serta sederhana dalam membuat query dan mudah diakses secara langsung oleh pengguna. Adapun starflake merupakan gabungan diantara keduanya. Keuntungan menggunakan masingmasing model tersebut dalam data warehouse antara lain : · Efisien dalam hal mengakses data · Dapat beradaptasi terhadap kebutuhan-kebutuhan user · Bersifat fleksibel terhadap perubahan yang terjadi khususnya perubahan yang mengarah pada perkembangan · · Memiliki kemampuan dalam memodelkan situasi bisnis secara umum Meskipun skema yang dihasilkan sangat kompleks, tetapi pemrosesan query dapat diperkirakan, hal ini dikarenakan pada level terendah, setiap table fakta harus di query secara independen. Berikut adalah gambar Tabel fact_penjualan bersera Tabel Multidimensional yang dibutuhkan untuk pembuatan Data Warehouse dengan model schema bintang sesuai dengan point Batasan masalah diatas. Skema diatas mengikuti bentuk bintang, dimana terdapat satu tabel fakta (fact table) di pusat bintang dengan beberapa tabel dimensi (dimensional tables) yang mengelilinginya. Semua tabel dimensi berhubungan dengan ke tabel fakta. Tabel fakta memiliki beberapa key yang merupakan kunci indek individual dalam tabel dimensi. 3. Kesimpulan dan Saran 1. Kebutuhan informasi yang diperoleh dari proses perancangan datamart ,sangat membantu para eksekutif dalam mengambil keputusan. dimana informasi ini nantinya dapat juga digunakan untuk membangun data warehouse 2. Setelah datamart ini diimplementasikan diharapkan dapat membentuk datawarehouse yang dapat mengintegrasikan datamart-datamart yang telah dibuat di tiap-tiap departemen maupun di kantor-kantor cabang. sehingga nantinya datawarehouse ini dapat di minning knowledge nya guna menentukan keputusan apa yang tepat diambil di masa mendatang 3. Dengan adanya proses data mining dari data warehouse yang sudah terbentuk diharapkan dapat mempercepat dan mempermudah para eksekutif dalam mengambil keputusan dikarenakan data mining hanya akan menampilkan data yang telah ter summary dengan baik menggunakan algoritma yang sesuai dengan kebutuhan perusahaan 4. Keberadaan data warehouse sangat penting sebagai salah satu tool dari pengambilan keputusan, Adanya data warehouse diharapkan dapat membantu perusahaan menjadi lebih unggul dari saingannya dan jeli melihat peluang pasar. Daftar Pustaka : 1. article07-Which Data Warehouse Architecture Is Most Successful.pdf 2. article08-Key organizational factors in data warehouse architecture selection.pdf 3. article11-MGI_big_data_exec_summary.pdf 4. Multidimensional Database Technology - article13-I1_pederson_p40.ppdf 5. article15-GIS and Business Intelligence - The Geographic Advantage.pdf 6. article16-BI and GIS Combine for Mapping Nuts and Bolts 41522173.pdf 7. Data Mart Concepts http://gkmc.utah.edu/ebis_class/2003s/Oracle/Cookbook/dm_conce.htm 8. http://en.wikipedia.org/wiki/Data_warehouse 9. http://en.wikipedia.org/wiki/Data_mart 10. From Enterprise Models to Dimensional Models: A Methodology for Data Warehouse and Data Mart Design - Daniel L. Moody (paper)