MENGENAL DATA WAREHOUSE Kusumawardani [email protected] :: http://ilmuti.org/author/kusumawardani/ Abstrak Tentu setiap orang kenal dengan yang namanya data, karena segala aktifitas sudah pasti merangkum data yang akan disimpan untuk dijadikan sebagai informasi. Saya akan menjelaskan data yang digunakan sebagai gudangnya dari data yaitu data warehouse. Pada perusahaan-perusahaan besar atau pun perusahaan kecil tidak luput dari data warehouse, karena jika tidak ada data warehouse, maka tidak ada gudang data organisasi disimpan secara elektronik, dirancang untuk memfasilitasi pelaporan dan analisis data. Gudang data atau Data Warehouse adalah kumpulan data yang berorientasi subjek, terpadu atau terintegrasi, time-variant atau rentang waktu dan nonvolatile untuk mendukung proses manajemen pengambilan keputusan. Data warehouse berfokus pada penyimpanan data. Namun, cara untuk mengambil dan menganalisis data, ekstrak, transformasi dan data beban, dan untuk mengelola data kamus juga dianggap komponen penting dari sistem penyimpanan data. Banyak referensi ke data pergudangan menggunakan konteks yang lebih luas. Jadi, definisi yang diperluas untuk data pergudangan meliputi alat intelijen bisnis, alat untuk ekstrak, transform dan load data ke dalam repositori, dan alat untuk mengelola dan mengambil data. Data pergudangan muncul membutuhkan sebuah organisasi untuk dapat diandalkan, laporan konsolidasi, unik dan terpadu dan analisis data tersebut, pada tingkat agregasi yang berbeda. Kata Kunci: Data, Data Warehouse, Gudang Data, Analisis Data, Data Pergudangan Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Pendahuluan Definisi Data adalah catatan atas kumpulan. Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra. Dalam keilmuan (ilmiah), fakta dikumpulkan untuk menjadi data. Data kemudian diolah sehingga dapat diutarakan secara jelas dan tepat sehingga dapat dimengerti oleh orang lain yang tidak langsung mengalaminya sendiri, hal ini dinamakan deskripsi. Pemilahan banyak data sesuai dengan persamaan atau perbedaan yang dikandungnya dinamakan klasifikasi. Dalam pokok bahasan Manajemen Pengetahuan, data dicirikan sebagai sesuatu yang bersifat mentah dan tidak memiliki konteks. Dia sekadar ada dan tidak memiliki signifikansi makna di luar keberadaannya itu. Dia bisa muncul dalam berbagai bentuk, terlepas dari apakah dia bisa dimanfaatkan atau tidak. Menurut berbagai sumber lain, data dapat juga didefinisikan sebagai berikut: • Menurut kamus bahasa inggris-indonesia, data berasal dari kata datum yang berarti fakta • Dari sudut pandang bisnis, data bisnis adalah deskripsi organisasi tentang sesuatu (resources) dan kejadian (transactions)yang terjadi • Pengertian yang lain menyebutkan bahwa data adalah deskripsi dari suatu kejadian yang kita hadapi Intinya data itu adalah suatu fakta-fakta tertentu sehingga menghasilkan suatu kesimpulan dalam menarik suatu keputusan. Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Pembahasan Data warehouse adalah suatu konsep dan kombinasi teknologi yang memfasilitasi organisasi untuk mengelola dan memelihara data historis yang diperoleh dari sistem atau aplikasi operasional [Ferdiana, 2008]. Pemakaian teknologi data warehouse hampir dibutuhkan oleh semua organisasi, tidak terkecuali Perpustakaan. Data warehouse memungkinkan integrasi berbagai macam jenis data dari berbagai macam aplikasi atau sistem. Hal ini menjamin mekanisme akses “satu pintu bagi manajemen untuk memperoleh informasi, dan menganalisisnya untuk pengambilan keputusan”. Beberapa konsep dasar tentang data warehouse : Data warehouse adalah data-data yang berorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan oleh para manajer di setiap jenjang (namun terutama pada jenjang manajerial yang memiliki peringkat tinggi). Data warehouse adalah suatu paradigma baru dilingkungan pengambilan keputusan strategik. Data warehouse bukan suatu produk tetapi suatu lingkungan dimana user dapat menemukan informasi strategik [Poniah, 2001, h.14]. Data warehouse adalah kumpulan data-data logik yang terpisah dengan database operasional dan merupakan suatu ringkasan. Data warehouse adalah data yang diperoleh dari proses dimana organisasi mengekstraksi makna dari aset infromasi yang mereka miliki. Data warehouse adalah inovasi baru dalam hal teknologi informasi. Sejak dimulai sekitar 15 tahun lalu, konsep data warehouse ini berkembang secara cepat sehingga saat ni konsep data warehouse ini adalah konsep yang paling banyak dibicarakan oleh para ahli di bidang tekhnologi informasi. Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org mendukung DSS (Decision Suport System) dan EIS (Executive Information System). Salinan dari transaksi data yang terstruktur secara spesifik pada query dan analisa. Salinan dari transaksi data yang terstruktur spesifik untuk querydan laporan. Karakteristik Data Warehouse 1. Berorientasi Subjek. Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi) dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya. Contoh lain misalnya di bank, aplikasi kredit mengotomasi fungsi-fungsi: verifikasi lamaran dan credit checking, pemeriksaan kolateral, approval, pendanaan, tagihan, dan seterusnya. Didalam data warehouse data-data yang dihasilkan dari proses kredit ini, diatur kembali (dikelompokkan) dan diintegrasikan (digabung) dengan data-data dari fungsi-fungsi lain, agar berorientasi pada misalnya nasabah dan produk. Gambar dibawah ini merupakan perbedaan mengenai data warehouse dan database operasional. Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org 2. Terintegrasi Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan yang konsisten, format-format, struktur terkodekan, serta karakteristikkarakteristik yang berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data pada sumber berbeda dapat diencode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat dienkode sebagai 0 dan 1 di satu tempat dan ”m” dan ”f” di tempat lain. Contoh lain misalnya : Data dari macam-macam aplikasi transaksi (untuk bank misalnya: tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada yang spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk kredit ada kolateral, untuk rekening koran ada overdraft) didalam data warehouse data-data yang sama harus diintegrasikan disatu database, termasuk misalnya diseragamkan formatnya (sederhana tetapi paling sering terjadi – aplikasi-aplikasi sering dibeli vendor berbeda, dibuat dengan/dijalankan di teknologi berbeda-beda) 3. Memiliki dimensi waktu (Time variant) Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse. Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi kode pos, maka yang lama dan yang Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org baru ada semua didalam data warehouse kita. Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah. 4. Non-volatile Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat „hanya-baca), Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem operasional. Data dalam database operasional akan secara berkala atau periodik dipindahkan kedalam data warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan, dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada gambar 2 dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi pada database data warehouse hanya bisa dibaca. 5. Ringkas Jika diperlukan, data operasional dikumpulkan ke dalam ringkasan-ringkasan Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org 6. Granularity Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi langsung dilakukan proses query. Pada data warehouse pada menganalisis harus memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-bulan. 7. Tidak ternormalisasi Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat redundan. Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya. Beberapa manfaat yang menyediakan data warehouse adalah sebagai berikut: Gudang data menyediakan model data yang umum untuk semua data tanpa bunga sumber data itu. Hal ini membuat lebih mudah untuk melaporkan dan menganalisa informasi daripada kalau beberapa model data yang digunakan untuk mengambil informasi seperti faktur penjualan, penerimaan pesanan, biaya buku besar, dll. Sebelum memasukkan data ke dalam data warehouse, ketidakkonsistenan diidentifikasi dan diselesaikan. Hal ini sangat menyederhanakan pelaporan dan analisa. Informasi dalam data warehouse adalah di bawah kontrol pengguna gudang data sehingga, bahkan jika sumber data sistem ini dihapus dari waktu ke waktu, informasi di gudang dapat disimpan dengan aman untuk waktu yang lama. Karena mereka terpisah dari sistem operasional, data warehouse menyediakan pengambilan data tanpa memperlambat sistem operasional. Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Data gudang dapat bekerja dalam kaitannya dengan dan, karenanya, meningkatkan nilai aplikasi bisnis operasional, terutama customer relationship management (CRM) sistem. Data gudang memfasilitasi aplikasi sistem pendukung keputusan seperti laporan tren (misalnya, barang-barang dengan penjualan paling di daerah tertentu dalam dua tahun terakhir), laporan pengecualian, dan laporan yang menunjukkan kinerja aktual versus tujuan. Kekurangan Data Warehouse Ada juga kerugian untuk menggunakan data warehouse. Beberapa di antaranya adalah: • Data gudang tidak lingkungan optimal untuk data tidak terstruktur. • Karena data harus diekstrak, diubah dan dimasukkan ke dalam gudang, ada unsur latency dalam data data warehouse. • Selama hidup mereka, gudang data dapat memiliki biaya tinggi. • Data gudang bisa mendapatkan usang relatif cepat. Ada biaya penyampaian informasi suboptimal bagi organisasi. • Ada sering garis tipis antara gudang data dan sistem operasional. Gandakan, fungsionalitas mahal dapat dikembangkan. Atau, fungsi dapat dikembangkan di gudang data yang, dalam retrospeksi, seharusnya dikembangkan dalam sistem operasional. Contoh Aplikasi Beberapa aplikasi pergudangan data dapat digunakan untuk sebagai berikut: o Kartu kredit churn analisis o Asuransi analisis penipuan o Call catatan analisis o Logistik manajemen. Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Penutup Banyak definisi tentang data warehouse, namun definisi yang paling populer berasal dari Bill Inmon. Menurutnya, "Gudang data adalah kumpulan data yang berorientasi subjek, terpadu atau terintegrasi, time-variant atau rentang waktu dan non-volatile untuk mendukung proses manajemen pengambilan keputusan." Berorientasi Subjek: Sebuah gudang data dapat digunakan untuk menganalisa suatu subyek tertentu. Misalnya, "penjualan" bisa menjadi topik atau subyek yang dianalisis. Terintegrasi: Sebuah data warehouse mengintegrasikan data dari berbagai sumber data. Misalnya, sumber A dan sumber B mungkin memiliki cara yang berbeda untuk mengidentifikasi produk, tetapi dalam data warehouse, hanya akan ada satu cara untuk mengidentifikasi produk, sehingga keduanya akan mempunyai cara yang sama dalam mengidentifikasi produk. Rentang Waktu: Seluruh data historis disimpan di gudang data. Sebagai contoh, seseorang dapat mengambil data per 3 bulan, 6 bulan, 12 bulan, atau bahkan lebih lama. Ini berbeda dengan sistem transaksi, yang hanya menyimpan data terbaru. Sebagai contoh, sistem transaksi dapat menyimpan alamat terbaru dari pelanggan, data warehouse dapat menampung semua alamat yang terkait dengan pelanggan. Non-volatile: Setelah data berada di dalam data warehouse, data tidak akan berubah. Jadi, data historis yang telah berada di dalam gudang data tidak akan berubah. Ralph Kimball memberikan definisi yang lebih singkat tentang data warehouse: "Gudang data adalah salinan data transaksi khusus terstruktur untuk query dan analisis." Ini adalah pandangan fungsional dari data warehouse. Kimball tidak membahas bagaimana data warehouse dibangun seperti yang dilakukan Inmon, karena dia lebih fokus pada fungsi data warehouse. Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Referensi www.1keydata.com/datawarehousing/data-warehouse-definition.html http://en.wikipedia.org/wiki/Data_warehouse http://artikel50.blogspot.co.id/2010/06/data-warehouse-sebuah-gudang-data.html https://id.wikipedia.org/wiki/Data https://opistation.wordpress.com/2013/10/15/pengertian-data-warehouse/ Biografi Nama saya Kusumawardani, wanita yang berusia 19 tahun, lahir pada tahun 1997.Hobi saya adalah bermain musik, belajar atau membaca yang berhubungan dengan komputer, suka membuat eksperimen, berolahraga, travelling. Aktivitas saya adalah bekerja sebagai operator pada salah satu warnet di Kota Tangerang dan melanjutkan studi saya ke jenjang diploma 3 pada salah satu perguruan tinggi di Kota Tangerang. Dibawah ini saya mencantumkan beberapa kontak yang bias dihubungi jika anda mengalami kendala dalam membaca artikel saya, terima kasih. Whatsapp : 081298545630 Email : [email protected] [email protected] Lisensi Dokumen: Copyright © 2008-2017ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org