BAB 2 LANDASAN TEORI 2.1 Dasar-Dasar Data Warehouse 2.1.1 Pengertian Sistem Informasi 2.1.1.1 Pengertian Sistem Menurut elemen-elemen McLeod ( 1998, p11 ), sistem yang terintegrasi dengan merupakan maksud yang sekelompok sama untuk mencapai suatu tujuan. Menurut O’Brien ( 2005, p22 ), sistem merupakan sekelompok komponen-komponen yang saling berhubungan satu sama lain dan bekerja bersama-sama untuk mencapai suatu tujuan dengan menerima input dan menghasilkan output yang melalui proses transformasi. Menurut O’Brien, dalam sistem terdapat 3 komponen-komponen yang saling berinteraksi, diantaranya adalah : 1. input, meliputi penangkapan elemen-elemen yang masuk ke dalam sistem untuk diproses. 2. proccessing, meliputi proses transformasi yang mengubah input menjadi output. 3. output, meliputi pemindahan elemen-elemen yang telah dihasilkan melalui proses transformasi. 7 8 Sistem boundary Input Apa itu Sistem ? Bagaimana sistem dikontrol ? Feed-Forward Output Feedback Sistem Enviroment Gambar 2.1. Bagian Dari Sebuah Sistem Dan Relasinya Satu Sama Lain Berdasarkan pada Gambar 2.1 karakteristik sistem dapat dijelaskan sebagai berikut : 1. Sebuah sistem berada dalam sebuah informasi 2. Sebuah sistem dipisahkan dari lingkungannya oleh beberapa batasan 3. Sistem memiliki input dan output. Mereka menerima input dari lingkungan dan mengirimkan output menuju lingkungan. 4. Sistem memiliki interface. Sebuah interface memungkinkan komunikasi diantara 2 sistem 5. Sistem dapat memiliki subsistem-subsistem 6. Sistem yang bertahan memiliki mekanisasi kontrol 7. kontrol sistem bertumpu pada feedback (dan kadang-kadang feedforward) 8. Sebuah sistem memiliki beberapa properti yang secara tidak langsung berdiri sendiri pada properti-properti dari bagian-bagiannya. 9 2.1.1.2 Pengertian Informasi Menurut O’Brien ( 2005, p27 ), informasi didefinisikan sebagai data yang telah diubah menjadi sebuah konteks yang berarti dan berguna bagi end-user. Menurut McLeod ( 1998, p15 ), informasi merupakan data yang telah diproses atau data yang memilki arti. Informasi adalah data yang telah diolah menjadi sebuah bentuk yang berarti bagi si penerima dan bermanfaat dalam pengambilan keputusan. 2.1.1.3 Pengertian Sistem Informasi Menurut O’Brien ( 2005, p6 ) ”An Information System is an organized combination of people, hardware, software, communicaton network, an data recources that collects, transform and disseminates information in an organization”, yang berpengertian sistem informasi merupakan kombinasi antara orang, perangkat keras, perangkat lunak, jaringan komunikasi dan sumber data organisasi. yang dikumpulkan, diubah dan informasi dalam sebuah 10 Tujuan dari sistem informasi adalah untuk memenuhi kebutuhan informasi umum semua manajer dalam perusahaan atau dalam subunit fungsional perusahaan. Subunit dapat didasarkan pada area fungsional atau tingkatan manajemen. Sistem informasi manajemen menyediakan informasi bagi pemakai dalam bentuk laporan dan output, model dapat disediakan dalam bentuk tabel atau grafik. Gambar 2.2 Piramida Sistem Informasi Berdasarkan pada gambar 2.2 maka dapat dijelaskan sebagai berikut: 1. Sistem Informasi untuk perencanaan strategis dan kebijakan serta pengambilan keputusan. 2. Sistem Informasi untuk perencanaan taktis dan pengambilan keputusan. 3. Sistem Informasi untuk perencanaan operasional, pengambilan keputusan dan pengendalian. 4. Pengolahan transaksi pemberian informasi (tanggapan dan pertanyaan) 11 2.1.2 Pengertian Database Menurut Thomas Connolly dan Carolyn Begg (2002, p14), “Database is a shared collection of logically related data, and a decription of this data, designed to meet the information needs if an organization”, yang kemudian diartikan sebagai berikut database adalah kumpulan data yang saling berhubungan satu sama lain yang digunakan secara bersama-sama dan kumpulan data ini dirancang untuk memenuhi kebutuhan informasi suatu perusahaan. 2.1.3 Pengertian Data Warehouse Menurut Vidette Poe (1996, p6), “A Data Warehouse is as read-only analytical database that used as the foundation of decision support system”, yang berarti bahwa Data Warehouse merupakan database yang bersifat analisis dan hanya dapat dibaca, dimana database tersebut digunakan sebagai dasar penunjang pengambilan keputusan. Menurut W.H.Inmon (2002, p389), “A data warehouse is a collection of integrated database designed to support the DSS function, where each unit of data is relevant to some moment in time” yang artinya Data warehouse adalah sekumpulan data yang dirancang untuk mendukung fungsi DSS, dimana setiap unit data relevan pada beberapa waktu. Menurut Thomas Connolly dan Carolyn Begg (2002, p1047) Data Warehouse adalah ”subject oriented, integrated, time-variant, and non-volatile collection of data in support of management’s decision-making process”. Yang dapat diartikan sebagi kumpulan data yang berorientasi pada subjek, terintegrasi, 12 memiliki rentang waktu tertentu, serta bersifat tidak selalu berubah yang digunakan untuk mendukung proses pengambilan keputusan. Keuntungan data warehouse menurut Thomas Connolly dan Carolyn Begg (2002, p1048) adalah sebagai berikut: a. Potential high returns on investment yang berarti kembalinya modal yang telah dikeluarkan akan lebih cepat. b. Competitive advantage, yang dapat diartikan bahwa dengan teknologi ini akan membawa keuntungan dalam bersaing dengan perusahaan lainnya yang sejenis. c. Increased productivity of corporate decision-maker, yaitu meningkat produktivitas perusahaan dalam pengambilan keputusan menghasilkan database terintegrasi yang konsisten, berorientasi subjek, serta bersifat historical. 2.1.4 Istilah-Istilah Dalam Data Warehouse Beberapa istilah-istilah yang berhubungan dengan data warehouse antara lain : 1. DSS (Decision Support System) Menurut Vidette Poe (1996, p23) ”A Decision support system is a system to users so that they can analyze a situation and make decisions”, yang dapat diartikan bahwa DSS merupakan suatu sistem yang memberikan informasi kepada pengguna, sehingga pengguna dapat menganalisa situasi. Selain itu DSS juga menyediakan informasi untuk membantu karyawan dalam pengambilan keputusan yang lebih efektif dalam mengerjakan tugas mereka. 13 2. Data mart Menurut W.H.Inmon ( 2002, p389 ) “Data mart is a departmentalized structure of data feeding from the data warehouse where data is denormalized based on the department’s need for information”, yakni data yang bersumber dari Data Warehouse yang bersifat sebagian – sebagian, dimana data tersebut diolah kembali (denormalisasi) sesuai dengan informasi yang dibutuhkan oleh masing – masing bagian (fungsi bisnis). Menurut Connolly ( 2002, p1067 ) “Data mart is a subset of a data warehouse that support the requirements of a particular department of business function”, yang berarti Data Mart adalah subset dari data warehouse yang mendukung kebutuhan informasi dari suatu departemen atau fungsi tertentu. Karakterisistik dari data mart meliputi : Data mart hanya berfokus pada kebutuhan suatu departemen atau fungsi bisnis. Data mart tidak berisi data operasional yang detail seperti data warehouse Data mart lebih mudah dimengerti karena data pada data mart lebih sedikit. 3. OLAP (On Line Analytic Processing) Menurut Connolly ( 2002, p1101 ) “OLAP is the dynamic synthesis, analysis, and consolidation of large volumes of multi- dimensional data”, yang berarti perpaduan dinamis, analistis dan 14 penggabungan data multi - dimensional dalam jumlah besar. OLAP adalah terminology yang menjelaskan teknologi yang menggunakan sudut pandang dari berbagai dimensi (multi dimensional) sehingga dapat mempercepat pengaksesan startegi informasi untuk tujuan lanjutan. OLAP juga memampukan pengguna untuk lebih memahami bahkan menyelami berbagai aspek perusahaan secara cepat, konsisten serta interaktif dalam melakukan pengaksesan ke berbagai macam sudut pandang data yang memungkinkan. 4. OLTP (On Line Transaction Processing) Menurut Connolly ( 2002, p1045 ) OLTP merupakan prosesa penyimpanan data mengenai kegiatan operasional atau transaksi kegiatan perusahaan sehari-harinya. OLTP dirancang untuk memungkinkan terjadinya pengaksesan secara bersamaan oleh beberapa user terhadap sumber data yang sama dan mengatur proses yang diperlukan. 5. Tabel Dimensi Menurut Inmon ( 2002, p389 ) “Dimension table is the place where extraneous data that relates to fact table is placed in a multidimensional table”. Yang dapat diartikan sebagai tempat data lain (asing) yang terhubung dengan tabel fakta yang ditempatkan pada tabel multi - dimensional. Tabel dimensi dapat berisikan kategori dengan ringkasan data detail yang dapat dilaporkan 15 6. Tabel Fakta Menurut Inmon ( 2002, p391 ) “Fact table is the center of a star join table that has many occurences will be located”, yang berarti tabel fakta adalah tempat yang sediakan untuk tabel pusat dari tabel bintang join yang memiliki beberapa kejadian (occurences). Tabel yang pada umumnya mengandung histori dimana key yang dihasilkan sangat unik karena merupakan kumpulan foreign key dan primary key yang ada pada table dimensi yang berhubungan atau merupakan tabel terpusat dari skema bintang. Tabel fakta juga menyimpan measure yang berbeda, seperti measure yang secara langsung terhubung dengan tabel dimensi (Additive) dan measure yang tidak berhubungan dengan tabel dimensi (Non Additve). 7. Data Mining Menurut Connolly ( 2002, p1115 ) “Data mining is the process of extracting valid, previously unknown, comprehensible, and actionable information from large databases and using it to make crucial business decisions ”. Yang berarti proses mengekstrak informasi dari database yang besar dan digunakan untuk membuat hal-hal yang bersifat penting dalam bisnis. 8. Metadata Menurut Mallach ( 2000, p514 ) ”Metadata are data that describe the data in the data warehouse”. Yang berarti data yang menjelaskan 16 data dalam data warehouse. Metadata diperlukan jika orang ingin mengakses data pada data warehouse. 2.2 Arsitektur Data Warehouse create Queries Metadata Data Mining Database Extract Cleanse Transform Load Summarize Transaksi dan Data Eksternal Lainnya Data Staging User Data Warehouse Gambar 2.3 Arsitektur Data Warehouse Berdasarkan pada Gambar 2.3 Elemen utama, entity eksternal yang berinteraksi dengan data warehouse menurut Mallach ( 2000, p473 ), yaitu: • Database operasional lainnya diberikan pada data warehouse. Data eksternal lainnya juga diberikan pada data warehouse. Data warehouse 17 mendapatkan salinan dari data yang berasal dari database. Database tidak menyimpan langsung data. • Data yang disimpan dalam database akan di-extract dan dibawa ke dalam data warehouse. Dalam melakukan proses meng-extract ini, harus sering melakukan transform data ke struktur data database dan format internal dari data warehouse. • Pada proses cleanse data, memastikan data berkualitas untuk pengambilan keputusan. • Selain itu juga dilakukan proses load, yang menyimpan data pada database data warehouse. Mulai dari proses extraction, cleanse, transform sampai load disebut sebagai data staging. • Proses selanjutnya adalah membuat ringkasan data (summarize) seseuai dengan yang diinginkan dan yang dibutuhkan. Data yang diringkas berasal dari data yanag tersimpan dalam data warehouse, dimana data tersebut bersumber dari data eksternal maupun internal. • Metadata berguna untuk mengetahui data yang berada dalam data warehouse. Misalnya dari mana asalnya data warehouse tersebut, atau siapa yang bertanggung jawab terhadap data tersebut. Metadata juga 18 memiliki query tool yang ada dalam data warehouse, seperti di mana data tersebut dapat ditemukan, siapa yang berhak untuk mengakses data serta ringkasan data apa yang belum diperhitungkan. • Database data warehouse berfungsi untuk menampung data detail dan ringkasan data dari data warehouse. • Query tool digunakan pada end user untuk memberikan pertanyaan terhadap database. Proses memberikan pertanyaan ini disebut sebagai online analytical processing (OLAP). Query tool juga dapat digunakan untuk mendapatkan data yang belum terbentuk (data mining). • User adalah pengguna dari data warehouse tersebut. 19 2.3 Struktur Data Warehouse Highly Summarized Lightly Summarized M E T A D A T A Current Detail Old Detail Gambar 2.4 Struktur Data Warehouse Menurut Inmon ( 2002, pp36-pp37 ) yang terdapat pada Gambar 2.4 data warehouse memilki struktur yang spesifik dan mempunyai perbedaan dalam tingkatan detil data serta perbedaan dalam tingkatan umur data. 2.3.1 Current Detail Data Current Detail data adalah data detil yang sedang aktif saat sekarang ini, dimana data ini mencerminkan keadaan yang sedang berjalan. 20 Alasan perlu diperhatikannya current detail data adalah sebagai berikut: 1. Melukiskan kejadian yang baru terjadi 2. Hampir selalu disimpan dalam media penyimpanan karena pengaksesannnya cepat, tetapi lebih mahal karena membutuhkan media penyimpanan yang besar dan kompleks dalam pengaturannya 3. Current detail data bersifat akurat, agar dapat digunakan untuk membuat rekapitulasi 4. Jumlahnya sangat banyak dan disimpan pada tingkat penyimpanan terendah 2.3.2 Old Detail Data Menurut Alex, Stephen, Kurt (2000, p27) old detail data merepresentasikan current detail data atau history dari area subject yang lama. Data ini yang membuat analisis trend yang mungkin. Old detail data biasanya berupa backup dalam storage terpisah dan mencerminkan umur data agar sewaktu - waktu dapat diakses. Data ini jarang diakses, sehingga disimpan dalam media penyimpanan alternatif seperti tape disk. 2.3.3 Lightly Summarized Data Merupakan ringkasan dari current detail data akan tetapi bukan bersifat total summary. Data ini memiliki tingkatan detail yang lebih tinggi, dan tingkatan ini juga disebut data mart. Data dapat diakses dan hasilnya banyak digunakan untuk view dari kondisi yang sedang berjalan. 21 2.3.4 Highly Summarized Data Ini merupakan data summary totalitas, datanya dapat dianalisis berdasarkan urutan waktu, analisis multidimensi untuk mendukung pengambilan keputusan serta data ini mudah diakses. 2.4 Anatomi Data Warehouse Dalam menentukan bentuk data warehouse berasal dari berbagai sumber dan kemudian dipindahkan ke dalam sebuah tempat penyimpanan data . Kita perlu mengetahui kebutuhan yang diperlukan untuk menjalankan aplikasi yang dirancang. Dengan adanya teknologi client/server memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan pengguna sistem secara lebih proporsional. Ada 3 jenis dasar sistem data warehouse, yaitu : 22 2.4.1 Anatomi Data Warehouse Fungsional Source Data Warehouse Fungsional Workstation Source Data Warehouse Fungsional Source Workstation Gambar 2.5 Data Warehouse Fungsional Berdasarkan pada Gambar 2.5 maka dapat dijelaskan Data warehouse fungsional dibuat lebih dari satu dan dikelompokkan berdasarkan tiap bagian fungsi bisnis, misalnya departemen, divisi dan sebagainya. Setiap unit fungsi dapat mempunyai gambaran datanya masing-masing. Penerapan jenis sistem pengumpulan data seperti ini merupakan kerugian dari sistem ini, karena kemampuan pengumpulan data yang terbatas bagi pengguna. Sehingga beresiko kehilangan konsistensi data diluar lingkungan fungsi bisnis yang bersangkutan. Apabila pendekatan ini lingkupnya menjadi lingkup perusahaan, maka konsistensi data dari perusahaan tidak terjamin lagi. 23 Selain kerugian pendekatan ini juga memiliki keuntungan yang memberi solusi yang mudah untuk dibangun dengan biaya yang relatif rendah dan dapat memberikan kelompok pengguna sebuah kemampuan sistem dengan data yang terbatas. 2.4.2 Anatomi Data Warehouse Terpusat Source Data Warehouse Fungsional Source Data Warehouse Terpusat Source Data Warehouse Fungsional Gambar 2.6 Data Warehouse Terpusat Pada Gambar 2.6 dapat dijelaskan bahwa Data warehouse terpusat merupakan pendekatan yang paling umum dan banyak digunakan, karena kebiasaan pengguna dengan lingkungan main frame yang terpusat. Data diambil dari seluruh sistem operasional dan disimpan dalam pusat penyimpanan data. Data yang telah terkumpul tersebut dibagi-bagi berdasarkan fungsi-fungsi yang dibutuhkan oleh perusahaan yang belum memliki jaringan eksternal 24 Keuntungan data warehouse terpusat adalah bahwa data benar-benar terpadu/ terintegrasi dengan baik. Tetapi pendekatan ini mengharuskan pemasok data untuk mengirimkan data tepat pada waktunya agar tetap konsisten dengan pemasok lainnya. Disamping itu pengguna hanya dapat mengambil data dari pusat pengumpulan saja dan tidak dapat secara langsung berhubungan dengan pemasok datanya sendiri. Adapun kekurangan dari sistem ini adalah biaya pemeliharaan yang besar atas pengumpulan data yang demikian besar dan waktu untuk membangun sistem ini lama. 25 2.4.3 Anatomi Data Warehouse Terdistribusi Source Workstation Data Warehouse Gateway Source Source Workstation Gambar 2.7 Data Warehouse Terdistribusi Pada gambar 2.7 maka dapat dijelaskan bahwa Data warehouse terdistribusi memiliki konsep data warehouse gateway, yang berfungsi sebagai jembatan antar lokasi data warehouse dengan workstation yang bersistem beda. Dimana memungkinkan pengguna untuk langsung mengakses sumber data yang berbeda di luar lokasi perusahaan (eksternal). Keunggulan yang dimiliki pendekatan ini adalah memungkinkan tiap departmen atau divisi membangun pengumpulan data fungsionalnya masing- masing, atau bahkan sistem operasionalnya, dan memadukan bagian-bagian tersebut dengan teknologi client / server. Kerugian dari pendekatan ini memerlukan biaya yang sangat besar karena setiap sistem pengumpulan data fungsional dan sistem operasinya dikelola secara 26 terpisah. Metode ini akan sangat efektif apabila data telah tersedia dalam bentuk yang konsisten. 2.5 Karakteristik Data Warehouse Menurut Inmon (2002, pp31-pp35) data warehouse berdasarkan subjek-subjek memiliki karakteristik sebagai berikut: Subject Oriented Data warehouse disusun (fungsi bisnis) yang ada didalam sebuah organisasi, bukan atau entity berorientasi pada data transaksi .Hal ini merefleksikan kebutuhan untuk menyimpan data pendukung keputusan daripada data transaksi. Time Variant Data warehouse menggunakan time stamp untuk mempresentasikan data history. Dimensi waktu penting untuk mengidentifikasi trend, memprediksikan operasi yang akan datang, dan men-setting target operasi. Data dalam data warehouse akan menjadi akurat dan valid pada beberapa interval waktu tertentu (seperti tahun, dekade). Integrated Data operasional yang berasal dari berbagai macam database dan sumber data eksternal di data warehouse digunakan untuk membuat keputusan. Data operasional tersebut membutuhkan suatu konsistensi penamaan, penggabungan format data dan perbandingan skala antara database dan sumber data eksternal. Hal ini menyebabkan data tersebut tidak konsisten, karena data warehouse menggabungkan berbagai data tersebut, makanya 27 kita harus mengintegrasikannya terlebih dahulu. Data disimpan sebagai satu kesatuan tunggal, bukan sebagai kumpulan file yang berbeda dalam pengelompokan data. Non Volatile Pada kenyataannya data pada data warehouse tidak boleh di update tetapi di refresh dari sistem operasional dalam basis regular. Jadi hanya menambah data baru, data yang lama tetap ada tidak dihapus. 2.6 Alat Perancangan Data Warehouse Adapun alat perancangan data warehouse menurut Vidette Poe (1996, pp120-pp121 ) adalah star schema (skema bintang). Yakni struktur sederhana yang terdiri dari beberapa tabel yang saling terhubung dan terdefinisikan dengan baik. Skema bintang terdiri dari 2 jenis tabel, yaitu tabel fakta dan tabel dimensi. Tabel fakta terkadang disebut sebagai major table, tabel yang berisi data fakta tentang bisnis. Sedangkan tabel dimensi, terkadang disebut minor table, yang berukuran lebih kecil dan gambaran data yang merefleksikan dimensi bisnis. 28 2.6.1 Skema Bintang Menurut Connolly (2002, p1079), “Star Schema is a logical structure that has a fact table containing factual data in teh center, surrounded by dimensio tables containing reference data (which can be denormalized)” Yang memiliki pengertian struktur logical yang memiliki tabel fakta yang mengandung data yang bersifat fakta ditengah dan beberapa tabel kecil (disebut tabel dimensi / dimension table), yang berisi data references yang mengelilingi tabel pusat (yang dapat di denormalisasi). 2.6.2 Jenis Skema Bintang 2.6.2.1 Skema Bintang Sederhana Menurut Vidette (1996, p124) pada skema bintang sederhana ini setiap tabel baik tabel dimensi maupun tabel fakta harus mempunyai primary key. Dimana primary key tersebut akan membuat setiap record-nya menjadi unik. Yang menjadi primary key pada tabel fakta adalah foreign key, yang dapat berjumlah lebih dari satu. Pada gambar dibawah terlihat hubungan antara satu tabel fakta dengan tiga tabel dimensi. Tabel fakta memiliki primary key yang terdiri dari tiga foreign key yaitu kunci 1, kunci 2, dan kunci 3. Terjadi hubungan one to many antara primary key pada tabel dimensi dengan foreign key pada tabel fakta. 29 Gambar 2.8 Skema Bintang Sederhana 2.6.2.2 Skema Bintang Dengan Beberapa Tabel Fakta Menurut Vidette (1996, p131) skema bintang dengan beberapa tabel fakta ini merupakan skema bintang yang bisa terdiri dari beberapa fakta atau lebih dari satu tabel fakta. Hal ini dapat terjadi karena tabel fakta tersebut berisi kenyataan yang tidak saling berhubungan. Skema bintang dengan banyak fakta dapat dilihat pada gambar dibawah ini. 30 Gambar 2.9 Skema Bintang Dengan Beberapa Tabel Fakta 2.6.2.3 Skema Bintang Dengan Tabel Dimensi Tambahan Skema bintang dengan tabel dimensi tambahan ini merupakan skema bintang yang bisa memiliki tabel dimensi tambahan. Dimana tabel dimensi yang ada mengandung foreign key yang mereferensikan primary key di tabel dimensi yang lain. Tabel yang direferensikan ini dinamakan outboard atau secondary dimension table. Gambar 2.10 Skema Bintang Dengan Tabel Dimensi Tambahan 2.1.1.1 Skema Snowflake Menurut Connolly (2002, p1080), “snowflake schema is a variant of the star schema where dimension table do not contain denormalized data”. Yang berarti skema snowflake adaalah bentuk lain dari skema bintang, dimana tabel dimensi tidak mengandung data yang didenormalisasi. (lihat gambar 2.10) Ciri – ciri Snowflake adalah : • Pada level atribut, tabel dimensi didenormalisasi • Setiap dimensi memilki satu kunci untuk setiap tingkatan pada hierarki dimensi • Tabel dimensi dihubungkan dengan tabel fakta dan tabel atribut ayng memiliki tingkatan rendah oleh kunci yang bertingkat rendah Gambar 2.11 Skema bintang Snowflake 2.1.2 Keuntungan Skema Bintang Menurut Connolly (2002, pp1081-pp1082), ada beberapa keuntungan menggunakan skema bintang dan snowflake yaitu : 1. Efisiensi, Lebih efisien dalam mengakses data karena struktur database yang konsisten 2. Skema bintang mampu beradaptasi terhadap perubahan kebutuhan pengguna. 3. Respon data lebih cepat daripada perancangan database operasional. 4. Extensibility, dimana mempermudah dalam hal modifikasi / pengembangan data warehouse yang terus-menerus. 5. Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan standar untuk menangani situasi umum di dunia bisnis terus bertambah. 33 2.7 Normalisasi vs Denormalisasi 2.7.1 Normalisasi Menurut Connolly (2002, p376), “Normalisasi is a technique for producing a set of relation with desirable properties, given the data requirements of an enterprise”, yang memiliki pengertian suatu teknik untuk menghasilkan sekumpulan relasi dengan properti yang diinginkan, memenuhi kebutuhan data pada perusahaan. Adapaun tujuan utama dari normalisasi adalah untuk menghilangkan redundancy atau ketergantungan data. Normalisasi memiliki lima tingkatan, namun demikian yang sering digunakan adalah tiga tingkatan pertama. Tingkatan – tingkatan tersebut antara lain: Unnormalized Form (UNF) Merupakan suatu tabel yang berisikan satu atau lebih group yang berulang. Dibuat dengan memindahkan semua data dari sumber informasi kedalam format tabel baris dan kolom. 1. First Normal Form (1NF) Merupakan sebuah relasi dimana setiap irisan antara baris dan kolom berisikan satu dan hanya satu nilai. Bentuk ini dapat dicapai dengan memindahkan group yang berulang. Bentuk 1NF ini digunakan untuk menghilangkan repeating group (functional dependency). 2. Second Normal Form (2NF) Merupakan sebuah relasi dalam 1NF dan setiap atribut non primary key bersifat fully functionally dependency pada primary key. Bentuk 2NF ini digunakan untuk menghilangkan partial dependency. 34 3. Third Normal Form (3NF) Sebuah relasi dalam 1NF dan 2NF dimana tidak terdapat atribut non primary key yang bersifat transitive dependency pada primary key. Bentuk 3NF ini digunakan untuk menghilangkan transitive dependency. 4. Fourth Normal Form (4NF) Dimana tingkatan pada normalisasi ini sangat jarang terjadi. Normalisasi ini dilakukan bila ada atribut yang bersifat multivalue dependency (memiliki nilai lebih dari 1) 5. Fifth Normal Form (5NF) Normalisasi ini dilakukan dengan membuang join dependency. Tingkatan pada normalisasi ini sangat jarang terjadi 2.7.2 Denormalisasi Denormalisasi merupakan penggabungan tabel untuk meningkatkan unjuk kerja (performance) yang ada. Hal ini merupakan sebuah proses yang melanggar peraturan struktur normalisasi bentuk ketiga. Alasan perlu dilakukannya denormalisasi oleh setiap perancang adalah: • Untuk mengurangi jumlah hubungan yang terjadi antara tabel-tabel dimana hubungan ini harus mengalami proses pada waktu dilakukan pencarian. Dengan cara ini, maka performance database dapat ditingkatkan. • Untuk membuat struktur fisik database semakin mendekati model dimensi pemakai. Pembuatan struktur tabel sesuai dengan yang ingin ditanyakan oleh pemakai. Memungkinkan terjadinya akses langsung, yang sekali lagi akan meningkatkan performance. 35 2.8 Tahapan Perancangan Data Warehouse Menurut Vidette Poe, dalam merancang data warehouse dapat menggunakan tahapan SDLC (System Development Life Cycle) yang meliputi beberapa fase berikut ini : a. Planning (Perencanaan) Sangat penting untuk melakukan perencanaan sebelum memulai untuk mengembangkan suatu proyek termasuk dalam mengembangkan proyek data warehouse. Perencanaan untuk data warehouse lebih difokuskan pada hal-hal berikut ini: • Mendefinisikan ruang lingkup (scope) dari proyek • Membuat rencana proyek • Mendefinisikan sumber-sumber apa saja yang dibutuhkan baik internal maupun eksternal • Mendefinisikan tugas-tugas dan tujuan-tujuannya • Mendefinisikan batasan waktu (timelines ) • Mendefinisikan tujuan akhir dari proyek yang dibuat b. Gathering data requirements and modeling (mengumpulkan permintaan data dan membuat model) Pada fase ini lebih difokuskan pada kebutuhan bisnis dan permintaan akan data dari pengguna. Fase ini dapat dilakukan kurang lebih dalam empat hingga enam minggu tetapi tidak lebih dari sepuluh minggu. Jika proyek yang dikerjakan terlalu lama, maka 36 ruang lingkup dari proyek tersebut harus dipecah menjadi fase yang lebih kecil lagi. Gathering data requirements (mengumpulkan permintaan akan data) • Bagaimana user melakukan bisnisnya. • Bagaimana performa user dapat diukur. • Atribut apa saja yang dibutuhkan user. • Apa saja hirarki dari bisnis tersebut. • Data yang digunakan user sekarang dan data apa yang kemudian mereka inginkan • Pada tingkat apa user menggunakan detail atau summary Data modeling (membuat model data) • Data model logika meliputi seluruh ruang lingkup dari pengembangan proyek termasuk relationship, cardinaliy, attribute dan candidate key. • Model bisnis dimensional yang menggambarkan fakta, dimensi, hirarki, relationship dan candidate key untuk semua ruang lingkup dari pengembangan proyek. 37 c. Physical database design and development (perancangan database fisikal dan pengembangannya) pada fase ini mencakup perancangan database dan denormalisasi. Fase ini juga mendukung untuk dilakukannya DSS (Decision Support System) dan pengembangannya. Pada fase perancangan database akan difokuskan pada: • Perancangan database yang meliputi tabel fakta, tabel relationship dan deskripsi dari tabel look up. • Denormalisasi data • Pengidentifikasian key • Membuat strategi pengindeksan • Membuat objek database yang sesuai Pada tahapan ini sangat penting diperlukan pemahaman tentang: Konsep pengambilan keputusan Konsep hirarki, dimensi dan fakta Pembuatan skema bintang Dalam perancangan database untuk data warehouse, diperlukan informasi yang luas dan lebih detail, yang akan membantu dalam proses ini, tahapan yang dilakukan: Pengembangan strategi agregasi Pengembangan strategi partisi Pengembangan perkiraan kapasitas 38 d. Data mapping and transformation (pemetaan data dan transformasi) Fase ini tergolong cukup canggih dan meliputi sumber dari data dalam sistem operasional, melakukan analisis untuk memahami tipe dari data transformasi yang dibutuhkan, dan pemetaan sumber data ke tujuan data warehouse pada perancangan database. Dalam fase ini, hal yang harus dilakukan adalah : • Mendefinisikan sumber sistem. • Menentukan layout dari file. • Melakukan pengembangan spesifikasi dari transformasi yang tertulis untuk transformasi yang canggih • Memetakan sumber ke tujuan • Meninjau ulang kemampuan perencanaan e. Data extraction and load (pengambilan data dan pengisian data) Proses utuh dari mengekstraksi, transformasi dan loading data ke dalam database tujuan akan sering dilakukan dengan bantuan dari teknologi transformasi data. Dengan menggunakan tool data transformasi akan mempengaruhi waktu dari fase siklus hidup dan mendukung tugas dan tujuannya. Fokus pada fase ini adalah : • Mengembangkan prosedur untuk mengekstrak dan memindahkan data • Mengembangkan prosedur untuk mengload data ke dalam warehouse 39 • Mengembangkan program atau menggunakan tool transformasi data untuk mentransformasi dan mengintegrasi data • Mencoba ekstraksi, transformasi dan meload prosedur f. Automating the data management process (mengotamasi proses manajemen data) Fase ini lebih terfokus pada otomasi pengekstraksian, transformasi dan load data warehouse. Seperti yang dijelaskan berikut ini: • Mengotomasi dan menjadwalkan proses ekstraksi data • Mengotomasi dan menjadwalkan proses transformasi data • Mengotomasi dan menjadwalkan proses loading data • Membuat backup dan merecovery prosedur • Melaksanakan full test dari semua prosedur yang diotomasi g. Application development – creating the starter set of reports (pengembangan aplikasi – membuat penetapan awal untuk laporan) Pengembangan aplikasi dapat langsung dilakukan setelah kita melakukan pengujian pada data. Pengembangan aplikasi DSS biasanya dilakukan dengan menggunakan tool pengaksesan data. Pada fase ini biasanya aplikasi dibuat dengan menuliskan coding Visual Basic tentu saja dengan memperhitungkan berapa lama waktu yang dibutuhkan untuk mengembangkannya. Hal yang termasuk di dalamnya, antara lain : 40 • Membuat set awal dari laporan yang telah didefinisikan sebelumnya • Mengembangkan laporan utama • Menguji laporan • Membuat dokumentasi dari aplikasi • Mengembangkan jalur navigasi h. Data validation and testing (validasi data dan pengujian) Pada fase ini aplikasi yang telah dihubungkan dengan data warehouse harus dilakukan validasi data dan testing. Yang didahului dengan proses ektraksi data, transformasi data dan loading data. i. Training Pada fase ini, pihak perusahaan memberikan pelatihan kepada semua staff yang hendak memakai aplikasi ini. Untuk mendapatkan value sesungguhnya dari bisnis, semua user dalam perusahaan harus dilatih dalam hal : • Ruang lingkup data warehouse • Tool untuk pengaksesan pada front end dan bagaimana cara kerjanya • Aplikasi DSS dan set awal dari report yang digunakan • Training yang akan membantu user dalam mengunakan sistem yang akan diterapkan dalam perusahaan 41 j. Rollout Fase terakhir dalam SDLC dilakukan untuk menyebarkan data warehouse kita kepada komunitas user yang akan menggunakannya. Hal yang termasuk di dalamnya: • memasang infrastruktur yang mendukung semua user. Misalnya komponen yang digunakan dalam LAN atau WAN. • Memperkenalkan aplikasi DSS • Membuat stuktur bantuan yang dapat digunakan oleh user • Membuat prosedur untuk menambah laporan baru dan memperluas aplikasi DSS • Membuat prosedur untuk membackup aplkasi DSS, tidak hanya untuk data warehouse • Membuat prosedur untuk investigasi dan memecahkan permasalahan integrasi data. 2.9 Tahapan Perancangan Sistem Berdasarkan Pressman (2001, pp29-pp30) model linier sequensial yang atau yang dikenal dengan model waterfall dibagi menjadi empat tahapan utama seperti yang dapat dilihat pada gambar di bawah ini (gambar 2.12). 42 Gambar 2.12 Model Waterfall Berdasarkan pada Gambar 2.12 maka dapat dijelaskan sebagai berikut: 1. Analisis Proses mengumpulkan kebutuhan difokuskan untuk pengembangan software. Untuk memahami program yang hendak dibuat, maka seorang analis harus memahami domain dari informasi yang akan digunakan untuk software, seperti halnya fungsi yang dibutuhkan, kelakuan, kinerja, dan antarmuka. Hasil analisa kebutuhan ini didokumentasikan dan di evaluasi oleh customer / user. 2. Desain Desain software adalah multi proses yang berfokuskan pada empat atribut utama dari program, yaitu : struktur data, arsitektur software, representasi antarmuka, dan detail algoritma / prosedur. Proses desain mengubah kebutuhan menjadi suatu representasi software yang dapat dievaluasi untuk kualitas sebelum proses coding. Proses desain ini didokumentasikan dan menjadi bagian dari konfigurasi software. 3. Coding juga harus 43 Pada tahapan ini desain diterjemahkan ke dalam suatu bahasa pemrograman yang dipahami oleh mesin. Jika desain dilakukan secara terperinci, maka coding dapat dilakukan secara mekanis. 4. Testing Setelah coding telah selesai, maka dilakukan testing program. Proses testing difokuskan pada logika internal dari software untuk memastikan bahwa setiap pernyataan yang ada telah diuji, dan juga fungsional eksternal untuk menemukan kesalahan yang ada dan untuk memastikan bahwa input yang diberikan akan menghasilkan output yang benar. 5. Support Tahapan ini tidak harus ada, karena setelah software diserahkan pada costumer / user, besar kemungkinan software akan mengalami perubahan / perbaikan. Perubahan terjadi karena adanya kesalahan, karena software harus dapat mengakomodasikan perubahan pada lingkungan eksternal, atau karena perubahan kebutuhan user. Software support / perawatan dapat mengulang tiap tahapan fase / langkah yang ada. 2.10 Makro Ekonomi Menurut Sadono, makro ekonomi adalah gambaran mekanisme kerja perekomian secara keseluruhan. Hubungan yang terdapat dalam makro ekonomi 44 adalah hubungan kausal / sebab-akibat antar variabel-variabel secara keseluruhan. Berikut ini adalah beberapa tersebut antara lain: • Sektor Rumah Tangga Pada sektor rumah tangga, kebutuhan energinya dihitung berdasarkan laju pertumbuhan jumlah rumah tangga dan tingkat pemakaian energi yang didasarkan pada Kebutuhan energi ini dipakai untuk memasak, pertumbuhan GDP. penerangan dan peralatan-peralatan. • Sektor Industri dan Komersial Sektor industri dianalisis secara sektoral, antara lain menurut inustri-industri logam dasar, semen, pupuk, kimia, kertas, gula dan nonmetalik. • Sektor Transportasi Pada sektor transportasi yang saat ini menduduki peringkat kertiga dalam mengkonsumsi energi setelah sektor rumah tangga dan sektor industri, pertumbuhan pemakaian energinya dipengaruhi oleh laju pertumbuhan penduduk dan tingkat perekonomian nasional. Analisis – analisis makro ekonomi menerangkan tentang : i. Pentingnya segi permintaan dalam menentukan tingkat kegiatan dalam perekonomian. 45 ii. Pentingnya kebijakan dan campur tangan pemerintah untuk mewujudkan prestasi kegiatan ekonomi di tingkat yang dikehendaki 2.10.1 Isu – Isu Utama Dalam Analisis Makro Ekonomi Makro ekonomi membahas isu-isu penting yang selalu dihadapi sesuatu perekonomian. Analisisnya berusaha memberi jawaban kepada pertanyaan – pertanyaan yang muncul. Pertanyaan tersebut meliputi ; a. Mengapa pertumbuhan ekonomi tidak selalu teguh? b. Mengapa kegiatan perekonomian tidak berkembang dengan stabil? c. Mengapa pengangguran dan kenaikan harga – harga selalu berlaku. Selain menjelaskan tentang keadaan yang menciptakan masalah perekonomian yang terjadi, analisis ekonomi juga menjelaskan langkah-langkah yang dapat digunakan untuk mengatasi masalah-masalah tersebut, antara lain; 1. Penentuan kegiatan ekonomi Analisis ini menunjukkan bagaimana pengeluaran agregat (permintaan agregat) dan penawaran agregat akan menentukan titik keseimbangan kegiatan sesuatu perekonomian. Dalam suatu perekonomian modern, komponen dari pengeluaran agregat dibedakan menjadi 4 golongan : a. Pengeluaran konsumsi rumah tangga b. Investasi perusahaan-perusahaan 46 c. Pengeluaran konsumsi dan investasi pemerintah d. Ekspor (pembelian baranag buatan dalam negeri oleh penduduk negara-negara lain) 2. Masalah dan kebijakan makro ekonomi Salah satu aspek penting dari ciri kegiatan perekonomian yang menjadi titik tolak analisis dalam teori makro ekonomi adalah pandangan bahwa sistem pasar bebas tidak dapat mewujudkan : a. Penggunaan tenaga kerja penuh b. Kestabilan harga-harga c. Pertumbuhan ekonomi yang teguh Setiap perekonomian akan selalu menghadapi masalah pengangguran, kenaikan harga – harga, dan pertumbuhan ekonomi yang tidak teguh. Dari permasalahan yang muncul tersebut, maka pemerintah menetapkan kebijakan-kebijakannya, yakni ; 1. Kebijakan fiskal Langkah pemerintah dalam perpajakan dan pengeluaran, meliputi: Jenis – jenis pajak : • Pajak langsung 47 Pajak yang dibayarkan langsung oleh pihak yang wajib membayar pajak. • Pajak tak langsung Pajak yang bebannya boleh dipindah pindahkan pada pihak lain, contoh: pajak impor. Jenis – jenis pengeluaran : • Pengeluaran konsumsi rumah tangga Nilai perbelanjaan yang dilakukan oleh rumah tangga untuk membeli berbagai jenis kebutuhannya dalam satu tahun tertentu. • Pengeluaran pemerintah Biaya yang digunakan pemerintah untuk kepentingan masyarakat. Misalnya; fasilitas pendidkan dan kesehatan, biaya penegembagan infrastruktur 2. Kebijakan moneter Mengatur penawaran uang dan tingkat suku bunga. Kebijakan moneter dibedakan menjadi 2, yakni : • Kebijakan moneter kualitatif Merupakan kebijakan yang bersifat melakukan kebijakan terpilih ke atas beberapa aspek dari masalah moneter yang dihadapi pemerintah, meliputi kegiatan ; i. Operasi pasar terbuka ii. Mengubah tingkat bunga dan tingkat diskonto iii. Mengubah tingkat cadangan minimum 48 • Kebijakan moneter kuantitatif Suatu kebijakan umum yang bertujuan untuk memperngaruhi jumlah penawaran uang dan tingkat bunga dalam perekonomian, meliputi; i. Pengawasan pinjaman secara selektif ii. Pembujukan moral 2.10.2 Istilah Yang Ada Dalam Makro Ekonomi 1. Inflasi Suatu proses kenaikan harga-harga yang berlaku dalam suatu perekonomian 2. Pendapatan nasional Disebut juga produk nasional, memiliki arti nilai barang atau jasa yang diproduksi di suatu negara dalam suatu tahun tertentu. 3. Produk Nasional Bruto (PNB) Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu tahun tertentu. 4. Produk Domestik Bruto (PDB) Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu tahun tertentu. 5. Gross Domestic Product (GDP) Nilai barang dan jasa dalam suatu negara yang diproduksi oleh faktor-faktor produksi milki warganegara negara tersebut dan negara asing. 6. Gross National Product (GNP) 49 Memiliki konsep yang sama dengan GDP, tetapi GNP memperkirakan jenisjenis pendapatan yang sedikit berbeda. 2.11 Metode Fact Finding Menurut Connolly (2002, pp305-pp308) Fact finding adalah proses formal penggunaan teknik seperti wawancara dan kuesioner untuk mengumpulkan fakta tentang sistem, kebutuhan dan apa yang dikehendaki. Ada 5 teknik fact finding yang biasa digunakan : • Pemeriksaan dokumen Cara ini dapat berguna saat sistem membutuhkan perkembangan dan dilakukan dengan menjadikan dokumen – dokumen yang berhubungan dengan sistem sebagai bahan referensi. • Wawancara Wawancara adalah cara yang paling umum digunakan, dan biasanya yang paling berguna. Dengan wawancara, pemberi respon dapat menjawab dengan bebas dan terbuka. • Observasi Observasi adalah cara yang efektif untuk memahami sistem. Dengan teknik ini, dimungkinkan untuk ikut berpartisipasi atau menyaksikan aktifitas yang dilakukan untuk mempelajari sistem. 50 • Penelitian Cara ini berguna untuk meneliti aplikasi dan masalah. Jurnal, buku referensi, dari internet adalah sumber informasi yang baik. • Kuesioner Kuesioner adalah dokumen yang dibuat untuk mengumpulkan fakta dari sejumlah besar orang dengan membuat control tertentu pada respon mereka. 2.12 Kerangka Berpikir Kerangka berpikir merupakan gambaran secara sistematis mengenai kaitan antar variabel yang diteliti untuk mengembangkan suatu sistem. Adapun teknik yang digunakan untuk memcahakan masalah, yaitu dengan analisis kebutuhan dengan metode fact finding. 51 Berikut ini metode dalam melakukan perancangan data warehouse makro ekonomi pada BPPT - P3TKKE : Analisis dan Perancangan Data Warehouse Makro Ekonomi BPPT-P3TKKE Studi sistem yang sedang berjalan pada Makro ekonomi BPPT-P3TKKE Studi Kepustakaan Tentang Data Warehouse Mencari Analisis Kebutuhan dari Sistem yang ada Perancangan Data Warehouse 1. Merancang Arsitektur DWH 2. Merancang Skema Bintang 3. Menentukan Proses Transformasi dan Metadata 4. Merancang Sistem Keamanan Desain Aplikasi Data Warehouse 1. Merancang STD 2. Merancang Tampilan Layar 3. Membuat Spesifikasi Proses Coding 1. Microsoft SQL Server 2000 2. Visual Basic 6.0 3. Crystal report 8.5 Implementasi Gambar 2.13 Kerangka Berpikir