BAB 2 LANDASAN TEORI

advertisement
BAB 2
LANDASAN TEORI
2.1
Dasar-Dasar Data Warehouse
2.1.1
Pengertian Sistem Informasi
2.1.1.1 Pengertian Sistem
Menurut
elemen-elemen
McLeod ( 1998, p11 ), sistem
yang
terintegrasi
dengan
merupakan
maksud
yang
sekelompok
sama
untuk
mencapai suatu tujuan.
Menurut
O’Brien ( 2005, p22 ), sistem
merupakan
sekelompok
komponen-komponen yang saling berhubungan satu sama lain dan bekerja
bersama-sama untuk mencapai suatu tujuan dengan menerima input dan
menghasilkan output yang melalui proses transformasi.
Menurut O’Brien, dalam sistem terdapat 3 komponen-komponen yang
saling berinteraksi, diantaranya adalah :
1. input, meliputi penangkapan elemen-elemen yang masuk ke dalam
sistem untuk diproses.
2. proccessing, meliputi
proses
transformasi
yang
mengubah
input
menjadi output.
3. output, meliputi pemindahan elemen-elemen yang telah dihasilkan
melalui proses transformasi.
7
8
Sistem boundary
Input
Apa itu Sistem ?
Bagaimana sistem
dikontrol ?
Feed-Forward
Output
Feedback
Sistem Enviroment
Gambar 2.1. Bagian Dari Sebuah Sistem Dan Relasinya Satu Sama Lain
Berdasarkan pada Gambar 2.1 karakteristik sistem dapat dijelaskan sebagai
berikut :
1. Sebuah sistem berada dalam sebuah informasi
2. Sebuah sistem dipisahkan dari lingkungannya oleh beberapa batasan
3. Sistem memiliki input dan output. Mereka menerima input dari
lingkungan dan mengirimkan output menuju lingkungan.
4. Sistem memiliki interface. Sebuah interface memungkinkan komunikasi
diantara 2 sistem
5. Sistem dapat memiliki subsistem-subsistem
6. Sistem yang bertahan memiliki mekanisasi kontrol
7. kontrol sistem bertumpu pada feedback (dan kadang-kadang feedforward)
8. Sebuah sistem memiliki beberapa properti yang secara tidak langsung
berdiri sendiri pada properti-properti dari bagian-bagiannya.
9
2.1.1.2 Pengertian Informasi
Menurut O’Brien ( 2005, p27 ), informasi didefinisikan sebagai data
yang telah diubah menjadi sebuah konteks yang berarti dan berguna bagi
end-user.
Menurut McLeod ( 1998, p15 ), informasi merupakan data yang telah
diproses atau data yang memilki arti.
Informasi adalah data yang telah diolah menjadi sebuah bentuk yang
berarti bagi si penerima dan bermanfaat dalam pengambilan keputusan.
2.1.1.3 Pengertian Sistem Informasi
Menurut O’Brien ( 2005, p6 ) ”An Information System is an organized
combination of people, hardware, software, communicaton network, an data
recources that collects, transform and disseminates information in an
organization”, yang berpengertian sistem
informasi
merupakan
kombinasi
antara orang, perangkat keras, perangkat lunak, jaringan komunikasi dan
sumber
data
organisasi.
yang
dikumpulkan, diubah
dan
informasi
dalam
sebuah
10
Tujuan dari sistem informasi adalah untuk memenuhi kebutuhan informasi
umum semua manajer dalam perusahaan atau dalam subunit fungsional
perusahaan. Subunit dapat didasarkan pada area fungsional atau tingkatan
manajemen. Sistem informasi manajemen menyediakan informasi bagi pemakai
dalam bentuk laporan dan output, model dapat disediakan dalam bentuk tabel
atau grafik.
Gambar 2.2 Piramida Sistem Informasi
Berdasarkan pada gambar 2.2 maka dapat dijelaskan sebagai berikut:
1. Sistem Informasi untuk perencanaan strategis dan kebijakan serta
pengambilan keputusan.
2. Sistem Informasi untuk perencanaan taktis dan pengambilan keputusan.
3. Sistem Informasi untuk perencanaan operasional, pengambilan keputusan
dan pengendalian.
4. Pengolahan transaksi pemberian informasi (tanggapan dan pertanyaan)
11
2.1.2
Pengertian Database
Menurut Thomas Connolly dan Carolyn Begg (2002, p14), “Database is
a shared collection of logically related data, and a decription of this data,
designed to meet the information needs if an organization”, yang kemudian
diartikan sebagai berikut database adalah kumpulan data yang saling
berhubungan satu sama lain yang digunakan secara bersama-sama dan kumpulan
data ini dirancang untuk memenuhi kebutuhan informasi suatu perusahaan.
2.1.3
Pengertian Data Warehouse
Menurut Vidette Poe (1996, p6), “A Data Warehouse is as read-only
analytical database that used as the foundation of decision support system”,
yang berarti bahwa Data Warehouse merupakan database yang bersifat analisis
dan hanya dapat dibaca, dimana database tersebut digunakan sebagai dasar
penunjang pengambilan keputusan.
Menurut W.H.Inmon (2002, p389), “A data warehouse is a collection of
integrated database designed to support the DSS function, where each unit of
data is relevant to some moment in time” yang artinya Data warehouse adalah
sekumpulan data yang dirancang untuk mendukung fungsi DSS, dimana setiap
unit data relevan pada beberapa waktu.
Menurut Thomas Connolly dan Carolyn Begg (2002, p1047) Data
Warehouse adalah ”subject oriented, integrated, time-variant, and non-volatile
collection of data in support of management’s decision-making process”. Yang
dapat diartikan sebagi kumpulan data yang berorientasi pada subjek, terintegrasi,
12
memiliki rentang waktu tertentu, serta bersifat tidak selalu berubah yang
digunakan untuk mendukung proses pengambilan keputusan.
Keuntungan data warehouse menurut Thomas Connolly dan Carolyn
Begg (2002, p1048) adalah sebagai berikut:
a.
Potential high returns on investment yang berarti kembalinya modal
yang telah dikeluarkan akan lebih cepat.
b.
Competitive advantage, yang dapat diartikan bahwa dengan
teknologi ini akan membawa keuntungan dalam bersaing dengan
perusahaan lainnya yang sejenis.
c.
Increased productivity of corporate decision-maker, yaitu meningkat
produktivitas perusahaan dalam pengambilan keputusan menghasilkan
database terintegrasi yang konsisten, berorientasi subjek, serta bersifat
historical.
2.1.4
Istilah-Istilah Dalam Data Warehouse
Beberapa istilah-istilah yang berhubungan dengan data warehouse antara
lain :
1.
DSS (Decision Support System)
Menurut Vidette Poe (1996, p23) ”A Decision support system is a system
to users so that they can analyze a situation and make decisions”, yang dapat
diartikan bahwa DSS merupakan suatu sistem yang memberikan informasi
kepada pengguna, sehingga pengguna dapat menganalisa situasi. Selain itu
DSS juga menyediakan informasi untuk membantu karyawan dalam
pengambilan keputusan yang lebih efektif dalam mengerjakan tugas mereka.
13
2. Data mart
Menurut W.H.Inmon ( 2002, p389 ) “Data mart is a departmentalized
structure of data feeding from the data warehouse where data is
denormalized based on the department’s need for information”, yakni data
yang bersumber dari Data Warehouse yang bersifat sebagian – sebagian,
dimana data tersebut diolah kembali (denormalisasi) sesuai dengan informasi
yang dibutuhkan oleh masing – masing bagian (fungsi bisnis).
Menurut Connolly ( 2002, p1067 ) “Data mart is a subset of a data
warehouse that support the requirements of a particular department of
business function”, yang berarti Data Mart adalah subset dari data warehouse
yang mendukung kebutuhan informasi dari suatu departemen atau fungsi
tertentu.
Karakterisistik dari data mart meliputi :
ƒ
Data mart hanya berfokus pada kebutuhan suatu departemen atau
fungsi bisnis.
ƒ
Data mart tidak berisi data operasional yang detail seperti data
warehouse
ƒ
Data mart lebih mudah dimengerti karena data pada data mart
lebih sedikit.
3.
OLAP (On Line Analytic Processing)
Menurut Connolly ( 2002, p1101 ) “OLAP is the dynamic
synthesis,
analysis, and consolidation of large volumes of multi-
dimensional data”,
yang berarti perpaduan dinamis, analistis dan
14
penggabungan data multi - dimensional dalam jumlah besar. OLAP adalah
terminology yang menjelaskan teknologi yang menggunakan sudut
pandang dari berbagai dimensi (multi dimensional) sehingga dapat
mempercepat pengaksesan startegi
informasi untuk tujuan lanjutan.
OLAP juga memampukan pengguna untuk lebih memahami bahkan
menyelami berbagai aspek perusahaan secara cepat, konsisten serta
interaktif dalam melakukan pengaksesan ke berbagai macam sudut
pandang data yang memungkinkan.
4.
OLTP (On Line Transaction Processing)
Menurut Connolly ( 2002, p1045 ) OLTP merupakan prosesa
penyimpanan data mengenai kegiatan operasional atau transaksi kegiatan
perusahaan sehari-harinya. OLTP dirancang untuk memungkinkan
terjadinya pengaksesan secara bersamaan oleh beberapa user terhadap
sumber data yang sama dan mengatur proses yang diperlukan.
5. Tabel Dimensi
Menurut Inmon ( 2002, p389 ) “Dimension table is the place where
extraneous data that relates to fact table is placed in a multidimensional
table”. Yang dapat diartikan sebagai tempat data lain (asing) yang
terhubung dengan tabel fakta yang ditempatkan pada tabel
multi
-
dimensional. Tabel dimensi dapat berisikan kategori dengan ringkasan data
detail yang dapat dilaporkan
15
6. Tabel Fakta
Menurut Inmon ( 2002, p391 ) “Fact table is the center of a star
join table that has many occurences will be located”, yang berarti tabel
fakta adalah tempat yang sediakan untuk tabel pusat dari tabel bintang
join yang memiliki beberapa kejadian (occurences).
Tabel yang pada umumnya mengandung histori dimana key yang
dihasilkan sangat unik karena merupakan kumpulan foreign key dan
primary key yang ada pada table dimensi yang berhubungan atau
merupakan tabel terpusat dari skema bintang. Tabel fakta juga menyimpan
measure yang berbeda, seperti measure yang secara langsung terhubung
dengan tabel dimensi (Additive) dan measure yang tidak berhubungan
dengan tabel dimensi (Non Additve).
7. Data Mining
Menurut Connolly ( 2002, p1115 ) “Data mining is the process of
extracting valid, previously unknown, comprehensible, and actionable
information from large databases and using it to make crucial business
decisions ”. Yang berarti proses mengekstrak informasi dari database
yang besar dan digunakan untuk membuat hal-hal yang bersifat penting
dalam bisnis.
8. Metadata
Menurut Mallach ( 2000, p514 ) ”Metadata are data that describe
the data in the data warehouse”. Yang berarti data yang menjelaskan
16
data dalam data warehouse. Metadata diperlukan jika orang ingin
mengakses data pada data warehouse.
2.2
Arsitektur Data Warehouse
create
Queries
Metadata
Data Mining
Database
Extract
Cleanse
Transform
Load
Summarize
Transaksi dan
Data Eksternal
Lainnya
Data Staging
User
Data Warehouse
Gambar 2.3 Arsitektur Data Warehouse
Berdasarkan pada Gambar 2.3 Elemen utama, entity eksternal yang berinteraksi
dengan data warehouse menurut Mallach ( 2000, p473 ), yaitu:
•
Database operasional lainnya diberikan pada data warehouse. Data
eksternal lainnya juga diberikan pada data warehouse. Data warehouse
17
mendapatkan salinan dari data yang berasal dari database. Database
tidak menyimpan langsung data.
•
Data yang disimpan dalam database akan di-extract dan dibawa ke dalam
data warehouse. Dalam melakukan proses meng-extract ini, harus sering
melakukan transform data ke struktur data database dan format internal
dari data warehouse.
•
Pada
proses
cleanse
data,
memastikan
data
berkualitas
untuk
pengambilan keputusan.
•
Selain itu juga dilakukan proses load, yang menyimpan data pada
database data warehouse. Mulai dari proses extraction, cleanse,
transform sampai load disebut sebagai data staging.
•
Proses selanjutnya adalah membuat ringkasan data (summarize) seseuai
dengan yang diinginkan dan yang dibutuhkan. Data yang diringkas
berasal dari data yanag tersimpan dalam data warehouse, dimana data
tersebut bersumber dari data eksternal maupun internal.
•
Metadata berguna untuk mengetahui data yang berada dalam data
warehouse. Misalnya dari mana asalnya data warehouse tersebut, atau
siapa yang bertanggung jawab terhadap data tersebut. Metadata juga
18
memiliki query tool yang ada dalam data warehouse, seperti di mana data
tersebut dapat ditemukan, siapa yang berhak untuk mengakses data serta
ringkasan data apa yang belum diperhitungkan.
•
Database data warehouse berfungsi untuk menampung data detail dan
ringkasan data dari data warehouse.
•
Query tool digunakan pada end user untuk memberikan pertanyaan
terhadap database. Proses memberikan pertanyaan ini disebut sebagai
online analytical processing (OLAP). Query tool juga dapat digunakan
untuk mendapatkan data yang belum terbentuk (data mining).
•
User adalah pengguna dari data warehouse tersebut.
19
2.3
Struktur Data Warehouse
Highly Summarized
Lightly Summarized
M
E
T
A
D
A
T
A
Current Detail
Old Detail
Gambar 2.4 Struktur Data Warehouse
Menurut Inmon ( 2002, pp36-pp37 ) yang terdapat pada Gambar 2.4 data
warehouse memilki struktur yang spesifik dan mempunyai perbedaan dalam
tingkatan detil data serta perbedaan dalam tingkatan umur data.
2.3.1
Current Detail Data
Current Detail data adalah data detil yang sedang aktif saat sekarang ini,
dimana data ini mencerminkan keadaan yang sedang berjalan.
20
Alasan perlu diperhatikannya current detail data adalah sebagai berikut:
1. Melukiskan kejadian yang baru terjadi
2. Hampir selalu disimpan dalam media penyimpanan karena pengaksesannnya
cepat, tetapi lebih mahal karena membutuhkan media penyimpanan yang
besar dan kompleks dalam pengaturannya
3. Current detail data bersifat akurat, agar dapat digunakan untuk membuat
rekapitulasi
4. Jumlahnya sangat banyak dan disimpan pada tingkat penyimpanan terendah
2.3.2
Old Detail Data
Menurut
Alex,
Stephen,
Kurt
(2000,
p27)
old
detail
data
merepresentasikan current detail data atau history dari area subject yang lama.
Data ini yang membuat analisis trend yang mungkin. Old detail data biasanya
berupa backup dalam storage terpisah dan mencerminkan umur data agar
sewaktu - waktu dapat diakses. Data ini jarang diakses, sehingga disimpan dalam
media penyimpanan alternatif seperti tape disk.
2.3.3
Lightly Summarized Data
Merupakan ringkasan dari current detail data akan tetapi bukan bersifat
total summary. Data ini memiliki tingkatan detail yang lebih tinggi, dan
tingkatan ini juga disebut data mart. Data dapat diakses dan hasilnya banyak
digunakan untuk view dari kondisi yang sedang berjalan.
21
2.3.4
Highly Summarized Data
Ini merupakan data summary totalitas, datanya dapat dianalisis
berdasarkan urutan waktu, analisis multidimensi untuk mendukung pengambilan
keputusan serta data ini mudah diakses.
2.4
Anatomi Data Warehouse
Dalam menentukan bentuk data warehouse berasal dari berbagai sumber
dan kemudian dipindahkan ke dalam sebuah tempat penyimpanan data . Kita
perlu mengetahui kebutuhan yang diperlukan untuk menjalankan aplikasi yang
dirancang. Dengan adanya teknologi client/server memungkinkan data
warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan
pengguna sistem secara lebih proporsional. Ada 3 jenis dasar sistem data
warehouse, yaitu :
22
2.4.1
Anatomi Data Warehouse Fungsional
Source
Data
Warehouse
Fungsional
Workstation
Source
Data
Warehouse
Fungsional
Source
Workstation
Gambar 2.5 Data Warehouse Fungsional
Berdasarkan pada Gambar 2.5 maka dapat dijelaskan Data warehouse
fungsional dibuat lebih dari satu dan dikelompokkan berdasarkan tiap bagian
fungsi bisnis, misalnya departemen, divisi dan sebagainya. Setiap unit fungsi
dapat mempunyai gambaran datanya masing-masing.
Penerapan jenis sistem pengumpulan data seperti ini merupakan kerugian
dari sistem ini, karena kemampuan pengumpulan
data yang terbatas bagi
pengguna. Sehingga beresiko kehilangan konsistensi data diluar lingkungan
fungsi bisnis yang bersangkutan. Apabila pendekatan ini lingkupnya menjadi
lingkup perusahaan, maka konsistensi data dari perusahaan tidak terjamin lagi.
23
Selain kerugian pendekatan ini juga memiliki keuntungan yang memberi
solusi yang mudah untuk dibangun dengan biaya yang relatif rendah dan dapat
memberikan kelompok pengguna sebuah kemampuan sistem dengan data yang
terbatas.
2.4.2
Anatomi Data Warehouse Terpusat
Source
Data Warehouse
Fungsional
Source
Data
Warehouse
Terpusat
Source
Data Warehouse
Fungsional
Gambar 2.6 Data Warehouse Terpusat
Pada Gambar 2.6 dapat dijelaskan bahwa Data warehouse terpusat
merupakan pendekatan yang paling umum dan banyak digunakan, karena
kebiasaan pengguna dengan lingkungan main frame yang terpusat. Data diambil
dari seluruh sistem operasional dan disimpan dalam pusat penyimpanan data.
Data yang telah terkumpul tersebut dibagi-bagi berdasarkan fungsi-fungsi yang
dibutuhkan oleh perusahaan yang belum memliki jaringan eksternal
24
Keuntungan data warehouse terpusat adalah bahwa data benar-benar
terpadu/ terintegrasi dengan baik. Tetapi pendekatan ini mengharuskan pemasok
data untuk mengirimkan data tepat pada waktunya agar tetap konsisten dengan
pemasok lainnya. Disamping itu pengguna hanya dapat mengambil data dari
pusat pengumpulan saja dan tidak dapat secara langsung berhubungan dengan
pemasok datanya sendiri.
Adapun kekurangan dari sistem ini adalah biaya pemeliharaan yang besar
atas pengumpulan data yang demikian besar dan waktu untuk membangun sistem
ini lama.
25
2.4.3
Anatomi Data Warehouse Terdistribusi
Source
Workstation
Data
Warehouse
Gateway
Source
Source
Workstation
Gambar 2.7 Data Warehouse Terdistribusi
Pada gambar 2.7 maka dapat dijelaskan bahwa Data warehouse
terdistribusi memiliki konsep data warehouse gateway, yang berfungsi sebagai
jembatan antar lokasi data warehouse dengan workstation yang bersistem beda.
Dimana memungkinkan pengguna untuk langsung mengakses sumber data yang
berbeda di luar lokasi perusahaan (eksternal).
Keunggulan yang dimiliki pendekatan ini adalah memungkinkan tiap
departmen atau divisi membangun
pengumpulan data fungsionalnya masing-
masing, atau bahkan sistem operasionalnya, dan memadukan bagian-bagian
tersebut dengan teknologi client / server.
Kerugian dari pendekatan ini memerlukan biaya yang sangat besar karena
setiap sistem pengumpulan data fungsional dan sistem operasinya dikelola secara
26
terpisah. Metode ini akan sangat efektif apabila data telah tersedia dalam bentuk
yang konsisten.
2.5
Karakteristik Data Warehouse
Menurut
Inmon
(2002,
pp31-pp35)
data
warehouse
berdasarkan
subjek-subjek
memiliki
karakteristik sebagai berikut:
ƒ
Subject Oriented
Data
warehouse
disusun
(fungsi bisnis) yang ada didalam sebuah organisasi, bukan
atau
entity
berorientasi
pada data transaksi .Hal ini merefleksikan kebutuhan untuk menyimpan
data pendukung keputusan daripada data transaksi.
ƒ
Time Variant
Data warehouse menggunakan time stamp untuk mempresentasikan
data history. Dimensi waktu penting untuk mengidentifikasi trend,
memprediksikan operasi yang akan datang, dan men-setting target operasi.
Data dalam data warehouse akan menjadi akurat dan valid pada beberapa
interval waktu tertentu (seperti tahun, dekade).
ƒ
Integrated
Data operasional yang berasal dari berbagai macam database dan sumber
data eksternal di data warehouse digunakan untuk
membuat keputusan.
Data operasional tersebut membutuhkan suatu konsistensi penamaan,
penggabungan format data dan perbandingan skala antara database dan
sumber data eksternal. Hal ini menyebabkan data tersebut tidak konsisten,
karena data warehouse menggabungkan berbagai data tersebut, makanya
27
kita harus mengintegrasikannya terlebih dahulu. Data disimpan sebagai
satu kesatuan tunggal, bukan sebagai kumpulan file yang berbeda dalam
pengelompokan data.
ƒ
Non Volatile
Pada kenyataannya data pada data warehouse tidak boleh di update tetapi
di refresh dari sistem operasional dalam basis
regular. Jadi hanya
menambah data baru, data yang lama tetap ada tidak dihapus.
2.6
Alat Perancangan Data Warehouse
Adapun alat perancangan data warehouse menurut Vidette Poe (1996,
pp120-pp121 ) adalah star schema (skema bintang). Yakni struktur sederhana
yang terdiri dari beberapa tabel yang saling terhubung dan terdefinisikan dengan
baik. Skema bintang terdiri dari 2 jenis tabel, yaitu tabel fakta dan tabel dimensi.
Tabel fakta terkadang disebut sebagai major table, tabel yang berisi data fakta
tentang bisnis. Sedangkan tabel dimensi, terkadang disebut minor table, yang
berukuran lebih kecil dan gambaran data yang merefleksikan dimensi bisnis.
28
2.6.1
Skema Bintang
Menurut Connolly (2002, p1079), “Star Schema is a logical structure that
has a fact table containing factual data in teh center, surrounded by dimensio
tables containing reference data (which can be denormalized)” Yang memiliki
pengertian struktur logical yang memiliki tabel fakta yang mengandung data
yang bersifat fakta ditengah dan beberapa tabel kecil (disebut tabel dimensi /
dimension table), yang berisi data references yang mengelilingi tabel pusat (yang
dapat di denormalisasi).
2.6.2
Jenis Skema Bintang
2.6.2.1 Skema Bintang Sederhana
Menurut Vidette (1996, p124) pada skema bintang sederhana ini setiap
tabel baik tabel dimensi maupun tabel fakta harus mempunyai primary key.
Dimana primary key tersebut akan membuat setiap record-nya menjadi unik.
Yang menjadi primary key pada tabel fakta adalah foreign key, yang dapat
berjumlah lebih dari satu.
Pada gambar dibawah terlihat hubungan antara satu tabel fakta dengan
tiga tabel dimensi. Tabel fakta memiliki primary key yang terdiri dari tiga
foreign key yaitu kunci 1, kunci 2, dan kunci 3. Terjadi hubungan one to many
antara primary key pada tabel dimensi dengan foreign key pada tabel fakta.
29
Gambar 2.8 Skema Bintang Sederhana
2.6.2.2 Skema Bintang Dengan Beberapa Tabel Fakta
Menurut Vidette (1996, p131) skema bintang dengan beberapa tabel fakta
ini merupakan skema bintang yang bisa terdiri dari beberapa fakta atau lebih dari
satu tabel fakta. Hal ini dapat terjadi karena tabel fakta tersebut berisi kenyataan
yang tidak saling berhubungan. Skema bintang dengan banyak fakta dapat dilihat
pada gambar dibawah ini.
30
Gambar 2.9 Skema Bintang Dengan Beberapa Tabel Fakta
2.6.2.3 Skema Bintang Dengan Tabel Dimensi Tambahan
Skema bintang dengan tabel dimensi tambahan ini merupakan
skema bintang yang bisa memiliki tabel dimensi tambahan. Dimana tabel
dimensi yang ada mengandung foreign key yang mereferensikan primary
key di tabel dimensi yang lain. Tabel yang direferensikan ini dinamakan
outboard atau secondary dimension table.
Gambar 2.10 Skema Bintang Dengan Tabel Dimensi Tambahan
2.1.1.1 Skema Snowflake
Menurut Connolly (2002, p1080), “snowflake schema is a variant of the
star schema where dimension table do not contain denormalized data”. Yang
berarti skema snowflake adaalah bentuk lain dari skema bintang, dimana tabel
dimensi tidak mengandung data yang didenormalisasi. (lihat gambar 2.10)
Ciri – ciri Snowflake adalah :
•
Pada level atribut, tabel dimensi didenormalisasi
•
Setiap dimensi memilki satu kunci untuk setiap tingkatan pada hierarki
dimensi
•
Tabel dimensi dihubungkan dengan
tabel fakta dan tabel atribut ayng
memiliki tingkatan rendah oleh kunci yang bertingkat rendah
Gambar 2.11 Skema bintang Snowflake
2.1.2
Keuntungan Skema Bintang
Menurut Connolly (2002, pp1081-pp1082), ada beberapa keuntungan
menggunakan skema bintang dan snowflake yaitu :
1. Efisiensi, Lebih efisien dalam mengakses data karena struktur database yang
konsisten
2. Skema bintang mampu beradaptasi terhadap perubahan kebutuhan pengguna.
3. Respon data lebih cepat daripada perancangan database operasional.
4. Extensibility, dimana mempermudah dalam hal modifikasi / pengembangan
data warehouse yang terus-menerus.
5. Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan
standar untuk menangani situasi umum di dunia bisnis terus bertambah.
33
2.7
Normalisasi vs Denormalisasi
2.7.1
Normalisasi
Menurut Connolly (2002, p376), “Normalisasi is a technique for
producing a set of relation with desirable properties, given the data
requirements of an enterprise”, yang memiliki pengertian suatu teknik untuk
menghasilkan sekumpulan relasi dengan properti yang diinginkan, memenuhi
kebutuhan data pada perusahaan. Adapaun tujuan utama dari normalisasi adalah
untuk menghilangkan redundancy atau ketergantungan data. Normalisasi
memiliki lima tingkatan, namun demikian yang sering digunakan adalah tiga
tingkatan pertama. Tingkatan – tingkatan tersebut antara lain:
Unnormalized Form (UNF)
Merupakan suatu tabel yang berisikan satu atau lebih group yang berulang.
Dibuat dengan memindahkan semua data dari sumber informasi kedalam
format tabel baris dan kolom.
1. First Normal Form (1NF)
Merupakan sebuah relasi dimana setiap irisan antara baris dan kolom
berisikan satu dan hanya satu nilai. Bentuk ini dapat dicapai dengan
memindahkan group yang berulang. Bentuk 1NF ini digunakan untuk
menghilangkan repeating group (functional dependency).
2. Second Normal Form (2NF)
Merupakan sebuah relasi dalam 1NF dan setiap atribut non primary key
bersifat fully functionally dependency pada primary key. Bentuk 2NF ini
digunakan untuk menghilangkan partial dependency.
34
3. Third Normal Form (3NF)
Sebuah relasi dalam 1NF dan 2NF dimana tidak terdapat atribut non primary
key yang bersifat transitive dependency pada primary key. Bentuk 3NF ini
digunakan untuk menghilangkan transitive dependency.
4. Fourth Normal Form (4NF)
Dimana tingkatan pada normalisasi ini sangat jarang terjadi. Normalisasi ini
dilakukan bila ada atribut yang bersifat multivalue dependency (memiliki
nilai lebih dari 1)
5. Fifth Normal Form (5NF)
Normalisasi ini dilakukan dengan membuang join dependency. Tingkatan
pada normalisasi ini sangat jarang terjadi
2.7.2
Denormalisasi
Denormalisasi merupakan penggabungan tabel untuk meningkatkan unjuk
kerja (performance) yang ada. Hal ini merupakan sebuah proses yang melanggar
peraturan struktur normalisasi bentuk
ketiga.
Alasan
perlu
dilakukannya
denormalisasi oleh setiap perancang adalah:
• Untuk mengurangi jumlah hubungan yang terjadi antara tabel-tabel dimana
hubungan ini harus mengalami proses pada waktu dilakukan pencarian. Dengan
cara ini, maka performance database dapat ditingkatkan.
• Untuk membuat struktur fisik database semakin mendekati model dimensi
pemakai. Pembuatan struktur tabel sesuai dengan yang ingin ditanyakan oleh
pemakai. Memungkinkan terjadinya akses langsung, yang sekali lagi akan
meningkatkan performance.
35
2.8
Tahapan Perancangan Data Warehouse
Menurut Vidette Poe, dalam merancang data warehouse dapat
menggunakan tahapan SDLC (System Development Life Cycle) yang meliputi
beberapa fase berikut ini :
a. Planning (Perencanaan)
Sangat penting untuk melakukan perencanaan sebelum memulai
untuk
mengembangkan
suatu
proyek
termasuk
dalam
mengembangkan proyek data warehouse. Perencanaan untuk data
warehouse lebih difokuskan pada hal-hal berikut ini:
• Mendefinisikan ruang lingkup (scope) dari proyek
• Membuat rencana proyek
• Mendefinisikan sumber-sumber apa saja yang dibutuhkan baik
internal maupun eksternal
• Mendefinisikan tugas-tugas dan tujuan-tujuannya
• Mendefinisikan batasan waktu (timelines )
• Mendefinisikan tujuan akhir dari proyek yang dibuat
b. Gathering
data
requirements
and
modeling
(mengumpulkan
permintaan data dan membuat model)
Pada fase ini lebih difokuskan pada kebutuhan bisnis dan
permintaan akan data dari pengguna. Fase ini dapat dilakukan kurang
lebih dalam empat hingga enam minggu tetapi tidak lebih dari
sepuluh minggu. Jika proyek yang dikerjakan terlalu lama, maka
36
ruang lingkup dari proyek tersebut harus dipecah menjadi fase yang
lebih kecil lagi.
ƒ
Gathering data requirements (mengumpulkan permintaan akan
data)
• Bagaimana user melakukan bisnisnya.
• Bagaimana performa user dapat diukur.
• Atribut apa saja yang dibutuhkan user.
• Apa saja hirarki dari bisnis tersebut.
• Data yang digunakan user sekarang dan data apa yang
kemudian mereka inginkan
• Pada tingkat apa user menggunakan detail atau summary
ƒ
Data modeling (membuat model data)
• Data model logika meliputi seluruh ruang lingkup
dari pengembangan proyek termasuk relationship,
cardinaliy, attribute dan candidate key.
• Model bisnis dimensional yang menggambarkan
fakta, dimensi, hirarki, relationship dan candidate
key untuk semua ruang lingkup dari pengembangan
proyek.
37
c. Physical database design and development (perancangan database
fisikal dan pengembangannya)
pada fase ini mencakup perancangan database dan denormalisasi.
Fase ini juga mendukung untuk dilakukannya DSS (Decision Support
System) dan pengembangannya. Pada fase perancangan database
akan difokuskan pada:
• Perancangan
database yang
meliputi
tabel
fakta,
tabel
relationship dan deskripsi dari tabel look up.
• Denormalisasi data
• Pengidentifikasian key
• Membuat strategi pengindeksan
• Membuat objek database yang sesuai
Pada tahapan ini sangat penting diperlukan pemahaman tentang:
‚ Konsep pengambilan keputusan
‚ Konsep hirarki, dimensi dan fakta
‚ Pembuatan skema bintang
Dalam perancangan database untuk data warehouse, diperlukan
informasi yang luas dan lebih detail, yang akan membantu dalam
proses ini, tahapan yang dilakukan:
‚
Pengembangan strategi agregasi
‚
Pengembangan strategi partisi
‚
Pengembangan perkiraan kapasitas
38
d. Data mapping and transformation (pemetaan data dan transformasi)
Fase ini tergolong cukup canggih dan meliputi sumber dari data
dalam sistem operasional, melakukan analisis untuk memahami tipe
dari data transformasi yang dibutuhkan, dan pemetaan sumber data ke
tujuan data warehouse pada perancangan database. Dalam fase ini,
hal yang harus dilakukan adalah :
• Mendefinisikan sumber sistem.
• Menentukan layout dari file.
• Melakukan pengembangan spesifikasi dari transformasi yang
tertulis untuk transformasi yang canggih
• Memetakan sumber ke tujuan
• Meninjau ulang kemampuan perencanaan
e. Data extraction and load (pengambilan data dan pengisian data)
Proses utuh dari mengekstraksi, transformasi dan loading data ke
dalam database tujuan akan sering dilakukan dengan bantuan dari
teknologi transformasi data. Dengan menggunakan tool data
transformasi akan mempengaruhi waktu dari fase siklus hidup dan
mendukung tugas dan tujuannya. Fokus pada fase ini adalah :
• Mengembangkan
prosedur
untuk
mengekstrak
dan
memindahkan data
• Mengembangkan prosedur untuk mengload data ke dalam
warehouse
39
• Mengembangkan program atau menggunakan tool transformasi
data untuk mentransformasi dan mengintegrasi data
• Mencoba ekstraksi, transformasi dan meload prosedur
f. Automating the data management process (mengotamasi proses
manajemen data)
Fase
ini
lebih
terfokus
pada
otomasi
pengekstraksian,
transformasi dan load data warehouse. Seperti yang dijelaskan
berikut ini:
• Mengotomasi dan menjadwalkan proses ekstraksi data
• Mengotomasi dan menjadwalkan proses transformasi data
• Mengotomasi dan menjadwalkan proses loading data
• Membuat backup dan merecovery prosedur
• Melaksanakan full test dari semua prosedur yang diotomasi
g. Application development – creating the starter set of reports
(pengembangan aplikasi – membuat penetapan awal untuk laporan)
Pengembangan aplikasi dapat langsung dilakukan setelah kita
melakukan pengujian pada data. Pengembangan aplikasi DSS
biasanya dilakukan dengan menggunakan
tool pengaksesan data.
Pada fase ini biasanya aplikasi dibuat dengan menuliskan coding
Visual Basic tentu saja dengan memperhitungkan berapa lama waktu
yang dibutuhkan untuk mengembangkannya.
Hal yang termasuk di dalamnya, antara lain :
40
• Membuat set awal dari laporan yang telah didefinisikan
sebelumnya
• Mengembangkan laporan utama
• Menguji laporan
• Membuat dokumentasi dari aplikasi
• Mengembangkan jalur navigasi
h. Data validation and testing (validasi data dan pengujian)
Pada fase ini aplikasi yang telah dihubungkan dengan data
warehouse harus dilakukan validasi data dan testing. Yang didahului
dengan proses ektraksi data, transformasi data dan loading data.
i. Training
Pada fase ini, pihak perusahaan memberikan pelatihan kepada
semua staff yang hendak memakai aplikasi ini. Untuk mendapatkan
value sesungguhnya dari bisnis, semua user dalam perusahaan harus
dilatih dalam hal :
• Ruang lingkup data warehouse
• Tool untuk pengaksesan pada front end dan bagaimana cara
kerjanya
• Aplikasi DSS dan set awal dari report yang digunakan
• Training yang akan membantu user dalam mengunakan sistem
yang akan diterapkan dalam perusahaan
41
j. Rollout
Fase terakhir dalam SDLC dilakukan untuk menyebarkan data
warehouse kita kepada komunitas user yang akan menggunakannya.
Hal yang termasuk di dalamnya:
• memasang infrastruktur yang mendukung semua user.
Misalnya komponen yang digunakan dalam LAN atau WAN.
• Memperkenalkan aplikasi DSS
• Membuat stuktur bantuan yang dapat digunakan oleh user
• Membuat prosedur untuk menambah laporan baru dan
memperluas aplikasi DSS
• Membuat prosedur untuk membackup aplkasi DSS, tidak
hanya untuk data warehouse
• Membuat prosedur untuk investigasi dan memecahkan
permasalahan integrasi data.
2.9
Tahapan Perancangan Sistem
Berdasarkan Pressman (2001, pp29-pp30) model linier sequensial yang atau
yang dikenal dengan model waterfall dibagi menjadi empat tahapan utama
seperti yang dapat dilihat pada gambar di bawah ini (gambar 2.12).
42
Gambar 2.12 Model Waterfall
Berdasarkan pada Gambar 2.12 maka dapat dijelaskan sebagai berikut:
1. Analisis
Proses mengumpulkan kebutuhan difokuskan untuk pengembangan
software. Untuk memahami program yang hendak dibuat, maka seorang
analis harus memahami domain dari informasi yang akan digunakan untuk
software, seperti halnya fungsi yang dibutuhkan, kelakuan, kinerja, dan
antarmuka. Hasil analisa kebutuhan ini didokumentasikan dan di evaluasi
oleh customer / user.
2. Desain
Desain software adalah multi proses yang berfokuskan pada empat atribut
utama dari program, yaitu : struktur data, arsitektur software, representasi
antarmuka, dan detail algoritma / prosedur. Proses desain mengubah
kebutuhan menjadi suatu representasi software yang dapat dievaluasi untuk
kualitas
sebelum
proses
coding.
Proses
desain
ini
didokumentasikan dan menjadi bagian dari konfigurasi software.
3. Coding
juga
harus
43
Pada tahapan ini desain diterjemahkan ke dalam suatu bahasa
pemrograman yang dipahami oleh mesin. Jika desain dilakukan secara
terperinci, maka coding dapat dilakukan secara mekanis.
4. Testing
Setelah coding telah selesai, maka dilakukan testing program. Proses
testing difokuskan pada logika internal dari software untuk memastikan
bahwa setiap pernyataan yang ada telah diuji, dan juga fungsional eksternal
untuk menemukan kesalahan yang ada dan untuk memastikan bahwa input
yang diberikan akan menghasilkan output yang benar.
5. Support
Tahapan ini tidak harus ada, karena setelah software diserahkan pada
costumer / user, besar kemungkinan software akan mengalami perubahan /
perbaikan. Perubahan terjadi karena adanya kesalahan, karena software harus
dapat mengakomodasikan perubahan pada lingkungan eksternal, atau karena
perubahan kebutuhan user. Software support / perawatan dapat mengulang
tiap tahapan fase / langkah yang ada.
2.10
Makro Ekonomi
Menurut Sadono, makro ekonomi adalah gambaran mekanisme kerja
perekomian secara keseluruhan. Hubungan yang terdapat dalam makro ekonomi
44
adalah hubungan kausal / sebab-akibat antar variabel-variabel secara
keseluruhan. Berikut ini adalah beberapa tersebut antara lain:
•
Sektor Rumah Tangga
Pada sektor rumah tangga, kebutuhan energinya dihitung
berdasarkan laju
pertumbuhan jumlah rumah tangga dan tingkat
pemakaian energi yang
didasarkan
pada
Kebutuhan energi ini dipakai untuk memasak,
pertumbuhan
GDP.
penerangan
dan
peralatan-peralatan.
•
Sektor Industri dan Komersial
Sektor industri dianalisis secara sektoral, antara lain menurut
inustri-industri logam dasar, semen, pupuk, kimia, kertas, gula dan nonmetalik.
•
Sektor Transportasi
Pada sektor transportasi yang saat ini menduduki peringkat
kertiga dalam mengkonsumsi energi setelah sektor rumah tangga dan
sektor industri, pertumbuhan pemakaian energinya dipengaruhi oleh laju
pertumbuhan penduduk dan tingkat perekonomian nasional.
Analisis – analisis makro ekonomi menerangkan tentang :
i.
Pentingnya segi permintaan dalam menentukan tingkat kegiatan dalam
perekonomian.
45
ii.
Pentingnya kebijakan dan campur tangan pemerintah untuk mewujudkan
prestasi kegiatan ekonomi di tingkat yang dikehendaki
2.10.1 Isu – Isu Utama Dalam Analisis Makro Ekonomi
Makro ekonomi membahas isu-isu penting yang selalu dihadapi sesuatu
perekonomian. Analisisnya berusaha memberi jawaban kepada pertanyaan –
pertanyaan yang muncul. Pertanyaan tersebut meliputi ;
a. Mengapa pertumbuhan ekonomi tidak selalu teguh?
b. Mengapa kegiatan perekonomian tidak berkembang dengan stabil?
c. Mengapa pengangguran dan kenaikan harga – harga selalu berlaku.
Selain menjelaskan tentang keadaan yang menciptakan masalah
perekonomian yang terjadi, analisis ekonomi juga menjelaskan langkah-langkah
yang dapat digunakan untuk mengatasi masalah-masalah tersebut, antara lain;
1. Penentuan kegiatan ekonomi
Analisis ini menunjukkan bagaimana pengeluaran agregat (permintaan agregat)
dan penawaran agregat akan menentukan titik keseimbangan kegiatan sesuatu
perekonomian.
Dalam suatu perekonomian modern, komponen dari pengeluaran agregat
dibedakan menjadi 4 golongan :
a. Pengeluaran konsumsi rumah tangga
b. Investasi perusahaan-perusahaan
46
c. Pengeluaran konsumsi dan investasi pemerintah
d. Ekspor (pembelian baranag buatan dalam negeri oleh penduduk
negara-negara lain)
2. Masalah dan kebijakan makro ekonomi
Salah satu aspek penting dari ciri kegiatan perekonomian yang menjadi titik tolak
analisis dalam teori makro ekonomi adalah pandangan bahwa sistem pasar bebas
tidak dapat mewujudkan :
a. Penggunaan tenaga kerja penuh
b. Kestabilan harga-harga
c. Pertumbuhan ekonomi yang teguh
Setiap perekonomian akan selalu menghadapi masalah pengangguran, kenaikan
harga – harga, dan pertumbuhan ekonomi yang tidak teguh. Dari permasalahan
yang muncul tersebut, maka pemerintah menetapkan kebijakan-kebijakannya,
yakni ;
1. Kebijakan fiskal
Langkah pemerintah dalam perpajakan dan pengeluaran, meliputi:
Jenis – jenis pajak :
• Pajak langsung
47
Pajak yang dibayarkan langsung oleh pihak yang wajib membayar
pajak.
• Pajak tak langsung
Pajak yang bebannya boleh dipindah pindahkan pada pihak lain,
contoh: pajak impor.
Jenis – jenis pengeluaran :
• Pengeluaran konsumsi rumah tangga
Nilai perbelanjaan yang dilakukan oleh rumah tangga untuk membeli
berbagai jenis kebutuhannya dalam satu tahun tertentu.
• Pengeluaran pemerintah
Biaya yang digunakan pemerintah untuk kepentingan masyarakat.
Misalnya; fasilitas pendidkan dan kesehatan, biaya penegembagan
infrastruktur
2. Kebijakan moneter
Mengatur penawaran uang dan tingkat suku bunga. Kebijakan moneter
dibedakan menjadi 2, yakni :
• Kebijakan moneter kualitatif
Merupakan kebijakan yang bersifat melakukan kebijakan terpilih ke
atas beberapa aspek dari masalah moneter yang dihadapi pemerintah,
meliputi kegiatan ;
i. Operasi pasar terbuka
ii. Mengubah tingkat bunga dan tingkat diskonto
iii. Mengubah tingkat cadangan minimum
48
• Kebijakan moneter kuantitatif
Suatu kebijakan umum yang bertujuan untuk memperngaruhi jumlah
penawaran uang dan tingkat bunga dalam perekonomian, meliputi;
i. Pengawasan pinjaman secara selektif
ii. Pembujukan moral
2.10.2 Istilah Yang Ada Dalam Makro Ekonomi
1. Inflasi
Suatu proses kenaikan harga-harga yang berlaku dalam suatu perekonomian
2. Pendapatan nasional
Disebut juga produk nasional, memiliki arti nilai barang atau jasa yang
diproduksi di suatu negara dalam suatu tahun tertentu.
3. Produk Nasional Bruto (PNB)
Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu
tahun tertentu.
4. Produk Domestik Bruto (PDB)
Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu
tahun tertentu.
5. Gross Domestic Product (GDP)
Nilai barang dan jasa dalam suatu negara yang diproduksi oleh faktor-faktor
produksi milki warganegara negara tersebut dan negara asing.
6. Gross National Product (GNP)
49
Memiliki konsep yang sama dengan GDP, tetapi GNP memperkirakan jenisjenis pendapatan yang sedikit berbeda.
2.11
Metode Fact Finding
Menurut Connolly (2002, pp305-pp308) Fact finding adalah proses
formal
penggunaan
teknik
seperti
wawancara
dan
kuesioner
untuk
mengumpulkan fakta tentang sistem, kebutuhan dan apa yang dikehendaki. Ada
5 teknik fact finding yang biasa digunakan :
•
Pemeriksaan dokumen
Cara ini dapat berguna saat sistem membutuhkan perkembangan dan
dilakukan dengan menjadikan dokumen – dokumen yang berhubungan
dengan sistem sebagai bahan referensi.
•
Wawancara
Wawancara adalah cara yang paling umum digunakan, dan biasanya yang
paling berguna. Dengan wawancara, pemberi respon dapat menjawab dengan
bebas dan terbuka.
•
Observasi
Observasi adalah cara yang efektif untuk memahami sistem. Dengan teknik
ini, dimungkinkan untuk ikut berpartisipasi atau menyaksikan aktifitas yang
dilakukan untuk mempelajari sistem.
50
•
Penelitian
Cara ini berguna untuk meneliti aplikasi dan masalah. Jurnal, buku referensi,
dari internet adalah sumber informasi yang baik.
•
Kuesioner
Kuesioner adalah dokumen yang dibuat untuk mengumpulkan fakta dari
sejumlah besar orang dengan membuat control tertentu pada respon mereka.
2.12
Kerangka Berpikir
Kerangka berpikir merupakan gambaran secara sistematis mengenai
kaitan antar variabel yang diteliti untuk mengembangkan suatu sistem. Adapun
teknik yang digunakan untuk memcahakan masalah, yaitu dengan analisis
kebutuhan dengan metode fact finding.
51
Berikut ini metode dalam melakukan perancangan data warehouse makro
ekonomi pada BPPT - P3TKKE :
Analisis dan Perancangan
Data Warehouse Makro
Ekonomi BPPT-P3TKKE
Studi sistem yang sedang berjalan
pada Makro ekonomi
BPPT-P3TKKE
Studi Kepustakaan Tentang Data
Warehouse
Mencari Analisis Kebutuhan dari
Sistem yang ada
Perancangan Data Warehouse
1. Merancang Arsitektur DWH
2. Merancang Skema Bintang
3. Menentukan Proses
Transformasi dan Metadata
4. Merancang Sistem
Keamanan
Desain Aplikasi Data Warehouse
1. Merancang STD
2. Merancang Tampilan
Layar
3. Membuat Spesifikasi
Proses
Coding
1. Microsoft SQL Server 2000
2. Visual Basic 6.0
3. Crystal report 8.5
Implementasi
Gambar 2.13 Kerangka Berpikir
Download