1 BAB 2 LANDASAN TEORI 2.1 Teori – Teori Umum 2.1.1

advertisement
BAB 2
LANDASAN TEORI
2.1 Teori – Teori Umum
2.1.1 Pengertian Data
Menurut Inmon (2005:493), data adalah sebuah rekaman dari
fakta - fakta, konsep – konsep, atau instruksi – instruksi pada media
penyimpanan untuk komunikasi. Perolehan, dan pemrosesan dengan
cara otomatis dan presentasi sebagai informasi yang dapat dimengerti
oleh manusia. Sedangkan menurut Whitten, Bentley, & Kevin
(2004:23), data adalah fakta mentah mengenai orang, tempat,
kejadian, dan hal-hal yang penting dalam organisasi. Tiap fakta,
dengan sendirinya, secara relatif tidak ada artinya. Jadi, data
merupakan kumpulan dari sebuah rekaman baik itu fakta, konsep atau
pun instruksi mentah yang dapat digunakan untuk menghasilkan
informasi yang dapat dimengerti dan berguna bagi organisasi.
2.1.2 Pengertian Informasi
Menurut Inmon (2005:498), informasi adalah data yang telah
diasimilasi dan dievaluasi oleh manusia untuk menyelesaikan sebuah
permasalahan atau membuat keputusan. Sedangkan menurut Whitten,
Bentley & Kevin (2004:23), informasi adalah data yang telah diproses
atau di organisasi ulang menjadi bentuk yang berarti. Informasi
dibentuk dari kombinasi data yang diharapkan memiliki arti ke
penerima.
8
9
Dapat disimpulkan bahwa informasi merupakan data yang
telah diolah, dimana informasi tersebut biasanya digunakan untuk
pengambilan keputusan.
2.1.3 Pengertian Database
Menurut Connolly & Begg (2010:15), database adalah
kumpulan dari data yang saling berhubungan secara logical dan
menjelaskan data tersebut, dirancang untuk memenuhi kebutuhan
informasi perusahaan. Sedangkan menurut Inmon (2005:493),
database adalah kumpulan dari data yang saling berhubungan yang
disimpan berdasarkan skema. Dapat disimpulkan bahwa database
adalah kumpulan dari data yang berhubungan secara logical dan
disimpan berdasarkan skema yang dirancang untuk memenuhi
kebutuhan informasi perusahaan.
2.1.4 Pengertian Database Management System
Menurut Turban, Aroson, & Liang (2005:228), Database
Management System (DBMS) merupakan suatu program software
untuk
menambahkan
memperbarui,
informasi
menghapus,
pada
sebuah
memanipulasi,
database
menyimpan,
dan
serta
mendapatkan kembali informasi. DBMS didesain untuk menangani
sejumlah besar informasi dan memungkinkan para user untuk
melakukan query data.
10
2.1.5 Pengertian Data Warehouse
Menurut
Inmon
(2005:29),
data
warehouse
adalah
sekumpulan dari data yang subject-oriented, integrated, time-variant,
dan non-volatile untuk mendukung proses pembuatan keputusan
manajemen. Sedangkan menurut McLeod & Schell (2008:249), data
warehouse merupakan perkembangan dari konsep database yang
menyediakan suatu sumber data yang lebih baik bagi para user dan
memungkinkan user untuk memanipulasi dan menggunakan data
tersebut secara intuitif. Dikutip dari jurnal Al-Debei (2011:164), data
warehouse sangat dikenal sebagai sebuah infrastruktur, beberapa
aplikasi bisa dijalankan dalam data warehouse seperti CRM dan DSS.
Disisi lain, beberapa teknik yang bisa digunakan
untuk ekstraksi
business intelligence dalam data warehouse seperti data mining,
OLAP dan dashboard. Data warehouse digunakan oleh manager
dikarenakan mendukung dalam proses pengambilan keputusan. Jadi,
dapat disimpulkan bahwa data warehouse merupakan sebuah
arsitektur data yang digunakan untuk menyediakan kebutuhan
informasi yang diperlukan dalam mendukung proses analisa data dan
pengambilan keputusan.
2.1.6 Karakteristik Data Warehouse
Menurut Inmon (2005:29), data warehouse memiliki beberapa
karakteristik yaitu :
1. Subject-Oriented, data warehouse diorganisasikan berdasarkan subjek
utama dari perusahaan (seperti pelanggan, produk, dan penjualan) dari
11
pada berdasarkan area aplikasi utama (seperti pembuatan faktur
pelanggan, pengendalian persedian dan penjualan produk). Hal ini
menggambarkan data yang ada didalam data warehouse merupakan
data untuk pengambilan keputusan, bukan data yang berorientasi
aplikasi.
2. Integrated, data didalam data warehouse berasal dari sumber data
yang berbeda dari sistem aplikasi yang berbeda diseluruh perusahaan.
Sumber data biasanya digunakan secara tidak konsisten, contohnya
format yang berbeda. Sumber data yang terintegrasi harus dibuat
konsisten untuk menampilkan pandangan terintegrasi dari data kepada
user.
Gambar 2.1 Contoh Integration
12
3. Time Variant, data didalam data warehouse hanya akurat dan valid
dalam suatu waktu tertentu atau dalam interval waktu tertentu.
Gambar 2.2 Time Variancy
4. Non-volatile, data didalam data warehouse tidak diupdate secara real
time tetapi diperbaharui dari sistem operasional secara berkala. Data
baru selalu ditambahkan sebagai tambahan ke dalam database bukan
sebagai penggantian.
Gambar 2.3 Contoh Non Volatility
13
2.1.7 Pengertian Online Transaction Processing (OLTP)
Menurut Connolly & Begg (2010:1149), OLTP adalah sebuah
sistem yang telah dirancang untuk menangani pemrosesan transaksi
tingkat tinggi, dengan transaksi yang secara umum membuat
perubahan kecil pada data operasional organisasi, yang dibutuhkan
oleh organisasi untuk menangani operasi sehari – hari. Menurut
Kimball, Ross, Thornthwaite, Mundy, & Becker (2008:608), OLTP
adalah penjelasan dari semua aktivitas dan sistem yang berhubungan
dengan memasukkan data yang dapat diandalkan ke dalam database.
Jadi, dapat disimpulkan bahawa OLTP adalah sebuah sistem yang
berfungsi untuk menangani pemrosesan transaksi dan semua aktivitas
dari sistem yang berhubungan dengan memasukkannya ke dalam
database.
2.1.8 Pengertian Online Analytical Processing (OLAP)
Menurut Connolly & Begg (2010:1200), OLAP merupakan
sebuah perangkat yang menggambarkan teknologi menggunakan
gambaran multidimensi sejumlah data yang menyediakan akses yang
lebih cepat bagi strategi informasi dengan tujuan mempercepat
analisis.
2.1.9 Perbandingan Data Warehouse dan OLTP
Secara umum perbedaan antara data warehouse dan OLTP
menurut Connolly & Begg (2010:1148) adalah sebagai berikut :
14
Table 2.1 Perbedaan antara OLTP dengan data warehouse
OLTP
Data Warehouse
Menyimpan data saat ini.
Menyimpan data history.
Menyimpan data detil.
Menyimpan detailed, lightly, dan
highly summarized data.
Datanya bersifat dinamik.
Datanya bersifat statis.
Proses yang berulang kali.
Prosesnya bersifat khusus dan tidak
terstruktur.
Transaksi tingkat tinggi.
Transasksinya
tingkat
menengah
hingga rendah.
Pola penggunaannya dapat diprediksi
Pola penggunaanmya tidak dapat
diprediksi.
Berfokus pada proses transaksi.
Berfokus pada proses analisis.
Berorientasi aplikasi.
Berorientasi subjek.
Mendukung pengambilan keputusan Mendukung pengambilan keputusan
harian.
strategis.
Melayani user dalam jumlah besar.
Melayani user dalam jumlah kecil
biasanya manajer.
2.1.10 Pengertian Data Mart
Menurut Inmon (2005:73), data mart adalah struktur data per
departemen yang berasal dari data warehouse dimana data di
denormalisasi berdasarkan kebutuhan informasi tiap departemen.
Sedangkan menurut Connolly & Begg (2005:1165), data mart
15
merupakan bagian dari data warehouse yang mendukung kebutuhan
informasi bagian departemen atau fungsi bisnis tertentu.
Karakteristik yang membedakan antara data mart dengan data
warehouse yaitu :

Data mart berfokus pada kebutuhan pengguna yang berhubungan
dengan satu bagian departemen atau fungsi bisnis.

Data mart tidak berisi data operasional yang bersifat detil.

Data mart lebih dimengerti dan digunakan karena berisi data
yang lebih sedikit dibandingkan data warehouse.
2.1.11 Keuntungan Data warehouse
Menurut Connolly & Begg (2005:1148), data warehouse
yang telah diimplementasikan dengan baik dapat memberikan
keuntungan besar bagi organisasi, yaitu:

Potensi nilai kembali yang besar pada investasi
Sebuah organisasi harus mengeluarkan uang dan sumber
daya dalam jumlah yang cukup besar untuk memastikan kalau
data warehouse telah diimplementasikan dengan baik, biaya yang
dikeluarkan tergantung dari solusi teknikal yang diinginkan. Akan
tetapi, setelah data warehouse digunakan, maka kemungkinan
didapatkannya ROI (Return on Investment) relatif lebih besar.
16
 Keuntungan kompetitif
Keuntungan kompetitif didapatkan apabila pengambilan
keputusan mengakses data yang dapat mengungkapkan informasi
yang sebelumnya tidak diketahui, tidak tersedia, misalnya
informasi mengenai konsumen, tren, dan permintaan.
 Meningkatkan
produktivitas
para
pengambil
keputusan
perusahaan
Data
warehouse
meningkatkan
produktivitas
para
pengambil keputusan perusahaan dengan menciptakan sebuah
database yang terintegrasi secara konsisten, berorientasi pada
subjek, dan data histori. Data warehouse mengintegrasikan data
dari beberapa sistem yang tidak compatible ke dalam bentuk yang
menyediakan satu pandangan yang konsisten dari organisasi.
Dengan mengubah data menjadi informasi yang berguna, maka
seorang manajer bisnis dapat membuat analisa yang lebih akurat
dan konsisten.
2.1.12 Struktur Data Warehouse
Berdasarkan Inmon (2005:33-34), dalam data warehouse
terdapat beberapa tingkat detil yang berbeda – beda, yakni : older
level of detail (biasanya berganti – ganti, penyimpanan bulk), current
level of detail, level of lightly summarized data (level data mart), dan
level of highly summarized data. Data mengalir ke dalam
data
warehouse dari lingkungan operasional. Biasanya transformasi
17
penting dari data terjadi pada jalur dari tingkat data operasional ke
tingkat data warehouse.
Seiring berjalannya waktu, data dari current detail mengalir
menuju older detail. Apabila data di-summarized, data akan beralih
dari current detail menuju lightly summarized data. Dibawah ini
merupakan gambaran mengenai tingkatan detil data dalam data
warehouse.
2.1.12.1 Granularity
Menurut Inmon (2005:41), granularity mengarah ke
level of detail atau ringkasan data pada data warehouse.
Semakin detil data maka semakin rendah juga tingkat
granularitynya. Begitu juga sebaliknya semakin ringkas data,
semakin tinggi tinkat granularity. Ringkasan dari semua
transaksi pada suatu bulan akan menjadi tingkat yang tinggi atas
granularity.
Granularity dari data akan menjadi sebuah persoalan
desain utama pada lingkungan data warehouse karena
mempengaruhi volume data pada data warehouse dan jenis
query yang dapat dijawab. Pada banyak kasus, data yang masuk
ke data warehouse berada pada tingkat granularity yang terlalu
tinggi artinya developer harus menghabiskan banyak sumber
daya untuk memecah data. Kadang – kadang data masuk ke data
warehouse pada tingkat granularity yang terlalu rendah.
18
2.1.12.2 Metadata
Menurut Inmon (2005:102), metadata adalah sebuah
komponen penting dari lingkungan data warehouse. Metadata
atau data tentang data, telah menjadi bagian dari lingkungan
pemrosesan informasi selama telah ada program dan data.
Tetapi dalam dunia data warehouse, metadata mendapatkan
tingkat kepentingan baru, untuk segala usaha yang paling
efektif digunakan pada data warehouse.
Metadata memungkinkan end-user atau decision
support system analyst untuk menavigasi melalui beberapa
kemungkinan. Ketika user akan menggunakan data warehouse
yang tidak memiliki metada, maka user tidak tahu darimana
akan memulai analisa. Dengan adanya metada, maka user
dapat dengan cepat mencari data yang penting atau
menentukan data yang tidak ada dalam data warehouse.
Metadata bertindak sebagai index untuk isi dari data
warehouse.
Metadata items menyimpan hal – hal sebagai berikut:

Struktur data bagi programmer.

Struktur data bagi DSS analyst.

Sumber data untuk data warehouse.

Transformasi data ke data warehouse.

Data model.

Relationship antara data model dan data warehouse.
19

Histori dari extracts.
2.1.13 Eksternal Data Dalam Data Warehouse
Menurut
Inmon
(2005:268)
data
warehouse
mampu
menampung data lebih dari data internal dan data terstuktur. Ada
banyak informasi relevan bagi perusahaan yang bersumber dari luar
perusahaan.
Menurut Inmon (2005:257 - 259) kebanyakan perusahaan dan
hampir semua kasus dalam membangun data warehouse sumber data
yang paling utama adalah data pada sistem yang sedang berjalan (data
internal dan data yang terstruktur) pada perusahaan tersebut.
Satu keseluruhan besar atas data lain yang sah digunakan
untuk sebuah perusahaan yang tidak dihasilkan dari sistem perusahaan
sendiri disebut dengan data eksternal dan biasanya memasuki
perushaaan dalam format yang tidak terduga. Ada 2 tipe dasar dari
eksternal data, yakni sebagai berikut : tipe pertama adalah records
dari eksternal data yang dikoleksi dari beberapa sumber (seperti
dokumen toko obat, supermarket dan lain – lain), tipe yang kedua
adalah eksternal data dari laporan, artikel dan sumber lainnya yang
diambil secara acak.
20
2.1.14 Arsitektur Data Warehouse
Menurut Kimball & Caserta (2004:16), komponen utama yang
dimiliki oleh data warehouse pada umumnya, yaitu :
Gambar 2.4 Arsitektur Data Warehouse (Kimball & Caserta, 2004:16)
2.1.14.1 Data Operasional
Sumber data untuk data warehouse berasal dari :
- Mainframe operasional data memegang kendali di hirarki
generasi pertama dan di database jaringan.
- Departmental data yang disimpan kepemilikan sistem file
seperti VSAM, RMS, dan relasi DBMS seperti Informix
dan Oracle.
- Data pribadi disimpan pada workstations dan private
servers.
21
- External systems seperti internet, database komersial atau
database yang berhubungan dengan pemasok organisasi
atau konsumen.
2.1.14.2 Operational Data Store
ODS
adalah
sebuah
tempat
penyimpanan
data
operasional terkini dan terintegrasi yang digunakan untuk
keperluan analisis. ODS sering kali terstruktur dan terisi data
dengan cara yang serupa dengan data warehouse, namun
kenyataannya merupakan tempat untuk menampung data
yang akan masuk ke dalam data warehouse.
2.1.14.3 ETL Manager
ETL Manager menjalankan seluruh operasi yang
berhubungan dengan proses ETL data ke dalam data
warehouse. Data dapat saja di ekstrak langsung dari sumber
data, atau lebih umum dari data store operasional.
2.1.14.4 Warehouse Manager
Warehouse Manager menjalankan seluruh operasi
yang
berhubungan
warehouse. Operasi
dengan
manajemen
data
yang dijalankan oleh
dalam
warehouse
manager meliputi :
- Analisis data untuk memastikan konsistensi.
- Transformasi
dan penggabungan sumber
data dari
penyimpanan sementara ke dalam tabel data warehouse.
22
- Pembuatan index dan views pada tabel-tabel.
- Generate denormalisasi (jika diperlukan).
- Generate agregasi.
- Back-up dan penyimpanan data.
2.1.14.5 Query Manager
Query Manager menjalankan semua operasi yang
berhubungan
dengan
manajemen
query
pengguna.
Kompleksitas dari query manager ditentukan oleh fasilitas
yang disediakan oleh end-user access tools dan database.
Operasi yang dijalankan oleh komponen ini termasuk
mengarahkan query ke tabel yang benar dan menjadwalkan
pengeksekusian query.
2.1.14.6 Detailed Data
Pada bagian ini, warehouse menyimpan detil seluruh
data dalam skema database. Dalam kebanyakan kasus, detil
data tidak disimpan secara online, namun dimungkinkan
dengan mengagregasi data ke tingkatan detil data selanjutnya.
2.1.14.7 Lightly and Highly Summarized Data
Pada bagian ini, warehouse menyimpan data yang telah
di agregasi (lightly and highly summarized) yang dihasilkan
dengan warehouse manager. Tujuan dari informasi yang
diringkas adalah agar dapat meningkatkan peforma query.
23
2.1.14.8 Archive / Backup Data
Pada bagian ini, warehouse menyimpan detailed data
dan data yang telah diringkas dengan tujuan untuk
penyimpanan (achiving) dan back up. Walaupun data yang
diringkas dihasilkan dari detailed data, sangatlah penting
untuk memback up online summary data.
2.1.14.9 Metadata
Pada bagian ini, warehouse menyimpan semua definisi
metadata (data mengenai data) yang digunakan oleh proses
yang terjadi dalam warehouse. Metadata digunakan untuk
berbagai keperluan, seperti :
- Proses ekstraksi dan loading, dimana metadata digunakan
untuk memetakan sumber data.
- Proses manajemen warehouse, dimana metadata digunakan
untuk meng-otomatisasi pembuatan ringkasan tabel.
- Sebagai bagian dari proses manajemen query, dimana
metadata digunakan untuk mengarahkan query ke sumber
data yang sesuai.
Struktur metadata berbeda untuk setiap proses karena
tujuannya berbeda.
24
2.1.14.10 End-User Access Tools
Tujuan
utama
data
warehouse
adalah
untuk
mendukung para pembuat keputusan. Data warehouse harus
bisa mendukung analisa ad-hoc dan rutin. Peforma tinggi
didapatkan dengan merencanakan keperluan untuk joins,
summations, dan laporan periodik dengan user. Tools ini
dikategorikan menjadi 4 jenis, yaitu:
a.
Reporting and Query Tools
Reporting tools meliputi production reporting
tools dan report writers. Production reporting tools
digunakan untuk menghasilkan laporan operasional
rutin, atau mendukung pekerjaan bervolume tinggi
seperti customers orders/invoices dan staff paychecks.
Query tools untuk relational data warehouses di
rancang untuk menerima SQL atau menghasilkan
statement SQL untuk query data yang tersimpan di
warehouse.
b.
Application Development Tools
Kemampuan
built-in
untuk
menghasilkan
laporan dan query tools tidak dapat memenuhi
kebutuhan user, entah dikarenakan analisis yang
diperlukan tidak dapat dilakukan, atau karena interaksi
user membutuhkan keahlian yang tinggi.
c.
Online Analytical Processing (OLAP) Tools
25
OLAP
tools
adalah
berdasarkan
konsep
database multidimensional dan memungkinkan user
untuk melakukan analisa mengggunakan pandangan
yang kompleks dan multidimensional. Aplikasi bisnis
yang umum untuk tools tersebut termasuk untuk
menilasi keefektifan suatu iklan marketing, prediksi
penjualan produk, dan perencanaan kapasitas. Tools
tersebut mengasumsikan bahwa data disusun dalam
sebuah model multidimensional yang didukung dengan
database multidimensional khusus (MDDB), atau
dengan database relasional yang di rancang untuk
memungkinkan query multidimensional.
d.
Data Mining Tools
Data
mining
merupakan
suatu
proses
menemukan korelasi, pola, dan trend baru dengan
mengambil
data
dalam
jumlah
besar
dengan
menggunakan teknik-teknik statistika, matematika, dan
AI. Data mining memiliki potensi untuk menggantikan
kemampuan OLAP tools, dikarenakan kemampuan
data mining yang utama adalah untuk membangun
model predictive daripada model retrospective.
2.1.15 Dimentional Modelling
Menurut
Connolly
&
Begg
(2010:1177),
dimentional
modelling merupakan suatu teknik merancang logikal yang bertujuan
untuk menampilkan data dalam bentuk standar dan intuitif yang
26
memungkinkan
akses
dengan
peforma
tinggi.
Setiap
model
dimensional terdiri dari satu tabel dengan primary key komposit yang
disebut fact table, dan sekumpulan tabel kecil yang disebut dimension
tables. Setiap tabel dimensi memiliki primary key yang sederhana
(noncomposite) yang sesuai dengan salah satu komponen dari
composite key pada tabel fakta. Dengan kata lain, primary key dari
tabel fakta tersusun dari dua atau lebih foreign keys. Karakteristik
struktur yang menyerupai bintang ini disebut star schema atau star
join.
Fitur penting dari suatu dimentional modelling adalah seluruh
natural keys digantikan oleh surrogate keys. Ini berarti setiap
penggabungan antara tabel fakta dan dimensi adalah berdasarkan
surrogate keys, bukan natural keys. Kegunaan dari surrogate keys
adalah untuk memungkinkan data yang ada dalam warehouse untuk
tidak tergantung dari data yang digunakan dan dihasilkan oleh sistem
OLTP.
Star schema adalah suatu model data dimensional yang
memiliki tabel fakta di tengah, dan dikelilingi oleh tabel dimensi yang
di denormalisasi. Star schema dapat digunakan untuk mempercepat
proses query dengan denormalisasi reference data ke dalam suatu
tabel dimensi. Menurut Mishra, Yazici, & Basaran (2009:83) dalam
jurnal A Comparison of Design Models in Data Warehousing
dikatakan bahwa keuntungan dalam menggunakan skema bintang ini
yaitu dapat mengurangi jumlah tabel dalam database dan jumlah relasi
27
di antara tabel tersebut dimana juga mengurangi jumlah joins yang
dibutuhkan dalam user queries.
Gambar 2.5 Contoh Star Schema
Terdapat dua variasi star schema, yaitu snowflake schema dan
starflake schema. Snowflake schema adalah suatu model dimensional
data yang memiliki tabel fakta di tengah, dan dikelilingi oleh tabel
dimensi yang telah di normalisasi. Skema ini memungkinkan dimensi
untuk memiliki dimensi. Starflake schema adalah suatu model
dimensional data yang memiliki tabel fakta di tengah, dan dikelilingi
oleh tabel dimensi, baik yang telah di normalisasi, maupun yang telah
di denormalisasi. Skema ini merupakan campuran dari star schema
dan snowflake schema.
28
2.1.15.1 Tabel Fakta
Tabel fakta disebut juga tabel major. Merupakan inti
dari skema bintang dan berisi data aktual yang akan
dianalisis. Field-field tabel fakta disebut measure dan
biasanya dalam bentuk numerik, selalu berisi foreign key dari
tabel-tabel dimensi. Tabel terdiri dari banyak kolom dan
dapat berisi ribuan baris data.
2.1.15.2 Tabel Dimensi
Tabel dimensi disebut juga tabel minor. Tabel dimensi
biasanya lebih kecil dari tabel fakta. Tabel dimensi pada
umumnya berisi informasi deskriptif. Atribut-atribut dimensi
digunakan sebagai constraint pada query data warehouse.
2.1.16 Extraction, Transformation, and Loading (ETL)
Menurut Connolly & Begg (2010:1158), ETL adalah suatu
proses dimana data yang ditujukan ke enterprise data warehouse
harus diekstrak terlebih dahulu dari satu atau lebih sumber data,
diubah menjadi suatu bentuk yang mudah untuk dianalisis, dan
konsisten dengan data yang telah ada di warehouse. Dan akhirnya
dikeluarkan ke dalam enterprise data warehouse.
2.1.16.1 Extraction
Langkah ekstraksi menargetkaan satu atau lebih
sumbar data untuk enterprise data warehouse (EDW);
sumber-sumber ini biasanya meliputi database OLTP namun
29
dapat juga termasuk sumber-sumber seperti personal
database dan spreadsheets, file ERP, dan web usage log files.
Sumber data biasanya internal, namun dapat juga termasuk
sumber eksternal, seperti sistem yang digunakan oleh
supplier atau customer.
Kompleksitas tahap ekstraksi tergantung pada seberapa
mirip atau bedanya sumber sistem bagi EDW. Jika sumber
sistem terdokumentasi dengan baik, dipelihara dengan baik,
sesuai dengan format data perusahaan, dan menggunakan
teknologi yang sama atau mirip, maka proses ekstraksi
seharusnya berjalan dengan cepat. Namun, jika sumber
terdokumentasi dengan buruk, dipelihara menggunakan
format data dan teknologi yang berbeda, maka proses
ekstraksi akan menjadi sangat rumit.
2.1.16.2 Transformation
Langkah
transformasi
menerapkan
serangkaian
peraturan atau fungsi terhadap data yang diekstraksi, yang
dimana menentukan bagaimana data akan digunakan untuk
analisis
dan
dapat
melibatkan
transformasi
seperti
penjumlahan data, data encoding, data merging, data
splitting, data calculation, dan pembuatan surrogate key.
Output dari transformasi adalah data yang bersih dan
konsisten dengan data yang telah ada di warehouse, dan lebih
30
lanjut, dalam bentuk yang siap untuk dianalisa oleh pengguna
warehouse.
2.1.16.3 Loading
Memasukkan data ke dalam warehouse dapat terjadi
setelah seluruh transformasi telah selesai. Selagi data
dimasukkan ke dalam warehouse, constraint tambahan
didefinisikan dalam database schema, begitu juga dalam
trigger yang diaktifkan ketika loading data. Hal penting yang
berhubungan dengan tahap loading adalah menentukan
frekuensi dari loading dan bagaimana proses loading dapat
mempengaruhi ketersediaan data warehouse.
2.1.17 Tahapan Merancang Data Warehouse
Menurut Ralph Kimball dalam buku Connolly T. and Begg C. (2010),
Database Systems : A Practical Approach to Design, Implementation,
and Management, analisa dan perancangan data warehouse terdiri dari
2 fase, yaitu :
Fase 1 : Create High-Level Dimensional Model.
1. Select Business Process
Memilih proses berarti mengarah pada suatu data mart tertentu.
Dilakukan dengan menentukan subjek-subjek utama yang merujuk
pada kegiatan bisnis yang penting dalam perusahaan. Cara terbaik
untuk menentukan data mart pertama biasanya yang memiliki
hubungan dengan penjualan.
31
2. Declare Grain
Memilih
grain
berarti
menentukan
apa
yang
akan
direpresentasikan oleh tabel fakta. Setelah grain untuk tabel fakta
ditentukan, maka selanjutnya ditentukan dimensi-dimensi dari
tabel fakta. Grain yang ditentukan untuk tabel fakta juga akan
menentukan grain untuk tiap tabel dimensi.
3. Choose Dimensions
Identifikasi hubungan tabel dimensi dengan tabel fakta. Dimensi
merupakan kumpulan sudut pandang yang penting untuk
menggambarkan fakta-fakta yang terdapat pada tabel fakta.
Dimensi membuat data mart lebih mudah dimengerti dan
digunakan.
4. Identify Facts
Grain dari suatu tabel fakta menentukan fakta-fakta yang dapat
digunakan dalam data mart. Fakta tambahan yang dapat
ditambahkan untuk sebuah tabel fakta kapan pun sesuai
konsistensi grain tabel tersebut.
Fase 2 : Identify All Dimension Attributes for the Dimensional Model.
1. Choosing the Duration of the Database
Memilih durasi dari database dengan menentukan durasi waktu
dari tabel fakta dan data-data yang ada di dalamnya. Menentukan
lamanya durasi database tergantung dari perusahaan itu sendiri,
sebagai contoh, pada perusahaan asuransi biasanya disimpan data
minimal 5 tahun atau lebih.
32
2. Tracking Slowly Changing Dimension
Dimensi dapat berubah sesuai dengan berjalannya waktu. Ada tiga
cara untuk mengatasi perubahan dimensi, yaitu :
1. Menulis ulang atribut yang berubah.
2. Membuat record yang baru dalam dimensi.
3. Membuat alternatif atribut untuk menampung nilai yang baru
sehingga nilai yang lama maupun yang baru tetap dapat
diakses dalam dimensi yang sama.
2.1.18 Oracle Warehouse Builder
Menurt Connolly & Begg (2010:1190) Oracle Warehouse
Builder (OWB) merupakan suatu tool untuk merancang dan extract,
transform, load. OWB juga merupakan komponen utama dari Oracle
Warehouse
Solution
yang
memungkinkan
perancangan
dan
pengimplementasian data warehouse, data mart, dan aplikasi ebusiness intelligence. Oracle Warehouse Builder adalah sebuah tool
untuk mengintegrasikan informasi yang memanfaatkan database
Oracle untuk ditransformasi menjadi informasi yang berkualitas
tinggi. Database Oracle adalah komponen pokok dalam arsitektur
Warehouse builder karena database tersebut mempunyai Warehouse
Builder repository dan kode yang dihasilkan oleh Oracle Warehouse
Builder.
2.1.19 Komponen dalam Oracle Warehouse Builder 11g
Komponen – komponen utama dalam Oracle Warehouse Builder
adalah sebagai berikut :
33
Design Center
Design Center menyediakan antar muka yang grafis untuk
mendefinisikan sumber dan merancang target dan proses ETL.
Control Center Manager
Control Center Manager merupakan komponen yang digunakan
untuk proses deploy dan eksekusi ETL. Control Center Manager
merupakan konsol deployment yang lengkat yang memungkinkan
anda untuk melihat dan memanage semua aspek dari deployment.
Target Schema
Target Schema adalah target dimana data di-load dan objek data
yang telah dirancang dalam Design Center seperti cubes,
dimensions, views, dan mapping.Target Schema mengandung
komponen seperti sysnonyms yang memungkinkan ETL mapping
untuk mengakses audit/service packages dalam repository.
Repository menyimpan semuan informasi yang berkaitan dengan
target schema seperti informasi eksekusi dan deployment.
Warehouse Builder Repository
Repository schema menyimpan semua definisi metadata untuk
semua sumber, target, dan proses ETL yang merupakan rancangan
metadata.
34
About Workspaces
Dalam mendefinisikan repository¸workspace bisa dibikin satu atau
lebih, dengan setiap workspace sesuai dengan sekumpulan user
yang mengerjakan proyek yang berkaitan. Latihan yang umum
yaitu membuat workspace yang terpisah untuk deployment, testing,
dan
produksi.
Menggunakan
latihan
ini,
kita
dapat
memperbolehkan user seperti developers untuk akses ke
development dan testing workspace tetapi melarang mereka dari
production workspace.
Repository Browser
Repository Browser adalah sebuah antarmuka web browser untuk
pelaporan kedalam repository. Kita bisa melihat metadata,
membuat laporan, audit runtime operations, dan perform lineage
and impact analysis. Repository browser diorganisir sedemikian
rupa agar kita bisa
melihat design-specific dan mengontrol
informasi center specific.
Control Center Service
Control Center Service adalah komponen yang memungkinkan
kita untuk mendaftarkan lokasi. Ia juga memungkinkan dalam
deployment dan eksekusi logika ETL yang telah kita rancang
dalam Design Center seperti mapping dan aliran proses (process
flows).
35
Komponen – komponen lain yang terdapat dalam Oracle
Warehouse Builder Connolly & Begg (2010:1190) :

A repository : berisi sekumpulan tabel dalam database Oracle
yang diakses melalui layar akses java-based.

A Graphical User Interface (GUI) : merupakan interface yang
digunakan untuk mengakses repository. GUI mempunyai
editor yang grafis dan wizard yang memudahkan user dalam
menggunakannya.

A code generator : digunakan untuk menghasilkan kode yang
memungkinkan untuk menjalankan data warehouse.

Integrators : merupakan komponen yang digunakan untuk
menjalankan ekstrasi data daru beberapa sumber yang berbeda.

An open interface : sebuah interface yang memungkinkan
developers untuk bisa berkarya dalam membangun Oracle
Warehouse Builder.

Runtime : merupakan sekumpulan dari table, sequence,
packages, dan triggers yang terinstal dalam skema target.
2.1.20 Oracle Business Intelligence Enterprise Edition
OBIEE
adalah
platform
business
intelligence
yang
komprehensif, yang memiliki banyak kemampuan seperti dashboards
yang interaktif, ad hoc queries, notifications dan alert, enterprise and
financial reporting, scorecard dan strategi manajemen, dan masih
banyak lagi. OBIEE juga membuat data perusahaan mudah di akses
oleh para pengguna bisnis.
36
2.1.21 Nilai yang terkandung dalam sistem BI yang berbasis data
warehouse dan 2 pendekatan data warehouse
Dikutip dari jurnal Andrews & Guerra (2011: 4), nilai dari
sistem business intelligence berbasis data warehouse kepada users
adalah sebagai berikut:
• The generation of scheduled reports. Laporan dapat dibikin
langsung oleh end-user, sehingga pembuatan laporan dengan sistem
BI meningkatkan konsistensi dan akurasi serta mengurangi biaya.
• Packaged analytical applications. Packages ini menyediakan
laporan dan metrik yang bisa digunakan oleh unit bisnis untuk
mengukur kinerjanya.
• Ad hoc reporting and analysis. Users dapat melakukan analisa data
dengan cepat dan menghasilkan laporan dengan sangat mudah.
• Dynamic presentation through dashboards. Menyediakan layar
presentasi yang interaktif, dengan menampilkan data dalam bentuk
grafik dan kreatif yang biasa disebut dengan dashboard.
• Drill down capability. Memungkinkan users untuk menjalankan
aksi drill down untuk melihat detil dari laporan.
• Support for regulations. Memastikan bahwa data yang penting akan
ditahan dalam data warehouse selama dibutuhkan oleh hukum.
• The creation of metadata. Data warehouse bisa digunakan untuk
membuat dan menyimpan metada dari potensial nilai yang tinggi.
37
• Support for operational processes. Selain digunakan untuk
menganalisa data dan menghasilkan laporan yang ringkas, juga bisa
mendukung dalam menjalankan bisnis yang sedang berjalan.
• Data mining. Sangat memungkinkan untuk menjalankan proses data
mining.
• Security. Dapat dengan mudah menyediakan keamanan akses
kedalam data yang spesifik.
Menurut Velicanu & Matei (2007:84) dari jurnalnya yang
berjudul Building a data warehouse step by step, dikatakan bahwa
terdapat 2 pendakatan dalam membangun data warehouse, yaitu :

Pendekatan top-down adalah pendekatan yang telah
matang dan digunakan ketika masalah teknologi dan
ekonomi telah diketahui dengan benar.

Pendekatan bottom-up adalah pendekatan yang cepat
dan didasarkan pada percobaan dan prototipe.
2.1.22 Activity Diagram
Menurut Satzinger, Jackson, & Burd (2005), bahwa Activity
Diagram adalah suatu diagram workflow yang menjelaskan aktivitasaktivitas user beserta alurnya. Workflow adalah serangkaian langkahlangkah dalam menjalankan transaksi bisnis. Adapun komponenkomponen dalam Activity Diagram adalah sebagai berikut:
- Swimlane adalah tabel dimana aktivitas yang dilakukan oleh seorang
aktor digambarkan.
38
- Pseudo adalah bulatan hitam penuh yang menandakan dimulainya
(starting point) suatu aktivitas.
- Activity adalah aktivitas/kegiatan yang dilakukan oleh aktor-aktor,
yang digambarkan di dalam simbol berbentuk oval.
- Transaction Arrow adalah simbol yang menandakan ke mana suatu
aktivitas berlanjut.
- Decision Activity adalah suatu simbol yang berbentuk ketupat, yang
digunakan ketika terjadinya aktivitas yang membutuhkan keputusan
seperti yes-no.
Contoh Activity Diagram :
Gambar 2.6 Activity Diagram
2.1.23 Fact – Finding Techniques
Menurut Connoly & Begg (2010:317), Fact finding techniques
adalah proses formal menggunakan tekhik-tehnik diantaranya
interview dan questionnaires yang digunakan untuk mengumpulkan
39
fakta tentang system, requirements, dan preferences. Fact finding
techniques pada umumnya digunakan pada babak awal dari lifecycle
termasuk database planning, system definition, dan requirement
collection. Database developer mengumpulkan fakta-fakta yang
penting untuk membangun database yang dibutuhkan. Fact-finding
techniques juga digunakan pada tahap database design dan babakbabak lifecycle selanjutnya.
Ada 5 tipe yang sering digunakan dalam fact-finding techniques :
1. Examining documentation
Mempelajari dokumentasi dapat berguna dalam mendapatkan
penglihatan
bagaimana
kebutuhan
dari
database
muncul.
Dokumentasi juga dapat membantu dalam menyediakan informasi
bagian dari perusahaan yang bermasalah. Dokumen yang biasanya
digunakan adalah form, laporan-laporan, dan file yang berhubungan
dengan sistem.
2. Interviewing.
wawancara adalah salah satu dari teknik pencarian data yang paling
sering digunakan dan paling berguna. Wawancara dapat dilakukan
untuk mengumpulkan informasi dari para individual secara langsung.
Ada beberapa tujuan yang dapat dicapai dengan wawancara
diantaranya menemukan fakta, memverifikasi fakta, mengklarifikasi
fakta, menghasilkan antusiasme, melibatkan end-user, menemukan
persyaratan, dan mengmpulkan ide dan opini.
3. Observing the enterprise in operation.
40
Observasi adalah salah satu teknik pegumpulan data yang paling
efektif untuk mengerti sebuah system. Hal yang mungkin dilakukan
diantaranya ikut berpartisipasi atau melihat orang yang melakukan
aktivitas untuk mempelajari sebuah sistem. Teknik ini biasanya
berguna untuk melakukan validasi kumpulan data yang telah didapat
dari metode lain atau ketika beberapa aspek yang kompleks sulit
dijelaskan oleh end-users.
4. Research
Studi kepustakaan
adalah tekhik yang paling berguna untuk
mempelajari aplikasi dan masalah. Beberapa sumber yang dapat
digunakan untuk studi kepustakaan adalah jurnal, buku referensi, dan
internet.
5. Questionnaires.
Kuesioner adalah tehnik yang digunakan secara khusus dalam
mengumpulkan fakta dari sejumlah besar responden. Kuesioner
dilakukan dengan cara menyebarkan pertanyaan.
2.1.24 Data Flow Diagram
Menurut Whitten & Bentley (2007:317) data flow diagram
adalah sebuah model proses yang digunakan untuk menggambarkan
alur dari data yang melalui sistem dan pekerjaan atau proses yang
dilakukan oleh sistem tersebut. Adapun komponen-komponen dalam
data flow diagram adalah sebagai berikut :
1. System / Process adalah pekerjaan yang dilakukan oleh system
dalam merespon alur data yang masuk atau suatu kondisi tertentu.
2. Data flow adalah data yang masuk dan keluar dari atau kedalam
sistem / proses.
41
3. External agent adalah orang luar, unit organisasi, sistem, atau
organisasi yang berinteraksi dengan system.
4. Data store adalah tempat penyimpanan data yang akan digunakan.
Gambar 2.11 data flow diagram (Whitten & Bentley, 2007:318)
2.1.24 Context data flow diagram
Menurut Whitten & Bentley (2007:338) Context data flow
diagram
adalah
model
proses
yang
digunakan
untuk
mendokumentasikan sistem secara keseluruhan. Sistem merupakan
sudut pandang yang diambil dari System Owner pada sistem
informasi.
42
Gambar 2.12 Context diagram (Whitten & Bentley, 2007:340)
2.1.26 Entity Relationship Diagram
Menurut Whitten & Bentley (2007:271) Entity Relationship
Diagram adalah data model yang memanfaatkan beberapa notasi
untuk mengambarkan data dalam hal entitas dan hubungan yang
dijelaskan oleh data.
43
Gambar 2.13 Entty Relationship Diagram (Whiten & Bentley, 2007:270)
Adapun komponen-komponen dalam Entity Relationship
Diagram adalah sebagai berikut :
1.
Entities adalah kelas dari orang, tempat, objek, kejadian atau konsep
tentang data apa yang perlu untuk ditangkap dan disimpan.
2.
Attributes adalah Properti penjelas atau karakteristik dari entitas.
Adapun komponen-komponen dalam attributes adalah sebagai berikut
:
a.
Compound Attribute adalah atribut yang terbuat dari atribut lain.
b.
Data type adalah property dari atribut yang mengindentifikasikan
tipe data yang dapat disimpan dalam atribut.
c.
Key adalah atribut atau kumpulan atribut yang dijadikan nilai unik
untuk setiap entitas. Biasanya disebut identifier.
3.
Relationship adalah hubungan bisnis natural antara satu atau lebih
entitas. Adapun komponen-komponen dalam Relationship adalah
sebagai berikut :
44
a. Cardinality adalah nilai minimal dan maksimal dari kemunculan
entitas yang mungkin berhubungan dengan suatu kemunculan
entitas lain.
b. Recursive relationship adalah hubungan yang muncul dalam entitas
yang sama.
c.
Associative entity adalah entitas yang mewarisi primary key dari
satu atau lebih entitas.
2.2 Teori Khusus
2.2.1 Kredit
Menurut Undang – Undang Perbankan nomor 10 tahun 1998
kredit adalah penyediaan uang atau tagihan yang dapat dipersamakan
dengan itu, berdasarkan persetujuan atau kesepakatan pinjam meminjam
antara bank dengan pihak lain yang mewajibkan peminjam melunasi
utangnya setelah jangka waktu tertentu dengan pemberian bunga.
Sedangkan, menurut Kabir, Jahan, Chisty, & Hasin (2010:331) dalam
jurnal yang berjudul Credit Risk Assessment and Evaluation System for
Industrial Project dijelaskan bahwa kredit dapat didefinisikan sebagai
sebuah transaksi antara dua pihak dimana satu pihak (kreditur atau
pemberi pinjaman) menyediakan uang atau moneter setara barang, jasa,
dan lain – lain, sebagai imbalan atas janji pembayaran masa depan oleh
pihak yang satunya lagi (debitur atau peminjam) sesuai dengan telah
disepakati.
45
2.2.2 Penjualan Kredit
Menurut Kieso (2009:323), penjualan kredit adalah janji lisan
dari pembeli untuk membayar jasa yang dijual, biasanya dapat ditagih
30-60 hari dan merupakan piutang terbuka yang berasal dari pelunasan
utang jangka pendek.
2.2.3 Prosedur Pemberian Kredit
Menurut Kasmir (2007:110-114), secara umum akan dijelaskan
prosedur pemberian kredit oleh badan hukum sebagai berikut:
1. Pengajuan proposal
Untuk memperoleh fasilitas kredit dari bank maka tahap yang
pertama pemohon kredit mengajukan permohonan kredit secara
tertulis dalam suatu proposal.
2. Penyelidikan berkas pinjaman
Tahap selanjutnya adalah penyelidikan dokumen-dokumen yang
diajukan pemohon kredit. Tujuannya adalah untuk mengetahui
apakah berkas yang diajukan sudah lengkap sesuai persyaratan yang
telah ditetapkan.
3. Penilaian kelayakan kredit
Dalam penilaian layak atau tidak suatu kredit disalurkan maka perlu
dilakukan suatu penilaian kredit. Penilaian kelayakan suatu kredit
dapat dilakukan dengan menggunakan 5C atau 7P namun untuk
46
kredit yang lebih besar jumlahnya perlu dilakukan metode penilaian
dengan studi kelayakan.
4. Wawancara pertama
Tahap ini merupakan penyidikan kepada calon peminjam dengan
cara berhadapan langsung dengan calon peminjam.
5. Peninjauan ke lokasi (On the Spot)
Setelah memperoleh keyakinan atas keabsahan dokumen dari hasil
penyelidikan dan wawancara maka langkah selanjutnya adalah
melakukan peninjauan ke lokasi yang menjadi objek kredit.
6. Wawancara kedua
Hasil peninjauan ke lapangan dicocokkan dengan dokumen yang ada
serta hasil wawancara satu dalam wawancara kedua.
7. Keputusan kredit
Setelah melalui berbagai penilaian mulai dari kelengkapan dokumen
keabsahan dan keaslian dokumen serta penilaian yang meliputi
seluruh aspek studi kelayakan kredit maka langkah selanjutnya
adalah keputusan kredit.
8. Penandatangan akad kredit / perjanjian lainnya
Kegiatan ini merupakan kelanjutan dari diputuskanya kredit.
sebelum kredit dicairkan maka terlebih dulu calon nasabah
menandatangani akad kredit.
47
9. Realisasi kredit
Setelah akad kredit ditandangani maka langkah selanjutnya adalah
merealisasikan
kredit.
realisasi
kredit
diberikan
penandatanganan surat-surat yang diperlukan dengan
rekening giro atau tabungan di bank yang bersangkutan.
setelah
membuka
Download