BAB 2 LANDASAN TEORI 2.1 Teori

advertisement
BAB 2
LANDAS AN TEORI
2.1
Teori-teori Dasar/Umum
2.1.1
Pengertian Data
M enurut Inmon (2002, p388), data adalah pencatatan dari fakta,
konsep, atau instruksi pada sebuah tempat penyimpanan untuk
komunikasi, pengambilan, dan pemrosesan dengan cara otomatis dan
presentasi yang dapat dimengerti oleh manusia.
Sedangkan menurut
Turban (2003, p15), data adalah fakta mentah atau deskripsi dasar dari
benda, peristiwa, aktivitas dan transaksi yang didapatkan, direkam,
disimpan, diklasifikasi tetapi belum terorganisir untuk menyampaikan
suatu arti spesifik.
2.1.2
Pengertian Informasi
M enurut Turban (2003, p15), informasi adalah suatu koleksi fakta
(data) yang telah terorganisir dengan beberapa cara sehingga memberikan
suatu arti yang dipahami oleh penerima. 8 9 2.1.3
Pengertian Sistem
Sistem adalah sekelompok elemen yang terintegrasi dengan
maksud yang sama untuk mencapai suatu tujuan (M cLeod, 2001, p11).
2.1.4
Pengertian Sistem Informasi
M enurut O’Brien (2004, p7) “An information system can be any
organized combination of people, hardware, software, communication
networks, and data resources that collects, transforms and disseminates
information in an organization” yang dapat diartikan sistem informasi
dapat berupa kombinasi yang teratur dari orang, perangkat keras,
perangkat
lunak,
jaringan
komunikasi dan
sumber
data yang
mengumpulkan, merubah dan menyebar informasi ke dalam sebuah
organisasi.
2.1.5
Pengertian Basis Data
M enurut Inmon (2002, p388), basis data adalah suatu koleksi
data yang saling berhubungan yang disimpan menurut suatu skema.
10 2.1.6
Pengertian Sistem Basis Data
Sistem basis data menurut Connolly dan Begg (2000, p4),
merupakan kumpulan dari program aplikasi yang berinteraksi dengan
basis data. Sedangkan menurut Navathe dan Elmasri (2000, p5), sistem
basis data merupakan gabungan basis data dengan software DBM S.
2.1.7
Pengertian DBMS
M enurut Inmon (2002, p388), DBM S adalah sebuah system
perangkat lunak yang digunakan untuk menampilkan dan mengatur data.
2.1.8
Pengertian Data Warehouse
M enurut Connolly dan Begg (2005, p1151), ”Data warehouse is
a subject-oriented, integrated, time-variant, and non-volatile collection
of data in support of management’s decision-making process”, yang
dapat diartikan “Data warehouse adalah kumpulan data yang
berorientasi subjek,
terintegrasi,
berdasarkan
waktu,
dan
tidak
mengalami perubahan secara langsung dalam mendukung proses
pengambilan keputusan manajemen”.
11 M enurut Inmon (2002, p389), “A Data warehouse is a collection
of integrated database designed to support DSS Function, where each
unit of data is relevant to some moment in time”, yang dapat diartikan
sebagai “Data warehouse adalah koleksi database yang terintegrasi yang
dirancang untuk mendukung fungsi sistem pengambilan keputusan,
dimana setiap unit data relevan pada beberapa waktu”.
2.1.8.1 Karakteristik Data Warehouse
1. Subject Oriented
Subject oriented berarti bahwa data warehouse
dibuat atau disusun berdasarkan pada subjek utama dalam
lingkungan perusahaan, bukan berorientasi pada proses
atau fungsi aplikasi. Subjek area biasa meliputi customer
(pelanggan), product (produk), transaction (transaksi).
Setiap area subjek utama yang diimplementasikan secara
fisik sebagai sekumpulan tabel yang saling berhubungan
dalam data warehouse (Inmon, 2002, p36).
2. Integrated
Data dalam data warehouse bersifat terintegrasi
karena bersumber dari sistem-sistem aplikasi yang
berbeda dalam perusahaan.
Sumber
data yang
12 terintegrasi ini harus dibuat konsisten untuk memberikan
data yang seragam atau sama kepada pelanggan (Inmon,
2007, p7)
3. Time Variant
Data pada data warehouse hanya akurat dan valid
pada waktu tertentu atau dalam interval waktu tertentu.
Perbedaan waktu dari data warehouse memperlihatkan
data-data yang ada dari waktu ke waktu secara
keseluruhan (Connolly and Begg, 2002, p1047).
4. Non Volatile
Proses Update tidak dilakukan secara real-time
melainkan di-refresh dari sistem operasional dalam basis
regular.
Data baru
selalu
ditambahkan
sebagai
supplement (tambahan), pada database, bukan sebagai
replacement (penggantian).
Database secara terus-
menerus mengambil data baru dan menggabungkannya
dengan data sebelumnya (Connolly and Begg, 2002,
p1047).
13 2.1.9
Pengertian Data Mart
M enurut Inmon (2002, p389), data mart adalah struktur data
yang tersusun rapi yang dikumpulkan dari data warehouse dimana data
telah didenormalisasi berdasarkan kebutuhan informasi departemendepartemen. Sedangkan menurut Liautaud (2001, p292), data mart
adalah suatu bentuk penyimpanan data pada business intelligence atau
pendukung keputusan. Data mart terbatas pada suatu lingkup tertentu
dan ditujukan untuk memenuhi kebutuhan suatu divisi atau kelompok
user tertentu. Ada beberapa karakteristik yang membedakan data mart
dan data warehouse, yaitu (Connolly, 2002, p1067):
-
Data mart hanya berfokus pada kebetuhan user yang
berhubungan dengan satu departemen atau fungsi bisnis.
-
Data mart biasanya tidak mengandung data operasional
yang detail, tidak seperti data warehouse.
-
Karena data mart mempunyai data yang lebih sedikit
dibandingkan dengan data warehouse, data mart lebih
mudah untuk dimengerti dan dijalankan.
Beberapa alasan membuat data mart, yaitu (Connolly, 2002, p1069) :
-
M emberikan akses ke data yang paling sering dianalisis
oleh user.
14 -
M enyediakan data dalam bentuk yang sesuai dengan
kebutuhan sekelompok user dalam sebuah departemen
atau fungsi bisnis.
-
M eningkatkan
waktu
respon
end-user
karena
pengurangan jumlah data yang akan diakses.
-
M enyediakan data yang terstruktur sesuai seperti yang
ada pada ketentuan dari alat akses end user yang mungkin
membutuhkan struktur basis data internal sendiri.
-
Biaya implementasi data mart biasanya lebih sedikit dari
biaya yang diperlukan untuk membangun data warehouse.
2.1.10 Pengertian Data Mining
Data mining berhubungan dengan penemuan pola baru di dalam
set data, dengan menguji validitas pendekripsian data. Tujuan dari data
mining adalah untuk memprediksi dan menggambarkan data. Prediksi
adalah dengan menggunakan data yang sudah ada dalam basis data
untuk memprediksi nilai data di masa depan. Deskripsi berfokus pada
penemuan pola yang menggambarkan data. M enurut Claude Seidman
(Seidman, 2001, p3) data mining adalah proses pencarian pola hubungan
serta tren yang tersembunyi di dalam suatu basis data yang besar.
15 2.1.11 Pengertian Cube/OLAP (Online Analitical Processing)
OLAP merupakan suatu perangkat yang menggambarkan
teknologi menggunakan gambaran multidimensi sejumlah data untuk
menyediakan akses yang lebih cepat bagi strategi informasi dengan
tujuan mempercepat analisis (Connolly, 2002, p1101).
OLAP adalah teknologi yang memperbolehkan user untuk
menganalisis basis data yang besar untuk mendapatkan informasi yang
lebih spesifik. Basis data untuk sistem OLAP disusun teratur agar lebih
efisien dalam penyimpanan data statis.
Karena penyimpanan OLAP
adalah multidimensi, biasanya disebut cube, yang berlawanan dengan
tabel.
Yang membuat OLAP unik adalah kemampuannya untuk
menyimpan kumpulan data secara hierarki.
Dimensi-dimensi ini
memberikan informasi secara kontekstual dalam bentuk bilangan atau
perhitungan yang diteliti.
OLAP
adalah
sebuah
perangkat
yang digunakan
untuk
menyimpan data multidimensional dan perangkat yang digunakan untuk
menampilkan sebuah tampilan multidimensional kepada user (Peterson,
Pinkelman, 2000, p1).
16 Sistem OLAP telah banyak diaplikasikan dalam dunia bisnis,
diantaranya (Peterson, Pinkelman, 2000, p25-31):
-
OLAP dapat melihat tren penjualan, melakukan promosi,
dan juga untuk menganalisis demografis pelanggan.
-
OLAP
dapat
membantu
mengelola inventory
dan
pergudangan, lokasi mana yang paling strategis dan
pengelolaan kapasitas semaksimal mungkin.
-
OLAP dapat digunakan untuk pengelolaan proses
manufaktur, kepuasan pelanggan dan pada akhirnya dapat
membantu menganalisis dan meningkatkan keuntungan
bisnis.
OLAP memiliki beberapa karakteristik (Peterson, Pinkelman,
2000, p35-54):
-
OLAP memasukkan data dari sistem OLTP dan sumbersumber lain termasuk dari luar organisasi.
-
OLAP menyimpan data yang dalam format yang
mengoptimalkan
analisis
query,
yang
merupakan
ringkasan informasi dari banyak sumber.
17 -
Sistem OLAP bekerja dengan sangat baik di dalam
lingkungan yang memiliki banyak indeks. Data –data
tidak
diupdate setelah
dianalisis,
jadi
tidak
ada
pemborosan waktu di dalam proses update indeks yang
besar.
-
Sistem OLAP mampu mendukung permintaan analisis
secara tepat, tanpa mendapatkan kesulitan mengenai
kombinasi perspektif apa yang dipilih oleh analisis.
2.1.12 Pengertian Business Intelligence
Business Intelligence adalah segala aktivitas, tool, atau proses
yang digunakan untuk mendapatkan informasi yang terbaik untuk
mendukung proses pembuatan keputusan (Scheps 2008, p11).
Definisi BI lainnya adalah yang sebagaimana diungkapkan oleh
DJ Powers:
“Business Intelligence menjelaskan tentang suatu konsep dan
metode bagiamana untuk meningkatkan kualitas pengambilan keputusan
bisnis berdasarkan sistem yang berbasiskan data.
BI seringkali
dipersamakan sebagaimana briefing books, report and query tools, dan
18 sistem informasi eksekutif.
BI merupakan sistem pendukung
pengambilan keputusan yang berbasiskan data-data”.
Berdasarkan
definisi
diatas
dapat
disimpulkan
Business
Intelligence (BI) merupakan sistem dan aplikasi yang berfungsi untuk
mengubah data-data dalam suatu perusahaan atau organisasi (data
operasional, data transaksional, atau data lainnya) ke dalam bentuk
pengetahuan. Aplikasi ini melakukan analisis data-data di masa lampau,
menganalisisnya dan kemudian menggunakan pengetahuan tersebut
untuk mendukung keputusan dan perencanaan organisasi.
2.1.13 Pengertian Entity Type
Entity Type adalah sebuah group dari beberapa objek dengan sifat
yang sama, yang teridentifikasi berdiri sendiri (Connolly, 2002, p.331).
2.1.14 Pengertian Attributes
M enurut Connolly (2002, p.338), Attributes adalah properti dari
entity type.
2.1.14.1 Klasifikasi Attribute
Attributes terdiri dari (Connolly, 2002, p.339):
19 1. Simple attributes
Simple attributes adalah sebuah atribut yang terdiri dari
komponen tunggal yang berdiri sendiri. Simple attributes tidak
dapat dibagi lagi menjadi komponen yang lebih kecil. Contohnya
posisi (position) dan gaji (salary) pada entity staff. Simple
attributes sering juga disebut atomic attributes.
2. Composite attributes
Composite attributes adalah atribut yang terdiri dari
beberapa komponen, masing-masing komponen adalah atribut
yang berdiri sendiri.
Beberapa atribut dapat dibagi menjadi
komponen yang lebih kecil.
Contohnya atribut address pada
entity branch yang dapat dibagi menjadi street dan postcode.
3. Single valued attribute
Single valued attribute adalah atribut yang memiliki satu
nilai untuk setiap entity. Contohnya adalah untuk setiap entity
branch hanya memiliki satu atribut branch number.
4. Multi valued attribute
Multi valued attribute adalah atribut yang memiliki nilai
lebih dari satu untuk setiap entity. Contohnya adalah pada entity
20 branch bisa memiliki lebih dari satu atribut telp_no. (Branch
number B003 bisa memiliki nomor telepon).
2.1.15 Klasifikasi Keys
Keys terdiri dari (Connolly, 2002, p.340-341):
1. Primary Key
Primary key adalah candidate key yang telah dipilih untuk
mengidentifikasi secara unik setiap entity. Entity bisa memiliki lebih
dari satu candidate key. Jika sebuah entity memiliki lebih dari satu
candidate key, maka salah satunya akan dipilih menjadi primary key.
Pemilihan entity pada primary key didasarkan pada panjang atribut,
jumlah minimal atribut yang diperlukan dan keunikannya.
2. Foreign Key
Foreign Key adalah sebuah atribut atau kumpulan dari atribut
yang memiliki hubungan dengan candidate key pada suatu relasi.
21 2.1.16 Dimesionality Modeling
Dimensionality Modeling adalah sebuah teknik desain logika
yang bertujuan untuk menampilkan data dalam bentuk standar, intuitif
yang memungkinkan akses cepat (Connolly, 2005, p.1183).
Dimensionality Modeling menggunakan konsep model EntityRelationship (ER) dengan beberapa batasan penting.
Setiap model
dimensi terdiri dari satu tabel dengan satu composite primary key yang
disebut fact tabel dan memiliki kumpulan dari tabel yang lebih
sederhana yang disebut tabel dimensi (Dimension Tabel). Tiap tabel
dimensi
memiliki
primary
key
(non
composite)
yang
akan
berkorespondensi tepat satu dengan komponen pada composite key
dalam fact tabel.
2.1.16.1 S tar S chema
Karakteristik struktur yang menyerupai bintang disebut
star schema / star join.
Star schema adalah sebuah struktur
logika yang mempunyai fact tabel terdiri dari factual data di
tengah, dikelilingi oleh tabel dimensi yang terdiri dari data
reference (yang bisa di-denormalized). Star schema mengambil
karakteristik dari factual data yang di-generate oleh event yang
terjadi di masa lampau.
22 Gambar 2.1 – Contoh Star Schema
http://articles.techrepublic.com.com/i/tr/cms/contentPics/r00520010416p
ra01_01.gif
2.1.17 S tate Diagram
Terdapat dua buah diagram state, yaitu:
a. Diagram statechart memodelkan behavior objek khusus yang
dinamis.
Diagram ini mengilustrasikan siklus objek, berbagai
23 keadaan yang dapat diasumsikan oleh objek dan event-event
yang menyebabkan objek beralih dari satu state ke state lain.
b. Diagram aktivitas menggambarkan rangkaian aliran aktivitas
baik proses bisnis atau use case. Diagram ini juga digunakan
untuk memodelkan action yang akan dilakukan saat sebuah
operasi dieksekusi, dan memodelkan hasil dari action tersebut.
2.2
Teori Khusus
2.2.1
Pendekatan Data Warehouse
M enurut Connolly dan Begg (2005, p1151), ”Data warehouse is
a subject-oriented, integrated, time-variant, and non-volatile collection
of data in support of management’s decision-making process”, Yang
dapat diartikan “Data warehouse adalah kumpulan data yang
berorientasi subjek,
terintegrasi,
berdasarkan
waktu,
dan
tidak
mengalami perubahan dalam mendukung proses pengambilan keputusan
manajemen”.
M enurut Inmon (2002, p389), “A Data warehouse is a collection
of integrated database designed to support DSS Function, where each
unit of data is relevant to some moment in time”, yang dapat diartikan
sebagai “Data warehouse adalah koleksi database yang terintegrasi yang
24 dirancang untuk mendukung fungsi sistem pengambilan keputusan,
dimana setiap unit data relevan pada beberapa waktu”.
2.2.1.1 Karakteristik (Multidimensional)
M enurut Turban, Rainer, dan Potter(2006), Basis Data
M ultidimesional yaitu basis data yang diatur dan dapat dianalisis
dari berbagai pandangan atau perspektif, yang disebut dimensi.
Perbandingan
Basis
Data
Multidimensional
dengan
Relasional
Relational database membuatnya menjadi mudah untuk
bekerja dengan record individual, mengingat multi-dimensional
Database didesain untuk menganalisis grup besar dari record.
Relational Database biasanya diakses menggunakan Structured
Ouery Language (SQL) query.
M ulti-dimensional Database
dapat menjawab pertanyaan user seperti “Berapa banyak jumlah
tempat duduk yang terjual dalam pesawat dari Surabaya ke
Jakarta?” dan “Berapa banyak penumpang yang melakukan
penerbangan malam hari dibandingan kan pada pagi atau siang
hari?”
25 2.2.1.2 ETL (Extract, Transform, Load)
M erupakan proses pengambilan (Extract), Pengubahan
(Transform), Pengisian (Load) dari DBM S ke data warehouse
atau yang dapat diartikan sebuah alat ETL seperti pembangunan
gudang dapat mengambil data dari sumbernya, mengubahnya
menggunakan
beberapa
variasi
teknik
(seperti
pengikat/penghubung, pengumpul, dan fungsi pengubah format
data), dan mengisinya ke dalam wadah data seperti tabel relasi.
2.2.1.3 OLAP/Cube sebagai hasil dari Data Warehouse
OLAP merupakan suatu perangkat yang menggambarkan
teknologi menggunakan gambaran multidimensi sejumlah data
untuk menyediakan akses lebih cepat bagi strategi informasi
dengan tujuan mempercepat analisis (Connolly, 2002, p1101).
Jadi
teknisnya,
cube
OLAP
memudahkan
untuk
menganalisis data melintasi multidimensi dengan menyediakan
tampilan multidimensional dari aggregasi/kumpulan grup data.
Dengan laporan OLAP, kategori besar seperti SLF per route, per
bulan, per hari bahkan per minggu berdasarkan jenis – jenis tipe
pesawat dapat dianalisis dengan sangat efisien, efektif dan
responsif.
26 Beberapa tipe OLAP (Turban, 2007, p.262) yaitu:
-
M ultidimensional OLAP (M OLAP)
MOLAP
meringkas
multidimensional.
transaksi
menjadi
gambaran
Data diorganisasi ke dalam cube yang
dapat dirotasi oleh user.
Dengan M OLAP, query dapat
dilakukan dengan cepat karena konsolidasi data telah
dilakukan.
-
ROLAP
ROLAP adalah ketika basis data OLAP diimplementasikan
pada basis data relasional yang sudah ada. ROLAP
mengambil data dari basis data relasional. ROLAP lebih
sering digunakan pada data dengan atribut yang banyak, yang
tidak dapat dipindahkan ke struktur cube.
-
Database OLAP dan Web OLAP
Database OLAP mengacu pada sistem manajemen basis data
relasional yang didesain untuk menyediakan struktur OLAP
dan menjalankan perhitungan OLAP. Web OLAP mengacu
pada data OLAP yang dapat diakses dari web browser.
27 -
Desktop OLAP
Desktop OLAP menyangkut tools OLAP yang biayanya
rendah dan sederhana yang dapat melakukan analisis
multidimensional lokal dan presentasi data ke mesin klien
dari basis data relasional dan multidimensional.
-
Karakteristik OLAP (Turban, 2007, p.204) yaitu:
Categorical analysis
Analisis kategoris adalah analisis statis yang didasarkan pada
data historical. Analisis ini merupakan analisis utama yang
didukung oleh basis data OLTP.
-
Exegetical analysis
Analisis aksegetik juga didasarkan pada data historical dan
menambah kemampuan dalam analisis drill-down. Analisis
drill-down adalah kemampuan untuk memperluas query
menjadi data untuk menentukan data detail yang digunakan
untuk menentukan nilai turunan.
28 -
Contemplative analysis
Analisis kontemplatif mengijinkan user untuk mengubah
suatu
nilai untuk
menentukan
pengaruhnya terhadap
informasi.
-
Formulaic analysis
Analisis formulasi mengijinkan perubahan pada banyak
variable.
2.2.2
Pendekatan Data Mart
Data Mart adalah suatu subset dari data warehouse yang
mendukung persyaratan
atau
ketentuan
sebuah
organisasi atau
perusahaan.
Ada beberapa karakteristik yang membedakan Data Mart dengan
Data Warehouse, yaitu (Connolly, 2002, p.1067) :
-
Data Mart hanya berfokus pada kebutuhan user yang berhubungan
dengan satu departemen atau fungsi bisnis.
-
Data Mart biasanya tidak mengandung data operasional yang detail,
tidak seperti data warehouse.
29 -
Karena Data Mart mempunyai data yang lebih sedikit dibandingkan
dengan Data Warehouse, data mart lebih mudah untuk dimengerti
dan dijalankan.
2.2.3
Pendekatan Data Mining
Data Mining adalah proses menganalisis data yang berukuran
besar dengan menggunakan pola-pola pengenalan maupun teknik
pencarian pengetahuan (knowledge discovery) untuk mengidentifikasi
tren-tren yang terjadi dan bermanfaat serta pola keterkaitan yang
terdapat di dalam basis data berukuran besar. Data mining adalah salah
satu alternatif terbaik untuk mengetahui trend dan pola dari basis data
yang besar. Data mining mampu menjelajahi informasi di dalam data
warehouse yang tidak terungkap secara efektif.
2.2.3.1 Karakteristik Data Mining
Data mining sering diidentifikasi dengan beberapa nama
lain seperti Knowledge Discovery in Database, Knowledge
Extraction, Pattern analysis, Data Archeology, Data Dredging,
Information Harvesting dan sebagainya.
30 Knowledge Discovery
Knowledge Discovery atau
penemuan
pengetahuan
mempunyai tujuan utama yaitu mengidentifikasi pola valid yang
baru, yang mungkin bermanfaat dan dapat dipahami dalam data.
Knowledge discovery berguna karena didukung oleh tiga
teknologi yang saat ini telah matang, yaitu pengumpulan data
yang besar, komputer multiprosesor yang berdaya tinggi dan
algoritma penggalian data lainnya.
Ad-hoc Query
Ad-hoc Query (Permintaan ad-hoc) memungkinkan
pengguna untuk meminta secara real time informasi dari
komputer yang tidak tersedia dalam laporan periodik. Jawaban
ini
sangat
dibutuhkan
untuk
mempercepat
pengambilan
keputusan.
31 2.2.4
Tahapan Dalam Mengembangkan Business Intelligence
Berikut ini tahapan dalam mengembangkan BI berdasarkan Studi
tentang Implementasi Business Intelligence pada Departemen Keuangan
Republik Indonesia Badan Pengawas Pasar M odal dan Lembaga
Keuangan tahun 2007, yaitu:
•
Tahap Perencanaan Proyek (Project Planning)
Pada tahap ini harus dapat dijelaskan apa yang menjadi tujuan
utama dari proyek BI, harapan yang diinginkan, dukungan formal
dari Pimpinan organisasi yang bersangkutan, serta capaian
(milestone) yang akan dituju.
•
Tahap Analisis Kebutuhan (Requirement Analysis)
Pada
tahap
ini
harus
sudah
teridentifikasi
kebutuhan
pengembangan BI secara detail. Hal ini dapat dilakukan dengan
menyusun dan mengumpulkan information package untuk semua
subjek informasi yang akan ada dalam data warehouse.
•
Tahap Desain dan Konstruksi (Design and Construction)
Pada tahap ini menyusun dan insfrastruktur yang diinginkan dari
desain BI, yang mencakup 3 (tiga) bagian utama, yaitu :
-
Data Acquisition
32 -
Data Storage
-
Information Delivery dengan data warehouse. Jenisnya
dapat berupa OLAP, data mining, maupun report/query.
•
2.2.5
Arsitektur dan Konstruksi BI
-
Tahap Implementasi (Deployment)
-
Tahap Pemeliharaan (Maintenance)
Jenis-jenis Business Intelligence
Berikut adalah jenis-jenis dari BI (Turban, 2007, p257) yaitu:
-
Enterprise reporting
Produk laporan enterprise digunakan untuk menghasilkan
laporan statis yang didistribusikan secara luas dan akan
digunakan oleh banyak orang.
M erupakan laporan dengan
format yang tepat untuk laporan operasional dan dashboard.
-
Cube analysis
Cube digunakan untuk menyediakan kemampuan analitis
OLAP multidimensional untuk manajer bisnis dalam lingkungan
yang terbatas.
33 -
Ad hoc querying and analysis
Tools relasional OLAP digunakan untuk memberikan
akses user untuk melakukan query pada basis data hingga
informasi transaksional.
-
Statistical analysis and data mining
Tools statistik, matematis dan data mining digunakan
untuk melakukan analisis prediksi atau untuk menemukan
korelasi sebab akibat.
-
Report delivery and alerting
M esin distribusi laporan digunakan secara proaktif untuk
mengirimkan laporan lengkap atau peringatan kepada populasi
user yang besar. Distribusi ini didasarkan pada jadwal dan event
yang disimpan di dalam basis data.
2.2.6
Keuntungan dan Tujuan Business Intelligence
Berikut beberapa keuntungan BI berdasarkan pada survey (Turban,
2007) yaitu:
-
Laporan yang lebih cepat dan akurat (81 %)
34 -
M emperbaiki pembuatan keputusan (78 %)
-
M emperbaiki servis pelanggan (56 %)
-
M eningkatkan pendapatan (49 %)
Sedangkan tujuan dari BI yaitu:
1. Struktur yang standard dan penyajian seluruh informasi bisnis
Pembuat keputusan membutuhkan informasi yang
dapat dipercaya dari berbagai divisi. Informasi yang
dibutuhkan harus up-to-date dan menggambarkan secara
lengkap setiap area bisnis dan bisnis secara keseluruhan.
Untuk
menghasilkan
laporan
ini
dibutuhkan
proses
penyimpanan data yang tinggi dari data source. Data tersebut
didefinisikan
secara unik
sepanjang organisasi untuk
menghindari munculnya eror.
2. Akses informasi bisnis yang mudah
Informasi harus digabungkan pada titik tertentu agar
data dapat dengan mudah diakses dan diolah.
35 3. M enyediakan alat untuk menyajikan laporan yang telah
diolah untuk analisis pada seluruh area
Dalam presentasi, analisis yang efisien dan visualisasi
informasi yang berarti sangatlah penting. Sistem harus dapat
digunakan dengan kebutuhan informasi yang bervariasi.
4. Implementasi yang cepat dan murah
Dengan
mengimplementasikan
data
warehouse,
faktor biaya yang berpengaruh adalah integrasi data ke
system OLTP dan penarikan data secara langsung dengan
data yang beragam.
5. Lingkungan performa yang tinggi
Analisis data tidak dapat dikeluarkan dengan data
warehouse tanpa mengintegrasikan
beragam.
Integrasi
tersebut
sumber data yang
dilakukan
dengan
proses
pembacaan yang membutuhkan banyak waktu.
Tools
penjadwalan sangatlah penting untuk mengijinkan data
ditarik pada waktu tertentu.
36 6. M enghidupkan sistem OLTP
Sistem OLTP tidak dapat melakukan banyak proses
karena sistem harus menyimpan data dan menganalisis data
pada saat yang bersamaan.
Server Data warehouse yang
terpisah mengijinkan user untuk menganalisis data pada
server yang berbeda.
2.2.7
Perbandingan OLTP dan OLAP dari BW310 Data Warehousing
S AP NetWeaver tahun 2006
System OLTP
Target
Efisiensi untuk otomatisasi
DWH / System OLAP
M en-generate knowledge
proses bisnis
Prioritas
M udah diakses, volume
M udah digunakan, akses
data yang besar
data fleksibel
View data
Detail
Lengkap
Umur data
Sekarang
Historical
Operasi database
Add, modify, delete,
Read
update, read
Struktur data tipikal
Relasional
Struktur multidimensional
Integrasi data
M inimal
Banyak
37 Data set
6-18 bulan
2-7 tahun
Archive
Ada
Ada
Tabel 2.1 Perbandingan OLTP dan OLAP dari BW310 Data Warehousing SAP
NetWeaver tahun 2006
2.2.8
S AP
SAP singkatan dari Systeme, Anwendungen und Produkte in der
Datenverarbeitung (Systems, Applications and Products in Data Processing)
merupakan perusahaan pengembangan software multinasional dan konsultasi
korporasi yang berpusat di Walldorf, Jerman.
Software yang digunakan dalam pengembangan aplikasi adalah SAP
BW (Business Warehouse) 310.
2.2.8.1 S AP BW (Business Warehouse)
Objek dari SAP BW Meta Data M odel menurut Kevin
M cDonald et al.(Wiley, 2002, hal 54):
1. InfoObjects
Info Objects adalah blok pemodelan yang utama untuk seluruh
objek meta data yang berhubungan dengan data warehouse di dalam
SAP BW, seperti sumber data, struktur analisis, dan query. Sebuah
38 InfoObjects adalah representasi SAP BW dari objek bisnis pada level
terendah yang digunakan untuk menjelaskan proses bisnis dan ketentuan
informasi.
Terdapat empat tipe InfoObjects yang tersedia pada SAP BW:
key figures, karakteristik, karakteristik unit, dan karakteristik waktu.
Key figures digunakan untuk menjelaskan informasi numerik
apapun dari level proses bisnis. Key figures dibagi menjadi enam tipe:
jumlah, kuantiti, angka, integer, tanggal, dan waktu.
Karakteristik digunakan untuk mendeskripsikan hubungan objek
pada bisnis proses mulai dari objek bisnis utama seperti pelanggan,
produk, dan catatan (accounts) hingga atribut yang sederhana seperti
warna, kode pos, dan status.
Deskripsi dari karakteristik termasuk
deskripsi bidang dan deskripsi dari seluruh tabel master data yang
menyimpan atribut, text, dan hirarki yang berhubungan dengan bidang
tersebut.
2. InfoObject Catalogs
Katalog InfoObject adalah sebuah direktori dari InfoObject yang
digunakan pada konteks bisnis yang sama.
39 3. InfoCubes
InfoCubes adalah tempat penyimpanan data multidimensional
yang digunakan sebagai dasar bagi analisis dan proses pembuatan
laporan pada SAP BW.
InfoCubes terdiri dari key figures dan
karakteristik, karakteristik diatur dalam dimensi.
4. ODS Objects
ODS Object adalah tempat penyimpanan data yang digunakan
untuk kepentingan pembuatan laporan dan pembersihan data / kepastian
kualitas. ODS Objects terdiri dari key figures dan karakteristik yang
diatur menjadi kolom kunci dan kolom data, dimana key figures tidak
dapat digunakan sebagai kolom kunci.
5. Data Target
Data target adalah tempat penyimpanan data fisikal yang tersedia
pada sistem SAP BW.
Data target adalah suatu istilah umum yang
memasukkan dasar InfoCubes, ODS Objects, dan tabel master data.
6. InfoProviders
InfoProvider adalah objek data fisikal atau virtual yang tersedia
pada sistem SAP BW dan yang menyediakan informasi. InfoProvider
adalah suatu istilah umum yang memasukkan seluruh target data
40 (InfoCubes, ODS Objects, dan tabel master data), serta InfoSets, remote
InfoCubes, dan MultiProviders.
7. MultiProviders
MultiProvider adalah gabungan dari sekurang-kurangnya dua
InfoProvider fisik atau virtual yang tersedia pada sistem SAP BW.
8. InfoAreas
InfoArea adalah sebuah direktori dari InfoProvider dan katalog
InfoObject yang digunakan pada konteks bisnis yang sama.
Setiap
InfoProvider dan katalog InfoObject termasuk pada satu InfoArea.
InfoArea sama seperti katalog InfoObject membantu mengatur proyek
agar dapat berjalan pada implementasi SAP BW yang besar.
9. Source Systems
Source system adalah sebuah definisi dari sistem fisikal dan
logikal yang menyediakan data kepada sistem SAP BW.
10. InfoSources
InfoSource menjelaskan tentang sumber informasi bisnis yang
tersedia pada satu atau lebih sumber sistem.
Bagian terpenting dari
41 definisi InfoSource adalah struktur komunikasi yang disusun dari
kumpulan InfoObject.
11. DataSources
DataSource menjelaskan sumber data yang spesifik pada sebuah
sistem sumber spesifik dari sudut pandang teknis. Deskripsi DataSource
termasuk informasi mengenai proses ekstraksi dan proses transfer data,
dan menyediakan pilihan penyimpanan data ke SAP BW pada tabel PSA
(Persistent Staging Area).
12. InfoPackages
Seluruh fungsi-fungsi penjadwalan dan pencatatan untuk proses
pengisian data pada SAP BW didasarkan pada InfoPackage.
13. Queries
Sebuah query adalah sebuah spesifikasi dari gambaran dinamis
tertentu dari sebuah InfoProvider yang digunakan untuk navigasi
multidimensional.
42 2.2.8.2 Teknologi penarikan data ke S AP
Berikut beberapa cara penarikan data ke SAP yaitu:
1. DB Connect
M engijinkan
database relasional diakses
secara
langsung. DB multi-connect digunakan untuk membuat
koneksi ke DBM S pada database eksternal. Dengan mengimport metadata dan data original, struktur yang diperlukan
akan di-generate pada BI, dan data dapat ditarik dengan
mudah dan efisien.
2. UD Connect
Dengan menggunakan UD Connect, DBA dapat
mengakses hampir seluruh data source relasional dan
multidimensional.
UD
Connect
mengkonversi
dan
memindahkan data multidimensional sebagai flat data.
2.2.9
Area Query Designer pada SAP Business Information Warehouse
Area Query Designer :
Antarmuka Query Designer terbagi dalam 3 bagian utama, yaitu :
1. Element yang terdapat di InfoProvider
2. Definisi query
43 3. Toolbar
Gambar 2.2 Area Query Designer
2.2.10 Konsep Data Modeling pada S AP BW
Konsep Data M odelling menurut SAP Business Information Warehouse
Functions in Detail: SAP BW3.5 version 4.0.
Gambar 2.3 Data M odelling
44 2.2.10.1 DataS ource
Sumber data yang di-ekstrak pada SAP Business Information
Warehouse terhubung pada SAP BW sebagai source system. Element
kunci pada model informasi SAP BW pada source system disebut
DataSource. DataSource menjelaskan data yang diperoleh dari source
system ke unit bisnis. DataSource terdiri dari beberapa field yang saling
terhubung dan tersusun dalam struktur ekstrak dan digunakan untuk
mengirim data ke BW.
M etadata BW yang berhubungan dengan
DataSource dikirim ke BW bergantung pada tipe dari source system.
Jika source systemnya adalah system SAP, metadata akan di-copy dari
source system. Jika sumber datanya adalah flat file, metadata terdefinisi
secara otomatis di BW. Berdasarkan permintaan dari SAP BW, data
dikirim dari source system ke SAP BW pada struktur pengiriman
(transfer structure). Struktur pengiriman adalah field yang dipilih dari
DataSource yang mengandung informasi yang berhubungan dengan
pengambilan keputusan (desicion making) untuk proses bisnis.
2.2.10.2 Persistent Staging Area Tabel
Persistent Staging Area tabel (tabel PSA) adalah tempat untuk
memasukkan data ke SAP BW dari source system.
Lalu data akan
disimpan dalam tabel database relational yang transparan pada SAP BW.
Tabel PSA dibuat setiap kali membuat source system pada DataSource.
45 Data yang diminta kemudian akan disimpan di tabel P SA dengan format
yang sama dengan struktur transfer DataSource. Tabel PSA juga terdiri
dari field key untuk data request ID, data package number, dan record
number. Beberapa saat, konversi mungkin diperlukan untuk memastikan
bahwa data pada SAP BW adalah konsisten. Contohnya, jika format
data source system berubah menjadi YYYYM MDD (19991231) maka
format ini yang akan digunakan pada SAP BW.
2.2.10.3 InfoS ource
InfoSource adalah beberapa InfoObject yang saling berhubungan
secara logic dan disederhanakan menjadi 1 unit.
Ini tersedia pada
struktur komunikasi (communication structure). InfoSource terdiri dari
transaksi data atau master data (atribut, text dan hierarki).
2.2.10.4 Mapping and Transformation
Pada BW, DataSource akan di-map ke InfoSource. Jika secara
logika field yang berhubungan terdiri dari source system yang beragam,
mereka dapat dimasukkan dalam 1 group yang sama pada satu
InfoSource. Beberapa DataSource akan di-map ke InfoSource.
Pada pemeliharaan
transfer
rules
untuk
kombinasi dari
DataSource dan InfoSource, field yang single pada DataSource akan dimap ke InfoObject yang terhubung di InfoSource. Informasi bagaimana
46 data dari DataSource yang akan ditransfer ke InfoSource juga terhubung
disini. Data yang di upload merupakan perubahan dari transfer rules.
Terdapat dua tipe dari InfoSources:
•
InfoSources dengan update fleksibel: tipe ini bisa update data ke
dalam target-target data (kecuali hirarki). Update rules dibuat
untuk InfoSource ini memungkinkan master data untuk di update
ke dalam master data object ODS, dimana data bisa dibersihkan
dan digabungkan.
•
InfoSources dengan direct updating: tipe ini bisa merubah master
data (karakteristik dengan atribut, text atau hirarki) untuk sebuah
InfoObject secara langsung (tanpa update rules) ke tabel master
data.
Sebuah target data bisa didefinisikan dengan beberapa
InfoSources yang dapat didefinisikan oleh beberapa sistem
source.
2.2.10.5 Update Rules
Update rules menentukan bagaimana data (karakteristik, time
karakteristik, key figure) diupdate dari InfoSources ke dalam data
targets. Oleh karena itu anda terhubung dengan data target. Sebuah
update rule harus ditentukan pada setiap key figurenya dan sesuai
karakteristiknya dari InfoObject. Untuk objek ODS, ini harus ditentukan
47 untuk data dan key fieldnya dan buat InfoObject harus ditentukan untuk
atribut dan key fieldnya.
Update type dapat mengontrol apakah key figure atau data field
telah diupdate dalam InfoProvider. Berikut beberapa tipe yang ada:
1. No update
2. Addition, minimum or maximum
3. Overwriting (with ODS objects and InfoObjects only)
M etode kalkulasi digunakan untuk mengontrol apakah dan
bagaimana sebuah karakteristik / key figure atau data field atau key field
seharusnya diupdate kedalam data target. Ada beberapa pilihan:
•
Source InfoObject: field ini diisi secara langsung dari source
InfoObject yang dipilih dari struktur komunikasi.
•
Constant: field ini tidak diisi oleh struktur komunikasi tetapi
secara langsung dengan ditentukan nilainya.
•
Formula: key figure atau data field atau atribut yang diupdate
dengan
sebuah
nilai
ditentukan
menggunakan
formula.
Transformasi library dan formula builder digunakan untuk
membuat formula secara mudah tanpa menggunakan ABAP
coding. Lebih dari 70 standar formula tersedia dalam berbagai
kategori misalnya fungsi untuk karakter string, fungsi tanggal,
fungsi dasar, matematika dan seterusnya.
48 •
M aster data attribute of: data field atau atribut diupdate dengan
membaca tabel master data dari sebuah karakteristik yang berisi
sebuah key dan nilai dalam komunikasi struktur yang berisi data
yang sesuai field atau atribut sebagai atribut.
•
Routine: field ini diisi dengan update rutin yang ditulis. Routine
dapat digunakan untuk membuat single return value atau return
tabel atau routine dengan kalkulasi unit.
•
Initial value: Field ini tidak diisi dan tetap kosong.
kalkulasi ini juga tersedia dengan transfer rules.
M etode
Ini juga
memungkinkan untuk translate currencies untuk key figures saat
diupdate kedalam InfoCubes.
2.2.10.6 Data Target
Sebuah data target adalah obyek ke dalam data yang dimuat.
Data target adalah benda-benda fisik yang relevan dengan data selama
pemodelan dan ketika loading data. Data target adalah:
•
Dasar InfoCubes
•
Transaksional InfoCubes
•
ODS Objects
•
InfoObjects (karakteristik dengan atribut, teks atau hirarki)
49 2.2.11 Pengertian Seat Load Factor
Seat Load Factor (SLF) adalah ukuran dari jumlah total
pemanfaatan kapasitas kendaraan transportasi komersial.
Hal ini
berguna untuk menghitung rata-rata hunian pada berbagai rute
penerbangan atau kereta api.
Dengan menggunakan informasi ini,
perusahaan penerbangan atau kereta api dapat menentukan profitibilitas
dan potensi penghasilan dari berbagai rute.
Dalam hal ini, SLF didefinisikan sebagai jumlah penumpangkilometer perjalanan sebagai persentase dari total kursi-kilometer yang
tersedia.
Jadi, jika sebuah maskapai penerbangan dengan 100 kursi
terbang dengan jarak 1000 kilometer, total kursi-kilometer tersedia
100.000.
Jika 60 penumpang melakukan perjalanan seluruh jarak,
penumpang-kilometer perjalanan menjadi 60.000 dengan demikian
memberikan SLF 60 persen.
2.2.12 Bisnis Penerbangan
2.2.12.1 Tipe Airlines
Terdapat 2 tipe Airlines:
1.
Full Services
Yang dikatakan bahwa sebuah airlines bertipe Full
Services adalah sebagai berikut:
50 •
Hub & Spoke
Pengumpulan jalur-jalur yang memiliki destination yang
sama.
•
Catering, surat kabar, majalah, etc
Terdapat banyak fasilitas yang diberikan dari airlines
tersebut, contohnya surat kabar, majalah dan catering
makanan.
•
Connecting Flight
Airlines tersebut memastikan bahwa penumpang akan sampai
ke tujuannya tanpa harus mengurus jalur
dan tiket
penerbangannya sendiri.
Contoh airlines dengan Full Services adalah Garuda.
2.
Low-Cost
Yang dikatakan bahwa sebuah airlines bertipe Low Cost
adalah layanan Point to point. Yang dimaksudkan adalah airlines
tersebut hanya akan menyediakan layanan penerbangan dari 1
point (origin) ke point lain (destination).
Jika untuk tiba ke
destination customer memerlukan penggantian pesawat, maka
hal ini tidak menjadi tanggung jawab dari airlines tersebut
sehingga customer harus menyiapkan semuanya sendiri.
51 Kerugiannya adalah
jika ternyata ada delay atau
keterlambatan dari penerbangan sebelumnya, akan menyebabkan
jadwal penerbangan berikutnya menjadi berantakan.
Contoh airlines dengan Low-Cost adalah Lion, Jet Blue.
2.2.12.2 Airlines Network
Terdapat 2 jenis Airlines Network:
1.
Hub and Spoke
Yang dimaksud adalah dengan mengumpulkan semua
jalur yang menuju ke kota destination yang sama di kota transit
dan diterbangkan ke kota destination bersamaan.
Contohnya: Jika ada 3 rute penerbangan dari M edan ke
Singapura, Aceh ke Singapura dan Bali ke Singapura. Sebagai
contoh, Jakarta adalah kota transit.
Semua penumpang dari
M edan, Aceh dan Bali akan diterbangkan menuju Jakarta dahulu,
barulah akan diberangkatkan ke Singapura.
52 Gambar 2.4 Airline Network: Hub dan Spoke
2.
Point to point
Yang dimaksud adalah dengan langsung melakukan
penerbangan dari kota origin ke kota destination tanpa harus
dikumpulkan dahulu.
Gambar 2.5 Airline Network: Point to Point
53 2.2.12.3 Airlines Organization Model
Terdapat 3 tipe Airlines Organization M odel :
1.
Traditional Airline M odel
Pada model ini, semua aktifitas yang berjalan di dalam
airlines akan menggunakan sumber daya internal.
Gambar 2.6 Traditional M odel Airline
2.
Virtual Airline M odel
Aktifitas utama tetap akan dijalankan oleh sumber daya
internal, namun aktifitas di luarnya akan di-outsource.
54 Gambar 2.7 Virtual Airline M odel
3.
Aviation Airline M odel
Pada pemodelan ini, akan digabungkan kedua pemodelan
yang ada.
Aktifitas utama akan tetap dijalankan oleh sumber
daya internal, dan bagian lain akan di-outsource namun outsource
disini tidak secara keseluruhan diserahkan kepada pihak luar,
tetapi pihak luar tersebut akan diajak untuk bekerjasama
sehingga tetap akan dapat dikontrol oleh sumber daya internal.
55 Gambar 2.8 Aviation Airline M odel
2.2.13 Dashboard
Setiap executive di sebuah perusahaan setiap harinya berhadapan
dengan banyak karyawan dan berbagai macam data.
M ereka pun
diharuskan untuk membuat keputusan yang cepat berdasarkan informasiinformasi tersebut.
Ketika transaksi semakin banyak terjadi maka
informasi yang dihasilkan pun semakin detail sehingga semakin sulit
pula dalam pengambilan keputusan strategis dalam waktu yang cepat.
Seorang business leader perlu mengetahui bagaimana performa jalannya
bisnis secara overall walaupun area perusahaan sangat luas. Dashboard
dan scorecard yang berisi charts (kurva), grafik, diagram, dan lain-lain
yang menggambarkan trend dan perbedaan berdasarkan pada kumpulan
56 data yang besar merupakan jawaban atas kebutuhan para executive
perusahaan (Turley, Bryant, Counihan, DuVarney, 2006, p290).
Dashboard juga menyediakan gambaran visual yang lengkap
mengenai ukuran, tren, dan eksepsi performa korporasi.
mengintegrasi informasi dari berbagai area bisnis.
memperlihatkan
grafik
yang
menggambarkan
Dashboard
Dashboard juga
performa
aktual
dibandingkan dengan satuan yang diinginkan (Turban, 2007).
2.2.14 Pendekatan Business Intelligence
M enurut Almeida, Ishikawa, Reinschmidt, Roeber (1999)
Business Intelligence berarti menggunakan data asset anda untuk
membuat keputusan yang lebih baik, yang menyangkut masalah akses
analisis dan menemukan kesempatan baru.
Business Intelligence adalah kategori luas dari aplikasi dan
teknik untuk mengumpulkan, menyimpan, dan menganalisis, dan
menyediakan akses data untuk membantu pengguna dalam membuat
keputusan bisnis strategis yang lebih baik (Oguz, 2003).
57 2.2.14.1 Karakteristik Business Intelligence
Program dari Business Intelligence menurut buku
M icrosoft OLAP (Loria, 2005) terbagi tiga yaitu:
a. Integrate (mempersatukan)
•
Tambahan data dari sistem sumber dan tergabung dalam
sistem.
•
Transformasi data dan perpaduannya.
b. Analyze (analisis)
•
Pengayaan
data,
menggunakan
logika bisnis,
dan
tampilan hirarkis.
•
Penemuan data melalui data mining.
c. Report (laporan)
•
Presentasi dari data dan distribusinya.
•
Akses data untuk banyak pengguna.
58 Dan
Business
Intelligence
Architecture
menurut
M icrosoft OLAP (Loria, 2005) terbagi dalam tiga bentuk yang
saling menyambung yaitu:
•
Report
(laporan):
Laporan
informasi
detail
yang
dibutuhkan oleh siapapun untuk kebutuhan pengambilan
keputusan hari-per-hari.
•
Analyze (analisis): Analisis data untuk menyingkap akar
permasalahan dan tren pada pelaksanaan bisnis, dan
masih menggunakan teknik simple yang powerful.
•
Monitor (mencatat): secara terus menerus mencatat hasil
organisasi pada setiap level/bidang.
Download