pengembangan data warehouse dan aplikasi olap

advertisement
PENGEMBANGAN DATA WAREHOUSE DAN APLIKASI OLAP
UNTUK PERSEBARAN HOTSPOT DI WILAYAH INDONESIA
Gananda Hayardisi
G64104053
1
Komisi Pembimbing
1. Imas S. Sitanggang, S.Si, M.Kom.
2. Dr. Ir. Lailan Syaufina, M.Sc
Latar Belakang
 Kebakaran hutan terjadi di sebagian besar
wilayah Indonesia
 Pencitraan jarak jauh  menghasilkan data
hotspot
 Penumpukan data hotspot tetapi minim
informasi yang didapatkan
 Informasi yang terdapat didalam data hotspot
perlu di eksplorasi dan divisualisasikan dalam
bentuk yang menarik
2
Tujuan
3
Ruang Lingkup
 Pembangunan data warehouse dan
4
aplikasi OLAP serta menampilkan
ringkasan untuk data hotspot di
wilayah Indonesia
 Data yang digunakan adalah
persebaran hotspot untuk wilayah
Indonesia sampai dengan tingkat
kabupaten dari tahun 2000 sampai
2004.
Manfaat
 Diharapkan berguna bagi pihak-pihak
terkait yang memerlukan informasi
cepat, menarik, dan akurat sehingga
dapat membantu dalam pengambilan
keputusan khusus dalam pengendalian
kebakaran hutan
5
Tinjauan Pustaka
 Data Warehouse adalah sekumpulan data yang
berorientasi subjek, terintegrasi, time-variant
dan nonvolatile yang mendukung dalam
manajemen pengambilan keputusan.
 Model Data Multidimensi  pembuatan data
warehouse didasarkan pada model data
multidimensi. Model data multidimensi
ditampilkan dalam bentuk kubus data. Model
data multidimensi dibagi menjadi yaitu dimensi
dan fakta (Han & Kamber 2006).
6
Tinjauan Pustaka (Lanj…)
 Dimensi adalah perspektif atau entitas
penting yang dimiliki organisasi untuk
menyimpan records.
 Fakta adalah ukuran-ukuran numerik.Fakta
merupakan kuantitas yang akan dianalisis
hubungan antar dimensi.
Data warehouse membutuhkan skema yang
ringkas dan berorientasi subjek untuk
memfasilitasi analisis data secara on-line. Tipetipe skema model multidimensi sebagai
berikut:
7
Skema – skema data warehouse
Star scheme (skema bintang)
Snowflake scheme
8
Skema – skema data warehouse
Fact constellation scheme
(skema galaksi)
9
Tinjauan Pustaka (Lanj…)
o OLAP (On-line Analytical Processing) 
1
0
menyediakan sebuah penampilan multidimensi
dari data dan alat yang cocok untuk proses
analisis.
Secara umum, OLAP berguna bagi pengguna
untuk antara lain (Cabbibo & Torlone 1997) :
 Mendefinisikan analisis persamaan melalui
dimensi-dimensi data berserta perhitungan
yang kompleks.
 Menyimpulkan dataset, agregasi dan
disagregasi dari beberapa dimensi.
 Mengevaluasi dan menampilkan hasil dari
analisis.
Tinjauan Pustaka (Lanj…)
1
1
Operasi-operasi OLAP adalah sebagai berikut
(Han & Kamber 2006) :
 Roll-up  menaikkan tingkat suatu hierarki
 Drill-down  kebalikan dari operasi roll-up.
Operasi ini merepsentasikan kubus data lebih
detil.
 Slice  pemilihan satu dimensi dari kubus
 Dice  mendefinisikan subcube dari pemilihan
dua dimensi atau lebih.
 Pivot (rotate)  memutar koordinat data
untuk menghasilkan presentasi data dalam
bentuk lain.
 Arsitektur Three-Tier Data Warehouse
12
Tinjauan Pustaka (Lanj…)
 Hotspot (titik panas)  salah satu
indikator tentang kemungkinan
terjadinya kebakaran hutan sehingga
dapat dilakukan analisis, pemantauan,
dan terkadang harus melakukan
pemeriksaan langsung ke
lapangan(Adinugroho et al dalam
Aprilia 2006).
1
3
Metode Penelitian
14
Lingkungan Pengembangan
Perangkat keras :
 Processor Intel Centrino Duo 1.8 Ghz
 RAM 1.5 GB DDR 2
 HDD 120 GB
 Monitor 14.1 dengan resolusi 1280 × 800
pixels
 Mouse dan keyboard
1
5
Lingkungan Pengembangan Lanj…
 Perangkat lunak :
 Sistem operasi Windows XP SP 2
 Microsof SQL Server 2000
 Palo Server Win 32 2.0
 Palo Excel Add-in 2.0 merupakan basis data cell-based



16

yang multidimensi, hierarki dan memory based. Palo
berfungsi untuk pembuatan atau pemodelan struktur
kubus data dan proses pemuatan data dari data
warehouse ke kubus data.
Web Server package WAMPP versi 2.0
Bahasa pemograman PHP 5
JpGraph 1.20 untuk membangkitkan grafik-grafik hasil
operasi OLAP
Web browser Mozilla Firefox 2.0 dan Internet Explorer 7
Hasil dan Pembahasan
 Analisis data sumber :
 Penentuan atribut-atribut terpilih
 Tabel fakta dan dimensi
 Skema data warehouse  star scheme (skema
bintang)
Hotspot
FK1 Id_waktu
FK2 Id_lokasi
--------------------------Jumlah_hotspot
1
7
Waktu
Lokasi
PK Id_waktu
Bulan
Kuartil
Tahun
PK Id_lokasi
Kabupaten
Propinsi
Pulau
Hasil dan Pembahasan (Lanj…)
 Praproses data :
○ Penggabungan data  data sumber (.xls) dari setiap
tahun di-import ke dalam basis data relasional
○ Reduksi data  pengurangan jumlah records data
○ Pembersihan data  Mengidentifikasi dan
memperbaiki data yang mengandung null dan tidak
konsisten
○ Penjumlahan hotspot  modul sum.php (tabel
hotspotNew) dan sumHotspotKab.php (tabel
hotspotBulan).
 Struktur kubus data  dibuat sesuai dengan skema
terdiri dari dimensi waktu dan lokasi. Kubus data diberi
1
nama hotspot
8
Diagram alur praproses data
Microsoft Excel 2007
Excel File
(*.xls)
SQL Server 2000
Excel File
(*.xls)
Pemilihan field/
atribut
Ekspor dan
Integrasi Data
Modul sum.php
Basis Data
1
9
Reduksi data dan
Penjumlahan Hotspot
Tingkat Harian dan
Kecamatan
Basis Data
SQL Server 2000
Modul sumHotspotKab.php
Pembersihan
Data
Penjumlahan Hotspot
Tingkat Bulanan dan
Kabupaten
Basis Data
Basis Data
Hasil dan Pembahasan (Lanj…)
Pemuatan data  membuat modul import
2
0
yaitu importLocation.php, importTime.php,
monthlyImport.php.
contoh elemen waktu  Q1 2000 atau Jan2000
Deksripsi Umum Aplikasi OLAP
 Mengadopsi arsitektur three-tier yang terdiri
dari 3 lapisan yaitu :
Lapisan bawah  Basis data operasional
untuk praproses data sumber
Lapisan tengah  OLAP Server Palo
Lapisan atas  web browser
Deskripsi umum aplikasi OLAP (Lanj…)
 Aplikasi OLAP pengembangan dari
Palo_demo.php yang terdapat di dalam sdk
1.0c
 Menggunakan Palo PHP API (SDK
20080118_1000)
 Fungsi filter dimensi
 Filter Quarter dan bulan
 Informasi disajikan dalam bentuk crosstab
dan grafik (bar dan pie plot)
21
Hasil dan Pembahasan (Lanj…)
Tampilan utama aplikasi OLAP persebaran
hotspot
2
2
Hasil dan Pembahasan (Lanj…)
 Fasilitas-fasilitas aplikasi OLAP :
 Memilih kubus data sesuai kepentingan
2
3
analisis
 Visualisasi hasil analisis dalam bentuk
crosstab dan grafik
 Operasi-operasi OLAP seperti roll up dan
drill down untuk proses analisis
 Filter dimensi
 Filter quarter pada filter dimensi untuk
dimensi waktu
Hasil dan Pembahasan (Lanj…)
 Kelebihan sistem :
 Aplikasi dibuat berbasis web  tidak perlu instalasi di
2
4
setiap komputer pengguna
 Aplikasi dibuat dengan menggunakan perangkat lunak
open source
 Dapat digunakan untuk data warehouse lainnya
dengan beberapa konfigurasi
 Kekurangan sistem :
 Untuk data warehouse tingkat kecamatan dan harian
menghasilkan nilai null di beberapa cell pada crosstab
 Tidak terdapat operasi pivot  saat ini dilakukan
dengan cara menukarkan axis dimensi
 Belum terdapat fungsi updating
Hasil dan Pembahasan (Lanj…)
 Contoh hasil analisis visual crosstab dan grafik :
 Analisis jumlah persebaran hotspot di wilayah Indonesia untuk
tingkat pulau :
2
5
Hasil dan Pembahasan (Lanj…)
 Analisis persebaran hotspot untuk tingkat propinsi
26
Hasil dan Pembahasan (Lanj…)
 Contoh operasi-operasi OLAP :
 Roll up : menaikkan hirarki dimensi lokasi dari
2
7
tingkat propinsi menjadi pulau (wilayah Sumatera)
 Drill down : menurunkan hirarki dimensi waktu dari
tingkat tahun secara keseluruhan (All) menjadi
setiap tahun
 Slice : pemilihan satu dimensi yaitu dimensi waktu
dengan kriteria tahun = 2000
 Dice : pemilihan kedua dimensi denga kriteria
propinsi = Sumatera dan tahun = 2000
 Pivot : menukarkan axis dimensi. Axis-x (dimensi
waktu) diubah menjadi dimensi lokasi dan
sebaliknya pada axis-y
Kesimpulan dan saran
 Kesimpulan :
 Penelitian menghasilkan data warehouse
dengan satu kubus data yaitu hotspot
 Aplikasi OLAP dibuat berbasis web
 Hasil Operasi OLAP ditampilkan dalam bentuk
crosstab dan grafik
 Berdasarkan penelitian ini OLAP Server Palo
mempunyai keterbatasan dalam jumlah
elemen dari suatu dimensi. Jumlah elemen
dimensi lokasi (kecamatan) 1.262 dan 1.946
untuk dimensi waktu (harian)
2
8
Kesimpulan dan saran (Lanj…)
 Salah satu informasi yang dapat diambil yaitu
pulau Sumatera mempunyai jumlah hotspot
terbanyak dari periode tahun 2000 sampai
2004.Hal ini disebabkan pada tahun 2000 jumlah
hotspot di pulau Sumatera mencapai 53.403 titik
kemudian disusul pulau Kalimantan di urutan
kedua sedangkan pulau Jawa sebagai wilayah
dengan jumlah hotspot paling sedikit.
2
9
Kesimpulan dan saran (lanj…)
 Saran :
 Pembuatan modul update untuk
memudahkan apabila terdapat data baru
 Pengembangan aplikasi OLAP dengan
menggunakan OLAP Server Palo dan Palo
PHP API versi terbaru
 Perbaikan grafik pada multiple pie plot
agar jumlah pie plot lebih dinamis.
 Penambahan fasilitas login untuk
membatasi pengguna misal, untuk update
data
3
0
Daftar Pustaka
 Cabbibo L & Torlone R. 1997. Querying Multidimensional Databases.





3
1
www.citeseer.ist.psu.edu
Han J & Kamber M. 2006. Data Mining Concepts & Techniques. Simon Fraser
University. USA: Morgan Kaufman
Hardani, M. 2006. Pengembangan Data Warehouse Pengiriman Barang di PT
Geologistics[Skripsi]. Bogor. Departemen Ilmu Komputer Fakultas Matematika
dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Herlambang, A. 2007. Pembangunan Data Warehouse dan Aplikasi OLAP
untuk Data PPMB IPB Menggunakan Palo[Skripsi]. Bogor. Departemen Ilmu
Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian
Bogor.
Stolle F. 2000. The Underlying Causes And Impacts Of Fires In Southeast Asia.
www.worldagroforestrycentre.org
Sukmawati A. 2006. Hubungan Antara Curah Hujan Dengan Titik Panas
(Hotspot) Sebagai Indikator Terjadinya Kebakaran Hutan Dan Lahan Di
Kabupaten Pontianak Propinsi Kalimantan Barat [Skripsi]. Bogor. Program Studi
Budidaya Hutan Fakultas Kehutanan Institut Pertanian Bogor.
Demo
Program
32
THX …
33
Download