PENGEMBANGAN DATA WAREHOUSE DAN APLIKASI OLAP UNTUK PERSEBARAN HOTSPOT DI WILAYAH INDONESIA Gananda Hayardisi G64104053 1 Komisi Pembimbing 1. Imas S. Sitanggang, S.Si, M.Kom. 2. Dr. Ir. Lailan Syaufina, M.Sc Latar Belakang Kebakaran hutan terjadi di sebagian besar wilayah Indonesia Pencitraan jarak jauh menghasilkan data hotspot Penumpukan data hotspot tetapi minim informasi yang didapatkan Informasi yang terdapat didalam data hotspot perlu di eksplorasi dan divisualisasikan dalam bentuk yang menarik 2 Tujuan 3 Ruang Lingkup Pembangunan data warehouse dan 4 aplikasi OLAP serta menampilkan ringkasan untuk data hotspot di wilayah Indonesia Data yang digunakan adalah persebaran hotspot untuk wilayah Indonesia sampai dengan tingkat kabupaten dari tahun 2000 sampai 2004. Manfaat Diharapkan berguna bagi pihak-pihak terkait yang memerlukan informasi cepat, menarik, dan akurat sehingga dapat membantu dalam pengambilan keputusan khusus dalam pengendalian kebakaran hutan 5 Tinjauan Pustaka Data Warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, time-variant dan nonvolatile yang mendukung dalam manajemen pengambilan keputusan. Model Data Multidimensi pembuatan data warehouse didasarkan pada model data multidimensi. Model data multidimensi ditampilkan dalam bentuk kubus data. Model data multidimensi dibagi menjadi yaitu dimensi dan fakta (Han & Kamber 2006). 6 Tinjauan Pustaka (Lanj…) Dimensi adalah perspektif atau entitas penting yang dimiliki organisasi untuk menyimpan records. Fakta adalah ukuran-ukuran numerik.Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek untuk memfasilitasi analisis data secara on-line. Tipetipe skema model multidimensi sebagai berikut: 7 Skema – skema data warehouse Star scheme (skema bintang) Snowflake scheme 8 Skema – skema data warehouse Fact constellation scheme (skema galaksi) 9 Tinjauan Pustaka (Lanj…) o OLAP (On-line Analytical Processing) 1 0 menyediakan sebuah penampilan multidimensi dari data dan alat yang cocok untuk proses analisis. Secara umum, OLAP berguna bagi pengguna untuk antara lain (Cabbibo & Torlone 1997) : Mendefinisikan analisis persamaan melalui dimensi-dimensi data berserta perhitungan yang kompleks. Menyimpulkan dataset, agregasi dan disagregasi dari beberapa dimensi. Mengevaluasi dan menampilkan hasil dari analisis. Tinjauan Pustaka (Lanj…) 1 1 Operasi-operasi OLAP adalah sebagai berikut (Han & Kamber 2006) : Roll-up menaikkan tingkat suatu hierarki Drill-down kebalikan dari operasi roll-up. Operasi ini merepsentasikan kubus data lebih detil. Slice pemilihan satu dimensi dari kubus Dice mendefinisikan subcube dari pemilihan dua dimensi atau lebih. Pivot (rotate) memutar koordinat data untuk menghasilkan presentasi data dalam bentuk lain. Arsitektur Three-Tier Data Warehouse 12 Tinjauan Pustaka (Lanj…) Hotspot (titik panas) salah satu indikator tentang kemungkinan terjadinya kebakaran hutan sehingga dapat dilakukan analisis, pemantauan, dan terkadang harus melakukan pemeriksaan langsung ke lapangan(Adinugroho et al dalam Aprilia 2006). 1 3 Metode Penelitian 14 Lingkungan Pengembangan Perangkat keras : Processor Intel Centrino Duo 1.8 Ghz RAM 1.5 GB DDR 2 HDD 120 GB Monitor 14.1 dengan resolusi 1280 × 800 pixels Mouse dan keyboard 1 5 Lingkungan Pengembangan Lanj… Perangkat lunak : Sistem operasi Windows XP SP 2 Microsof SQL Server 2000 Palo Server Win 32 2.0 Palo Excel Add-in 2.0 merupakan basis data cell-based 16 yang multidimensi, hierarki dan memory based. Palo berfungsi untuk pembuatan atau pemodelan struktur kubus data dan proses pemuatan data dari data warehouse ke kubus data. Web Server package WAMPP versi 2.0 Bahasa pemograman PHP 5 JpGraph 1.20 untuk membangkitkan grafik-grafik hasil operasi OLAP Web browser Mozilla Firefox 2.0 dan Internet Explorer 7 Hasil dan Pembahasan Analisis data sumber : Penentuan atribut-atribut terpilih Tabel fakta dan dimensi Skema data warehouse star scheme (skema bintang) Hotspot FK1 Id_waktu FK2 Id_lokasi --------------------------Jumlah_hotspot 1 7 Waktu Lokasi PK Id_waktu Bulan Kuartil Tahun PK Id_lokasi Kabupaten Propinsi Pulau Hasil dan Pembahasan (Lanj…) Praproses data : ○ Penggabungan data data sumber (.xls) dari setiap tahun di-import ke dalam basis data relasional ○ Reduksi data pengurangan jumlah records data ○ Pembersihan data Mengidentifikasi dan memperbaiki data yang mengandung null dan tidak konsisten ○ Penjumlahan hotspot modul sum.php (tabel hotspotNew) dan sumHotspotKab.php (tabel hotspotBulan). Struktur kubus data dibuat sesuai dengan skema terdiri dari dimensi waktu dan lokasi. Kubus data diberi 1 nama hotspot 8 Diagram alur praproses data Microsoft Excel 2007 Excel File (*.xls) SQL Server 2000 Excel File (*.xls) Pemilihan field/ atribut Ekspor dan Integrasi Data Modul sum.php Basis Data 1 9 Reduksi data dan Penjumlahan Hotspot Tingkat Harian dan Kecamatan Basis Data SQL Server 2000 Modul sumHotspotKab.php Pembersihan Data Penjumlahan Hotspot Tingkat Bulanan dan Kabupaten Basis Data Basis Data Hasil dan Pembahasan (Lanj…) Pemuatan data membuat modul import 2 0 yaitu importLocation.php, importTime.php, monthlyImport.php. contoh elemen waktu Q1 2000 atau Jan2000 Deksripsi Umum Aplikasi OLAP Mengadopsi arsitektur three-tier yang terdiri dari 3 lapisan yaitu : Lapisan bawah Basis data operasional untuk praproses data sumber Lapisan tengah OLAP Server Palo Lapisan atas web browser Deskripsi umum aplikasi OLAP (Lanj…) Aplikasi OLAP pengembangan dari Palo_demo.php yang terdapat di dalam sdk 1.0c Menggunakan Palo PHP API (SDK 20080118_1000) Fungsi filter dimensi Filter Quarter dan bulan Informasi disajikan dalam bentuk crosstab dan grafik (bar dan pie plot) 21 Hasil dan Pembahasan (Lanj…) Tampilan utama aplikasi OLAP persebaran hotspot 2 2 Hasil dan Pembahasan (Lanj…) Fasilitas-fasilitas aplikasi OLAP : Memilih kubus data sesuai kepentingan 2 3 analisis Visualisasi hasil analisis dalam bentuk crosstab dan grafik Operasi-operasi OLAP seperti roll up dan drill down untuk proses analisis Filter dimensi Filter quarter pada filter dimensi untuk dimensi waktu Hasil dan Pembahasan (Lanj…) Kelebihan sistem : Aplikasi dibuat berbasis web tidak perlu instalasi di 2 4 setiap komputer pengguna Aplikasi dibuat dengan menggunakan perangkat lunak open source Dapat digunakan untuk data warehouse lainnya dengan beberapa konfigurasi Kekurangan sistem : Untuk data warehouse tingkat kecamatan dan harian menghasilkan nilai null di beberapa cell pada crosstab Tidak terdapat operasi pivot saat ini dilakukan dengan cara menukarkan axis dimensi Belum terdapat fungsi updating Hasil dan Pembahasan (Lanj…) Contoh hasil analisis visual crosstab dan grafik : Analisis jumlah persebaran hotspot di wilayah Indonesia untuk tingkat pulau : 2 5 Hasil dan Pembahasan (Lanj…) Analisis persebaran hotspot untuk tingkat propinsi 26 Hasil dan Pembahasan (Lanj…) Contoh operasi-operasi OLAP : Roll up : menaikkan hirarki dimensi lokasi dari 2 7 tingkat propinsi menjadi pulau (wilayah Sumatera) Drill down : menurunkan hirarki dimensi waktu dari tingkat tahun secara keseluruhan (All) menjadi setiap tahun Slice : pemilihan satu dimensi yaitu dimensi waktu dengan kriteria tahun = 2000 Dice : pemilihan kedua dimensi denga kriteria propinsi = Sumatera dan tahun = 2000 Pivot : menukarkan axis dimensi. Axis-x (dimensi waktu) diubah menjadi dimensi lokasi dan sebaliknya pada axis-y Kesimpulan dan saran Kesimpulan : Penelitian menghasilkan data warehouse dengan satu kubus data yaitu hotspot Aplikasi OLAP dibuat berbasis web Hasil Operasi OLAP ditampilkan dalam bentuk crosstab dan grafik Berdasarkan penelitian ini OLAP Server Palo mempunyai keterbatasan dalam jumlah elemen dari suatu dimensi. Jumlah elemen dimensi lokasi (kecamatan) 1.262 dan 1.946 untuk dimensi waktu (harian) 2 8 Kesimpulan dan saran (Lanj…) Salah satu informasi yang dapat diambil yaitu pulau Sumatera mempunyai jumlah hotspot terbanyak dari periode tahun 2000 sampai 2004.Hal ini disebabkan pada tahun 2000 jumlah hotspot di pulau Sumatera mencapai 53.403 titik kemudian disusul pulau Kalimantan di urutan kedua sedangkan pulau Jawa sebagai wilayah dengan jumlah hotspot paling sedikit. 2 9 Kesimpulan dan saran (lanj…) Saran : Pembuatan modul update untuk memudahkan apabila terdapat data baru Pengembangan aplikasi OLAP dengan menggunakan OLAP Server Palo dan Palo PHP API versi terbaru Perbaikan grafik pada multiple pie plot agar jumlah pie plot lebih dinamis. Penambahan fasilitas login untuk membatasi pengguna misal, untuk update data 3 0 Daftar Pustaka Cabbibo L & Torlone R. 1997. Querying Multidimensional Databases. 3 1 www.citeseer.ist.psu.edu Han J & Kamber M. 2006. Data Mining Concepts & Techniques. Simon Fraser University. USA: Morgan Kaufman Hardani, M. 2006. Pengembangan Data Warehouse Pengiriman Barang di PT Geologistics[Skripsi]. Bogor. Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Herlambang, A. 2007. Pembangunan Data Warehouse dan Aplikasi OLAP untuk Data PPMB IPB Menggunakan Palo[Skripsi]. Bogor. Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Stolle F. 2000. The Underlying Causes And Impacts Of Fires In Southeast Asia. www.worldagroforestrycentre.org Sukmawati A. 2006. Hubungan Antara Curah Hujan Dengan Titik Panas (Hotspot) Sebagai Indikator Terjadinya Kebakaran Hutan Dan Lahan Di Kabupaten Pontianak Propinsi Kalimantan Barat [Skripsi]. Bogor. Program Studi Budidaya Hutan Fakultas Kehutanan Institut Pertanian Bogor. Demo Program 32 THX … 33