Prosiding Seminar Nasional Sains Antariksa Homepage:http//www.lapan.go.id KAJIAN PENERAPAN METODE DATA WAREHOUSE UNTUK PENGELOLAAN DATA SAINS ANTARIKSA (THE STUDY ON THE APPLICATION OF DATA WAREHOUSE TO MANAGE SPACE SCIENCE DATA) Siti Maryam, Elyyani Pusat Sains Antariksa Lembaga Penerbangan dan Antariksa Nasional e-mail: [email protected] ABSTRAK Riwayat Artikel: Diterima: 22-11-2016 Direvisi: 07-04-2017 Disetujui: 17-04-2017 Diterbitkan: 22-05-2017 Kata kunci: Bank data, Basis Data, Data warehouse, Source Data, Data Marts. Keywords: Bank data, Database Data, Data warehouse, Source Data, Data Marts.. 1. Pusat Sains Antariksa memiliki sistem penyimpanan data https://bimasakti.sains.lapan.go.id. Sistem ini menampung data sains antariksa untuk mendukung riset cuaca antariksa. Tahun 2015 dilakukan pengembangan basis data sains antariksa. Hasil identifikasi menunjukan bahwa data sains antariksa memiliki aneka ragam format jenis dan struktur file. Hal ini menyebabkan ketidakberhasilan dalam mengembangkan sistem basis data sains antariksa. Keseragaman format file merupakan syarat dalam pengembangan suatu basis data. Tahun 2016 Pusat Sains Antariksa mencoba menerapkan kajian metode data warehouse pada pengelolaan data sains antariksa. Metode data warehouse memungkinkan integrasi berbagai jenis file, aplikasi serta sistem. Dengan menerapkan metode data warehouse diharapkan dapat memberi solusi kemudahan dalam pengelolaan data sains antariksa. ABSTRACT Space Science Center has data storage system https://bimasakti.sains.lapan.go.id. This system holds space science data to support space weather research. In the year of 2015 has been developed a space science data. The result of identification shows that the space science data has a variety of file format and structures, and this condition led to several unsuccessful in developing database system. The uniformity of file format is a requirement in database development. In the year of 2016, Space Science Center, attempting to apply the data warehouse method on data management. Methods of warehouse data is enables to integrate a different types of files, an applications and it’s systems, and by applying the method of warehouse data it is expecting to provide solutions to ease in management of space science data. Pendahuluan Pusat Sains Antariksa memiliki sistem bank data yang menampung seluruh data hasil pengamatan dari Loka dan Balai pengamatan dirgantara. Data hasil pengamatan disimpan dalam media https://bimasakti.sains.lapan.go.id. Seminar Nasional Sains Antariksa Bandung, 22 November 2016 Sistem ini bertujuan menyediakan data untuk mendukung riset cuaca antariksa. Format pengelolaan bank data hasil pengamatan berupa kumpulan file data (folder). Tahun 2015 sistem bank data sains antariksa dikembangkan dengan menerapkan c 2017 Pusat Sains Antariksa LAPAN ISBN: 978-602-17420-1-3 264 S. Maryam & Elyyani metode pengelolaan basis data, akan tetapi belum berhasil dikarenakan faktor ketidak seragaman format file data hasil pengamatan. Disamping itu, data sains antariksa dihasilkan dari berbagai aplikasi dan sistem yang berbeda. Tahun 2016 sistem bank data sains antariksa dikembangkan dengan mencoba menerapkan metode pengelolaan data warehouse. Metode ini memungkinkan integrasi pengelolaan data dari berbagai sistem aplikasi yang berbeda. Kajian penerapan metode data warehouse pada pengelolaan data sains antariksa diharapkan memberikan solusi dan kemudahan bagi pengelola dalam meenyediakan data sains antariksa untuk mendukung kegiatan riset cuaca antariksa. 2. Tinjauan Pustaka Kebutuhan akan data dan informasi di suatu institusi tampaknya hanya bisa dipenuhi apabila institusi tersebut telah memanfaatkan sistem informasi berbasis teknologi informasi dan menggunakan teknologi data warehouse sebagai sarana untuk melakukan berbagai analisa yang mendalam mengenai kondisi dan situasi dari institusi tersebut (Iik, 2013). Data warehouse adalah basis data berukuran besar yang menyimpan data dari berbagai sumber (Stephanie, 2014). Data warehouse tumbuh sebagai kebutuhan dalam berbagai organisasi untuk mengalisis data histori yang dimiliki dan konsolidasi data dari berbagai sumber dalam satu tempat penyimpanan (repository) yang besar (Agus, 2009). Data warehouse adalah kumpulan data yang bersifat subject-oriented, terintegrasi, time variant, dan non volatile yang membantu pihak organisasi dan perusahaan dalam proses pembuatan keputusan. Data warehouse menyediakan suatu tool yang disebut On Line Analytical Processing (OLAP) untuk melakukan analisis data multi dimensional secara interaktif yang akan menjadi fasilitas kemudahan dalam melakukan proses data mining (Randy, 2012). Keuntungan dari menerapkan data warehouse adalah kemampuan mengakses data enterprise, kemampuan dalam konsistensi data, kemampuan menampilkan hasil analisis secara cepat, menemukan gap antara pengetahuan bisnis dan bisnis proses, mengurangi biaya administrasi, dan menampilkan informasi yang memang dibutuhkan secara efektif. Membuat data warehouse tidak sekedar memindahkan data opersional ke dalam data warehouse, memindahkan data dari beberapa sumber berpotensi menimbulkan masalah besar Prosiding SNSA 2016 ISBN: 978-602-17420-1-3 terutama terkait dengan isu tidak konsistennya data (Eka, 2011). Data sains antariksa merupakan data yang tidak sederhana baik dari sifat, sumber, jenis, cara memperoleh serta waktu pengumpulan datanya (Maryam, 2015). Data warehouse diharapkan dapat menjadi metoda yang tepat dalam pengelolaan data sains antariksa. 3. Data dan Metode Data yang digunakan pada kajian penerapan metode data warehouse untuk pengelolaan data sains antariksa adalah data hasil pengamatan matahari, geomagnet serta ionosfer dan telekomunikasi yang terdapat pada bank data https://bimasakti.sains.lapan.go.id/. Metodologi kajian penerapan metode data warehouse pada pengelolaan data sains antariksa membuat disain arsitektur data warehouse dengan menggunakan pendekatan nine steps methodologhy dari Ralph Kimbal (Meta, 2013). Kesembilan tahapan tersebut meliputi identifikasi data, pemulihan grain, Identifikasi dan penyesuaian dimensi, penyimpanan precalculation pada tabel fakta, memastikan tabel dimensi, pemilihan durasi basis data, penentuan prioritas dan model query. Identifikasi data sains antariksa akan menentukan rancangan kode data sains antariksa, kode alat pengamatan, kode Balai Pengamat Dirgantara, nama data, nama alat, nama Balai Pengamatan Dirgantara, tipe data baik berupa teks maupun gambar, waktu, dan nilai data. Pemulihan grain, merupakan proses yang mengacu pada analisis proses data sains antariksa. Analisis proses akan menghasilkan nilai data berdasarkan waktu, jumlah alat pengamatan berdasarkan nama data. Identifikasi dan penyesuaian dimensi. Pada tahap ini dilakukan identifikasi dan penyesuaian dimensi yang terkait dengan fakta. Pemilihan fakta. Merupakan tahap untuk melakukan pemilihan fakta yang akan digunakan pada tabel fakta data, fakta alat, fakta Balai Pengamatan Dirgantara serta hubungan antara tabel fakta dan tabel dimensi (Fact Constellation Schema). Penyimpanan precalculation pada tabel fakta. Terdapat data yang merupakan kalkulasi awal dan hasilnya disimpan dalam tabel fakta. Memastikan tabel dimensi. Tabel dimensi menambahkan gambaran teks terhadap dimensi yang memungkinkan. Gambaran teks harus mudah digunakan dan dimengerti oleh user. Pemilihan durasi basis data. Durasi yang masukan kedalam database Data Warehouse. Melacak perubahan dari dimensi secara Kajian Penerapan Metode Data Warehouse . . . 265 Gambar 4-1. Arsitektur Data Warehouse Data Sains Antariksa perlahan. Pada atribut dimensi tidak semuanya memiliki nilai yang tetap, ada beberapa kemungkinan atribut tersebut akan berubah dalam waktu yang cukup lama. Oleh karna itu data yang sudah lama harus dilakukan pembaharuan data untuk tetap menjaga keakuratan data. Penentuan prioritas dan model query. Dalam perancangan sebuah data warehouse kapasitas penyimpanan sangat berpengaruh dan harus dipertimbangkan karena semakin banyak data kapasitas memori yang dibutuhkan harus semakin besar. 4. Pembahasan Gambar 4-1 adalah arsitektur data warehouse sains antariksa terbagi kedalam komponen, source data system, data staging area, data warehouse, data marts, users. Sources data system membagi kelompok data sains antariksa kedalam dua bagian yaitu internal dan eksternal. Source data internal adalah data sains antariksa yang dihasilkan dari alat pengamatan yang berada di Balai Pengamatan Dirgantara. Konten source data internal merupakan data hasil pengamatan matahari dan antariksa, geomagnet dan magnet antariksa, serta ionosfer dan telekomunikasi. Untuk source data eksternal, konten berasal dari sistem informasi cuaca antariksa. Komponen Staging data berisi proses extraction, transformation, and loading, yaitu proses mengambil dan mengubah data dari sistem sumber dan memasukkannya ke dalam data warehouse (Akhmad, 2013). Untuk memperoleh data yang berkualitas, maka selama proses pengambilan data sains antariksa harus bersih dari inkonsistensi, duplikasi, dan keabsahan nilai data. Komponen data warehouse merupakan kumpulan data sains antariksa yang diseleksi dan dipilih pada satu tempat penampungan yang besar. Komponen data mart merupakan bagian dari data warehouse yang mendukung pembuatan laporan dan analisa data sains antariksa. Komponen users terdiri peneliti dayang melakukan prediksi dan evaluasi cuaca antariksa dan user yang membuat dan menyampaikan laporan tentang kegiatan cuaca antariksa. Gambar 4-2 adalah arsitektur proses extract transform loading data sains antariksa yang dilakukan setelah proses menghilangkan noise pada basis data sumber internal dan eksternal. Noise dibersihkan dengan melakukan proses clean, transform, combine, deduplicate, household, dan archive. Hal ini dilakukan untuk menjaga integritas data yang akan diolah. Proses ekstraksi data sains antariksa dari basis data operasional ke data warehouse menggunakan suatu teknik populasi. Proses ini terdiri dari teknik untuk mempopulasikan ke tabel dimensi dan tabel fakta. Prosiding SNSA 2016 ISBN: 978-602-17420-1-3 266 S. Maryam & Elyyani Gambar 4-2. Arsitektur Extract Transform Loading (ETL) Data Sains Antariksa. Gambar 4-3. Arsitektur ETL Internal Data Source Data Sains Antariksa. Gambar 4-3 Arsitektur ETL data sains antariksa adalah proses memilih data sains antariksa yang akan digunakan dan disimpan dalam format terpilih, merapikan data yang terpilih. Proses transformasi yaitu menata ulang field dan menata inkonsistensi data sains antariksa. Loading merupakan proses penyimpanan data yang telah ditransformasikan kedalam data warehouse (Tanty, 2011). Proses loading dilakukan dengan menjalankan script pemanggilan data sains antariksa untuk memasukan data yang sudah bersih pada data warehouse. Ketiga proses tersebut selanjutnya memasuki tahap penataan pada media storage data warehouse pengelolaan data sains antariksa. Analisis pengelolaan data matahari, geomagnet dan magnet antariksa, ionosfer dan telekomunikasi untuk kebutuhan riset cuaca antariksa. Gambar 4-4 Menggambarkan proses penting yang harus dilakukan dalam pengoperasian data warehouse, yaitu penyalinan data. Proses ini dilakukan setiap periode waktu tertentu, terutama setelah terjadi transaksi yang mengakibatkan penambahan atau perubahan Prosiding SNSA 2016 ISBN: 978-602-17420-1-3 data pada basis data operasional (Dewi, 2012). Data sains antariksa terdiri dari 13 tabel basis data operasional, yang telah disalin kedalam tabel dimensi dan tabel fakta. Untuk memudahkan pemanfaatan data sains antariksa, dibuat halaman muka yang memuat memuat ikon data sains antariksa yaitu data matahari dan antariksa, geomagnet dan magnet antariksa, ionosfer dan telekomunikasi dari lokasi pengamatan yang tersebar di seluruh wilayah indonesia. 5. Kesimpulan Konsep data warehouse secara kajian dapat diterapkan di Pusat Sains Antariksa. Integrasi data sains antariksa diawali dengan melakukan ekstraksi dari beberapa sumber data dengan mengambil item data yang diperlukan. Sumber data diperoleh dari kelompok bank data matahari dan antariksa, geomagnet dan magnet antariksa, ionosfer dan telekomunikasi (legacy Systems). Prosesi integrasi data diawali dengan ekstraksi (extraction) kemudian dilakukan penyeragaman (transformation) sehingga sesuai dengan format yang digunakan untuk Kajian Penerapan Metode Data Warehouse . . . 267 Gambar 4-4. Halaman Indek Pengelolaan Data Warehouse Sains Antariksa (Sumber gambar : simbada.sains.lapan.go.id). kepentingan analisis. Data dalam format yang telah sesuai untuk keperluan analisis kemudian disimpan dalam data warehouse (loading). Prototipe data warehouse Pusat Sains Antariksa mencakup proses input data melalui ekstraksi data lama maupun data baru menggunakan media perangkat lunak yang sesuai dengan sistem data base yang sudah dirancang dengan keluaran berupa laporan data baik dalam bentuk hardcopy atau file dengan perioda data sesuai dengan kebutuhan. Harapan dari keluaran data warehouse Pusat Sains Antariksa dapat diintegrasikan melalui pengolahan OLAP (Online Anlytical Processing) menggunakan berbagai metode pengolah data. Ucapan Terimakasih Ucapan terima kasih disampaikan kepada teman-teman tim jaringan Rizal Suryana, Yoga Andrian, Ahmad Zulfiana, Sutan Syahril, Yusuf Dirgantara yang telah membantu dalam pemeliharaan jaringan dan pengembangan basis data sains antariksa. Rujukan Akhmad, D., Ema, U., Emha, T. L. (2013). Perancangan Data Warehouse Perpustakaan Perguruan Tinggi XYZ Menggunakan Metode Snowflake Schema. Jurnal Teknologi Informasi, 8, 1. Agus, S. (2009). Perancangan dan Implementasi Data Warehouse Meteorologi, Klimatologi Geofisika dan Bencana Alam. Jurnal Meteorologi dan Geofisika, 10, 132. Dewi, K. W. (2012). Perancangan Struktur Data Warehouse Untuk Mendukung Perencanaan Pemasaran Produk Menggunakan Star Schema. Jurnal Ilmiah ESAI, 6, 1. Eka, M. (2011). Implementasi Datawarehouse dan Data Mining : Studi Kasus Analisis Peminatan Studi Siswa. ComTech, 2, 1. Randy, O. P. (2012). Rancang Bangun Data Warehouse Untuk analisis Kinerja Penjualan Pada Industri Dengan Model SPA-DW (Sales Perfomance Analysis–Data Warehouse) Studi Kasus : PT Semen Padang. Skripsi, Universitas Diponegoro, Semarang. Iik, W., (2013). Pemanfaatan Data Warehouse Di Pergurfuan Tinggi Indonesia. Jurnal Sistem Informasi, 4, 1. Maryam, S. (2015). Penembangan Bais Data Sains Antariksa Online. Laporan Kegiatan Inhouse, Pusat Sains Antariksa. Stephanie, Y., (2014) Perancangan Data Warehouse Pada Profil Mahasiswa di Universitas XYZ. Jurnal Teknik Dan Ilmu Komputer, 3, 1. Tanty,O., (2011). Perancangan Model Data Warehouse Dalam Mendukung Perusahaan Jasa Pengiriman. Seminar Nasional Informatika E-93 ISSN: 1979-2328. UPN ”Veteran” Meta, S., Jemakmun, Suyanto, (2013) Analisis dan Perancangan Data Warehouse Rumah Sakit Umum Daerah Palembang Bari. Jurnal Ilmiah Teknik Informatika Ilmu Komputer, 1, 1. Prosiding SNSA 2016 ISBN: 978-602-17420-1-3 268 S. Maryam & Elyyani Prosiding SNSA 2016 ISBN: 978-602-17420-1-3