OLAP Outline • • • • Keuntungan OLAP Penyajian Data Multidimensi Peralatan OLAP dan Kategorinya Penerapan SQL pada OLAP OLAP 2/16 Pengertian OLAP OLAP : Sintesa dinamis, analisis, dan konsolidasi dari data multidimensi dengan volume yang besar. Merupakan terminology yang menerangkan teknologi yang menggunakan view multidimensi pengelompokkan data untuk menyediakan akses cepat terhadap informasi strategis untuk keperluan analisa lebih lanjut (Coddet al.,1995). Keterkaitan data warehouse dengan online analytical processing (OLAP) dengan cepat berkembang dalam beberapa kurun waktu. Pada sisi lain, sensitivitas keamanan informasi dan privacy juga sangat dibutuhkan. Keuntungan OLAP 1. Meningkatkan produktifitas pemakai akhir bisnis, pengembang IT, dan keseluruhan organisasi. Pengawasan yang lebih dan akses tepat waktu terhadap informasi strategis dapat membuat pengambilan keputusan lebih efektif. 2. Mengurangi “backlog” pengembangan aplikasi bagi staf IT dengan membuat pemakai akhir dapat merubah schema dan membangun model sendiri. 3. Penyimpanan pengawasan organisasi melalui integritas data koorporasi. 4. Sebagai aplikasi OLAP tergantung pada data warehouse dan sistemOLTP untuk memperbaharui sumber tingkatan data mereka. 5. Mengurangi aktifitas query dan lalulintas jaringan pada system OLAP atau pada data warehouse. 6. Meningkatkan hasil dan keuntungan secara potensial dengan mengizinkan organisasi untuk merespon permintaan pasar lebih cepat. Penyajian Data Multi Dimensi Server basis data OLAP menggunakan struktur multi dimensi untuk menyimpan data dan hubungan antar data. Struktur multidimensi data dapat digambarkan seperti kubus data, dan kubus didalam kubus data. Setiap sisi kubus adalah sebuah dimensi. Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran. Contoh atribut dimensi adalah nama barang dan warna barang, contoh atribut ukuran adalah jumlah barang. Timbulnya beberapa masalah ketika akan menyembunyikan informasi dalam kubus. Jika irisan kubus tertentu tersembunyi, data pada suatu Region level akan dipalsukan (object yang seandainya kelihatan dimasukkan), atau, jika tak diubah, tracker query menduga data yang tersembunyi mungkin menjadi tersedia. Selama ini kita mengenal adanya tabel relasional. Jika kita perhatikan tabel relasional tersebut, maka dapat kita ketahui karakteristiknya. Secara jelas dapat kita lihat bahwa tabel relasional dibangun oleh baris dan kolom. Hal ini menunjukkan adanya dua sudut pandang, baris sebagai sumbu x dan kolom sebagi sumbu y. tapi sebenarnya tabel relasional tersebut hanya mempunyai satu dimensi. Pada gambar terlihat karekteristik dari tabel mahasiswa, dimana setiap record atau baris merepresentasikan data mahasiswa yang berbeda-beda. Satu baris dengan baris lainnya diidentifikasikan dengan sebuah key yaitu primary key. Sedangkan bagian kolom seperti, nama, alamat, telepon menyimpan fakta yang sama atau sejenis, dimana setiap fakta tersebut merujuk pada primary key . Hal inilah yang menunjukkan bahwa tabel relasional hanya mempunyai satu dimensi. Sedangkan yang dimaksud dengan data multidimensi adalah ketika kita dapat melihat sebuah data dari berbagai sudut pandang atau dimensi. Sebagai contoh, penjualan buku dapat dilihat dari segi lokasi Buku, waktu, lokasi penjualan / toko dan sebagainya. Jika digambarkan , maka akan terdapat tiga koordinat yaitu sumbu x mewakili buku, sumbu y mewakili dimensi waktu dan sumbu z untuk dimensi lokasi. Hal inilah yang menjadi perbedaan mendasar antara tabel relasional dan data multidimensi. Spreadshet merupakan salah satu contoh dari data multidimensi ini. Fungsi yang ia sediakan seperti perhitungan sederhana dan dapat juga diubah pada dimensi tunggal. Cube merupakan contoh data multidimensi selain spreadsheet. Dengan cube data menjadi lebih mudah untuk dimanipulasi. Setiap sumbu cube mewakili dimensi-dimensi. Terdapat measure yaitu nilai quantitative database yang ingin kita analisa. Biasanya measure berupa nilai penjualan, biaya, budget dan sejenisnya. Measure dihitung berdasarkan dimensi-dimensi dari cube. Misalkan kita ingin meganalisa penjualan buku, total penjualan (sebagai measure) untuk suatu jenis buku tertentu (dimensi) pada lokasi / toko buku yang berbeda-beda (lokasi dapat dipilih sesuai dengan kebutuhan seperti negara, propinsi dll) pada suatu periode waktu tertentu (hari, minggu, bulan,tahun, kuartal). Penyajian Data Multidimensi • Server basis data OLAP menggunakan struktur multidimensi untuk menyimpan data dan hubung an antar data. Struktur multidimensi data dapat digambarkan seperti ku- bus data, dan kubus di dalam ku- bus data. Setiap sisi kubus adalah sebuah dimensi. • Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran • Contoh atribut dimensi adalah nama barang dan warna barang, contoh atribut ukuran adalah jumlah barang OLAP 9/16 Server basis data OLAP multi dimensi mendukung operasi analitikal, seperti : • Konsolidasi melibatkan pengelompokkan data seperti ekspresi roll-up sederhana atau kompleks yang melibatkan hubungan antar data. Contoh : kantor-kantor cabang dikelompokkan menurut kota, dan kota dikelompokkan berdasarkan negara OLAP 10/16 • drill-down : kebalikan dari konsolidasi, menampilkan data secara rinci yang berisikan penggabungan data. • slicing & dicing (atau dikenal dengan istilah pivoting) : menerangkan kemampuan untuk melihat data dari sudut pandang yang berbeda-beda. OLAP 11/16 • drill-down OLAP 12/16 • slicing & dicing Rasa Sirup Biasa Rendah Kalori Total Strawberry Mangga Total 3.500.000 1.750.000 500.000 5.750.000 2.300.000 1.500.000 5.800.000 3.250.000 250.000 4.050.000 750.000 9.800.000 Sirup Biasa Biasa Biasa Rendah Kalori Rendah Kalori Rendah Kalori OLAP Nanas 13/16 Rasa Strawberry Mangga Nanas Strawberry Mangga Nanas Pendapatan 3.500.000 1.750.000 500.000 2.300.000 1.500.000 250.000 Peralatan Dan Kategori OLAP Aturan-aturan Codd untuk peralatan OLAP : 1. Multi-Dimensional Conceptual View 2. Transparency 3. Accessibility 4. Consistent Reporting Performance 5. Client-Server Architecture 6. Generic Dimensionality 7. Dynamic Sparse Matrix Handling 8. Multi User Support 9. Unrestricted Cross Dimensional Operations 10. Intuitive Data Manipulaiton 11. Flexible Reporting 12. Unlimited Dimensions & Aggregation Levels Kategeori OLAP : 1. Multi-dimensional OLAP (MOLAP atau MD-OLAP) 2. Relational OLAP (ROLAP), disebut juga Multi-relational OLAP 3. Managed Query Environment (MQE), disebut juga Hybrid OLAP (HOLAP) Penerapan SQL Pada OLAP Contoh penggunaan fungsi CUME (menghitung total kumulatif nilai kolom). Tampilkan penjualan triwulan untuk kantor cabang B003, dalam bentuk year-to-date. Asumsi: terdapat table Branch Quarter Sales dengan 3 atribut: branchNo, quarter, quarterlySales, yang menggambarkan semua penjualan property untuk triwulan tersebut. • SELECT quarter, quarterlySales, CUME(quarterlySales) AS Year-toDate FROM BranchQuarterSales WHERE branchNo = ‘B003’ Tabel hasil : Quarter quarterly Sales Year-to-Date 1 2 3 4 960000 2250000 4250000 5750000 OLAP 960000 1290000 2000000 1500000 17/16 Implementasi Pada Sistem Komersial Kebutuhan General Security Pada OLAP Proses OLAP Pada Data Warehouse Posisi OLAP Pada Data Warehouse Kesimpulan OLAP merupakan sintesa dinamis, analisis dan konsolidasi dari data multi dimensi dengan volume yang besar. Server basis data OLAP multi dimensi mendukung operasi analitikal, seperti: konsolidasi, drilldown, slicing & dicing. Peralatan OLAP dikategorikan sesuai dengan arsitektur basis data yang digunakan(menyediakan data untuk kebutuhan OLAP), terdiri dari: multidimensional OLAP, relational OLAP dan hybrid OLAP. Tugas Aturan-aturan Codd untuk peralatan OLAP : 1. Multi-dimensional conceptual view 2. Transparency 3. Accessibility 4. Consistent reporting performance 5. Client-server architecture 6. Generic dimensionality 7. Dynamic sparse matrix handling 8. Multi user support 9. Unrestricted cross dimensional operations 10. Intuitive data manipulaiton 11. Flexible reporting OLAPUnlimited dimensions 22/16 12. & aggregation levels Referensi • Connoly, Thomas; Begg, Carolyn; Strachan, Anne; Database Systems : A Practical Approach to Design, Implementation and Management, 3rd edition, Addison Wesley, 2003. OLAP 23/16