13 BAB II KAJIAN PUSTAKA 2.1 State Of The Art Review Beberapa penelitian yang berkaitan dengan desain sistem semantic data warehouse dengan menggunakan metode ontology diantara lain penelitian yang dilakukan oleh Banu dkk. (2011) dengan judul penelitian “Semantic – Based Querying Using Ontology in Relational Database of Library Management System”. Pada penelitian ini dijelaskan bahwa bahwa web tradisional termasuk sebagian besar dari relational database (RDB) yang mendukung penataan data pada dasar sintak (code). Mengkonversi data yang disimpan dalam database relasional ke format RDF sangat susah dan sering terjadi kesalahan. Maka dibangun sebuah relasi database dengan format RDF dengan desain ontology. Jadi pendekatan ini untuk penggalian ontology dari RDB dan memungkinkan pengguna untuk melakukan query semantic dan menerjemahkannya ke dalam RDF bahasa query atau sering disebut dengan SPARQL. SPARQL bisa digunakan untuk mengekspresikan query di sumber data yang beragam. Penelitian yang lain tentang semantic data juga dilakukan oleh Airinei dan Berta (2012) dengan judul “Semantic Business Intelligence – a New Generation of Business Intelligence”. Menjelaskan perkembangan generasi baru solusi business Intelligence yang akan digunakan oleh perusahaan untuk mengelola dan menganalisis data untuk memberikan sebuah informasi yang mendukung keputusan yang tepat. Dalam konteks semantic data perkembangan untuk mengintegrasikan data semantic yang tidak terstruktur, membuat solusi business intelligence yang akan didesain untuk dapat 13 14 menganalisis, memproses dan memahami data dalam bentuk terstruktur maupun tidak terstruktur. Selanjutnya penelitian Kakish dan Kraft (2012) dengan judul penelitian “ETL Evolution for Real-Time Data Warehousing”. Dalam penelitian ini dijelakan metode yang digunakan dipenelitian ini adalah Change Data Capture (CDC) yang diintegrasikan dengan tool ETL sehingga proses ETL dapat efisien dan real-time. CDC adalah pendekatan inovasi untuk integrasi data, berdasarkan identifikasi, menangkap, dan mengirimkan perubahan yang dibuat oleh data sumber. Dengan memproses hanya perubahannya, CDC membuat proses integrasi data lebih efisien. Integrasi CDC dengan tool ETL yang ada menyediakan pendekatan terintegrasi untuk mengurangi jumlah informasi yang dikirimkan sambil meminimalisasi kebutuhan sumber daya dan memaksimalkan kecepatan dan efisiensi ke data warehouse secara real- time. Penelitian Thenmozhi1 dan Vivekanandan (2013) dengan judul “A Tool For Data Warehouse Multidimensional Schema Design Using Ontology” menjelaskan tentang data warehouse telah menjadi komponen yang diperlukan untuk analisis yang efektif usaha besar. Hal ini diterima secara luas bahwa data warehouse harus terstruktur sesuai dengan model multidimensi untuk memudahkan analisis OLAP. Metode yang digunakan untuk perancangan data warehouse dipenelitian ini adalah dengan menggunakan ontology. Ontology memanfaatkan domain pengetahuan pada data warehouse yang digunakan untuk proses pencarian sumber-sumber rancangan informasi yang relevan sesuai dengan yang diinginkan. Pembuatan desain ontology dilakukan untuk membuat konsep pengetahuan tentang database yang berasal dari sumber data yang berbeda. 15 Penelitian Yadav dan Srivastava (2014) dengan judul “Semantic Web Data Mining & Analysis”. Dalam penelitian ini hanya menjelaskan tentang penggunaan semantic web mining yang menggabungkan dua bidang penelitian yaitu semantic web dan web mining. Dalam hubungan ini, kehebatan penelitian ini adalah untuk meningkatkan pencarian informasi pada web dengan strategi semantic yang membuatnya cepat dan akurat dalam menggali informasi. Dengan perkembangan yang luar biasa dari WWW, itu membuat halaman web yang banyak dapat menghabiskan waktu cukup lama untuk pengguna dalam mencari informasi yang dibutuhkan. Oleh karena itu menggali informasi dengan web semantic telah menjadi sangat diperlukan agar informasi yang penting bisa dicari dengan cepat dan tepat. Strategi semantic web dan web mining bila diterapkan dengan penggalian informasi web akan memberikan hasil yang baru dan efisien bagi permintaan pengguna. Hal ini akan membantu untuk memberikan kepuasan yang lebih baik bagi pengguna yang kurang paham didalam mencari informasi pada website. Tabel 2.1 Daftar Penelitian yang Dijadikan Acuan Area Penelitian No 1 2 Judul Penelitian Thn DWH/ BI Ontology SETL/ SDWH Rule Based OLAP 2011 √ x x x x 2011 √ √ x x √ 2011 √ √ x x √ 2012 √ x x x √ 2012 √ x x x √ 2013 √ x x x √ Design and Analysis of DWH and BI in Education Domain Using Ontologies For The Design Of Data Warehouse Semantic – Based Querying Using Ontology in 3 Relational Database of Library Management System 4 5 Semantic Business Intelligence – a New Generation of Business Intelligence ETL Evolution for Real-Time Data Warehousing Data Warehousing, Data Mining, OLAP and 6 OLTP Technologies Are Essential Elements to Support Decission Making Process in Indutries 16 7 8 9 10 A Tool For Data Warehouse Multidimensional Schema Design Using Ontology Semantic Web Data Mining & Analysis 2013 √ √ x x x 2014 √ √ x x √ 2014 √ x x x √ 2014 √ √ x x √ 2015 √ √ √ √ √ Data Warehouse Design of Students Profile from XYZ University Toward An Ontology Based Approach For Data Warehouse Desain Sistem Semantic Data Warehouse 11 Untuk Mengolah Data Akademik dengan Menggunakan Metode Ontology dan Rule Based 2.2 Konsep Data Warehouse Menurut Turban dkk. (2011), data warehouse adalah kumpulan data yang dihasilkan untuk mendukung pengambilan keputusan. Data warehouse juga merupakan tempat penyimpanan data saat ini dan data historis dari kepentingan manager diseluruh organisasi. Menurut Laudon dan Laudon (2010), data warehouse adalah database yang menyimpan data penting saat ini dan historis dari kebutuhan informasi untuk manager dalam perusahaan. Berdasarkan pengertian yang dijabarkan oleh para ahli diatas dapat disimpulkan bahwa pengertian data warehouse adalah kumpulan data atau database yang digunakan sebagai tempat penyimpanan data saat ini dan data historis dari kebutuhan informasi untuk manager diseluruh organisasi untuk mendukung pengambilan keputusan. 2.3 Karakteristik Data Warehouse Karakteristik data warehouse terdiri dari subject oriented, integrated, time variant, dan non volatile. Karakteristik Data Warehouse menurut Turban dkk. (2011), antara lain: 17 a) Subject Oriented Data tersusun berdasarkan subyek yang detil, seperti sales, product, atau customers, hanya mengandung informasi yang relevan untuk mengambil keputusan. Subject Oriented tidak hanya dapat membantu user untuk menentukan bagaimana proses bisinis mereka berjalan tetapi juga membantu dalam menentukan mengapa proses bisnis mereka berjalan. b) Integrated Integrasi berhubungan erat dengan subject orientation. Data warehouse harus menempatkan data dari sumber yang berbeda ke dalam format yang konsisten untuk melakukannya, mereka harus menghadapi konflik penamaan dan perbedaan di antara satuan ukuran. c) Time Variant Data warehouse menyimpan data historical. Data yang tidak selalu memberikan status. Mereka mendeteksi tren, penyimpangan dan hubungan jangka panjang untuk melakukan peramalan dan perbandingan, yang mengarah kepada pengambilan keputusan. Setiap data warehouse mempunyai kualitas yang sementara. Waktu adalah satu-satunya dimensi yang penting yang semua data warehouse harus bisa mendukung. d) Nonvolatile Setelah data dimasukan ke dalam data warehouse, user tidak bisa mengganti atau meng-update data. Data yang lama dibuang dan perubahan data disimpan sebagai data yang baru. 18 2.4 Model Dimensional Data Warehouse Menurut Connolly dan Begg (2010), dimensionality modeling adalah sebuah teknik desain logika yang bertujuan untuk menampilkan data dalam bentuk standar, intuitif yang memungkinkan akses cepat. Dimensionality modeling menggunakan konsep model Entity-Relationship (ER) dengan beberapa batasan penting. Setiap model dimensi terdiri dari satu tabel dengan satu composite primary key yang disebut fact table dan memiliki kumpulan dari tabel yang lebih sederhana yang disebut tabel dimensi (dimension table). Tiap tabel dimensi memiliki primary key (non composite) yang akan berkorespondensi tepat satu dengan komponen pada composite key dalam fact table. a) Star Schema Menurut Connolly dan Begg (2010), star schema adalah model data dimensional yang mempunyai fact table di bagian tengah, dikelilingi oleh tabel dimensi yang terdiri dari data reference (yang bisa di-denormalized). Star schema mengambil karakteristik dari factual data yang di-generate oleh event yang terjadi dimasa lampau. Gambar 2.1 Star Schema (Sumber: Connolly dan Begg, 2010) 19 b) Snowflake Menurut Connolly dan Begg (2010), Snowflake adalah jenis dari star schema dimana tabel dimensinya tidak mengandung denormalisasi. Gambar 2.2 Snowflake (Sumber: Connolly dan Begg, 2010) c) Starflake Menurut Connolly dan Begg (2010), Starflake adalah struktur gabungan yang mengandung campuran dari star schema dan snowflake. Berdasarkan dari kutipan pengertian ketiga schema diatas, dapat disimpulkan bahwa tabel fakta pada star schema dikelilingi oleh banyak dimensi dengan hubungan one-tomany, sedangkan pada snowflake tabel fakta terhubung banyak ke tabel dimensi, yang dimana dimensi tersebut dapat dihubungkan ke tabel dimensi lain, sedangkan starflake schema merupakan gabungan antara star schema dengan snowflake. 20 2.5 Web Semantic Menurut Jhon Markoff, web semantic adalah sekumpulan teknologi yang menawarkan cara baru yang efisien dalam membantu komputer mengorganisasi dan menarik kesimpulan dari data online. Melalui web semantic inilah berbagai perangkat lunak akan mampu mencari, membagi, dan mengintegrasi informasi dengan cara yang lebih mudah. Web Semantic adalah sekumpulan informasi yang dikumpulkan dengan metode tertentu agar dapat dengan mudah diproses oleh mesin, dalam skala yang besar. Ini seperti cara yang efisien dari representasi data pada World Wide Web, atau sebagai database global yang saling terhubung. Web semantic terdiri dari seperangkat prinsipprinsip desain, kelompok kerja kolaboratif, dan berbagai teknologi. Beberapa elemen dari web semantic yang dinyatakan sebagai calon masa depan dan unsur-unsur lain dari web semantic disajikan dalam spesifikasi formal dimaksudkan untuk memberikan deskripsi formal konsep, istilah, dan hubungan dalam satu domain tertentu. Istilah web semantic itu sendiri diperkenalkan oleh Tim Berners-Lee, penemu World Wide Web. Sekarang, prinsip web semantic disebut-sebut akan muncul pada Web 3.0, generasi ketiga dari World Wide Web. Bahkan Web 3.0 itu sendiri sering disamakan dengan web semantic. Web semantic menggunakan XML, XMLS (XML Schema), RDF, RDFS (Resources Description Framework Schema) dan OWL. 2.6 ETL Berbasis Semantic Menurut Rainardi (2008), ETL adalah suatu proses mengambil dan mengirim data dari sumber data ke data warehouse. Dalam proses pengambilan data, data harus bersih agar didapat kualitas data yang baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang tidak eksis lagi, ada beberapa data yang null, dan lain sebagainya. Pendekatan tradisional pada proses ETL mengambil data dari data sumber, meletakkan 21 pada staging area, dan kemudian mentransformasi dan meng-load ke data warehouse. Pada ETL berbasis semantic ini, prosesnya hampir sama denga ETL tradisional hanya perbedaan pada transfrom yang akan menerapkan metode ontology dengan rule based. Proses Extrac Transform Loading (ETL) berbasis semantic terbagi menjadi 3, yaitu: 1. Extract Extract adalah proses penentuan source yang akan digunakan sebagai sumber data bagi data warehouse. Di sini kita bisa menentukan data apa saja yang diperlukan, tabel apa saja yang dijadikan sumber. Langkah pertama pada proses ETL adalah mengekstrak data dari sumber-sumber data. Kebanyakan proyek data warehouse menggabungkan data dari sumber-sumber yang berbeda. Pada hakekatnya, proses ektraksi adalah proses penguraian, pembersihan dari data diekstrak untuk mendapatkan struktur atau pola data yang diharapkan. 2. Transform Setelah source ditentukan, maka data tersebut diubah agar sesuai dengan standard yang ada pada data warehouse. Tahapan transformasi menggunakan serangkaian aturan atau fungsi untuk mengekstrak data dari sumber dan selanjutnya dimasukkan dalam data warehouse. Dibawah ini hal-hal yang dilakukan dalam tahapan transformasi, yaitu: a) Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam data warehouse. b) Menterjemahkan nilai-nilai yang berupa kode, misalnya sumber database menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk perempuan, tetapi data warehouse yang telah ada menyimpan A untuk dewasa dan C untuk anak-anak, maka ini disebut juga dengan automated data cleaning 22 (tidak ada pembersihan secara manual yang ditunjukkan selama proses ETL). c) Proses transformasi dari OLTP fisik ke data model mapping dengan pendekatan ontology dan rule based yang menghasilkan bentuk model RDFS logic. Dari RDFS logic ini akan ditransformasikan kebentuk SDWH fisik dengan model dimensional schema. 3. Loading Loading adalah proses memasukkan data-data yang sudah di transformasi ke dalam data warehouse untuk disimpan sebagai summary atau archieve. Fase load merupakan tahapan yang berfungsi untuk memasukkan data ke dalam target akhir, yang biasanya ke dalam suatu data warehouse. Jangka waktu proses ini tergantung pada kebutuhan organisasi. Beberapa data warehouse dapat setiap minggu menulis keseluruhan informasi yang ada secara kumulatif, data diubah, sementara data warehouse yang lain satau bagian lain dari data warehouse yang sama dapat menambahkan data baru dalam suatu bentuk historical, contohnya setiap jam. Waktu dan jangkauan untuk mengganti atau menambah data tergantung dari perancangan data warehouse pada waktu menganalisis keperluan informasi. 2.7 Semantic Data Warehouse Semantic data warehouse adalah repositori data yang cerdas yang diciptakan dalam proses ETL berbasis semantic. Memiliki sifat yang sangat dinamis karena kemampuannya untuk mengolah semantic ETL dan menerima update langsung secara terus menerus. Semantic data warehouse juga merupakan pengembangan data warehouse saat ini dimana informasi yang diberikan didefinisikan lebih bermakna dan 23 lebih baik yang memungkinkan komputer dan pengguna dapat bekerja sama. Semantic data warehouse bertujuan agar informasi pada data warehouse yang diekpresikan di dalam bahasa alami yang dimengerti manusia dan perangkat lunak (software). Melalui semantic data warehouse inilah, berbagai perangkat lunak akan mampu mencari, membagi, dan mengintegrasikan informasi dengan cara yang lebih mudah dan cepat. Gambar 2.3 Alur Semantic Data Warehouse (Sumber : TAS Information Intelligence) 2.8 OLTP dan OLAP 2.8.1 OLTP (Online Transaction Processing) Menurut Stair dkk. (2010), OLTP adalah suatu bentuk pengolahan data dimana setiap transaksi diproses dengan segera, tanpa penundaan mengumpulkan transaksi ke dalam batch. Memiliki karakteristik dengan jumlah data yang besar namun transaksi yang dilakukan cukup sederhana seperti insert, update, dan delete. Hal utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah melakukan query secara cepat dan mudah untuk diperbaiki dan dapat diakses. 24 1.8.2 OLAP (Online Analytical Processing) 1.8.2.1 Pengertian OLAP (Online Analytical Processing) Menurut Turban dkk. (2011) struktur operasional utama dalam OLAP didasarkan pada konsep yang disebut kubus (cube). Kubus (cube) didalam OLAP adalah struktur data multidimensional (actual atau virtual) yang memungkinkan analisis data yang cepat. Juga dapat didefinisikan sebagai kemampuan dari memanipulasi dan menganalisis data secara efisien dari berbagai perspektif. Susunan data ke dalam kubus bertujuan untuk mengatasi keterbatasan database relational. Database relational tidak cocok untuk analisis yang cepat dan dekat dari sejumlah besar data. Sebaliknya, mereka lebih cocok untuk memanipulasi record (menambahkan, menghapus, dan memperbarui data) yang mewakili serangkaian transaksi. Gambar 2.4 Online Analytical Processing (Sumber: Scheps, 2008) 25 Berdasarkan pengertian yang dijabarkan oleh para ahli diatas dapat disimpulkan bahwa pengertian Online Analytical Processing (OLAP) adalah sebuah konsep data multidimensional yang mendukung kegiatan mulai dari self service reporting dan analisis data yang cepat dan efisien dari berbagai perspektif. 1.8.2.2 Arsitektur OLAP Menurut Scheps (2008), Sistem OLAP mempunyai dua kategori, yaitu: a) OLAP Cube Di lingkungan OLAP, cube adalah penyimpan data terspesialisasi dirancang secara spesifik untuk menangani data ringkasan multidimensional (multidimentional summary data). Data cube disimpan di cell dan strukturnya seperti 3D spreadsheet. Gambar 2.5 Cube (Sumber: Scheps, 2008) 26 b) OLAP Access Tools Lingkungan client yang memungkinkan pengguna untuk memanipulasi data cube dan akhirnya menghasilkan Business Intelligence yang berarti dari berbagai sudut pandang dan dapat lebih dari satu sudut pandang. 1.8.3 Perbedaan OLAP dan OLTP Menurut Vercellis (2009) terdapat perbedaan antara OLAP dan OLTP, antara lain dapat dilihat pada tabel dibawah ini : Tabel 2.2 Perbedaan Antara OLTP dan OLAP Karakteristik OLAP OLTP Volatilitas Data statis Data dinamis Waktu Data saat ini dan historis Data saat ini Dimensi waktu Eksplisit dan varian Implisit dan terkini Granuality Data agregasi dan Data yang detil konsolidasi Update Periodic dan regular Berlanjut dan tidak regular Aktivitas Tidak dapat diprediksi Berulang kali Fleksibilitas Tinggi Rendah Kinerja Rendah untuk query yang Tinggi, satu detik per kompleks query User Knowledge workers Karyawan Fungsi Analisis Operasional Tujuan Query kompleks dan Transaksi penggunaan pendukung keputusan Prioritas Fleksibilitas tinggi Kinerja tinggi Metric Respon efektif Rata-rata transaksi Ukuran data Gigabyte hingga terabyte Megabyte hingga gigabyte (Sumber: Vercellis, 2009) 27 1.9 Data Mining Menurut Han dan Kamber (2011), data mining adalah proses menemukan pola yang menarik dan pengetahuan dari data yang berjumlah besar. Menurut Vercellis (2009), data mining adalah aktivitas yang menggambarkan sebuah proses analisis yang terjadi secara iteratif pada database yang besar, dengan tujuan mengekstrak informasi dan knowledge yang akurat dan berpotensial berguna untuk knowledge workers yang berhubungan dengan pengambilan keputusan dan pemecahan masalah. Aktivitas data mining dapat dipisahkan menjadi 2, berdasarkan tujuan dari analisis yaitu: a) Interpretasi Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan menghasilkannya dalam bentuk aturan dan kriteria yang dapat dimengerti eksekutif. b) Prediksi Tujuan dari prediksi adalah untuk mengestimasikan kejadian-kejadian yang terjadi di masa depan. Contohnya, perusahaan retail dapat menggunakan data mining untuk memprediksikan penjualan dari produk mereka di masa depan dengan menggunakan data-data yang telah didapatkan dari beberapa minggu. Berdasarkan pengertian yang dijabarkan oleh para ahli diatas dapat disimpulkan bahwa pengertian data mining adalah sebuah proses analisis yang terjadi secara interatif dan menemukan pola yang menarik, serta pengetahuan dari data yang berjumlah besar. 28 1.10 BI (Business Intelligence) 2.10.1 Pengertian Business Intelligence Menurut Scheps (2008), Business Intelligence adalah segala aktivitas, tool, atau proses yang digunakan untuk mendapatkan informasi yang terbaik untuk mendukung proses pembuatan keputusan. Menurut Vercellis (2009), Business Intelligence adalah kumpulan model metematika dan metodologi analisa yang secara sistematik menghasilkan data untuk menghasilkan suatu informasi dan pengetahuan yang berguna untuk mendukung proses pengambilan keputusan yang kompleks. Tujuan utama dari business intelligence adalah untuk menyediakan alat dan metodologi bagi knowledge workers untuk membuat keputusan yang efektif dan tepat waktu. a) Keputusan yang efektif Aplikasi dari metode analisa yang butuh ketelitian tinggi membuat pengambil keputusan harus mengandalkan informasi dan pengetahuan mana yang dapat diandalkan. Hasilnya, mereka dapat membuat keputusan yang lebih baik dan membuat suatu perencanaan yang dapat membuat tujuan mereka tercapai dengan efektif. b) Keputusan yang tepat waktu Perusahaan beroperasi dalam lingkungan ekonomi yang berkarakterisasi oleh tingkatan kompetisi dan dinamisme yang tinggi. Konsekuensinya, kemampuan untuk bereaksi dengan pesaing dan kondisi pasar baru merupakan faktor penting dalam kesuksesan ataupun kelangsungan hidup perusahaan. 29 Berdasarkan pengertian yang dijabarkan oleh para ahli diatas dapat disimpulkan bahwa pengertian Business Intelligence (BI) adalah kumpulan aktivitas, tool, atau proses yang digunakan, dan metodologi analisa yang secara sistematis dapat menghasilkan suatu informasi dan pengetahuan yang berguna untuk mendukung proses pembuatan keputusan yang kompleks. 2.10.2 Arsitektur Business Intelligence Menurut Vercellis (2009), arsitektur dari sebuah business intelligence system, terdiri dari enam komponen utama yaitu: a) Data sources Pada tahap pertama, diperlukan suatu proses untuk mengumpulkan dan mengintegrasikan data-data yang disimpan dalam berbagai sumber yang bervariasi, yang mana saling berbeda baik itu asal maupun jenisnya. Sumber ini kebanyakan berasal dari data-data yang terdapat pada operational systems, tetapi bisa juga berasal dari dokumen yang tidak terstruktur seperti email dan data-data yang dikirimkan oleh pihak luar. b) Data Warehouse dan Data Marts Dengan menggunakan extraction dan transformation tools yang dikenal sebagai ETL (extract, transform, load), data yang berasal dari berbagai sumber yang berbeda disimpan ke dalam database yang ditujukan untuk mendukung analisis business intelligence. Database inilah yang biasanya dikenal dengan sebutan data warehouse dan data marts. 30 c) Data Exploration Pada level ketiga ini, tools-tools yang berfungsi untuk keperluan analisis business intelligence pasif digunakan. Tools-tools ini terdiri dari query dan reporting systems, serta statistical methods. Metodologi ini bersifat pasif karena para pengambil keputusan harus mengambil keputusan berdasarkan hipotesa mereka sendiri atau mendefinisikan kriteria dari data extraction, kemudian menggunakan tools analisis untuk menemukan jawaban dan mencocokkannya dengan hipotesa awal mereka. d) Data Mining Level keempat ini terdiri dari sejumlah metodologi business intelligence yang bersifat aktif yang tujuannya adalah untuk mengekstrak informasi dan pengetahuan dari data. Metodologi ini berisi sejumlah model matematika untuk pengenalan pola, pembelajaran mesin, dan teknik data mining. Tidak seperti tools yang digunakan pada level sebelumnya, model dari business intelligence yang bersifat aktif ini tidak mengharuskan para pengambil keputusan untuk mengeluarkan hipotesa apapun. e) Optimization Pada level ini, solusi terbaik harus dipilih dari sekian alternative yang ada, yang biasanya sangat banyak dan beragam. f) Decisions Pada level terakhir ini yang menjadi persoalan utama adalah bagaimana menentukan keputusan akhir yang akan diambil yang dikenal sebagai 31 decision making process. Walaupun metodologi business intelligence berhasil diterapkan, pilihan untuk mengambil sebuah keputusan ada pada para pengambil keputusan. Pertimbangkan untuk mengambil keputusan ini biasanya diambil juga dari informasi yang tidak terstruktur serta tidak formal dan memodifikasi rekomendasi serta kesimpula yang dicapai melalui penggunaan model matematika. Gambar 2.6 Komponen Business Intelligence (Sumber: Vercellis, 2009) 2.10.3 Siklus Hidup Business Intelligence Menurut Vercellis (2009), ada 4 siklus hidup business intelligence, yaitu: a) Analysis Saat fase analisis, sangat penting untuk mengenali masalah luar maupun dalam. Pengambil keputusan harus membuat representasi dari kejadian yang sedang dianalisis, dengan mengidentifikasikan faktor penting yang paling relevan dengan masalah. b) Insight Fase kedua membuat pengambil keputusan mengerti lebih dalam mengenai masalah, biasanya dalam tingkatan kausal. Sebagai contoh, 32 jika analisis dalam fase pertama menunjukkan bahwa banyak pelanggan yang tidak lagi melanjutkan asuransi mereka, dalam fase kedua sangat penting untuk mengidentifikasi profil dan karakteristik yang dimiliki oleh pelanggan. Informasi yang didapat dari fase pertama ditransformasikan kedalam fase kedua. c) Decision Saat fase ketiga, pengetahuan yang didapat dari fase kedua diubah menjadi suatu keputusan yang akan diikuti dengan ksi. Metodologi business intelligence memungkinkan fase analisis dan pendalaman dieksekusi berkali-kali agar keputusan yang efektif dan tepat waktu dalam dibuat untuk memenuhi prioritas strategis suatu perusahaan. d) Evaluation Fase terakhir dari Business Intelligence meliputi pengukuran kinerja dan evaluasi. Dengan menunjukkan indikator kinerja yang dapat digunakan untuk mengevaluasi kinerja dari perusahaan. Gambar 2.7 Siklus Hidup Business Intelligence (Sumber: Vercellis, 2009) 33 2.10.4 Keuntungan Business Intelligence Menurut Khan (2012) dalam jurnalnya mengatakan bahwa sementara dunia bisnis berubah dengan cepat dan proses bisnis menjadi lebih dan lebih kompleks sehingga lebih sulit bagi manager untuk memiliki yang komprehensif pemahaman lingkungan bisnis. Faktor globalisasi, deregulasi, merger dan akuisisi, kompetisi dan inovasi teknologi, telah memaksa perusahaan untuk memikirkan kembali strategi bisnis mereka dan hanya perubahan besar telah menggunakan teknik Business Inteligence (BI) untuk membantu mereka memahami dan mengendalikan proses bisnis untuk mendapatkan keuntungan kompetitif. BI terutama digunakan untuk meningkatkan ketepatan waktu dan kualitas informasi, dan memungkinkan manager lebih memahami posisi perubahan mereka dibandingkan dengan pesaing. Aplikasi dan Teknologi BI ini membantu perusahaan untuk menganalisis perubahan tren dalam pangsa pasar, perubahan perilaku pelanggan dan pengeluaran pola, preferensi pelanggan, kemampuan perusahaan dan kondisi pasar. Hal ini digunakan untuk membantu analisis dan manager menentukan penyesuaian yang paling mungkin untuk merespon perubahan tren. Ia telah muncul sebagai sebuah konsep untuk menganalisis data yang dikumpulkan dengan tujuan untuk membantu unit pengambilan keputusan mendapatkan pengetahuan yang lebih baik yang komprehensif dari sebuah operasi, organisasi dan dengan demikian membuat keputusan bisnis lebih baik. 34 2.10.5 Komponen Business Intelligence Menurut Kapoor (2010) dalam jurnalnya mengatakan bahwa komponen Business Intelligence terdiri dari 4 (empat) sub-system, yaitu: a) The Data Management Sub-System Mencakup komponen yang berkaitan dengan data warehouse, data mart, dan Online Analytical Processing (OLAP). Orang-orang yang bekerja terutama di daerah ini adalah "teknologi", yang mengkhususkan diri dalam Ilmu Komputer, Sistem Informasi Manajemen (MIS), atau disiplin terkait. b) The Advanced Analytics Sub-System Meliputi analisis fungsi berdasarkan statistik, data mining, peramalan, pemodelan prediktif, analisis prediktif, dan optimasi. Orang-orang yang bekerja terutama di daerah ini adalah super user, yang mengkhususkan diri dalam Matematika, Statistik, Ilmu Manajemen atau disiplin yang terkait. c) The Business Performance Management Sub-System Terdiri dari proses untuk tujuan strategis dan tujuan, pengukuran kinerja dan mentoring, menganalisis kinerja dan membuat keputusan untuk meningkatkan kinerja bisnis. d) The Information Delivery Sub-System Memberikan pengguna bisnis kemampuan untuk mengakses laporan dan terus memantau kinerja organisasi pada perusahaan dan tingkat yang lebih rendah. Menurut perannya sebagai teknokrat, super user, manager menengah, manager eksekutif, atau pengguna operasional, ia akan diberi 35 peran berbasis hak untuk mengakses laporan yang relevan dalam ringkasan dan atau format rinci. Pengguna akhir juga mampu memantau kegiatan kunci seperti tren, metrik, dan KPI dalam mudah untuk memahami desain, seperti portal informasi dikonfigurasi, Scorecard dan dashboard. Tergantung pada peran individu dan tanggung jawab, disajikan dengan tren, metrik, dan KPI pada tingkat agregasi yang sesuai dengan keamanan untuk memblokir non-hak istimewa item. 2.11 Metode Ontology Metode ontology digunakan untuk pemodelan bentuk dari konseptual data warehouse yang akan dirancang. Metode ontology ini memiliki beberapa tahapan (rule based) didalam perancangan. Untuk lebih jelasnya akan didefinisikan dibawah ini. 2.11.1 Definisi Ontology Metode ontology adalah suatu konseptual yang formal dari sebuah domain tertentu. Ontology juga merupakan teori tentang makna dari suatu obyek, properti dari suatu obyek, serta relasi obyek tersebut yang mungkin terjadi pada suatu domain pengetahuan. Ontology sangat penting karena dapat digunakan menerangkan tentang struktur suatu database. Secara teknis sebuah ontology direpresentasikan dalam bentuk classes, properties, slots, dan instans. a. Class, menerangkan konsep (atau makna) suatu domain. Class adalah kumpulan dari elemen dengan properti yang sama. Suatu class dapat mempunyai turunan subclass yang menerangkan konsep yang lebih spesifik. b. Properti, menerangkan konsep nilai-nilai, status, terukur yang mungkin ada untuk domain. 36 c. Slot, merupakan representasi dari kerangka pengetahuan atau relasi yang menerangkan properti dari class dan instant. d. Instant, adalah individu yang telah dibuat (diciptakan). Instant dari sebuah subclass merupakan instant dari suatu superclass. Gambar 2.8 Model Ontology (Sumber: www.ontology.com, 2014) 2.11.2 Bahasa Ontology Ontologi sendiri mempunyai struktur bahasa yang formal (terdefinisi), agar dapat digunakan. Beberapa struktur bahasa yang menyusun ontology antara lain : a. XML (Extensible Markup Langguage) Struktur mirip HTML yang tag-nya dapat didefiniskan sendiri. b. XML Schema Bahasa yang membatasi struktur yang didefinisikan pada dokumen XML. c. RDF (Resource Description Framework) Model data untuk objek (resources) dan relasi diantaranya, menyediakan semantic yang sederhana untuk model data tersebut, dan data model ini dapat disajikan dalam sintaksis XML. 37 d. RDF Schema Adalah kosakata untuk menjelaskan properties dan classes dari sumber RDF, dengan sebuah semantics untuk hirarki penyamarataan dari properties dan classes. e. OWL (Ontology Web Langguage) Menambahkan beberapa kosakata untuk menjelaskan properties dan classes, antara lain: relasi antara classes (misalkan disjointness), kardinalitas (misalkan tepat satu), equality, berbagai tipe dari properties, karakteristik dari properties (misalkan symmetry), menyebutkan satu persatu classes . 2.12 Metode Rule Based Aturan atau rule merupakan sebuah konsep yang menjadi acuan pada suatu model ontology dan proses pencarian informasi dengan query menggunakan bahasa alami (Natural Language Processing). 2.12.1 Ontology Rule Based Suatu model ontology dimungkinkan terdiri dari sebuah rule bahkan lebih dari satu rule. Banyaknya rule yang digunakan atau diterapkan pada sebuah model ontology dipengaruhi oleh banyak faktor seperti komplektivitas permasalahan, keragaman data yang digunakan, hubungan antar objek dalam permasalahan, dan lain sebagainya. Rule digunakan untuk mengatur relasi atau hubungan antar elemen-elemen penyusun ontology seperti relasi antar class, relasi class dengan data type, relasi antar instance dalam suatu class ataupun instance antar class. 38 2.12.2 Query Rule Based Query Rule Based merupakan sebuah aturan yang menjadi acuan pada proses pencarian informasi dengan kata kunci bahasa alami (natural language) indonesia. Tipe query yang digunakan untuk acuan implementasi ini dengan penyusunan aturan produksi (production rule). Berdasarkan identifikasi yang telah dilakukan Andayani yang digunakan pada penelitian Wibisono (2013) , terdapat tujuh tipe query sebagai berikut: 1. Tipe q _ a (query – atribut) Tipe query ini hanya berisi satu atribut pada kalimat yang berfungsi sebagai pertanyaan atau pernyataan. 2. Tipe q _ a _ a (query – atribut – atribut) Tipe query ini berisi beberapa atribut yang akan ditampilkan. 3. Tipe q _ a _ opr (query – atribut – operator) Tipe query berisi satu atribut yang akan ditampilkan dan mempunyai satu kondisi. 4. Tipe q _ a _ a _ opr (query – atribut – atribut – operator – atribut – operator) Tipe query berisi beberapa atribut yang akan ditampilkan dan beberapa kondisi. 5. Tipe q _ a _ opr _ data (query – atribut – operator – <data>) Tipe query berisi beberapa atribut yang akan ditampilkan dan kondisi operator ‘lebih’, ‘kurang’, ‘sebelum’ atau ‘sesudah’. 6. Tipe q _ a _ bukan (query – atribut – bukan – data) Tipe query berisi sebuah atribut yang akan ditampilkan dan kondisi operator ‘bukan’ atau ‘tidak’ atau ‘selain’. 39 7. Tipe q _ a _ a _ bukan (query – atribut – atribut – bukan – data) Tipe query berisi beberapa atribut yang akan ditampilkan dan kondisi operator ‘bukan’ atau ‘tidak’ atau ‘selain’. 2.13 Metode Nine Step Kimball Metodologi yang digunakan perancangan basis data untuk semantic data warehouse adalah metodologi sembilan langkah atau tahap (Nine-Step Methodology) yang dikemukan oleh Kimball. Kesembilan langkah tersebut meliputi: 1. Pemilihan Proses (Choosing the process) Pada tahap ini yang dilakukan adalah data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting. 2. Pemilihan Sumber (Choosing the grain) Pemilihan sumber data untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta. Misal, jika sumber data dari sebuah tabel fakta properti sale adalah properti sale individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan yang membeli properti utama. 3. Mengidentifikasi Dimensi (Identifying and conforming the dimensions) Pada tahap identifikasi dimensi ini yang dilakukan adalah: a. Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk memahami dan menggunakan data mart. b. Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta. 40 c. Jika ada dimensi yang muncul pada dua data mart, kedua data mart tersebut harus berdimensi sama, atau paling tidak salah satunya berupa subset matematis dari yang lainnya. d. Jika sebuah dimensi digunakan pada dua data mart atau lebih, dan dimensi ini tidak disinkronisasi, maka keseluruhan data warehouse akan gagal, karena dua data mart tidak bisa digunakan secara bersama-sama. 4. Pemilihan Fakta (Choosing the facts) Pada tahap pemilahan fakta yang dilakukan adalah: a. Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart. b. Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber. 5. Menyimpan Pre-kalkulasi di Tabel Fakta (Storing pre-calculations in the fact table) Tabel fakta merupakan tabel utama dalam data warehouse, semua informasi yang ingin dicapai lewat data warehouse melalui tabel fakta. Banyak proses kalkulasi dilakukan terhadap tabel fakta, dan untuk memudahkan dalam implementasi ke data warehouse perlu menyimpan hasil pre-kalkulasi tersebut. 6. Melengkapi Tabel Dimensi (Rounding out the dimension tables) Pada tahap ini yang kita lakukan adalah: a. Menambahkan keterangan selengkap-lengkapnya pada tabel dimensi. b. Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna. 41 7. Pemilihan Durasi Basis Data (Choosing the duration of the database) Berdasarkan kegunaan dari basis data yang dibuat maka pada tahap ini ditentukan berapa lama data tersebut tersimpan. 8. Menelusuri Perubahan Dimensi Secara Perlahan (Tracking slowly changing dimensions) Ada tiga tipe perubahan dimensi yang perlahan, yaitu : a. Atribut dimensi yang telah berubah tertulis ulang b. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru c. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama. 9. Menentukan Prioritas dan Mode Query (Deciding the query priorities and the query modes) Setelah langkah 1 sampai dengan 8 dilalui, maka pada tahap ini kita menggunakan perancangan fisik. Tahap perancangan fisik ini menghasilkan data warehouse yang siap diimplementasikan. Untuk itu perlu dibuat sebuah sistem atau aplikasi yang didalamnya berisi query-query yang digunakan untuk dapat menampilkan data yang diinginkan oleh pengguna. 2.14 PHP (PHP: Hypertext Preprocessor) 2.14.1 Pengantar PHP (PHP:Hypertext Preprocessor) PHP adalah bahasa atau script yang dijalankan pada sisi server yang diciptakan khusus untuk pengembangan web. Di dalam halaman HTML kita dapat menambahkan kode PHP yang akan dijalankan pada saat halaman dikunjungi. Kode PHP yang 42 ditanamkan akan dijalankan oleh web server dan men-generate HTML atau output lain yang akan dilihat oleh pengunjung. PHP dibuat pada tahun 1994 oleh Rasmus Lerdorf. Kemudian dikembangkan oleh para ahli di seluruh dunia. Pada Januari 2001, PHP digunakan hampir sekitar lima juta domain di seluruh dunia dan terus berkembang dengan pesatnya. Kebanyakan dari sintaks PHP dipinjam Perl, C, dan Java dengan beberapa penambahan corak spesial PHP. PHP biasanya sering digunakan bersama web server apache diberagam sistem operasi. PHP dikembangkan sepenuhnya untuk bahasa skrip server-side programming. PHP bersifat open source, kita dapat mengakses langsung ke source code PHP dan dapat digabungkan dengan berbagai server yang berbeda-beda. PHP mempunyai kemampuan mengakses database dan diintegrasikan dengan HTML. PHP semakin populer karena memiliki beberapa kelebihan, antara lain : a. Mudah dibuat dan dijalankan. b. Mampu berjalan pada web server dengan sistem operasi yang berbeda-beda, seperti sistem operasi UNIX, keluarga windows, dan macintosh. c. PHP bisa didapatkan secara gratis. d. Dapat berjalan pada web server yang berbeda, seperti Microsoft Personal Web Server, Apache, IIS, Xitami, dll. 2.14.2 Framework Codeigniter Codeigniter merupakan framework PHP yang diklaim memiliki eksekusi tercepat dibandingkan dengan framework yang lainnya (Saputra, 2011). Codeigniter bersifat open source dan menggunakan model basis MVC (Model Veiw Controller), yang merupakan model konsep modern framework yang digunakan saat ini. Dengan 43 konsep MVC ini, segala macam logika dan layout telah dipisahkan, sehingga si programmer dan designer dapat mengerjakan masing-masing tugasnyan secara fokus. Konsep MVC juga dapat menuntun para pembuat program untuk membangun web dengan cara yang terstruktur. Dilihat dari cara kerjanya, framework codeigniter menekankan pada MVC. Untuk alurnya dapat dilihat pada Gambar 2.9 dibawah ini. Gambar 2.9 Konsep MVC (Sumber : Saputra, 2011) 1. Model, digunakan sebagai presentasi database. Berbeda dengan framework CadePHP. Dalam Codeigniter, segala macam perintah-perintah query SQL diletakkan dalam file model, seperti insert, edit, delete, dan select. Karena semuanya berhubungan dengan database. 2. Controller, digunakan sebagai pengendali (control) antara view dan model melalui permintaan dari HTTP. 3. View, suatu halaman khusus yang digunakan untuk menyajikan informasi kepada client. Secara definisi, segala macam permintaan yang dikelola oleh controller dan model, akan dikembalikan kepada view sesuai hasi permintaan yang di-request. 44 Alur kerjanya dapat dilihat pada Gambar 2.10 berikut ini. Gambar 2.10 Alur Kerja MVC (Sumber: Saputra, 2011) Dari gambar 2.2 dapat dijelaskan sebagai berikut: 1. Index.php merupakan controller awal yang menginiliasisakan kebutuhan untuk menjalankan Codeigniter. 2. Router/Routing merupakan bagian yang menentukan kegiatan yang harus dilakukan ketika ada request/permintaan dari client/browser. 3. Caching merupakan bagian yang mengcek apakah data sudah pernah diminta atau belum. Jika cache dalam keadaan aktif, maka akan langsung dikirimkan kepada client/browser dengan mengabaikan alur kerja normal. 4. Security, sebelum apalikasi dikirimkan, maka akan terlebih dahulu data tersebut difilter sebagai keamanan. 5. Controller merupakan pengendali dari jalannya aplikasi dan akan segera memproses sesuai request/permintaan yang diminta, yaitu models, libraries, helpers, plugins, dan scripts. 6. View merupakan bagian dari menyajikan suatu informasi ke client/browser sesuai dengan permintaan yang diminta (setelah melewati tahap 1 s/d 5). 45 2.15 Database MySQL MySQL merupakan database yang populer digunakan karena kemudahannya, kecepatan kinerja, dan memenuhi kebutuhan database perusahaan-perusahaan skala menengah kecil. Keuntungan lainnya adalah bahwa software ini sudah open source, yang berarti dapat dipergunakan dan didistribusikan baik untuk pribadi maupun komersial secara bebas. MySQL dikenal sebagai database yang pertama kali didukung oleh bahasa pemrograman skrip untuk internet, misal PHP dan Perl. MySQL dan PHP dianggap sebagai pasangan software pengembangan aplikasi berbasis web yang ideal. Antar muka untuk aplikasi database MySQL dapat menggunakan bahasa pemrograman umum seperti Java, C/C++, MS Visual Basic ataupun Borland Delphi. Hasil akhir dari model aplikasi yang dihasilkan adalah aplikasi Client/Server. Umumnya akses kepada database MySQL dari bahasa pemrograman yang disebutkan di atas jika di lingkungan Windows menggunakan MyODBC, driver koneksi database dengan menggunakan standar ODBC. Paket distribusi software MySQL terdiri atas komponen: 1. Server SQL merupakan komponen yang menjadi inti dari MySQL, sebagai engine, dan menyediakan akses kepada database. 2. Program client untuk mengakses server program interaktif yang memungkinkan kita untuk melakukan query dan manipulasi data kemudian melihat hasilnya secara langsung, program untuk administratif dan utilitas. Hanya satu utilitas yang digunakan untuk melakukan pengendalian server, lainnya untuk mengekspor, impor data, memeriksa hak akses dan lain-lainnya. 3. Sekumpulan library untuk menulis program untuk mengakses server merupakan kumpulan library fungsi yang dapat digunakan untuk membuat program client sendiri dengan menggunakan bahasa C, karena library yang 46 disediakan menggunakan C, sebenarnya bisa juga untuk digunakan oleh bahasa pemrograman lain. 2.16 Teknik Pengujian Sistem 2.16.1 Pengujian Black Box Menurut Luqman (2012), pengujian black box merupakan tahap yang berfokus pada pernyataan fungsional perangkat lunak. Test case ini bertujuan untuk menunjukan fungsi perangkat lunak tentang cara beroperasinya. Apakah pemasukan data telah berjalan sebagaimana mestinya dan apakah informasi yang tersimpan dapat dijaga kemutahirannya. Selain itu juga black box adalah pengujian yang dilakukan hanya mengamati hasil eksekusi melalui data uji dan memeriksa fungsional dari perangkat lunak. Jadi dianalogikan seperti melihat suatu kotak hitam, hanya bisa melihat penampilan luarnya saja, tanpa tau ada apa dibalik bungkus hitam nya. Pengujian black box berfokus pada pengujian persyaratan fungsional perangkat lunak, untuk mendapatkan serangkaian kondisi input yang sesuai dengan persyaratan fungsional suatu program. Dengan demikian, pengujian black box memungkinkan pembuat perangkat lunak mandapatkan serangkaian kondisi input yang sepenuhnya menggunakan semua persyaratan fungsional untuk suatu program. Pengujian black box berusah menemukan kesalahan dalam beberapa hal yaitu: a. Fungsi-fungsi yang tidak benar atau salah. b. Kesalahan interface. c. Kesalahan dalam struktur data atau akses database. d. Kesalahan kinerja, analisa, dan kesalahan terminasi. 47 2.16.2 Teknik Angket Kuesioner atau angket merupakan teknik pengumpulan data yang dilakukan dengan cara memberi seperangkat pertanyaan atau pernyataan tertulis kepada responden untuk dijawabnya (Sugiyono, 2013). Sedangkan menurut Sutoyo (2012), kuesioner atau angket merupakan sejumlah pertanyaan atau pernyataan tertulis tentang data faktual atau opini yang berkaitan dengan diri responden, yang dianggap fakta atau kebenaran yang diketahui dan perlu dijawab oleh responden. Kuesioner cocok apabila digunakan pada responden yang jumlahnya cukup besar dan tersebar di wilayah yang luas.