BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Data Menurut Inmon (2005,p.493) Data adalah suatu pencetakan dari fakta, konsep, atau instruksi dalam suatu media penyimpanan untuk komunikasi, pencarian, dan pemprosesan dengan menggunakan alat otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh manusia. Menurut O’Brien (2005, p.38), Data adalah fakta atau observasi mentah, yang biasanya mengenai fenomena fisik atau transaksi bisnis. Dari kutipan diatas, dapat disimpulkan bahwa data adalah kumpulan dari fakta-fakta yang di dapat dari sekitar lingkungan yang bisa diolah sehingga menghasilkan informasi yang dibutuhkan oleh penggunanya. 2.1.2 Informasi Menurut Inmon (2005, p498), informasi adalah data yang dikumpulkan dan dievaluasi untuk memecahkan suatu masalah atau membuat keputusan. Menurut O’Brien (2005, p38) informasi adalah data yang telah diubah menjadi konteks yang berarti dan berguna bagi para pengguna akhir tertentu. Menurut Sharm Manwani (2008, Journal of Information Technology Case and Application Research / page 39-53). Keterampilan informasi telah dibedakan oleh struktur-struktur dari data relative. Teknologi yang digunakan untuk mengelolah struktur data berasal dari file yang berkembang ke dalam aplikasi seperti perencanaan sumber daya perusahaan dan data warehouse. 6 7 Sebuah perbedaan lebih lanjut dalam pengelolan informasi adalah adanya kontrol dan eksploitasi. Dari kutipan diatas, dapat disimpulkan bahwa informasi adalah data yang telah diubah menjadi pesan yang berbentuk dokumen yang memiliki arti dan berguna bagi penggunanya atau daya guna bagi seseorang. 2.1.3 Database Menurut Connolly dan Begg (2005, p14), database adalah sekumpulan data dan deskripsi dari data yang berhubungan secara logical didesain untuk menemukan kebutuhan informasi dari organisasi. Menurut McLeod & Schell (2004, p130), Database adalah kumpulan dari seluruh data berbasis komputer dalam suatu organisasi. Menurut O'Brien (2005, p211), Database adalah kumpulan terintegrasi dari elemen data yang secara logika saling berhubungan. Dari kutipan diatas, dapat disimpulkan bahwa Database adalah suatu kumpulan dari elemen, ralasi atau file-file yang saling terintegrasi untuk digunakan bersama dan dapat digunakan untuk memperoleh informasi yang dibutuhkan perusahaan. 2.1.4 Data warehouse Menurut Inmon (2005, p29) Data warehouse adalah sebuah kumpulan data yang integrated, subject oriented, nonvolatile, dan time variant yang mendukung manajemen pengambilan keputusan. Menurut McLeod & Schell (2004, p. 406) data warehouse adalah suatu penyimpanan data, dimana kapasitasnya yang sangat besar, dan data 8 diakumulasikan dengan menambahkan dokumen-dokumen baru dengan memperbaharui dokumen lama dengan informasi yang baru. Menurut Pedro Furtado (2009) Data warehouse adalah suatu teknologi penting bagi organisasi yang kompetitif di dunia global saat ini, kecepatanm ukuran dan operasi pendistribusian merupakan tantangan utama terhadap sistem tersebut. Berdasarkan teori-teori tersebut dapat disimpulkan bahwa data warehouse merupakan kumpulan data atau record dalam system komputer yang saling berelasi secara logikal satu dengan yang lainnya untuk pengambilan keputusan di tingkat manajerial. 2.1.5 Perbandingan Data Operasional dan Data warehouse Menurut Inmon (2005, p15), secara umum perbandingan data operasional dan data warehouse : Data Operasional Data warehouse Berorientasi Aplikasi Berorientasi Subjek Detail Ringkas dan telah disaring Dapat di – update Tidak Dapat di – update Disajikan Disajikan untuk komunitas operasional untuk komunitas manajerial Sesuai dengan SDLC Siklus hidup yang lengkap Jumlah data yang diproses kecil Data yang diproses besar Non-Redundancy (normalisasi) Redudancy (denormalisasi) Struktur yang tetap/statis Struktur yang fleksibel Mendukung operasional sehari – hari Mendukung kebutuhan manajerial 9 Pengaksesan data besar Tabel Pengaksesan data kecil atau sedang 2.1 Perbandingan Umum antara Data Operasional dan Data warehouse (Inmon, 2005, p15) 2.1.6 Karakteristik Data warehouse Karakteristik data warehouse menurut Inmon (2005, p30-p33), yaitu : 1. Berorientasi subyek (Subject Oriented) Data warehouse berorientasi subyek adalah data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasi disekitar subject-subject utama dari perusahaan (Customers, diorganisasikan pada products, area-area dan aplikasi sales) dan tidak utama (Customer invoicing, stock control , dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjung suatu keputusan daripada aplikasi yang berorientasi terhadap data. Jadi, dengan kata lain, data yang disimpan adalah berorientasi kepada subject bukan terhadap proses. Secara garis besar perbedaan anatara data operasional dan data warehouse yaitu : 10 Gambar 2.1 Subject Orientation (Inmon 2005,p30) 2. Terintegrasi (Integrated) Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah ke dalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara seperti konsisten dalam penamaan variable, konsisten dalam ukuran variable, konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terhadap berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu mungkin dalam aplikasi-aplikasi 11 tersebut ada variable yang memiliki tujuan yang sama, tetapi nama dan formatnya berbeda. Variabel tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi keracunan Karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya. Gambar 2.2 Integration (Inmon 2005, p31) 3. Non-Volatile Karakteristik keempat dari data warehouse adalah non-volatile, maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara regular. Berbeda dengan database operasional yang dapat melakukan update, insert dan delete terhadap data yang mengubah isi dari 12 database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilkan laporan yang dibutuhkan, tidak ada kegiatan updating data). Gambar 2.3 Non-Volatile (Inmon 2005, p32) 4. Time Variant (Rentang waktu) Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain : Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun kedepan. Cara yang kedua, dengan menggunakan variasi atau perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun ecplicit. Secara explicit dengan 13 unsure waktu dalam hari, minggu, bulan dan sebagainya. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan atau per tiga bulan. Unsure waktu akan tetap ada secara implicit didalam data tersebut. Cara yang ketiga, variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only. Gambar 2.4 Time Variant (Inomn 2005,p32) 2.1.7 Struktur Data warehouse Berdasarkan Inmon (2005, p33-34), struktur data warehouse menunjukan level detil yang berbeda dalam data warehouse. Terdapat older level of detail, current level of detail, level of lighty seummarized data (level data mart) dan level of highly semmarized data. Data mengalir ke dalam data warehouse dari lingkungan operasional. Biasanya transformasi penting dari data terjadi pada jalur dari level data operasional ke level data warehouse. 14 Sekali data disimpan, data melalui current detail ke older detail. Selama data diringkas, data melalui current detail ke lightly summarized data, kemudian dari lightly summarized data ke highly summarized data. Gambar 2.5 Struktur data warehouse Inmon (2005, p34) Komponen – komponen struktur data warehouse sebagai berikut: 1. Current Detail Data Data yang mencerminkan keadaan yang sedang berjalan dan merupakan tahap terendah dari data warehouse.Maka,data di tahap ini belum efisien untuk digunakan sekalipun datanya detail.Hal ini dikarenakan proses analisis data menjadi rumit jika dilakukan dengan data dalam jumlah yang besar.Biasanya current detail memerlukan penyimpanan yang besar. 15 2. Old Detail Data Data lama atau histori berupa hasil backup yang disimpan dalam media penyimpanan yang terpisah, seperti tape atau disk dengan frekuansi akses yang relatif rendah. file atau directory dari data ini disusun berdasarkan umur daari data untuk mempermudahkan pencarian atau pengaksesan kembali. 3. Lightly Summarized Data Data yang merupakan hasil ringkasan dari current detail data, namun sifatnya belum merupakan ringkasan secara total dan masih bersifat detil.Akses data ini yang biasanya digunakan untuk view data dari suatu kondisi yang sedang berjalan atau yang sudah berjalan. 4. Highly Summararized Data Data hasil summary yang bersifat total dan mudah diakses.Data di tahap ini dapat digunakan untuk mengambil keputusan di tingkat eksekutif perusahaan karenan dianggap sudah representatif dan ringkas.Data ini mencerminkan keseluruhan sehingga eksekutif tidak perlu membaca dan menganalisis data dalam waktu yang lama. 5. Metadata 16 Metadata adalah informasi yang ada di dalam data warehouse yang mendeskripsikan mengenai struktur, isi, kunci, indeks dan hal lain mengenai data. 2.1.8 Keuntungan Data warehouse Menurut Connolly dan Begg (2005, p1152), Data warehouse adalah yang telah diimplementasi dengan baik dapat memberikan keuntungan yang besar bagi organisasi, yaitu : Potensi nilai kembali yang besat pada investasi Sebuah organisasi harus mengeluarkan uang dan sumber daya salam jumlah yang cukup besar untuk memastikan kalau data warehouse telah diimplementasikan dengan baik, biaya yang dikeluarkan tergantung dari solusi teknikal yang diinginkan. Akan tetapi, setelah data warehouse digunakan, maka kemungkinan didapatkannya ROI (Return on Investment) relatif lebih besar. Keuntungan kompetitif Keuntungan kompetitif didapatkan apabila pengambilan keputusan mengakses data yang dapat mengungkapkan informasi yang sebelumnya tidak diketahui, tidak tersedia, misalnya informasi mengenai konsumen, trend, dan permintaan. Meningkatkan produktivitas para pengambilan keputusan perusahaan Data warehouse meningkatkan produktivitas para pengambil keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi secara konsisten, berorientasi pada subjek, dan data hitoris. Data warehouse menintegrasikan data dari beberapa sistem 17 yang tidak compatible ke dalam bentuk yang menyediakan satu pandangan yang konsisten dari organisasi. Dengan mengubah data menjadi informasi yang berguna, maka seorang manajer bisnis dapat membuat analisa yang lebih akurat dan konsisten. 2.1.9 Arsitektur Data warehouse Komponen utama data warehouse menurut Connoly & Begg (2005, p1156) yaitu : 1. Operational Data Operational data adalah data yang digunakan untuk mendukung jalannya operasi bisnis sehari-hari. 2. Operasional Data Store (ODS) Operational data store (ODS) adalah suatu media penyimpanan dan pengintegrasian data operasional yang digunakan untuk analisis. ODS biasanya dibuat ketika sistem operasional yang lama tidak mampu mencapai kebutuhan laporan. Membuat ODS dapat menjadi langkah yang membantu dalam membangun suatu data warehouse karena ODS dapat menyalurkan data yang telah diextract dari sistem sumber dan “dibersihkan”. Artinya, sisa pekerjaan dari mengintegrasi dan merestrukturisasi data pada data warehouse menjadi lebih sederhana. 3. Load Manager Load manager (disebut font-end component) melaksanakan semua operasi yang berhubungan dengan proces extracting dan loading data kedalam data warehouse. 18 Operasi yang dilakukan oleh load manager dapat meliputi perubahan bentuk yang sederhana dari data untuk dipersiapkan sebelum masuk ke data warehouse. 4. Warehouse Manager Warehouse Manager melaksanakan semua operasi yang berhubungan management data didalam data warehouse. Operasi yang dilakukan oleh warehouse manager meliputi : Analisis data untuk memastikan konsistensi Transformasi dan penggabungan sumber data dari tempat penyimpanan data sementara kedalam tabeltabel data warehouse Pembuatan indeks dan view pada table Melakukan denormalisasi Melakukan agregasi Melakukan back-up dan mengarsip data 5. Query Manager Query manager (disebut juga back-end component) melaksanakan semua operasi yang berhubungan dengan manajemen user query. Kompleksitas query manager ditentukan oleh fasilitas yang disajikan melalui peralatan akses para end user database. Operasi yang dilakukan meliputi pengarahan query pada table yang sesuai dan penjadwalan pelaksanaan query. Query manager juga mengijinkan warehouse manager menentukan kesesuaian indeks dan agregasi. 19 6. Detailed Data Detailed data menyimpan semua detail data yang terperinci didalam skema database. Umumnya, detailed data tidak tersimpan secara online melainkan dibuat tersedia dengan melakukan penjumlahan (aggregation) terhadap data ke detail tingkat berikutnya. Biasanya detailed data ditambahkan ke warehouse untuk menambahkan data yang terintegrasi. 7. Lightly and highly summarized data Area ini menyimpan semua data linghtly and highly summarized data yang dihasilkan oleh warehouse manager. Area ini merupakan tempat penampungan sementara sebelum dilakukan perubahan untuk merespon perubahan profil query. 8. Archive or Backup Data Area data warehouse ini menyimpan semua detailed data dan ringkasan data untuk kepentingan archiving and backup. Meskipun ringkasan data dibuat dari detil data, sangat memungkinkan untuk membuat cadangan ringkasan data secara online jika data ini ditunjukan melebihi penyimpanan waktu untuk detil data. 9. Metadata Area data warehouse ini menyimpan semua definisi metadata (data tentang data) yang digunakan oleh semua proses di data warehouse. 20 10. End-User Access Tools Tujuan utama dari data warehouse adalah menyajikan informasi berupa laporan kepada user untuk mendukung pengambilan keputusan stategis. Data warehouse harus mendukung analisis rutin dan ad hoc secara efisien. Berdasarkan kategori Menurut Connoly and Begg (2005, p1160) yang dikemukakan oleh Berson dan Smith terdapat lima grup utama dari tools tersebut, anatara lain : Sebagai alat untuk laporan query Menghasilkan program laporan tertulis, sedangkan query tools didesain untuk menerima SQL atau menghasilkan pertanyaan SQL untuk men-query data di dalam data warehouse. Perangkat pengembangan aplikasi Keperluan end-user dari laporan dan alat query terkadang tidak cukup karena analisis yang dilakukan tidak dapat ditampilkan atau diperlukannya keahlian yang tinggi dari user. Perangkat Executive Information System (EIS) Executive Information System (EIS), dikembangkan untuk mendukung pembuatan keputusan tingkat tinggi. Alat EIS membangun pendukung berhubungan dengan mainframe untuk aplikasi grafik menyediakan sebuah kebiasaan-kebiasaan, keputusan untuk 21 gambaran data-data organisasi dan akses ke sumber data luar. Perangkat Online Analytical Processing (OLAP) Perangkat OLAP berdasarkan dari konsep multidimensional database dan mengijinkan pengguna untuk menganlisa dan menggunakan kompleks multidimensional views. Aplikasi ini berguna untuk menilai keefektifan marketing dan rencana kapasitas serta memperkirakan penjualan. Perangkat data mining Data mining merupakan proses penemuan hubungan baru, pola, arah yang baru dengan menganalisa sejumlah data menggunakan statistic, matematika, dan teknik artificial intelligent. Data mining memiliki potensi untuk menggantikan kemampuan OLAP tools, dikarenakan daya tarik utama dari data mining adalah kemampuannya untuk memprediksi sekedar melihat data lampau. daripada hanya 22 Gambar 2.6 Arsitektur Data warehouse (Connoly and Begg, 2005, p1053) 2.1.10 Aliran Data dalam Data warehouse Menurut Connolly dan Begg (2005,p1162), Data warehouse berfokus pada management lima arus data primen, yaitu : 2.1.10.1 Inflow Merupakan proses ekstrsaksi, pembersihan, dan pengisian data dari sumber data ke dalam data warehouse. Proses inflow ini berkonsentrasi pada proses mengambil data dari sumber sistem dan memasukkannya ke dalam data warehouse. Cara lainnya yaitu data dimasukkan ke dalam operational data store (ODS) sebelum dikirim ke data warehouse. Proses rekonstruksi dari data meliputi : 23 Membersihkan data yang kotor. Restrukturisasi data untuk dicocokan dengan kebutuhan dari data warehouse, contohnya menambah atau membuang fieldfield, dan denormalisasi data. Memastikan bahwa sumber data konsisten dengan dirinya sendiri dan dengan data lainnya yang sudah ada di data warehouse. 2.1.10.2 Upflow Merupakan penambahan nilai ke dalam data di dalam data warehouse melalui peringkasan, pemaketan, dan distribusi data. Aktivitas yang berhubungan dengan upflow yaitu sebagai berikut Meringkas data dengan proses memilih, memperhitungkan, menggabungkan dan mengelompokan data relasional ke dalam tampilan yang lebih baik dan berguna bagi user. Pengepakan data dengan mengubah data yang detail ke dalam format yang lebih berguna seperti spreadsheets, teks dokumen, diagram, tampilan grafik yang lain, database pribadi dan animasi. Mendistribusikan data ke kelompok-kelompok yang tepat untuk meningkatkan dan dapat diakses. 2.1.10.3 Downflow Merupakan proses mengambil dan mem-backup data dalam data warehouse. Menyimpan data lama memainkan 24 peranan yang penting di dalam mempertahankan penampilan dan efektifitas dari warehouse dengan mengirimkan data lama dengan nilai yang terbatas ke sebuah tempat penyimpanan seperti magnetic tape atau optical disk. Downflow dari data juga meliputi proses yang memastikan bahwa kondisi sekarang dari data warehouse dapat dibangun kembali jika tejadi kehilangan data, kegagalan software atau hardware. 2.1.10.4 Outflow Merupakan proses membuat data agar tersedia bagi end-user. Outflow merupakan kondisi dimana manfaat dari data warehouse benar-benar dirasakan oleh sebuah organisasi. Dua aktivitas kunci yang terdapat pada outflow yaitu sebagai berikut : Pengaksesan, dimana berhubungan dengan proses memuaskan pemakai akhir dengan menyediakan data yang dibutuhkan oleh mereka. Yang menjadi perhatian utama yaitu membuat suatu lingkungan jadi user dapat dengan efektif menggunakan query tool untuk mengakses sumber data yang paling tepat. Frekuensi dari pengaksesan ini dapat bervariasi mulai dari ad hoc, secara rutin, sampai real time. Selain itu juga harus dipastikan bahwa sumber sistem digunakan dengan cara yang paling efektif di dalam menjadwalkan pengeksekusian terhadap query dari user. 25 Pengiriman, dimana berhubungan dengan secara aktif mengirimkan informs ke workstation dari user. Ini merupakan area yang baru dari data wareahouse dan sering dihubungkan dengan proses publish dan subscribe. Wareahouse akan mempublish objek bisnis yang bermacam-macam dan user akan mensubcribe terhadap objek bisnis yang dibutuhkan oleh mereka. 2.1.10.5 Metaflow Merupakan proses memanajemen metadata. Metaflow merupakan proses yang memindahkan metadata (data tentang flow yang lainnya). Metadata merupakan deskripsi dari data di tampung didalam data warehousem apa yang ada di dalamnya, dari aman asalnya, dan apa yang telah dilakukan terhadap data tersebut dengan cara cleansing, integrating dan summarizing. 2.1.11 Data Mart Menurut Conolly dan Begg (2005,p1171), Data mart merupakan bagian dari data warehouse yang mendukung kebutuhan informasi bagian departemen atau fungsi bisnis tertentu. Berikut karateristik yang membedakan antara data mart dengan data warehouse : Data mart berfokus pada kebutuhan pengguna yang berhubungan dengan satu bagian departemen atau fungsi bisnis. Data mart tidak berisi data operasional yang bersifat detil. 26 Data mart lebih dimengerti dan digunakan karena berisi data yang lebih sedikit dibandingkan data warehouse. Menurut Inmon (2005, p494), adalah strukur data yang terbagi-bagi yang diperoleh dari data warehouse dimana data tersebut teleh didenormalisasi berdasarkan kebutuhan informasi manajemen. Jadi berdasarkan teori diatas data mart adalah suatu bagian dari data warehouse yang dapat mendukung pembuatan laporan dan analisis data pada suatu unit, bagian atau operasi perusahaan. 2.1.12 Pengembangan Data Warehouse Menurut Sergio Lujan-Mora and Juan Trujillo (2006, The Journal of computer Information Systems / page 30-56). Tujuan kinerja dalam mengembangkan teknik data warehouse adalah untuk membuat proses pengembangan data warehouse yang lebih efisien. Untuk mencapai tujuan harus mempertimbangkan beberapa alasan sebagai berikut : Metode yang digunakan harus pengembangan data warehouse harus didasarkan pada standar bahasa pemodelan visual. Metode yang digunakan harus memberikan metode yang jelas dan mulus untuk mengembangkan data warehouse. 27 Metode yang dipakai harus menangani semua tahapan data warehouse yang di desain secara terintegrasi dari sumber data operasional dengan pelaksanaan terakhir dan termasuk definisi proses ETL (Extract, Transform and Load) dan pengguna akhir persyaratan. Metode yang digunakan harus menyediakan berbagai tingkatan detail. 2.1.13 Anatomi Data warehouse Dalam menentukan bentuk data warehouse yang akan digunakan oleh suatu perusahaan, terlebih dahulu kita harus mengetahui kebutuhan informasi yang diperlukan oleh perusahaan. Data warehouse terdiri atas tiga jenis dasar sistem, yaitu : 1. Data warehouse Fungsional (Functional Data warehouse) Data warehouse fungsional dibangun berdasarkan kebutuhan informasi dari tiap bagian fungsi bisnis perusahaan. Data warehouse fungsional merupakan pendekatan yang digunakan untuk membangun suatu sistem data warehouse dengan biaya investasi yang rendah. 2. Data warehouse Terpusat (Centralized Data warehouse) Menurut Inmon(2005, p193), kebanyakan organisasi membangun dan memelihara lingkungan data warehouse terpusat yang tunggal. Pengaturan ini masuk akal karena sebagai berikut : a. Data di dalam data warehouse terintegrasi antar perusahaan dan gambaran terintegrasi digunakan hanya pada kantor pusat 28 b. Perusahaan beroperasi pada model bisnis terpusat c. Volume dari data dalam data warehouse seperti tempat penyimpanan tunggal yang terpusat d. Sekalipun data dapat terintegrasi dan diedarkan antar area lokal yang beragam, data tersebut akan tidak praktis untuk diakses. 3. Data warehouse Terdistribusi (Distributed Data warehouse) Perusahaan yang memiliki cabang tersebar di seluruh dunia membutuhkan informasi yang mencakup tidak hanya di wilayah lokal saja tetapi juga wilayah global. Global data warehouse membutuhkan informasi terpadu dari data warehouse tempat informasi dikumpulkan. Disamping itu, ada kebutuhan yang lain untuk data warehouse yang terpisah di setiap cabang perusahaan. Dalam kasus ini, Menurut Inmon (2005,p193), data warehouse terdistribusi dibutuhkan. Tiga tipe dari data warehouse terdistribusi : 1. Data warehouse yang terdistribusi secara geografi terdiri dari data warehouse lokal dan global. 2. Data warehouse yang terdistribusi dalam banyak prosesor, secara logis ada suatu data warehouse tetapi secara fisiknya ada banyak data warehouse yang saling berhubungan. 3. Data warehouse yang tumbuh dalam sumber yang tidak terkoordinasi. 29 2.1.14 ETL (Extract, Transfrom and Loading) Menurut Loshin (2003, p246), Landasan dasar dari sebuah data warehouse adalah bahwa sekumpulan data dari beberapa sumber dikumpulkan lalu ditambahkan ke dalam penyimpanan data dimana aplikasi analitis dapat menggunakannya sebagai data masukan. Extraction Proses ekstraksi adalah pengambilan data dari sumber data internal dan external yang ada yang dilanjutkan ke database tujuan. Pada dasarnya, tujuan proses ekstraksi ini adalah menyiapkan data untuk diproses lebih lanjut pada proses selanjutnya. Transform Proses transformasi adalah proses pengubahan bentuk data agar sesuai dan seragam dengan tujuan data menjadi lebih terintegrasi satu sama lain, sehingga data dalam database tujuan menjadi konsisten. Sebagai contoh adalah proses tranformasi format tanggal, didalam database A, format tanggal adalah 10-10-10, sedangkan di database B adalah 10oct-10, data dari database A dan B akan ditransformasikan sesuai dengan database tujuan, misalnya menjadi 10-Oktober2010. Load Setelah data diproses di tahap Extraction dan Transfrom, data sudah siap untuk dimuat kedalam database tujuan lewat proses 30 Loading, sehingga data dapat membantu dalam proses analisis lebih lanjut ke depannya. 2.1.15 Konsep Pemodelan Data warehouse 1. Model Dimensi (Dimensionality Modeling) Menurut Connolly dan Begg (2005, p1183), Dimensional Modelling adalah teknik logikal design yang bertujuan untuk menghadirkan data dalam bentuk standard dan intuitif yang memungkinkan pengaksesan database dengan performa yang tinggi. Beberapa konsep pemodelan data warehouse pada dimensionality modeling, antara lain Skema Bintang, Skema Snowflake, dan Skema Starflake. a. Skema Bintang (Star Schema) Menurut Connolly dan Begg (2005, p1183), skema bintang adalah sebah struktur logikal yang memiliki tabel fakta ditengahnya, yang terdiri atas data factual, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data. Skema bintang mengeksploitasi karakteristik data factual seperti fakta yang digeneresikan oleh events yang muncul pada waktu yang lampau dan tidak berubah. Skema bintang dapat digunakan untuk mempercepat kinerja query dengan informasi referensi denormalisasi ke tabel dimensi tunggal. Skema bintang memiliki beberapa kelebihan yang tidak ada dalam struktur relasional biasa. Keuntungan skema bintang yaitu : 31 Efisiensi, struktur database konsisten sehingga efisien dalam mengakses data dengan menggunakan tool untuk menampilkan data termasuk laporan tertulis dan query. Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang dapat beradaptasi terhadap perubahan kebutuhan pengguna karena semua tabel dimensi memiliki kesamaan dalam hal menyediakan akses ke tabel fakta. Extensibility, model dimensional dapat dikembangkan. Seperti menambah tabel fakta selama data masih konsisten, menambah tabel dimensi selama ada nilai tunggal di tabel dimensi tersebut yang mendefinisikan setiap record tabel fakta yang ada, menambahkan attribute tabel dimensi, dan memecah record tabel dimensi yang ada menjadi level yang lebih rendah daripada level sebelumnya. Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan standar untuk menangani situasi umum di dunia bisnis yang terus bertambah. Proses query yang bisa diprediksi, aplikasi data warehouse yang mencari data dari level yang dibawahnya akan mudah menambahkan jumlah attribute pada tabel dimensi dari sebuah skema bintang. Aplikasi yang mencari data dari level yang setara akan menghubungkan tabel fakta yang terpisah melalui tabel dimensi yang dapat diakses bersama. 32 Gambar 2.7 Star Schema (Connolly & Begg, 2005, p1184) b. Skema Snowflake (Snowflake Schema) Menurut Connolly dan Begg (2005, p1184), skema snowflake adalah variasi lain dari skema bintang dimana table dimensi tidak berisi data denormalisasi. Suatu tabel dimensi diperbolehkan memiliki tabel dimensi lainnya. 33 Gambar 2.8 Snowflake Schema (Connolly & Begg, 2005, p1185) c. Skema Starflake (Starflake Schema) Menurut Skema starflake Connolly adalah dan struktur Begg (2005, p1185), yang diturunkan dari penggabungan konsep star schema dan snowflake schema. Beberapa dimensi memiliki kemungkinan untuk dibentuk dengan kedua konsep star schema dan snowflake schema tergantung kebutuhan akan query yang dimiliki. 2. Tabel Fakta dan Tabel Dimensi a. Tabel Fakta Menurut Connolly dan Begg (2005, p1183), Tabel Fakta adalah sebuah tabel pada dimensional 34 model yang isinya composite Primary Key (PK). Jadi, Primary Key pada tabel fakta merupakan beberapa Foreign Key (FK). b. Tabel dimensi Menurut Connolly dan Begg (2005, p1183), Tabel Dimensi merupakan sekumpulan dari tabel-tabel yang lebih kecil yang memiliki sebuah primary key sederhana yang merespon secara benar terhadap salah satu komponen dari composite key yang ada dari tabel fakta. 2.1.16 Entity Relationship Modeling Menurut Connoly dan Begg (2005, p342), Pemodelan Entity Relationship adalah pendekatan dari atas kebawah untuk merancang database yang dimulai dengan mengidentifikasi data yang penting yang dikenal dengan sebutan entitas dan hubungan antara data harus diperlihatkan dalam model ini. Konsep dasar dari pemodelan ER antara lain : 1. Entity Type (Tipe Entitas) Menurut Connolly dan Beg(2005,p343), entity type ialah sekumpulan objek dengan property yang sama, dimana diidentifikasi oleh perusahaan karena mempunyai keadaan bebas. Menurut Connolly dan Begg(2005.p333), entity occurrence ialah objek yang diidentifikasi secara unik dari entity type. Entity type 35 digambarkan dalam bentuk bujur sangkar dengan diberi nama entitas, yang umumnya adalah kata benda tunggal, dapat dilihat pada gambar di bawah ini : Gambar 2.9 Diagram dari Entity Type Branch dan Staff (Connolly dan Begg 2005,p345) 2. Relationship (Hubungan) Menurut Connoly dan Begg(2005,p346), Relationship Type adalah sekumpulan asosiasi yang berarti diantara entity types. Sedangkan, relationship occurrence ialah sebuah asosiasi yang dapat diidentifikasi secara unik dimana terdiri dari 1 occurrence dari masing – masing entity type yang berhubungan. 36 Gambar 2.10 Diagram dari relationship type Branch mempunyai staff (Connoly dan Begg, 2005, p 347) 3. Attribute (Atribut) Menurut Connoly dan Begg(2005,p350), atribut ialah property dari sebuah entitas atau relationship type. Contohnya, staff memiliki atribut staffNo, nama, posisi, dan gaji. 2.1.17 OLTP (Online Transaction Processing) Menurut Connolly dan Begg (2055, p 1149), OLTP adalah suatu sistem yang telah dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi yang pada umumnya membuat perubahan yang kecil bagi data operasional organisasi. Oleh karena itu, data organisasi memrlukan penanganan operasinya setiap hari. 37 Ukuran database OLTP dapat berkisar dari database berukuran kecil (beberapa Megabytes (Mb)), database berukuran menengah/medium (Gigabytes (Gb)), database berukuran besar (Terabytes(Tb)), atau bahkan sampai penyimpanan yang sangat besar hingga Petabytes(Pb). 2.1.18 OLAP(Online Analytical Processing) Menurut Connlly & Begg (2005, p1101), OLAP (Online Analytical Processing) adalah sintetis, analisis dan konsolidasi dinamis dari sejumlah besar multidimensional data. Manfaat yang didapat dari implementasi aplikasi OLAP yang berhasil, antara lain (Connolly & Begg, 2005, p1104) : Meningkatkan produktivitas dari end-user bisnis, pengembang IT, dan juga seluruh organisasi. Akses yang lebih terkendali dan terencana terhadap informasi strategi dapat menyediakan pengambilan keputusan yang efektif. Mengurangi backlog pengembangan aplikasi untuk staff IT dengan membuat end-user dapat membuat perubahan skema mereka sendiri dan membangun model milik mereka sendiri. Mempertahankan kendali organisasi melalui integritas data yang berhubungan sebagai aplikasi OLAP yang 38 tergantung pada data warehouse dan sistem OLTP untuk me-refresh sumber data. Meningkatkan pendapatan dan profitabilitas yang potensial dengan cara memampukan organisasi untuk merespon lebih cepat terhadap permintaan pasar. 2.1.19 Perbandingan Data Warehouse dengan OLTP Menurut Connolly dan Begg (2005, p1153), biasanya sebuah organisasi mempunyai beberapa sistem Online Transaction Processing (OLTP) yang berbeda untuk setiap proses bisnis, seperti proses bisnis, seperti pengawasan persediaan (inventory control), pesanan pelanggan (invoicing customer) dan tingkat penjualan. Sistem ini menghasilkan data operasional yang detil, terbaru dan selalu berubah. Sistem OLTP optimal jika digunakan untuk sejumlah transaksi yang dapat diramalkan (predictable), berulang (repetitive), dan sering diperbaharui (update intensive). Data OLTP diorganisasikan berdasarkan syarat-syarat dari transaksi dihubungkan dengan keputusan per-hari aplikasi bisnis dan mendukung dalam sejumlah besar operasional user yang konkruen. Umumnya organisasi hanya mempunyai satu data warehouse yang menyimpan data secara historis, detil, dan ringkasan dengan beberapa tingkatan dan sangat jarang berubah. Data warehouse didesain untuk mendukung transaksi 39 yang tidak dapat diramalkan (unpredicteable), dan heuristic. Data warehouse diorganisasikan pada syarat-syarat query yang potensial dan mendukung keputusan strategis jangka panjang dari sejumlah kecil user tingkat manajerial. Di bawah ini adalah tabel perbandingan antara sistem OLTP dengan sistem Data warehouse (Connolly dan Begg 2005, p1153) : Sistem OLTP Sistem Data warehouse Mengandung data terkini Mengandung data historis (data lama) Menyimpan data yang rinci Menyimpan data yang rinci, sedang, dan ringkas Data bersifat dinamis Data bersifat statis Prosesnya berulang Prosesnya tidak terstruktur, ditujukan untuk maksud tertentu digunakan untuk analisis Digunakan untuk transaksi Transaksi tingkat menengah sampai rendah Berorientasi pada aplikasi Berorientasi pada subjek Penggunaannya dapat diprediksi Penggunaannya tidak dapat diprediksi Tabel 2.2 Perbandingan Data warehouse dengan OLTP (Connolly dan Begg 2005, p1153) 40 2.1.20 Granularity Menurut Inmon (2005, p41), Granularity adalah masalah desain yang paling penting dalam lingkup data warehouse karena sangat mempengaruhi volume data yang berada di gudang data dan jenis pertanyaan yang dapat di jawab. Volume data di dalam gudang data digunakan pada tingkat detail dari query. 2.1.21 Perancangan Data Warehouse Menurut Connolly dan Begg (2005, p1187), terdapat Sembilan tahapan dalam membangun data warehouse (nine step methodology) yaitu: 1. Pemilihan Proces (Choosing the Process) Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan menjawab pertanyaan bisnis yang penting. Misalnya pilihan terbaik untuk data mart yang pertama adalah yang berkaitan dengan sales, seperti property sales dan property leasing. 2. Memilih Grain Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta. Misalnya, jika sumber dari sebuah tabel fakta property sales adalah individual, maka sumber dari 41 sebuah dimensi pelanggan berisi rincian pelanggan yang membeli property utama. 3. Mengidentifikasi dan menyesuaikan dimensi Mengatur dimensi dari data mart yang dibangun dengan baik akan memberikan kemudahan dalam memahami dan menggunakan data mart tersebut. Dimensi penting untuk menggambarkan fakta-fakta pada tabel fakta. Misalnya, setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan id_pelanggan, no_pelanggan, tipe_pelanggan, tempat_tinggal dan sebagainya. Jika ada dimensi yang muncul pada dua data mart, kedua data mart tersebut harus berdimensi sama atau salah satunya berupa subset matematis dari yang lainnya. Jika sebuah dimensi digunakan pada dua data mart atau lebih dan dimensi ini tidak disinkronisasi, maka keseluruhan data warehouse akan gagal karena dua data mart tidak bisa digunakan secara bersama-sama. 4. Memilih fakta Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart. 42 Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber. Misalnya, jika sumber dari tabel fakta adalah property sale, maka semua fakta numeric harus menunjuk pada particular sale. 5. Meyimpan pre-kalkulasi dalam tabel fakta Ketika fakta sudah dipilih, maka masing-masing fakta tersebut menentukan harus diperiksa kembali apakah ada kemungkinan untuk untuk menggunakan pre-kalkulasi. Contoh umum pemakaian pre-kalkulasi dalam tabel fakta adalah ketika terdapat fakta yang membandingkan rugi dan laba. Pre-kulkalasi dalam tabel fakta akan semakin diperlukan jika tabel fakta didasarkan pada invoice atau penjualan. 6. Melengkapi tabel dimensi Pada tahap ini akan ditambahkan keterangan selengkap-lengkapnya pada tabel dimensi. Keterangan yang ditambahkan harus bersifat intuitif dan mudah dipahami oleh pengguna. 7. Memilih durasi dari database 43 Durasi mengukur waktu dari pembatasan data yang diambil dan dipindahkan kedalam tabel fakta. Sebagai contoh, perusahaan asuransi memiliki kebutuhan untuk menyimpan data dalam jangka waktu 5 tahun atau lebih. Tabel fakta yang besar menimbulkan dua persoalan. Permasalahan pertama, semakin lama umur data, akan muncul pembacaan dan interpretasi terhadap file yang lama. Permasalahan kedua, terdapat kemungkinan digunakan versi dimensi yang lama, bukan versi terbarunya. 8. Melacak perubahan dimensi secara perlahan Mengamati perubahan dari dimensi pada tabel dimensi khususnya data history yang lama atau data lama yang sudah berubah. Ada tiga tipe dasar dari perubahan dimensi yang perlahan, yaitu : Tipe 1. Perubahan dimensi menyebabkan data lama di overwrite. Tipe 2. Perubahan dimensi menyebabkan pembentukan record baru. Tipe 3. Perubahan dimensi menyebabkan pembuatan attribut alternatif sehingga nilai yang lama dan yang 44 baru dapat diakses secara bersama pada dimensi yang sama. 9. Menentukan prioritas dari mode query Pada tahap ini, kita memutuskan perancangan fisik yang akan digunakan, seperti penyotiran urutan tabel pada disk dan keberadaan dari penyimpanan awal ringkasan (summaries) atau penjumlahan (aggregate). Selain itu masalah administrasi backup, kinerja, indeks, dan keamanan juga merupakan faktor yang harus diperhatikan. Dengan langkah-langkah diatas, kita bisa membangun sebuah data warehouse yang baik. 2.2 Teori-teori Khusus 2.2.1 Penjualan Menurut Kotler (2006, p470), proses penjualan adalah langkah-langkah yang dilakukan oleh bagian penjualan dalam penjualan dimana meliputi prosepecting dan standarlisasi, preapproach, approach, presentasi dan demostrasi, mengenai keluhan, closing dan follow-up. Sistem penjualan adalah sebuah sistem yang digunakan untuk mencatat sampai membuat kalkulasi tentang penjualan barang dagangan ke pelanggan baik secara kredit maupun tunai. 45 2.2.2 Pembelian Menurut Kakouris(2006, p709), pembelian sekarang diakui sebagai sebuah fungsi strategis, tidak hanya karena keputusan dibuat oleh manajer pembelian yang memiliki pengaruh besar pada kinerja perusahaan secara keseluruhan, tetapi juga karena para pebisnis harus mengatur proses yang menghubungkan mereka dengan para pemasok mereka. Berdasarkan teori diatas dapat disimpulkan pembelian adalah proses membeli barang atau jasa lalu kita membayar barang atau jasa. 2.2.3 Pengertian Persediaan Menurut Lukman Syamsuddin (2004, p281-285), persediaan dibagi kedalam tiga bentuk utama dari persediaan perusahaan, yaitu : 2.2.3.1 Persediaan barang mentah (raw material inventory) Persediaan barang mentah(Raw Material) adalah merupakan persediaan yang dibeli oleh perusahaan untuk diproses menjadi barang setengah jadi atau produk akhir dari perusahaan. Dalam beberapa hal dimana perusahaan industry memproduksi barang-barang yang sangat kompleks, maka persediaan barang mentah mungkin terdiri dari barang-barang setengah jadi ataupun barang jadi yang sudah diproses oleh perusahaan lain, misalnya perusahaan mobil akan membeli ban atau radio yang merupakan kelengkapan dari mobil yang diproduksinya dari perusahaan lain. Setiap perusahaan 46 industry/manufaktur harus mempunyai persediaan bahan dalam bentuk apapun karena hal tersebut mutlak diperlukan dalam produksi yang dilakukan. Adapun jumlah bahan mentah yang harus dipertahankan oleh perusahaan akan sangat tergantung pada : a. Lead time (waktu yang dibutuhkan sejak saat pemesanan sampai bahan diterima) b. Jumlah pemakaian c. Jumlah investasi dalam persediaan d. Karakteristik fisik dari bahan mentah yang dibutuhkan. Faktor kelancaran lead time perlu dipertimbangkan dengan sebaik-baiknya mengingat adanya tenggang waktu antara saat pemesanan dengan saat penerimaan barang. Dengan kata lain perusahaan perlu menetapkan suatu jumlah minimum pada saat pemesanan bahan sehingga pada saat bahan tersebut diterima jumlah persediaan masih berada pada titik yang memungkinkan perusahaan berproduksi secara normal. Frekuensi atau jumlah pemakaian bahan mentah juga mempengaruhi tingkat persediaan. Semakin sering atau semakin banyak suatu bahan digunakan dalam proses produksi maka akan semakin besar jumlah persediaan bahan yang dibutuhkan oleh perusahaan. Jumlah investasi yang dibutuhkan dalam persediaan akan persediaan perusahaan. sangat mempengaruhi tingkat 47 Faktor lain juga mempengaruhi tingkat persediaan bahan mentah adalah karakteristik fisik dari bahan mentah itu sendiri, seperti besar kecilnya ukuran bahan mentah atau bahan tersebut mudah rusak atau tidak. Keempat faktor tersebut di atas perlu diperhatikan secara baik dan dipertimbangkan dengan seksama dalam menentukan jumlah persdiaan bahan mentah yang harus dipertahankan dalam perusahaan. Kebutuhan masing-masing bahan mentah dalam proses produksi haruslah dapat dipenuhi, namun pada saat yang sama harus dipertimbangkan faktor biaya, sehingga jumlah modal yang di investasikan dalam persediaan bahan mentah tidak terlalu tinggi. 2.2.3.2 Persediaan barang dalam proses/barang setengah jadi (work in process/goods in process inventory) Persediaan barang dalam proses (work in process) adalah persediaan barang yang terdiri dari keseluruhan barangbarang yang digunakan dalam proses produksi tetapi masih membutuhkan proses lebih lanjut untuk menjadi barang yang siap untuk dijual (barang jadi). Tingkat penyelesaian suatu barang dalam proses sangat tergantung pada panjang serta kompleknya proses produksi yang dilaksanakan. Dengan kata lain, semakin panjang “production cycle”, semakin besar jumlah persediaan barang dalam proses. 48 Besarnya persediaan barang dalam proses ini akan menyebabkan semakin besar biaya-biaya persediaan karena modal yang terikat didalam persediaan tersebut semakin besar. Persediaan barang dalam proses merupakan jenis persediaan yang paling tidak likuid karena akan cukup sulit bagi perusahaan untuk dapat menjual barang-barang yang masih dalam bentuk setangah jadi. Karakteristik lainnya adalah bahwa barang dalam proses merupakan suatu bentuk “peningkatan nilai”. Karena dengan adanya proses transformasi dari bahan mentah menjadi bahan jadi, melalui proses produksi, dibutuhkan adanya biaya tamabahan tenaga kerja, bahan mentah lain dan bahan pembantu serta biaya overhead. 2.2.3.3 Persediaan barang jadi(finished goods inventory) Persediaan barang jadi(finished goods) adalah merupakan persediaan barang-barang yang telah selesai diproses oleh perusahaan tetapi masih belum dijual. Perusahaan-perusahaan industry yang beroperasi berdasarkan pesanan mempunyai persediaan barang jadi yang relatif kecil. Sedangkan dalam industry manufaktur, barang-barang yang diproduksikan berdasarkan antisipasi terhadap volume penjualan sehingga persediaan barang jadi sangat ditemukan oleh ramalan-ramalan penjualan, proses produksi, serta jumlah investasi dalam persediaan barang jadi tersebut. 49 Skedul produksi diarahkan untuk menyediakan barang jadi yang dapat memenuhi forecasting atau ramalan penjualan yang disampaikan bagian pemasaran. Skedul produksi yang diatur sedemikian rupa sehingga cukup untuk menutup estimasi-estimasi permintaan terhadap produk perusahaan tanpa adanya kelebihan persediaan yang terlalu besar akan meminimalkan biaya-biaya operasi perusahaan. Usaha-usaha untuk mengoptimalkan persediaan barang jadi akandapat tercapai apabila perusahaan dapat membuat estimasi penjualan yang realistis serta skedul produksi yang baik. Aktivitas perusahaan manufaktur meliputi kegiatan proses produksi yang mengubah bahan baku mentah menjadi bahan jadi, dimana proses produksi merupakan kegiatan yang menambah nilai guna suatu barang. Sehingga seluruh barang yang dimiliki perusahaan pada saat tertentu dengan tujuan untuk dijual kembali pada proses produksi merupakan persediaan barang. Dan penelitian ini menggunakan jenis persediaan barang jadi.