6 BAB 2 LANDAS AN TEORI 2.1 Data Data (Tiwana, 2000, p59) adalah himpunan fakta obyektif dan tertentu dari suatu kejadian atau sekedar rekaman terstruktur dari suatu transaksi. 2.2 Basis Data dan S istem Manajemen Basis Data (DMBS ) 2.2.1 Definisi Basis Data Pengertian dari basis data adalah sekumpulan koleksi dari data – data logic yang saling berhubungan dan dirancang untuk memenuhi kebutuhan informasi dari suatu organisasi (Connolly, Begg, 2002, p14). Basis data adalah sebuah data tunggal yang besar yang dapat digunakan secara simultan (bersamaan) oleh beberapa user dan departemen. Sehingga secara umum, pengertian basis data adalah data – data yang terhubung secara logis. 2.2.2 Definisi Sistem Manajemen Basis Data (DMBS ) Pengertian dari DBM S adalah suatu software system yang membuat user dapat menentukan, membuat, menangani dan mengontrol akses basis data (Connolly, Begg, 2002, p16). 7 2.2.3 Komponen – komponen Sistem Manajemen Basis Data (DMBS ) Terdapat 5 komponen penting pada DBM S environment (Connolly, Begg, 2002, p18) yaitu : • Perangkat Keras (Hardware) DBM S dan aplikasi membutuhkan hardware untuk dapat dijalankan. Hardware yang dipakai bisa dari personal computer sampai ke personal mainframe bahkan pada jaringan komputer. Hardware yang dipakai tergantung pada kebutuhan suatu organisasi dan DBM S yang digunakan. Beberapa DBM S hanya dapat digunakan pada beberapa hardware dan operating system. • Perangkat Lunak (Software) Komponen software meliputi software DBM S, program aplikasi, operating system dan software network jika DBM S digunakan melalui network. • Data Komponen yang paling penting dari DBM S environment, terutama dari sudut pandang pemakai adalah data. Data bertindak sebagai jembatan antara komponen mesin dan komponen manusia. Basis data berisi dari operational data dan meta data. 8 • Prosedur (Procedures) Procedures berhubungan dengan instruksi dan aturan yang mempengaruhi design dan penggunaan dari basis data. Pengguna dari sistem dan s taff yang mengatur basis data. membutuhkan procedures yang telah didokumentasi mengenai bagaimana cara menggunakan atau menjalankan sistem. • M anusia (People) Komponen yang paling terakhir adalah orang yang terlibat dalam sistem tersebut. 2.2.4 Kelebihan Sistem Manajemen Basis Data (DMBS ) Suatu DBM S menjanjikan beberapa kelebihan (Connolly, Begg, 2002, p25) yaitu : • Kontrol dari data yang berulang (control of data redundancy) Seperti yang telah kita ketahui file based system menghabiskan banyak ruang memori dengan menyimpan informasi yang sama pada lebih dari satu file. Perbedaannya pada pendekatan basis data mencoba untuk menghilangkan perulangan tersebut dengan menggabungkan file – file sehingga data yang sama tidak tersimpan. Biar bagaimana pun, pendekatan basis data tidak menghilangkan perulangan secara menyeluruh, tetapi mengontrol jumlah perulangan yang diturunkan pada basis data. 9 • Konsistensi data (data consistency) Dengan menghilangkan dan mengontrol perulangan, maka mengurangi terjadinya resiko dari ketidak konsistenan • M endapatkan informasi dari sejumlah data yang sama (more information from the same amount of data) Dengan integrasi dari data operasi, memungkinkan organisasi untuk mendapatkan informasi tambahan dari data yang sama. • Data dapat digunakan bersama (sharing of data) Biasanya, file – file dimiliki oleh seseorang atau departemen yang menggunakannya. Pada sisi lain, basis data digunakan oleh seluruh organisasi dan dapat dipakai bersama oleh pemakai yang berotoritas. Sehingga banyak pemakai dapat memakai data bersama. • M eningkatkan integritas data (improved data integrity) Integritas basis data berhubungan dengan kesahan dan konsistensi data yang tersimpan. Integritas biasanya berhubungan dengan batasan, dimana konsistensi mengatur bahwa basis data tidak menimbulkan kesalahan. Batasan lebih mengarah pada data item dengan record tunggal atau mengarah pada relasi antara record. 10 • M eningkatkan keamanan (improved security) M engamankan basis data dari pemakai yang tidak memiliki autoritas. Tanpa ukuran keamanan yang tepat, integrasi membuat data lebih lemah dari pada file-based system. • M eningkatkan backup dan recovery services (improved backup and recovery services) DBM S menyediakan fasilitas untuk meminimalkan sejumlah proses yang hilang dikarenakan terjadinya kegagalan • M eningkatkan pemeliharaan melalui data yang berdiri sendiri (improved maintenance through data indepence). DBM S memisahkan deskripsi data dari aplikasi, dengan membuat aplikasi kebal terhadap perubahan pada deskripsi data. 2.2.5 Kekurangan Sistem Manajemen Basis Data (DMBS ) Selain DBM S memiliki kelebihan, sayangnya DBM S juga memiliki beberapa kekurangannya (Connolly, Begg, 2002, p29) antara lain: • Rumit (complexity) Suatu DBM S yang baik akan membuat DBM S menjadi software yang sangat rumit. Basis data designer, developer, data, basis data administrator dan pengguna harus mengerti fungsi – fungsi yang terdapat pada DBM S untuk dapat 11 menggunakan seluruh kelebihan dari DBM S. Jika tidak bisa memahami sistemnya maka dapat menuju pada pengambilan keputusan yang salah, dimana dapat berdampak sangat serius pada suatu organisasi. • Ukuran (Size) Kerumitan dan luasnya fungsi – fungsi yang ada membuat DBM S menjadi software yang sangat besar ukurannya menghabiskan banyak megabytes dari disk space dan membutuhkan banyak memori untuk dapat berjalan baik. • Harga dari DBM S (cost of DBMS) Harga dari DBM S beragam – ragam, tergantung pada environment dan fungsi – fungsi yang disediakan. • Harga hardware tambahan DBM S dan basis data membutuhkan suatu tempat penyimpanan yang lebih. Sehingga untuk mendapatkan performa yang baik diharapkan untuk membeli mesin yang lebih besar, bahkan mungkin membeli mesin yang khusus digunakan untuk DBM S. • Besar kemungkinan adanya kegagalan (higher impact of a failure) Sumber yang tersentralisasi meningkatkan terjadinya kelemahan pada suatu sistem. Ketika semua pemakai dan aplikasi bergantung pada ketersediaan DBM S, kegagalan pada 12 komponen – komponen DBM S dapat membuat operasi menjadi terhenti. • Performa (performance) DBM S dibuat lebih umum, maksudnya menangani bukan hanya satu saja, tetapi banyak aplikasi. Sehingga akibatnya beberapa aplikasi mungkin tidak berjalan secepat biasanya. 2.3 Data Warehouse 2.3.1 Definisi Data Warehouse M enurut English (1999, p471), Data Warehouse adalah sebuah kumpulan dari software yang mengatur, mengumpulkan, membersihkan, mentransformasikan serta menempatkan data yang berasal dari bermacam – macam sumber. Data Warehouse juga menganalisis informasi yang ada untuk mendukung pengambilan keputusan serta perhitungan proses bisnis yang strategis. Analisis yang digunakan bersifat hanya untuk dibaca (readonly) sehingga tidak dapat dilakukan perubahan data yang digunakan. Bentuk fisik perancangannya dari Data sangat Warehouse berbeda berupa dengan basis perancangan data, basis tetapi data operasional yang digunakan pada sistem informasi. Untuk kegiatan perancangan basis data operasional digunakan metode normalisasi dengan tujuan pada fleksibilitas dan efisiensi media penampungan data, sedangkan dalam perancangan Data Warehouse digunakan metode denormalisasi. Pada Data warehouse fleksibilitas dan efisiensi media penampungan bukanlah yang utama, bahkan seringkali 13 perancang Data Warehouse mempertukarkan hal tersebut dengan kemampuan query yang handal. M enurut Benson dan Smith (2001, p5), Data Warehouse adalah sebuah konstruksi arsitektural dari sistem informasi yang mendukung dan menyediakan informasi saat ini dan masa lalu (historis) untuk pengambilan keputusan oleh user yang sulit diakses dengan basis data operasional biasa. Secara prinsip, Data Warehouse dapat memenuhi kebutuhan informasi kepada para eksekutif dan mampu menyediakan peluang – peluang bisnis strategis dengan memperhatikan faktor keamanan. 2.3.2 Karakteristik Data Warehouse M enurut Inmon, seperti yang dikutip M allach (2000, p467) Data Warehouse memiliki karakteristik sebagai berikut : 1. Subject-oriented Suatu Data Warehouse bersifat subject-oriented artinya Data Warehouse dirancang untuk menganalisis data berdasarkan subyek – subyek tertentu yang ada di dalam organisasi, bukan berorientasi pada proses atau fungsi aplikasi tertentu. Dalam hal mengakses data, pemakai berorientasi pada subyek tertentu yang utama seperti pelanggan, produk, dan penjualan. 2. Integrated Data Warehouse bersifat integrated artinya Data Warehouse harus menyimpan data – data yang berasal dari sumber – sumber yang terpisah ke dalam suatu format yang konsisten (dalam penamaan 14 variabel ukuran – ukuran, atribut fisik) dan saling terintegrasi satu dengan yang lainnya. Dengan demikian data tidak dapat dipisah – pisah karena data yang ada lebih merupakan satu kesatuan yang menunjang keseluruhan konsep Data Warehouse itu sendiri. 3. Non-volatile Karakteristik Data Warehouse berikutnya adalah non-volatile, Data Warehouse bersifat read-only, sehingga user hanya dapat melihat tanpa dapat mengubah data yang ada dalam Data Warehouse. Artinya data yang telah disimpan dalam Data Warehouse tidak boleh berubah. Berbeda dengan sistem basis data tradisional yang bersifat mengumpulkan data (data capturing), Data Warehouse berfungsi untuk mendukung sistem pelaporan (reporting). 4. Time-variant Karakteristik Data Warehouse ke empat adalah time variant, yang dapat diartikan bahwa Data Warehouse saling berhubungan dengan suatu titik atau point dalam suatu periode waktu tertentu, misalnya semester, kuartal, tahun fiskal, maupun periode pembayaran. Data tersebut merupakan data hasil summary yang membantu dalam menentukan performa query dari Data Warehouse serta dalam bentuk pengertian bisnis. Sebagai contoh, data yang menunjukan penjualan produk terlaris per tahun dan jumlah pembelian per kuartal. Seperti : hasil penjualan produk X pada kuartal pertama tahun 2002 di kota A. 15 2.3.3 Arsitektur Data Warehouse Ada beberapa komponen yang dimiliki oleh arsitektur Data Warehouse, (Connolly, Begg, 2002, p1052) yaitu : 1. Data Operasional (Operational Data) Sumber data untuk Data Warehouse dapat berasal dari: a. Mainframe data operasional b. Data – data antar bagian departemen yang tersimpan dalam beraneka – ragam sistem, Proprietery File System, misalnya: VSAM , RM S, dan DBM S relasional, seperti: Informix dan Oracle. c. Data internal yang tersimpan di workstation – workstation dan private servers. d. Data yang berasal dari sistem eksternal, seperti: Internet, basis data yang sifatnya komersial atau basis data perusahaan yang berhubungan dengan pelanggan atau supplier 2. Penyimpanan Data Operasional (Operational Data Storage) Sebuah Penyimpanan Data Operasional merupakan tempat penyimpanan data yang terkini dan terintegrasi yang digunakan untuk analisa. Biasanya memiliki struktur dan disediakan data yang sama seperti Data Warehouse, tetapi pada dasarnya Penyimpanan Data Operasional ini hanya berperan sebagai tempat persiapan untuk data sebelum dipindahkan ke Data Warehouse. 16 3. Load Manager Load Manager ini berfungsi untuk melakukan semua operasi yang berhubungan dengan ekstraksi dan pemuatan data kedalam Data Warehouse. Data tersebut dapat diperoleh langsung dari sumber data atau biasanya berasal dari tempat Penyimpanan Data Operasional. Hal yang dilakukan oleh Load Manager ini termasuk juga transformasi data sederhana untuk mempersiapkan data sebelum masuk ke dalam Data Warehouse. Ukuran dan kompleksitas dari komponen ini berbeda antar Data Warehouse. 4. Warehouse Manager Warehouse Manager ini berfungsi untuk melakukan semua operasi yang berhubungan dengan manajemen data dalam Data Warehouse. Operasi yang dilakukan oleh Warehouse Manager antara lain adalah: a. Analisa data untuk memastikan konsistensi. b. Transformasi dan penggabungan sumber data dari tempat penyimpanan data sementara kedalam tabel – tabel Data Warehouse. c. Pembuatan index dan view pada tabel. d. Generate denormalisasi (jika dibutuhkan). e. Generate agregasi (jika dibutuhkan). f. Back-Up dan Archive data. 17 5. Query Manager Query Manager ini berfungsi untuk melakukan semua operasi yang berhubungan dengan manajemen dari query user. Kompleksitas dari Query Manager ini ditentukan dari fasilitas yang disediakan perangkat akses dari end-user dan basis data. Hal yang dilakukan oleh Query Manager ini termasuk juga mengarahkan query ke tabel yang sesuai dan penjadwalan eksekusi query. 6. Data Detail Pada bagian ini merupakan tempat Data Warehouse menyimpanan semua detail data dalam skema database, yang bertujuan untuk melengkapkan kumpulan data untuk Data Warehouse. 7. Lightly and Highly Summarized Data Pada bagian ini merupakan tempat Data Warehouse menyimpanan semua (kumpulan) Lightly dan Highly Summarized Data yang dihasilkan oleh Warehouse Manager. Tujuan dilakukannya rekapitulasi informasi (baik lightly maupun highly) adalah untuk meningkatkan performa query. Rekapitulasi data ini akan di-update secara terus menerus setiap kali data baru masuk ke Data Warehouse. 8. Archive / Back-up data Pada bagian ini merupakan tempat Data Warehouse menyimpanan semua data detail dan data rekapitulasi untuk tujuan dokumentasi dan backup. 18 9. Meta Data Pada bagian ini merupakan tempat Data Warehouse menyimpanan semua keterangan dari Meta Data (data mengenai data) yang digunakan dalam setiap proses dalam Data Warehouse. Meta Data adalah data yang berisi tentang data misalnya: asal data, lokasi data, definisi data, kualitas dan umur data yang ada didalam Data Warehouse. Data – data ini digunakan sebagai data pendukung informasi pendukung informasi yang dihasilkan oleh Data Warehouse untuk mendukung pengambilan keputusan. Struktur Meta Data berbeda pada tiap proses, karena memang masing-masing memiliki tujuan yang berbeda – beda. Tujuan penggunaan Meta Data adalah: a. Proses ekstraksi dan loading : untuk melakukan pemetaan sumber data dengan data dalam Data Warehouse. b. Proses M anajemen Data Warehouse : untuk otomatisasi yang menghasilkan tabel rekapitulasi. c. Sebagai bagian dari Proses M anajemen Query – untuk menunjuk query ke sumber data yang paling tepat. 10. Alat akses untuk End-user Prinsip tujuan dari Data Warehouse adalah menyediakan informasi kepada user untuk mendukung pengambilan keputusan. User akan berinteraksi dengan Data Warehouse melalui perangkat akses end-user. 19 Berikut ini adalah beberapa kategori perangkat akses end-user: a. Perangkat Reporting dan Query b. Perangkat Pengembangan Aplikasi c. Perangkat Executive Information System d. Perangkat Online Analytical Processing e. Perangkat Data Mining Pada gambar 2.1 menjelaskan mengenai arsitektur dari data warehouse Gambar 2.1 - Arsitektur Data Warehouse (Sumber: Connolly, 2002, p1053) 20 2.3.4 Keuntungan penggunaan Data Warehouse Kesuksesan pengimplementasian Data Warehouse dapat menberikan keuntungan bagi organisasi maupun perusahaan (Connolly, Begg, 2002, p1048) antara lain : 1. Adanya kemungkinan balik modal yang tinggi pada investasi. Dalam proses pengimplementasian Data Warehouse, suatu organisasi harus mememberikan sumber daya dan biaya yang relatif besar untuk menjamin kesuksesannya. Namun timbal balik yang akan didapat terhadap biaya yang dikeluarkan untuk pengimplementasiannya akan relatif lebih besar. Sehingga organisasi tidak perlu khawatir mengenai anggapan adanya pemborosan untuk investasi Data Warehouse ini. 2. Keuntungan yang kompetitif. Dengan adanya balik modal yang besar terhadap investasi ini merupakan bukti adanya keuntungan yang kompetitif dengan adanya teknologi ini. Keuntungan kompetitif ini dicapai dengan memungkinkan para pengambil keputusan untuk mengakses data yang sebelumnya tidak tersedia, tidak diketahui, ataupun informasi yang tidak tercatat. 3. M eningkatkan produktivitas para pengambil keputusan di perusahaan. Data Warehousing dapat memungkinkan hal ini dengan mentransformasikan data menjadi informasi yang berarti. Teknologi ini menyediakan para manager bisnis untuk dapat melakukan analisis yang lebih konsisten sehingga akhirnya terjadi peningkatan produktivtitas. 21 2.3.5 Data Mart Pengertian Data Mart menurut Berson dan Smith (2001, p124) Data Mart adalah penyimpanan data yang merupakan bagian dari Data Warehouse yang berisi data yang terintegrasi. Sedangkan menurut artikel yang dipublikasikan oleh OR Society (2002), Data Mart adalah sebuah tempat penyimpanan informasi yang diciptakan untuk fungsi yang lebih spesifik. Sebuah Data Mart biasanya digunakan untuk menampung subset atau simpulan/rangkuman dari informasi yang detail di Data Warehouse. Berfungsi untuk meningkatkan laporan dan analisa yang lebih spesifik sesuai kebutuhan golongan user tertentu. Sebuah Data Warehouse pusat dapat mengisi beberapa Data Mart dengan isi yang saling melengkapi. Setiap Data Mart menyediakan tampilan yang diatur menurut konsistensi data pada Data Warehouse pusat. 2.3.6 Perbedaan Data Mart dengan Data Warehouse Berdasarkan buku yang berjudul Database system : A Practical Approach to Design, Implementation, and Management. (Connolly, Begg, 2002, p1067) ada beberapa hal yang membedakan Data Mart dengan Data Warehouse diantaranya yaitu : 1. Data Mart lebih berfokus kepada ketentuan maupun permintaan dari pengguna yang berkaitan dengan sebuah departemen ataupun fungsi – fungsi bisnis. 22 2. Secara normal Data Mart tidak mencakup data operasional yang mendalam, tidak seperti halnya Data Warehouse. 3. Data Mart memiliki jumlah data yang lebih sedikit dibandingkan dengan Data Warehouse, sehingga Data Mart lebih mudah dimengerti dan diaplikasikan. Ada beberapa pendekatan dalam membangun Data Mart. Salah satunya adalah dengan membangun beberapa Data Mart ditinjau dari segi pengintegrasian dengan Data Warehouse. Cara lain adalah membangun infrastruktur untuk Data Warehouse perusahaan dimana pada saat yang sama juga membangun satu atau lebih Data Mart untuk memenuhi kebutuhan bisnis yang mendadak sekalipun (Connolly, Begg, 3003, p1067). 2.3.7 Alasan – alasan membangun Data Mart Ada beberapa alasan membangun sebuah Data Mart (Connolly, Begg, 2002, p1069) diantaranya : 1. M emberi akses data yang dibutuhkan kepada user, agar dapat dianalisis sesering mungkin. 2. M enyediakan data dalam format yang sesuai dengan macam – macam sudut pandang dari data, oleh sekelompok pemakai dalam sebuah departemen maupun fungsi bisnis. 3. Untuk meningkatkan waktu respon dari end-user dalam rangka pengurangan waktu akses ke sebuah data. 23 4. M enyediakan struktur data yang sesuai seperti permintaan dari tools OLAP maupun tools Data Mining, yang mungkin membutuhkan struktur basis data internal mereka sendiri. Pada penerapannya, tools tersebut sering membuat desain Data Mart sendiri untuk mendukung fungsionalitas yang spesifik. 5. Data Mart umumnya menggunakan data yang lebih sedikit sehingga proses seperti pembersihan data, transformasi dan integrasi menjadi jauh lebih mudah, sehingga proses pembuatan dan implementasi Data Mart menjadi lebih sederhana daripada Data Warehouse perusahaan yang sudah ada. 6. Biaya implementasi Data Mart umumnya lebih kecil daripada yang dibutuhkan untuk membuat Data Warehouse. 7. Para pengguna potensial dari Data Mart dapat menjadi lebih jelas, dan dapat ditargetkan dengan lebih mudah untuk mendukung sebuah proyek Data Mart daripada sebuah proyek Data Warehouse perusahaan. 2.3.8 Online Analytical Processing (OLAP) OLAP adalah sebuah perangkat yang digunakan untuk menyimpan data multidimensional dan perangkat yang digunakan untuk menampilkan sebuah tampilan data multidimensional kepada user (Peterson, Pinkelman, 2000, p8). 24 2.3.8.1 Karakteristik Online Analytical Processing (OLAP) OLAP memiliki beberapa karakteristik (Peterson, Pinkelman, 2000, pp35-54) yaitu : 1. OLAP memasukan data dari sistem OLTP dan sumbersumber lain, termasuk dari luar organisasi. 2. OLAP menyimpan data dalam format yang mengoptimalkan analisis query, yang merupakan ringkasan informasi dari banyak sumber. 3. Sistem OLAP bekerja dengan sangat baik di dalam lingkungan yang memiliki banyak indeks. Data – data tidak di update setelah dianalisis, jadi tidak ada pemborosan waktu di dalam proses update indeks yang besar. 4. Sistem OLAP mampu mendukung permintaan analisis secara cepat, tanpa mendapat kesulitan mengenai kombinasi perspektif apa yang dipilih oleh analisis. 2.3.8.2 Keuntungan Online Analytical Processing (OLAP) Terdapat keuntungan dari OLAP (Connolly, Begg, 2002, p1104 ) yaitu : 1. M eningkatkan produktifitas bisnis pada End-User, IT Developer , dan keseluruhan perusahaan. Lebih dapat mengontrol dan lebih keputusan. efektif dalam mengambil 25 2. M engurangi backlog dari pengembangan aplikasi untuk staff IT dengan membuat. 3. M engurangi query dan lalu – lintas jaringan pada sistem OLTP atau pada data warehouse. 4. M eningkatkan kemungkinan pendapatan dan keuntungan dengan memberi tanggapan yang lebih cepat terhadap permintaan pasar. 2.4 Data Mining 2.4.1 Definisi Data Mining Data mining (Seidman, 2001, p3) adalah proses menemukan patterns yang bernilai dan relationship yang tersembunyi dalam basis data yang sangat besar. Karena pencarian dengan tabel dan record sangat jarang ditemukan pattern yang berguna, data biasanya dianalisa dan diproses secara otomatisasi. 2.4.2 Penerapan Data Mining Di berbagai perusahaan di dunia, saat ini penerapan aplikasi dengan Data mining (Seidman, 2001, p6) untuk : • Correct data. Pada saat proses menggabungkan basis data secara besar – besaran, banyak perusahaan menemukan data yang digabungkan tersebut tidak lengkap, dan terdiri dari informasi yang salah dan bertentangan. Dengan menggunakan 26 teknik data mining, dapat membantu untuk mengidentifikasi dan membetulkan kesalahan dengan cara yang konsisten. • Discover Knowledge. Proses mencari pengetahuan bertujuaan untuk menentukan dengan jelas relationship, pattern, atau correlations yang tersembunyi dari tempat penyimpanan data di dalam basis data. • Visualize Data. Seorang analis harus bisa merasakan sebuah informasi yang besar yang disimpan di dalam basis data. Tujuannya untuk “mempermanusiakan” data yang banyak dan menemukan cara yang terbaik untuk menampilkan data. 2.4.3 Metodologi Data Mining Proses Data Mining dilakukan dengan melalui tahapan – tahapan tertentu (Seidman, 2001, p9), yaitu : 1. Analisa M asalah Data asal atau data sumber harus bisa ditaksir untuk dilihat apakah data tersebut memenuhi kriteria data mining. Kualitas dan kelimpahan data adalah faktor utama untuk memutuskan apakah data tersebut cocok dan tersedia sebagai tambahan. Hasil yang diharapkan dari dampak data mining harus dengan hati – hati dimengerti dan dipastikan bahwa data yang dibutuhkan membawa informasi yang bisa diekstrak. 27 2. M engektrak dan M embersihkan Data Data pertama kali diekstrak dari data aslinya, seperti dari OLTP basis data, text file, Microsoft Access Database, dan bahkan dari spreadsheet, kemudian data tersebut diletakan dalam data warehouse yang mempunyai struktur yang sesuai dengan data model secara khas. Data Transformation Services (DTS) dipakai untuk mengekstrak dan membersihkan data dari tidak konsistennya dan tidak kompatibelnya dengan format yang sesuai. 3. Validasi Data Sekali data telah diekstrak dan dibersihkan, ini adalah latihan yang bagus untuk menelusuri model yang telah kita ciptakan untuk memastikan bahwa semua data yang ada adalah data sekarang dan tetap. 4. M embuat dan M elatih M odel Ketika algoritma diterapkan pada model, struktur telah dibangun. Hal ini sangatlah penting pada saat ini untuk melihat data yang telah dibangun untuk memastikan data tersebut menyerupai fakta di dalam data sumber. Hal ini bisa dibuat dengan berbagai cara. 5. Query Data Sekali data model yang pantas / cocok telah diciptakan dan dibangun, data yang telah dibuat tersedia untuk mendukung keputusan. Hal ini bisaanya melibatkan penulisan front end query aplikasi dengan suatu program aplikasi atau suatu program basis data SQL Server melalui OLE DB melalui data mining. 28 6. Pemeliharaan Validasi M odel Data Mining Karakteristik data mining yang telah terisi harus terjaga validasinya, seperti persediaan jumlah suatu barang pada supermarket, apabila ada perubahan terhadap persediaan barang tersebut, maka perubahan tersebut harus dicatat, jadi data mining yang terbentuk akan jadi lebih efektif. 2.4.4 Kategori Data Mining Teknik data mining berhubungan dengan penemuan dan pembelajaran, pembelajaran tersebut dapat dibagi menjadi tiga metode utama, yaitu supervised, unsupervised, dan reinforcement (Berson, Smith, Thearling, 2000, p36). a. Supervised Teknik ini melibatkan tahap pelatihan dimana data lama yang telah dilatih tersebut memiliki characteristic map yang telah diketahui terlebih dahulu untuk diberikan kepada algoritma data mining. Proses ini melatih algoritma untuk mengenali variabel dan nilai – nilai kunci, yang kemudian menjadi dasar untuk membuat prediksi ketika membaca data baru. b. Unsupervised Teknik ini tidak melibatkan tahap pelatihan, tetapi bergantung pada penggunaan algoritma yang mendeteksi semua bentuk seperti asosiasi dan rangkaian yang terjadi berdasarkan kriteria yang spesifik dalam memasukan data. Pendekatan ini membawa ke generasi yang 29 mempunyai banyak peraturan yang menggolongkan penemuan asosiasi, cluster, dan segment. Peraturan ini kemudian akan melakukan penganalisaan untuk menentukan mana yang memiliki ketertarikan secara universal. c. Reinforcement Walaupun jarang digunakan dibandingkan metode lain, tetapi memiliki aplikasi untuk mengoptimalkan waktu dan penyesuaian kontrol. M etode ini sangat mirip dengan realita, karena metode ini tidak menyediakan tindakan untuk melakukan koreksi dengan segera, tetapi dapat digunakan untuk memecahkan pembagian masalah ketergantungan waktu yang sulit. 2.4.5 Hubungan antara Data Mining dengan Data Warehouse Data Mining merpakan kumpulan teknik yang bertujuan untuk menemukan pola – pola yang berguna namun tersembunyi di dalam basis data, dan memprediksi kecederungan masa depan berdasarkan analisis dari aktivitas masa lampau. Banyak pimpinan perusahaan telah menyadari bahwa basis data berukuran besar yang memiliki banyak informasi menjadi sangat penting perannya. Disinilah pentingnya hubungan dan integrasi antara Data Mining dan Data Warehouse. Salah satu kunci sukses penerapan Data Mining adalah kemampuan untuk mendapatkan akses terhadap data – data yang akurat, lengkap dan terintegrasi. Oleh karena itu, aplikasi Data Mining dapat 30 meningkatkan kapabilitas dan integrasi dari Data Warehouse untuk mencapai keuntungan kompetitif (Berson, Smith, Thearling, 2000, p16). 2.5 Teknik – teknik yang digunakan untuk melakukan Data Mining 2.5.1 Teknik Statistic Teknik statistik bukanlah data mining, Tetapi teknik ini dikendalikan oleh data dan digunakan untuk mencari pola – pola dan membuat predictive model. Statistik adalah cabang dari matematika mengenai koleksi dan deskripsi data (Berson, Smith, Thearling, 2000, p124). 2.5.2 Teknik Decision Tree Decision Tree adalah suatu model prediksi yang dapat dilihat sebagai tree. Setiap cabangnya merupakan hasil klasifikasi dari pertanyaan dan daunnya merupakan hasil partisi dari kumpulan data sesuai dengan klasifikasinya. Algoritma decision tree berhenti mengembangkan segmen atau cabang – cabangnya ketika semua segmen terdiri hanya dari 1 record, semua record dalam segmen memiliki karakteristik yang sama, pengembangan segmen selanjutnya tidak penting (Berson, Smith, Thearling, 2000, p156). 2.5.3 Teknik Clustering M etode di mana record dijadikan dalam grup – grup. Biasanya untuk high level end user untuk melihat apa yang terjadi di database. 31 Clustering dapat juga berarti segmentasi yang sangat berguna dalam prediksi masalah bisnis (Berson, Smith, Thearling, 2000, p139). 2.5.4 Teknik Memory Based Reasoning (MBR) atau Nearest Neighbor Clustering dan Nearest Neighbor adalah teknik – teknik tertua dalam Data Mining. Nearest Neighbor mirip dengan clustering untuk memprediksi nilai prediksi dari sebuah record, mencari record dengan nilai yang mirip dan menggunakan nilai prediksi dari record yang terdekat daripada record yang belum diklasifikasi (Berson, Smith, Thearling, 2000, p134). Contoh Nearest Neighbor : jika tetangga – tetangga berpenghasilan Rp 5.000.000,00 maka besar kemungkinan penghasilan kita juga Rp 5.000.000,00. 2.5.5 Teknik Neural Network Neural Networks yang sesungguhnya adalah jaringan syaraf dalam otak manusia yang mengenali pola – pola, membuat perkiraan dan pembelajaran (Berson, Smith, Thearling, 2000, p166). Sedangkan yang dimaksud di sini adalah artificial neural networks yaitu program komputer yang menerapkan pencarian pola dan algoritma pembelajaran mesin komputer untuk membuat model perkiraan dari data historis. Neural Networks pertama kali diperkenalkan oleh M c Cullock dan Pits dalam seminar dalam Perang Dunia ke-2 yang mulanya hanya menyampaikan sebuah ide tentang unit pemrosesan sederhana (seperti sebuah neuron dalam otak manusia). Ide tersebut dapat dihubungkan 32 bersama – sama dalam jaringan yang besar sehingga membangun sebuah sistem dengan kemampuan untuk menyelesaikan masalah – masalah yang sulit dan menampilkan pola – pola yang kompleks dari yang dapat dibuat oleh satu buah unit saja (Berson, Smith, Thearling, 2000, p167). 2.5.6 Teknik Rule Induction Rule Induction (Berson, Smith, Thearling, 2000, p183) adalah salah satu teknik dalam data mining yang paling sering digunakan dalam menemukan pengetahuan dalam sistem unsupervised learning. Rule (aturan) adalah bentuk sederhana dari “jika ini maka ini dan kemudian ini“. Agar aturan – aturan tersebut bermanfaat maka harus ditambahkan 2 informasi tambahan sesuai dengan keadaan sebenarnya, yaitu : 1. Keakuratan yang menunjukkan seberapa sering aturan tersebut benar. 2. Penerapan yaitu angka yang menunjukkan seberapa sering aturan tersebut dipakai. 2.6 Data Mining vs Online Analytical Processing (OLAP) Data Mining dan OLAP (Seidman, Claude, 2000, p11) merupakan komponen – komponen dari Microsoft Analysis Services. Keduanya merupkan tools pendukung pengambilan keputusan, tetapi data mining dan OLAP dirancang untuk pengguna yang berbeda. OLAP dibuat khusus untuk menyimpan data dalam bentuk table singkat untuk menyediakan pemanggilan dan navigasi data tersebut oleh end users. Banyak pemakai yang menganggap bahwa ini adalah sebuah 33 solusi data mining karena pemakai dapat menemukan informasi tentang data dengan mencari informasi – infomasi singkat, yang kemudian di analisa untuk menemukan hubungan kausal yang lebih. Bagaimana pun juga dari banyak kasus, banyak pemakai mencari melalui dimensi – dimensi yang berisi arti dan hubungan yang telah dikenal dengan baik. OLAP dapat digunakan untuk mencoba menemukan data baru. Tetapi karena penemuan data telah diselesaikan oleh end users, dengan bantuan sebuah tool OLAP, penemuan data akan menjadi tidak teratur dan tidak lengkap. Data Mining tidak terlalu mementingkan untuk memperbolehkan end user dengan mudah melihat data – data yang telah terangkum, namun lebih pada menemukan pola dan rule baru yang dapat digunakan sebagai hasil untuk masa mendatang. Jadi kesimpulannya dari perbedaan yang ada adalah OLAP merupakan suatu mekanisme penyimpanan dan retrieval yang efisien dan data mining adalah untuk knowledge discovery. 2.7 Rekayasa Piranti Lunak (Software Engineering) 2.7.1 Definisi Rekayasa Piranti Lunak (Software Engineering) Software engineering sebagai suatu disiplin teknologi yang terkait dengan pemeliharaan dan produksi produk perangkat lunak secara sistematis yang dikembangkan dan dimodifikasi tepat waktu dan dengan perkiraan biaya. (Fairley, 1985, p5) Software Engineering berbeda dengan pemrograman komputer tradisonal, teknik pada software engineering digunakan untuk menentukan, merancang, menerapkan, menvalidasi, dan merawat produk software 34 dengan batasan waktu dan anggaran yang ditetapkan pada proyek tersebut. Kesimpulannya software engineering berhubungan dengan masalah – masalah yang terdapat pada managerial yang terdapat diluar wilayah pemograman tradisional. 2.7.2 Model – model Rekayasa Piranti Lunak (Software Engineering) 2.7.2.1 Linier Sequential Model (Waterfall Model) M odel ini (Pressman, 2001, p29) mendekati ke pengembangan software yang mulai dari tingkatan sistem dan prosesnya menuju dari analisa, rancangan, coding, pengujian, dan pendukungan. Gambar 2.2 – Linier Sequential Model (Sumber : Pressman, 2001, P29) 2.7.2.2 Prototyping Model M embuat Prototyping Model (Pressman, 2001, p31) dimulai dengan kebutuhan yang dikumpulkan. Dari pengembang 35 lalu pelanggan mencobanya dan kemudian hasilnya digambarkan untuk keseluruhan sasaran hasil untuk perangkat lunak. Lalu "rancangan cepat" kemudian terjadi. Rancangan yang cepat memusat pada suatu penyajian aspek perangkat lunak tersebut. Itu semua yang akan dilihat oleh pelanggan untuk membuat perangkat lunak tersebut lebih terfokus. Gambar 2.3 – Prototyping Model (Sumber : Pressman, 2001, P31) 2.7.2.3 RAD Model (Rapid Application Development) RAD Model (Pressman, 2001, p33) adalah suatu pengembangan incremental software yang memproses model yang penekanannya keapada suatu pengembangan yang singkat. M odel RAD adalah suatu pengadaptasian yang berkecepatan tinggi dan juga sebagai model percontohan yang linier di mana perkembangan cepat dicapai dengan component - based. penggunaan konstruksi 36 Gambar 2.4 – RAD Model (Sumber : Pressman, 2001, P33) 2.7.2.4 Incremental Model Incremental model (Pressman, 2001, p35) menggabungkan elemen – elemen dari linier sequential model dengan filosofi iterative dari prototyping. Berdasarkan gambar 2.5, incremental model membutuhkan linier sequential pada tahapan awal sebagai progres-progres waktu yang telah dijadwalkan. Tiap – tiap linier sequence menghasilkan “incremental” yang dapat disampaikan. 37 Gambar 2.5 – Incremental Model (Sumber : Pressman, 2001, P35) 2.7.2.5 Spiral Model Spiral Model (Pressman, 2001, p37) adalah suatu perangkat lunak evolusiner yang memproses model secara kooperatif dengan membuat prototype dengan aspek yang sistematis dan yang dikendalikan pada linier model. M odel ini menyediakan potensi untuk meningkatkan versi pada perangkat lunak tersebut. 38 Gambar 2.6 – Spiral Model ( Sumber : Pressman, 2001, P37) 2.8 State Transition Diagram (S TD) 2.8.1 Definisi State Transition Diagram (S TD) State Transition Diagram (Yourdon, 1989,p259) merupakan suatu modeling tool yang menggambarkan sifat ketergantungan pada waktu dari suatu sistem. Pada awalnya hanya digunakan untuk menggambarkan suatu sistem yang memiliki sifat real – time. 2.8.2 Notasi State Tran sition Diagram (S TD) Notasi yang digunakan pada State Transition Diagram adalah (Yourdon, 1989, p260) : merupakan state 39 merupakan event Gambar 2.7 – Notasi S TD (Sumber : Yourdon, 1989, p260) 2.8.3 Condition dan Action Untuk melengkapi State Transition Diagram diperlukan dua hal lagi yaitu (Yourdon, 1989, p265) : • Condition adalah suatu event pada external environment yang dapat dideteksi oleh sistem • Action adalah yang dilakukan oleh sistem bila terjadi perubahan state atau merupakan reaksi terhadap condition. Action akan menghasilkan output, message display pada layar, dan juga menghasilkan perhitungan. 2.9 Asuransi 2.9.1 Pengertian Asuransi Pengertian Asuransi (Purba, 1992, p40) adalah suatu persetujuan, di mana penanggung mengikat dan kepada tertanggung, dengan mendapat premi, untuk mengganti kerugian karena kehilangan, kerugian, atau tidak diperolehnya keuntungan yang diharapkan, yang dapat diderita karena peristiwa yang tidak diketahui lebih dahulu (pasal 246 Kitab Undang – Undang Hukum Dagang (KUHD) ). 40 Ada empat unsur yang terlibat dalam asuransi (Purba, 1992, p41), yaitu: • Penanggung (insurer), yang memberikan proteksi. • Tertanggung (insured), yang menerima proteksi. • Peristiwa (accident), yang tidak diduga atau tidak diketahui sebelumnya, peristiwa yang dapat menimbulkan kerugian. • Kepentingan (interest), yang diasuransikan, yang mungkin akan mengalami kerugian disebabkan oleh peristiwa itu. Keempat unsur itu merupakan unsur pokok dalam asuransi kerugian, yang meliputi asuransi pengangkutan laut, asuransi pengangkutan udara, asuransi pengangkutan darat, asuransi kendaraan bermotor, asuransi kebakaran, dan sebagainya. Disebut asuransi kerugian karena dalam batas pengertian kerugian, penanggung hanya membayar ganti rugi kepada tertanggung sesuai dengan kerugian yang diderita oleh tertanggung. 2.9.2 Tujuan Asuransi Tujuan Asuransi terbagi menjadi 3 (Purba, 1992, p56) yaitu: 1. Tujuan Ganti Rugi Ganti rugi yang diberikan oleh penanggung kepada tertanggung bila tertanggung menderita kerugian yang dijamin oleh polis, bertujuan untuk mengembalikan tertanggung kepada posisinya semula atau untuk menghindarkan tertanggung dari 41 kebangkrutan sehingga ia masih mampu berdiri seperti sebelum menderita kerugian. Jadi tertanggung hanya boleh memperoleh ganti rugi maksimal sebesar kerugian yang dideritanya, sekedar mengembalikannya pada posisi semula. Berarti, tertanggung tidak boleh mencari keuntungan (spekulasi) dan asuransi. Penanggung, apakah perseorangan atau perusahaan, selaku yang bergerak dalam bidang pemberian jasa berupa jaminan, tidak pantas bila ia mencari keuntungan (spekulasi) atas interest yang ditanggungnya, kecuali memperoleh balas jasa, yaitu premi. 2. Tujuan Tertanggung • Untuk memperoleh rasa tentram dari resiko yang dihadapinya atas kegiatan usahanya atau atas harta miliknya. • Untuk mendorong keberaniannya mengiatkan usaha yang lebih besar dengan resiko yang lebih besar pula, karena resiko yang besar itu diambil alih oleh penanggung. 3. Tujuan Penanggung Tujuan umum penanggung tidak berbeda dari tujuan umum suatu perusahaan, yaitu memperoleh keuntungan, disamping menyediakan lapangan pekerjaan bila penanggung membutuhkan tenaga – tenaga pembantu (karyawan). 42 Sedangkan tujuan khusus adalah : • M eringankan resiko yang dihadapi oleh para nasabahnya (para tertanggung) dengan mengambil alih resiko yang mereka hadapi. • M enciptakan rasa tenteram dikalangan nasabahnya sehingga lebih berani menggiatkan usaha yang lebih besar. • M engumpulkan dana melalui premi yang terkumpul sedikit demi sedikit dari para nasabahnya sehingga terhimpun dana besar, yang dapat digunakan untuk membiayai pembangunan bangsa dan negara. 2.9.3 Pengertian Polis Untuk setiap perjanjian perlu dibuat bukti tertulis atau surat perjanjian antara pihak-pihak yang mengadakan perjanjian . Bukti tertulis untuk perjanjian asuransi di sebut polis (Purba, 1992, p59). Surat perjanjian itu dibuat dengan itikad baik dan kedua pihak yang mengadakan perjanjian. Di dalam surat perjanjian itu disebutkan dengan tegas dan jelas mengenai hal – hal yang diperjanjikan kedua belah pihak, hak-hak atas pelanggaran perjanjian, dan sebaginya. Redaksinya harus disusun sedemikian rupa sehingga dengan mudah dapat ditangkap maksud dan perjanjian itu, juga tidak memberi peluang untuk menyalah tafsirkannya. 43 2.9.4 Fungsi Umum Polis Fungsi umum polis (Purba, 1993, p60) adalah sebagai berikut : 1. Perjanjian pertanggungan (a contract of indemnity). 2. Sebagai bukti jaminan dan penanggung kepada tertanggung untuk mengganti kerugian yang mungkin dialami oleh tertanggung akibat peristiwa yang tidak diduga sebelumnya, dengan prinsip : • Untuk mengembalikan kedudukannya semula tertanggung sebelum kepada mengalami kerugian; atau • Untuk menghindarkan tertanggung dan kebangkrutan (total collapse). 3. Bukti pembayaran premi asuransi oleh tertanggung kepada penanggung sebagai balas jasa atas jaminan penanggung. Fungsi polis bagi tertanggung : 1. Sebagai bukti tertulis mengganti kerugian atas jaminan penanggung untuk yang mungkin dideritanya yang ditanggung oleh polis. 2. Sebagai bukti (kwitansi) pembayaran premi kepada penanggung. 3. Sebagai bukti otentik untuk menuntut penanggung bila lalai atau tidak memenuhi jaminannya. 44 Fungsi polis bagi penanggung : 1. Sebagai bukti (tanda terima) premi asuransi dan tertanggung. 2. Sebagai bukti tertulis atas jaminan yang diberikannya kepada tertanggung untuk membayar ganti rugi yang mungkin diderita oleh tertanggung. 3. Sebagai bukti otentik untuk menolak tuntutan ganti rugi (klaim) bila yang menyebabkan kerugian tidak memenuhi syarat-syarat polis. 2.9.5 Pengertian Premi M enurut pengertian umum, premi (Purba, 1992, p105) adalah sesuatu yang diberikan sebagai hadiah atau derma, atau sesuatu yang dibayarkan ekstra sebagai pendorong atau perancang, atau sesuatu pembayaran tambahan di atas pembayaran normal. Dalam ruang lingkup asuransi, premi merupakan: 1. Imbalan jasa atas jaminan yang diberikan oleh penanggung kepada “ tertanggung untuk mengganti kerugian yang mungkin diderita oleh tertanggung (asuransi kerugian). 2. Imbalan jasa atas jaminan perlindungan yang diberikan oleh penanggung kepada tertanggung dengan menyediakan sejumlah uang (benefit) terhadap risiko hari tua maupun risiko kernatian (asuransi jiwa). 45 2.9.6 Premi vs Klaim Premi merupakan masalah pokok dalam asuransi (Purba, 1992, p105). Bagi penanggung, premi sangat penting karena dengan premi yang dikumpulkannya dan banyak tertanggung dalam waktu yang relatif lama sehingga terkumpul dana besar, maka penanggung akan mampu: 1. M engembalikan tertanggung kepada posisinya semula seperti halnya sebelum kerugian menimpanya, atau 2. M enghindarkan tertanggung dan kebangkrutan sedemikian rupa sehingga ia mampu berdiri di tempat semula seperti keadaan sebelum kerugian menimpanya. Premi – premi yang relatif kecil dikumpulkan oleh penanggung dan banyak tertanggung hingga terkumpul dana besar. Dan bila ada tertanggung ditimpa oleh suatu peristiwa sehingga menderita kerugian, maka untuk menutupi kerugian itu diambilkan dari dana yang terkumpul tadi. Bagi tertanggung, premi juga sangat penting karena merupakan biaya baginya. Tinggi rendahnya premi pada umumnya menjadi pertimbangan pokok bagi tertanggung apakah menutup asuransi atas interestnya atau tidak. Di samping pertimbangan pokok ini, juga kesanggupan penanggung untuk menyelesaikan klaim dan kemampuan membayar ganti rugi dengan lancar menjadi pertimbangan penting bagi tertanggung. Walaupun premi rendah, tetapi bila penanggung tidak lancar 46 menyelesaikan klaim, apalagi kurang mampu membayar ganti rugi, adalah sia-sia bagi tertanggung menutup asuransi. 2.10 Marketing 2.10.1 Definisi Pemasaran M erupakan falsafah perusahaan yang menyatakan bahwa pemasaran keinginan pembeli adalah syarat utama bagi kelangsungan hidup perusahaan. Segala kegiatan perusahaan di bidang produksi, teknik, keuangan, dan pemasaran diarahkan untuk mengetahui keinginan pembeli dan kemudian memuaskan keinginan tersebut dengan mendapatkan laba. Jadi, bagian pemasaran mempunyai peranan aktif sejak dimulainya proses produksi. Semua kegiatan perusahaan untuk menghasilkan dan menjual barang didasarkan pada masalah pemasaran. Perusahaan yang menganut konsep pemasaran ini tidak hanya sekedar menjual barang saja, tetapi lebih dari itu, perusahaan harus memperhatikan konsumen beserta kebutuhannya. Secara definitif dapat dikatakan bahwa (Swastha, Sukotjo, 2000, p178) : Konsep pemasaran : adalah sebuah falsafah bisnis yang menyatakan bahwa pemuasan kebutuhan konsumen merupakan syarat ekonomi dan social bagi kelangsungan hidup perusahaan. Konsep pemasaran ini banyak dianut oleh perusahaan modern yang ingin mencapai laba jangka panjang dengan berorientasi pada konsumen atau pasar. 47 2.11 Analisis S WOT M enurut Pearce dan Robinson (1991, p181) analisis SWOT merupakan suatu identifikasi secara sistematis strategi dan fakor internal, strength dan weakness dan faktor lingkungan, opportunities dan threats, dari suatu perusahaan yang mewakili perpaduan terbaik antara faktor tersebut. Ini berdasarkan pada asumsi bahwa suatu strategi yang efektif memaksimumkan strength dan opportunities dan meminimumkan weakness dan threats suatu perusahaan. Penerapan asumsi sederhana ini secara tepat dapat memberikan dampak besar dalam keberhasilan perancangan strategi. Dengan analisis SWOT pemasaran berdasarkan seluruh data pesaing yang di miliki dapat di identifikasi hal – hal paling relevan yang dapat dilihat berdasarkan pengalaman waktu yang lalu. Faktor – faktor yang perlu diperhatikan dalam analisis SWOT tersebut antara lain : • Kekuatan (strength) M erupakan kekuatan yang dimiliki suatu perusahaan dibandingkan dengan keadaan para pesaingnya • Kelemahan (weakness) M erupakan kelemahan atau permasalan yang dihadapi suatu perusahaan dibandingkan dengan keadaan para pesaingnya. • Kesempatan (opportunities) M erupakan suatu kesempatan yang dimiliki suatu perusahan untuk merebut lebih banyak lagi konsumen yang dibandingkan dengan para pesaingnya. 48 • Ancaman (threats) M erupakan segala tantangan yang dihadapi dari para pesaingnya dalam rangka merebut konsumen.