1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Akumulasi data-data pada perusahaan dalam jumlah besar menghadirkan dua sisi mata uang. Banyaknya data menjadi suatu masalah sendiri karena penumpukan data yang sering disebut sebagai “rich of data but poor of information”, “data tombs” atau kuburan data. Sebagai ilustrasi, perusahaan-perusahaan retail besar seperti hero supermarkets, hypertmarts, atau carefour yang menerapkan teknik OLTP (On Line Transaction Processing), yakni mengumpulkan data-data penjualannya setiap hari yang berkisar 1 gigabyte setiap bulan per satu toko. Data-data sebanyak itu berasal dari transaksi penjualan, transaksi pemasukan barang dan stok barang, aplikasi kartu kredit dan bank, dan lain lain. Dapat dibayangkan betapa besarnya data-data tersebut memenuhi hard disk komputer. Data tersebut tidak efektif dan hanya memenuhi hard disk komputer. Memang dilihat dari sisi hardware, kapasitas penyimpan data sekarang ini sudah jauh lebih besar dan ukuran fisiknya pun tidak berubah. Tetapi dilihat dari kegunaannya data sebanyak itu boleh dibilang tidak bermanfaat. Kalau dicermati, pada faktanya data-data tersebut mengandung variable-variabel informasi yang kerap tidak terlihat secara kasat mata. Data-data tersebut hanya dikumpulkan dan didokumentasikan tanpa diproses lebih lanjut menjadi informasi-informasi yang lebih berguna untuk perkembangan perusahaan. Sekarang pertanyaannya adalah masihkah perusahaan membiarkan data-data sebanyak itu berada di dalam “hard disk” tanpa ditindak lanjuti? Apakah akan dibuang begitu saja? Ataukah dapat di- 2 “tambang” untuk mencari “emas”, atau “berlian” yang berupa informasi yang berguna untuk organisasi atau perusahaan. Data mining merupakan alat bantu teknologi informasi yang pesat perkembangannya dalam dunia bisnis saat ini. Data mining adalah serangkaian proses untuk menggali nilai tambah suatu kumpulan data, berupa pengetahuan yang selama ini tidak diketahui secara manual atau kasat mata. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki arti penting bagi bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Beberapa teknik yang sering disebut-sebut dalam literatur data mining (classical techniques) antara lain : clustering, classification, association rule mining, neural network, genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap data mining adalah perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum data mining populer, teknik-teknik tersebut hanya dapat dipakai untuk data-data pada perusahaan skala kecil saja. Penjualan dan promosi adalah dua hal yang berkaitan dan sangat berarti bagi sebuah perusahaan. Kerap kali keduanya menjadi tulang punggung perusahaan dan merupakan strategi usaha bisnis yang penting. Dengan promosi, maka diharapkan perusahan tersebut dapat mencapai jumlah penjualan yang telah ditargetkan. Sebuah promosi dapat diputuskan dengan mempelajari pola pembelian produk (customer character prediction) dari data-data transaksi pelanggan. Pola-pola tersebut ternyata dapat dipetakan berdasarkan informasi-informasi yang ada. Selama ini pencarian 3 pola tersebut dilakukan secara manual dengan menggunakan perhitunganperhitungan statistik. Namun seturut dengan meningkatkan jumlah data transaksi pelanggan, terutama dalam sebuah perusahaan distributor yang berskala besar, hal tersebut tentunya sangatlah tidak efisien. Dari pola pembelian suatu produk tersebut dapatlah dibuat predictive modelnya, atau perkiraan promosi dan penjualan agar optimal, efisien, serta efektif. Dengan dilatarbelakangi oleh masalah tersebut dan dengan didukung oleh penemuan teknik data mining, maka akan dirancang aplikasi data mining untuk memprediksi customer character secara otomatis guna membantu pengambilan keputusan demi kepentingan promosi bagi sebuah perusahaan medis atau kesehatan berskala besar. 1.2. Perumusan Masalah Perumusan masalah yang ingin dirancang dalam skripsi ini adalah cara menciptakan suatu aplikasi data mining yang dapat diterapkan di sebuah perusahaan medis, kesehatan, insurance dan produk-produk kesehatan lainnya. Aplikasi data mining diharapkan dapat membuat peningkatan secara maksimal untuk bagian penjualan dan promosi dari perusahaan medis tersebut. Untuk pembuatan data mining, model predictive-nya menggunakan teknik association rule dengan logika apriori. Teknik association rule ini dapat memetakan pola pembelian produk (customer character prediction) dari data-data transaksi customer yang terdokumentasi sebelumnya. Sedangkan logika apriori adalah logika yang mendukung pencarian pola pembelian produk (customer character prediction) dari 4 data transaksi pelanggan. Prediksi tersebut digunakan sebagai penunjang pengambilan keputusan dalam melakukan promosi produk tertentu. Skripsi ini dibatasi ruang lingkupnya hanya untuk memprediksi dua jenis produk, yakni: • Produk-produk baru dari perusahaan • Produk-produk kurang laku dalam tingkat penjualannya. Untuk meningkatkan akurasi kebenaran customer character prediction, maka digunakan metode runge-kutta orde tiga. Hampir dapat dipastikan bahwa hasil data dari data mining engine sesuai dan akurat untuk kepentingan perusahaan. Adapun ruang lingkup akan diprediksi dibatasi sebagai berikut. 1. Produk apa yang paling tepat untuk ditawarkan kepada customer tertentu? 2. Faktor-faktor apakah yang menentukan seorang customer untuk membeli produk tertentu. Batas-batas yang ada dan perlu diperhatikan dalam skripsi ini adalah sebagai berikut. 1. Perancangan berfokus pada data transaksi penjualan (sales) dan data pelanggan (customer) perusahaan yang merupakan data masukan bagi penemuan predictive model untuk data mining. 2. Teknik yang digunakan dalam penemuan predictive model di dalam sistem ini adalah teknik association rule dan logika apriori yang didukung oleh metode runge-kutta orde tiga. 5 1.2.1. Komponen Perancangan Komponen perancangan yang terlibat dalam sistem ini adalah sistem operasi, database management system (DBMS) dan bahasa pemrograman. Sistem operasi yang digunakan adalah Microsoft Windows sebagai sistem operasi yang paling umum digunakan. DBMS yang digunakan adalah SQL Server 2000 yang digunakan dalam mengimplementasi aplikasi. Sedangkan bahasa pemrograman yang digunakan adalah Borland Delphi versi 2005. 1.2.2. Spesifikasi Perancangan Rancangan yang akan dibuat adalah aplikasi data mining untuk relational database. Proses aplikasi ini terbagi menjadi dua proses, yaitu learning process dan predict process. Dalam proses learning, aplikasi ini akan mengambil data dari database dan mempelajarinya sesuai dengan atribut–atribut dari tabel yang dimasukkan. Dalam proses ini digunakan teknik association rule dengan logika apriori. Proses pembelajaran ini akan disimpan di suatu file database yang akan digunakan untuk memprediksi atribut suatu tabel yang akan dianalisis. Dalam proses predicting, aplikasi ini akan mengambil data dari file database yang sudah disimpan sebelumnya. Lalu aplikasi akan mengambil atribut– atribut dari tabel yang akan diprediksi dan menampilkan hasilnya. 6 1.3. Tujuan dan Manfaat Perancangan 1.3.1. Tujuan Perancangan Adapun tujuan rancangan aplikasi data warehouse dan data mining ini adalah sebagai berikut. 1. Menemukan pola karakteristik customer dalam membeli produk (customer character prediction) dari sekumpulan data transaksi pelanggan yang sangat besar jumlahnya. 2. Memprediksi customer character yang paling optimal untuk digunakan sebagai penunjang pengambilan keputusan dalam melakukan promosi produk tertentu. 1.3.2. Manfaat Perancangan Manfaat dari perancangan aplikasi data mining ini adalah sebagai berikut. 1. Bagi perusahaan di bidang kesehatan: • Mengoptimalkan predictive model untuk meningkatkan tingkat promosi dan penjualan produk tertentu. • Dapat menghemat waktu dan tenaga dalam memprediksi pola pembelian produk (customer character prediction) dari transaksi pelanggan. • Dapat mengurangi kerugian akibat strategi promosi dan penjualan yang tidak tepat sasaran, guna meningkatkan efektifitas bagian marketing dan penjualan pada perusahaan tersebut. 7 2. Bagi dunia bisnis: • Dapat mengembangkan strategi bisnis yang lebih tepat dan efisien untuk menghadapi persaingan dalam dunia bisnis. • Dapat menginspirasikan sebuah strategi baru untuk pengambilan keputusan dengan tingkat efektifitas tinggi. • Dapat diterapkan ke sistem yang lebih luas seperti marketing, human resources dan sebagainya. 1.4. Metodologi Penelitian Penelitian yang dilakukan menggunakan metode analisis dan perancangan untuk membangun progam aplikasi data mining. Tiap tahapan tersebut akan dijelaskan sebagai berikut. 1. Tahapan survei Pada tahap ini dilakukan studi kepustakaan untuk memperoleh sumber-sumber mengenai topik dan pokok masalah yang ada, rumusan masalah, tujuan, manfaat, metodologi penelitian, masalah utama, usulan penyelesaian yang ada, serta teori yang digunakan sebagai dasar untuk pemecahan masalah tersebut. Setelah itu dilanjutkan dengan wawancara dan studi lapangan pada perusahaan yang menjadi tempat studi kasus. 2. Analisis kebutuhan sistem dan analisis teknologi informasi Tahap ini dilakukan untuk mengetahui sistem Data Mining yang seperti apa yang akan dibuat, dilihat dari penggunanya, kebutuhan perusahaan yang 8 berkaitan dengan customer character prediction, dan teknologi informasi dalam perusahaan yang menjadi tempat studi kasus. 3. Perancangan model konseptual aplikasi data mining Setelah mengetahui gambaran kebutuhan sistem dan teknologi informasi perusahaan pada umumnya, maka perancangan model konseptual aplikasi data mining dipetakan menjadi beberapa tahapan-tahapan, mulai dari analisis kebutuhan data sampai kepada perancangan aplikasi front-end untuk user. Penjelasan setiap tahap yang dilakukan dapat dilihat pada Tabel 1.1 berikut ini. Tabel 1.1 Pengambaran Setiap Tahap yang Terdapat pada Model Konseptual Tahap 1. Analisis kebutuhan data Masukan Permasalahan yang ada, Proses Menganalisis kebutuhan Keluaran Data yang diperlukan landasan teori, kebutuhan data dan membaca literatur untuk memecahkan sistem, dan teknologi masalah yang ada dan informasi pada perusahaan report 2. Analisis teknik data Teknik-teknik data mining Menganalisa teknik-teknik Teknik yang diperlukan mining yang ada data mining dan membaca untuk membuat model data literatur mining 3. Analisis sistem basis Data yang diperlukan Menganalisa basis data Tabel-tabel pada basis data data berjalan untuk memecahkan perusahaan menurut sistem berjalan yang masalah dan report karakteristik bisnisnya dibutuhkan oleh aplikasi 4. Perancangan aplikasi Tabel-tabel pada basis data Merancang, membangun, Predictive model (model data mining (back-end) sistem berjalan yang memvalidasi dan data mining) dibutuhkan oleh aplikasi merepresentasikan predictive model data mining 5. Perancangan aplikasi data mining (front-end) Tabel-tabel pada basis data Membuat tampilan, melatih Aplikasi sistem berjalan yang model secara keseluruhan dibutuhkan oleh aplikasi data mining dan mengupdate data mining 9 1.5 Sistematika Penulisan Penyusunan skripsi ini dibagi menjadi lima bab dengan bagian isi pada bab 3 dan bab 4 dengan berdasar pada bab 1 dan bab 2 yang kemudian dirangkum dalam bab 5 berupa kesimpulan dan saran. Penjelasan dari setiap bab adalah sebagai berikut. Bab 1. Pendahuluan Bab pertama ini membahas mengenai latar belakang perancangan, ruang lingkup dari penulisan dan pembahasan skripsi ini, tujuan dan manfaat perancangan, metodologi yang digunakan untuk perancangan, sistematika penulisan yang memberikan gambaran umum dari setiap bab. Bab 2. Landasan Teori Bab ini membahas teori-teori umum dan khusus yang berkaitan dengan penulisan skripsi ini dan merupakan landasan bagi setiap tahap pengerjaan dalam menyelesaikan masalah yang ada. Bab 3. Analisis dan Perancangan Bab ini menggambarkan keadaan perusahaan secara umum, kemudian dilanjutkan dengan pembahasan analisis kebutuhan dan perancangan serta analisis teknik data mining yang digunakan secara mendetail. Bab 4. Implementasi dan Evaluasi Bab ini menjelaskan bagaimana proses implementasi program aplikasi data mining pada perusahaan, dan juga mendokumentasikan segala kesulitan dan hal-hal penting lainnya untuk dievaluasi. 10 Bab 5. Kesimpulan dan Saran Pada bab ini segala hasil yang didapat melalui proses dokumentasi dari awal perancangan sampai kepada proses evaluasi akan dituangkan dalam kesimpulan serta saran yang merupakan masukan untuk melakukan penilitian pada masa yang akan datang.