Kecerdasan Bisnis Data Warehousing, Akuisisi Data, Data Mining, Analitik Bisnis Visualisasi Data dan Sumber Data • Tidak ada data Tidak ada Keputusan yang baik • Data perlu digali, diekstrak, disaring, divalidasi, dianalisa • Sumber data -> Proses -> Informasi Definisi • Data – Item mengenai sesuatu, kejadian, aktivitas, transaksi yang direkam, diklasifikasikan, disimpan namun tidak diorganisasi untuk menyampaikan makna spesifik • Informasi – Data yang telah diorganisasi dalam cara tertentu agar bermakna bagi penerima Definisi • Pengetahuan – Pengetahan terdiri dari item data dan atau informasi yang diorganisasi dan diproses untuk menyampaikan pemahaman, pengalaman, pembelajran akumulatif dan keahlian yang dapat diaplikasikan pada sebuah masalah atau aktifitas saat ini Sumber Data • Data internal – Data tentang orang, produk, jasa dan proses • Data personal – Data yang merupakan keahlian, catatan-catatan serta opini yang dimiliki oleh perseorangan • Data Eksternal – Data yang berasal dari luar berupa database komersial sampai data yang dikumpulkan dengan sensor dan satelit, data yang tersedia pada cd/dvd, pada internet, berupa text, audio dan video Pengumpulan Data • Survei • Observasi • Wawancara • ………………………………… • ………………………………… • ………………………………… Kualitas Data • Prinsip Gigo (garbage in garbage out) • Berhubungan dengan akurasi data, tidak lengkap, ambigu • Tahun 2001 burukunya kualitas data menyebabkan bisnis di AS menghabiskan biaya $611 miliar dalam satu tahun untuk mengatasi (the datawarehose institute) Masalah Kualitas Data • Data tidak benar (data tidak dihasilkan hati hati, data tidak dientry dengan benar) – Solusinya ? • Otomatisasi entry data • Membangun program kemanan dan validasi data Masalah Kualitas Data • Data tidak tepat waktu – Metode menghasilkan data tidak cukup cepat untuk memenuhi kebutuhan – Solusinya ? • Menggunakan web untuk mendapatkan data yang tepat • Memodifikasi sistem Masalah Kualitas Data • Data yang diperlukan tidak ada – Tidak seorangpun memliki data yang dibutuhkan – Data yang diperlukan tidak pernah dicatat sama sekali – Solusinya • Memprediksi data yang akan dibutuhkan masa depan • Mengestimasi data baru Sumber Masalah Kualitas Data • • • • • • • • Entry data karyawan :76% Perubahan pada sumber data :53% Migrasi data dan proyek konversi: 48% Harapan pengguna : 46% Data eksternal : 34% Kesalahan Sistem : 35% Entri oleh pelanggan : 25% Lainnya : 12% Kategori Kualitas Data • Menurut Strong dkk (1997) kualitas data dibagi menjadi 4 dimensi yaitu : – Kontekstual : relevansi, nilai tambah, batasan waktu, kelengkapan, jumlah data – Intrinsik : Akurasi, obyektivitas, kemampuan untuk dipercaya, reputasi – Aksesibilitas : Kemampuan untuk diakses – Representasi : Kemampuan untuk diintrepretasi, kemudahan pemahaman, representasi tepat, repesentasi konsisten BAGAIMANA SEBAIKNYA ? Bagaimana Sebaiknya • Mulai dari awal – Kualitas data harus dimulai sejak awal, tidak setelah data menjadi rumit – Kenali Data anda : Pahami data apa yang dipunyai, tentukan tingkat presisi yang tepat yang dibutuhkan oleh tiap item data – Jadikan proses itu terus berulang : membudayakan kualitas data – Mengukur hasilnya