Gudang data

advertisement
Sistem Hirarki komputer :
Field : Karakter dari group
Record : Hubungan field (lingkungan) dari group
File : Group yang memiliki record yang sama
Database : Group dari field yang berhubungan
• Redundansi dan Inskonsistensi Data
• Redundasi Data: Duplikasi data dalam beberapa file
• Inkonsistensi Data: Beberapa Atribut yang memiliki nilai
berbeda
• Ketergantungan program data:
• mengacu kepada pasangan data yang tersimpan dalam
file dan program tertentu yang dibutuhkan untuk
memperbaharui dan memelihara file tersebut
• Kurangnya Flexibilitas
• Keamanan yang buruk
• Kekurangan dalam pembagian dan ketersediaan data
• Database
• Sekumpulan data organisasi guna melayani banyak aplikasi
dengan memusatkan data dan mengendalikan redundansi
data
• Sistem Manajemen Database:
• Menghubungkan antara program aplikasi dan fisik data file
• Memisahkan Logika dan fisik dari data
• Memecahkan permasalahan dari lingkungan file tradisional
• Mengontrol redudansi
• Mengeliminasi inkonsistensi
• Memisahkan program dan data
• Tidak Memungkinkan memusatkan dan keamanan
Hirarki Database
• DBMS Relational
• Merepresesntasikan data sEperti tabel dua dimensi ( yang
disebut relasi)
• Setiap tabel berisi data dari entitas dan atribut
• Table: Jaringan dari kolom dan baris
• Row (tuples): Untuk mencatat entitas yag berbeda
• Fields (columns): Merepresentasikan atribut untuk entitas
• Key field: Field khusus untuk mengindenfikasikan masing
masing catatan (record)
• Primary key: Field adlam tabel yang digunakan untuk key
field
• Foreign key: Kunci utama yang digunakan dalam tabel
kedua
• Operasi DBMS Relasional: Tiga dasar operasi yang didunakan
untuk mengembangkan kegunaan pengaturan data
• SELECT: Mambuat subset dari data dari semua records dari
tabel
• JOIN: manggabungkan tabel relasional untuk menyediakan
lebih banyak informasi dari pada yang tersedia dari
• PROJECT: Menciptakan substdari kolom pada tabel,
menciptakan tabel dengan hanya informasi yang spesifik
• Hierarchical DBMS: Model satu ke banyak
jaringan
• Network DBMS: Model banyak ke banyak
jaringan
• Gudang data dan prosedur sebagai objek
• Memungkinakan pengaturan grafik, multimedia,
javaCapable of managing graphics, multimedia, applets
Java
• Relatif lebih lambat dibandingkan DBMS tradisional
Kemampuan dari sistem manajemen database
• Defenisi data: untuk menentukan struktur dari basis data
• Kamus Data: File otomatis atau manual yang menyimpan
definisi dari elemen data dan karakteristiknya
• Bahasa Manipulasi Data: Untuk menambah, mengganti,
menghapus, mengambil kembali data dari database
• Structured Query Language (SQL)
• Microsoft Access user tools for generation SQL
• Mendesain Data
• Conceptual (logical) design: Menggambarkan model dari
prespektif bisnis
• Physical design: Bagaimana database diatur langsung dari
perangkat penyimpanan
• Proses Identifikasi:
• Hubungkan antara elemen data, elemen database yang
berlebihan
• Cara yang lebih efisien menuju kelompok data elemen
untuk mempertemukan keperluan bisnis, kebutuhan
aplikasi program
• Normalisasi
• Mengalirkan kelompok data yang komplek sehingga
menjadi data yang sederhana.
Menggunakan Basis Data untuk
Meningkatkan Kinerja Bisnis dan proses
Pengambilan Keputusan
Perusahaan menggunakan basis data untuk melacak
transaksi dasar, seperti membayar pemasok, memproses
pesanan, melacak pelanggan dan membayar gaji
karyawan. Tapi perusahaan juga membutuhkan basis
data untuk menyediakan informasi yang akan membantu
perusahaan menjalankan bisnis dengan lebih efisien, dan
membantu manajer dan karyawan membuat keputusan
lebih baik.
Gudang data (data warehouse)
Basis data yang menyimpan data yang
sekarang dan terdahulu diminati oleh para
pembuat keputusan di seluruh perusahaan.
Gudang data menggabungkan dan
menstandarkan informasi dari basis data
operasional yang berbeda sehingga informasi
dapat digunakan di seluruh perusahaan untuk
analis dan pembuatan keputusan manajemen.
Komponen Gudang data
Sumber
Data
Operasiona
Data
Internal
Data
Pelanggan
Data
Manufaktur
Sumber
Data
Eksternal
Data
Histori
Data
Eksternal
Ekstraksi
dan
Transformasi
Gudang
data
Direktori
Informasi
Akses dan
Analisa
Data
- Query dan
Pelaporan
- OLAP
- Pengalihan
data
Data Mart
subset dari gudang data yang didalamnya terdapat
ringkasan atau porsi data perusahaan yang sangat
terfokus ditempatkan dalam basis data terpisah
untuk suatu populasi atau pengguna tertentu.
Intelegensi Bisnis, Analisa data Multidimensi,
dan penggalian data
Intelegensi bisnis (business intelligence) adalah Perangkat –
peramgkat untuk menggabungkan, menganalisis, dan
menyediakan akses untuk data yang luas untuk membantu
pengguna mengambil keputusan bisnis yang lebih baik.
Pemrosesan Analitis Online ( online analytical
processing – OLAP)
Serangkaian alat analitis bekerja dengan data yang disimpan
dalam basis data untuk mencari pola dan pemahaman baru
untuk membantu manajer dan karyawan keputusan lebih
baik untuk meningkatkan kinerja organisasi.
Basis data
Gudang data
Intelegensi Bisnis
Pengalihan data OLAP
Query Pelaporan
________________
Menyimak Jejak transaksi
____________________
Mencari pola&pemahaman
__________________
Keputusan utk merespon data&pola
Penggalian Data ( data mining)
Penggalian data menyediakan pengetahuan tentang data
perusahaan yang tidak dapat diperoleh dengan OLAP,
dengan cara menemukan pola dan hubungan yang
tersembunyi dalam basis data yang besar dan menyimpulkan
aturan untuk memprediksi perilaku di masa depan.
Jenis informasi yang dapat diproleh dari penggalian
data meliputi,
- Asosiasi
- Sekuan
- Klasifikasi
- Kluster
- Prediksi
Basis Data dan Web
Klien
dengan
penjelajah
Web
Internet
Server
Web
Server
Aplikasi
Server
Basis
Data
Basis Data
Dalam lingkungan klien/server, DBMS disimpan pada
computer khusus yang disebut server basis data
(database server). DBMS menerima permintaan SQL
dan memberikan data yang diminta. Perangkat
middleware mentransfer informasi di dalam basis data
internal organisasi kembali ke server Web dalam bentuk
halaman Web untuk pengguna.
Menjadi alat ampuh untuk memerangi
kriminalitas,
karena
dapat
mengidentifikasikan pelaku tindak
kriminal dari gennya sendiri. Dan DNA
juga berguna dalam membuktikan
kebenaran.
Masalah Kontroversial:
Orang-orang yang mengumpulkan dan
menganalisis DNA dapat membuat
kesalahan, seperti koleksi data dan
prosedur laboratorium yang tidak teliti.
Menentukan aturan-aturan organisasi dalam hal
pembagian, penyebaran, perolehan, standardisasi,
klasifikasi dan penyimpanan dari informasi.
Kebijakan informasi menjelaskan prosedur dan
akuntabilitas yang spesifik, mengidentifikasikan
informasi dapat saling dibagikan oleh pengguna dan
unit organisasi, di mana informasi dapat
didistribusikan, dan siapa yang bertanggung jawab
untuk memperbarui dan memelihara informasinya.
Administrasi data (data administration) bertanggung
jawab atas kebijakan dan prosedur yang mengatur data
sebagai sumber daya organisasi. Tanggung jawab ini
meliputi
pengembangan
kebijakan
informasi,
perencanaan data, pengawasan rancangan basis data
logis dan pengembangan kamus data serta pemantauan
terhadap spesialis sistem informasi dan kelompok
pengguna yang menggunakan data.
Audit kualitas data (data quality audit) yang merupakan
survei terstruktur atas akurasi dan tingkat kelengkapan
dari data dalam sebuah sistem informasi.
Pembersihan data (data cleansing atau data scrubbing)
adalah kegiatan mendeteksi dan mengoreksi data dalam
basis data yang tidak benar, tidak lengkap, formatnya
tidak tepat, atau berlebihan. Pembersihan data tidak
hanya mengoreksi kesalahan, tetapi juga menekankan
antara sekumpulan data yang berbeda yang berasal dari
sistem informasi yang terpisah.
Download