Uploaded by andidwiiwulandari

Materi SIM-Andi Dwi Wulandari

advertisement
Nama : Andi Dwi Wulandari
NIM
: 1993140044
Kelas : Manajemen A 2019
Menggunakan Database untuk Meningkatkan Kinerja dan Pengambilan Keputusan
Bisnis
Bisnis menggunakan database untuk melacak transaksi dasar, seperti
pembayaran pemasok, memproses pesanan, melacak pelanggan, dan membayar
karyawan. Tetapi mereka juga membutuhkan database untuk memberikan informasi
yang akan membantu perusahaan menjelaskan bisnis dengan lebih efisien, dan
membantu manajer dan karyawan menentukan keputusan dengan baik. Jika suatu
perusahaan ingin mengetahui produk mana yang paling popular atau siapa
pelanggannya yang paling menguntungkan, jawabannya ada pada datanya.
Tantangan dan Big Data
Hingga sekitar lima tahun yang lalu, sebagian besar data yang dikumpulkan
oleh organisasi terdiri dari data transaksi yang dapat dengan mudah masuk ke dalam
baris dan kolom relasional sistem manajemen basis data. Sejak itu, telah terjadi
ledakan data dari lalu lintas web, pesan email, dan konten media social (tweet dan
pesan status), serta data yang dihasilkan mesin dari sensor (digunakan dalam
pengukur pintar, sensor pabrikan, dan pengukur listrik) atau dari elektronik sistem
perdagangan. Data ini mungkin tidak trstruktur atau semi terstruktur dan karenanya
tidak cocok untuk produk database relasional yang mengatur data dalam bentuk
kolom dan baris. Kami sekarang menggunakan istilah Big Data (data besar) untuk
menggambarkan kumpulan data ini dengan volume yang sangat besar sehingga
melebihi kemampuan DBMS biasa tangkat, simpan, dan analisis.
Big data tidak mengacu pada kuantitas tertentu, tetapi biasanya mengacu pada
data dalam kisaran petabyte dan Exabyte, dengan kata lain, miliaran hingga triliunan
catatan, semua dari sumber yang berbeda. Big data diproduksi dalam jumlah yang
jauh lebih besar dan jauh lebih cepat daripada data tradisional. Misalnya, mesin jet
tunggal mampu menghasilkan 10 terabyte data hanya dalam 30 menit, da nada lebih
dari 25.000 penerbangan maskapai setiap hari. Meskipun “tweet” terbatas pada
masing-masing 140 karakter, Twitter menghasilkan lebih dari 8 terabyte data setiap
hari. Menurut ke firma riset teknologi international data center (IDC), data lebih
banyak meningkat dua kali lipat setiap dua tahun, sehingga jumlah data yang tersedia
untuk organisasi meroket.
Bisnis tertarik pada Big data karena mereka dapat mengungkapkan lebih
banyak pola dan anomali yang menarik dibandingkan kumpulan data yang lebih kecil,
dengan potensi untuk disediakan wawasan baru tentang perilaku pelanggan, pola
cuaca, pasar keungan aktivitas, atau fenomena lainnya. Namun, untuk mendapatkan
nilai bisnis dari ini data, organisasi membutuhkan teknologi dan alat baru yang
mampu mengelola dan menganalisis data non-tradisional bersama dengan data
perusahaan tradisional mereka.
Infrastruktur Intelejen Bisnis
Misalnya anda menginginkan informasi yang ringkas dan andal tentang
operasi saat ini, tren, dan perubahan di seluruh perusahaaan. Jika anda bekerja
disebuah perusahaan besar, data yang anda butuhkan mungkin harus disatukan dari
sistem yang terpisah, seperti penjualan, manufaktur, dan akuntansi, bahkan dari
sumber eksternal, seperti data demografis atau pesaing. Anda mungkin semakin
membutuhkannya untuk menggunakan Big data. Sebuah infrastruktur kontemporer
untuk intelejen bisnis memiliki serangkaian alat untuk memperoleh informasi yang
berguna dari semua jenis data yang berbeda yang digunakan oleh bisnis saat ini,
termasuk semi-terstruktur dan tidak terstruktur Big data dalam jumlah yang besar.
Kemampuan ini mencakup gudang data dan data mart, hadoop, komputasi dalam
memori, dan platform analitik.

Gudang Data dan Data Mart
Alat tradisional untuk menganalisis data perusahaan selama dua decade
terakhir telah menjadi gudang data. Gudang data adalah database yang
menyimpan arus dan data historis minat potensial bagi pengambil keputusan di
seluruh perusahaan. Data berasal dari banyak sistem transaksi operasional inti,
seperti sistem untuk penjualan, akun pelanggan, dan manufakturs, dan mungkin
termasuk data dari transaksi situs web. Gudang data mengekstrak arus dan data
historis dari berbagai sistem operasional di dalam organisasi. Data ini
digabungkan dengan data dari sumber eksternal dan diubah dengan mengoreksi
data yang tidak akurat dan tidak lengkap serta merestrukturisasi data untuk
pelaporan dan analisis manajemen sebelum dimuat ke dalam gudang data.
Gudang data membuat data tersedia untuk diakses siapa saja sesuai
kebutuhan, tapi tidak bisa diubah. Sistem gudang data juga menyediakan berbagai
ad hoc dan alat kueri standard, alat analitis dan pelaporan fasilitas grafis.
Perusahaan sering membangun gudang data di seluruh perusahaan, tempat
pusat gudang data melayani seluruh organisasi, atau mereka menciptakan yang
lebih kecil, desentral-gudang berukuran besar yang disebut data mart. Data mart
adalah bagian dari gudang data dimana bagian data organisasi yang diringkas atau
sangat terfokus ditempatkan dalam database terpisah untuk populasi pengguna
tertentu. Sebagai
contoh, sebuah perusahaan mungkin
mengembangkan
pemasaran dan penjualan data mart untuk menangani pelanggan informasi tomer.
Penjual Buku Barnes & Noble biasa menyimpan serangkaian data mart- satu
untuk data tempat penjualan di toko eceran, satu lagi untuk toko buku perguruan
tinggi penjualan, dan sepertiga untuk penjualan online.

Hadoop
Produk DBMS relasional dan gudang data tidak cocok untuk organisasi
dan menganalisis big data atau data yang tidak mudah masuk ke dalam kolom dan
baris digunakan dalam model data mereka. Untuk menangani data tidak
terstruktur dan semi-terstruktur dalam jumlah besar, serta data terstruktur,
organisasi menggunakan Hadoop. Hadoop adalah kerangka perangkat lunak
sumber terbuka yang dikelola oleh Apache Softrware Foundation yang
memungkinkan pemrosesan parallel terdistribusi besar jumlah data di computer
murah.
Ini
memecahkan
masalah
big
data
turun
ke
sub-masalah,
mendistribusikannya di antara hingga ribuan inexpen-sive node pemrosesan
computer, dan kemudian menggabungkan hasilnnya menjadi kumpulan data yang
lebih kecil dan lebih mudah dianalasis. Anda mungkin pernah menggunakan
Hadoop untuk menemukan tiket pesawat yang terbaik di internet, mendapatkan
petunjuk arah ke restoran, menelusuri Google, atau terhubung dengan teman di
Facebook.
Hadoop terdiri dari beberapa layanan utama : Sistem File Terdistribusi
Hadoop (HDFS) untuk menyimpan data dan MapReduce untuk data parallel yang
berkinerja tinggi dalam pengolahan. HDFS menghubungkan sistem file pada
banyak node di file Kluster Hadoop untuk mengubahnya menjadi satu sistem file
besar. MapReduce milik Hadoop tadinya terinspirasi oleh sistem MapReduce
Google untuk memecah pemrosesan yang sangat besar dasaset dan menugaskan
pekerjaan ke berbagai node dalam sebuah cluster. HBase, Hadoop database nonrelasional, menyediakan akses cepat ke data yang disimpan di HDFS dan sebuah
platform transaksional untuk menjalankan aplikasi real-time skala tinggi.
Hadoop dapat memproses data apapun dalam jumlah besar, termasuk data
terstruktur, data tradisional, data yang terstruktur secara longgar seperti feed
Facebook dan Twitter, data kompleks seperti file log server Web, serta audio dan
video data yang tidak terstruktur. Hadoop berjalan pada sekelompok server yang
tidak mahal, dan prosesor bisa ditambahkan atau dihapus sesuai kebutuhan.
Perusahaan menggunakan Hadoop untuk menganalisis volume data yang sangat
besar serta untuk area pementasan untuk tidak terstruktur dan semi terstruktur.
Data turet sebelum masuk ke gudang data. Facebook menyimpan banyak datanya
pada cluster Hadoop yang sangat besar, yang menampung sekitar 100 petabyte,
sekitar 10.000 kali lebih banyak informasi daripada Perpustakaan Kongres. Yahoo
menggunakan Hadoop untuk melacak perilaku pengguna sehingga dapat
mengubah halaman beranda agar sesuai dengan minat mereka. Firma riset ilmu
hayati NextBio menggunakan Hadoop dan HBase untuk memproses datanya
perusahaan farmasi yang melakukan penelitian genomic. Vendor database teratas
seeprti IBM, Hewlett-Packard, Oracle, dan Microsoft memiliki Hadoop sendiri
distribusi perangkat lunak. Vendor lain menawarkan alat untuk memindahkan data
masuk dan keluar Hadoop atau untuk menganalisis data dalam Hadoop.

Komputasi dalam Memori
Cara lain untu memfasilitasi analisis big data adalah dengan menggunakan
komputasi dalam memori, yang terutama mengandalkan memori utama (RAM)
computer untuk penyimpanan data. (DBMS konvensional menggunakan sistem
penyimpanan disk). Pengguna mengakses data yang disimpan di memori utama
sistem, sehingga menghilangkan kemacetan dari pengambilan dan membaca data
dalam database tradisional terbasis disk dan memperpendek secara dramatis waktu
respons kueri. Pemrosesan dalam memori memungkinkan kumpulan data yang
sangat besar, sebesar ukuran data mart atau gudang data kecil, hingga seluruhnya
berada dalam memori. Perhitungan bisnis yang rumit dulu jam atau hari bisa
diselsesaikan dalam hitungan detik dan ini bahkan bisa dicapai pada perangkat
genggam.
Bab sebelumnya menjelaskan beberapa kemajuan kontemporer teknologi
perangkat keras computer yang memungkinkan pemrosesan dalam memori,
seperti itu sebagai prosesor berkecepatan tinggi yang kuat, pemrosesan multi inti,
dan computer jatuh harga memori. Teknologi ini membantu perusahaan
mengoptimalkan penggunaan memori dan mempercepat kinerja pemrosesan
sekaligus menurunkan biaya.
Produk komersial terkemuka untuk komputasi dalam memori termasuk
SAP’s High Permormance Analytics Appliance (HANA) dan Oracle Exalytics.
Masing-masing menyediakan satu set komponen perangkat lunak terintegrasi,
termasuk perangkat lunak basis data dalam memori dan perangkat lunak analitik
khusus, yang berjalan pada perangkat keras yang dioptimalkan dalam memori
pekerjaan komputasi.
Centrica, utilitas gas dan listrik, menggunakan HANA untuk menangkap
dan menganalisis dengan cepat sejumlah besar data yang dihasilkan oleh pengukur
pintar. Perusahaan mampu menganalisis penggunaan setiap 15 menit, memberikan
gambaran yang lebih jelas tentang penggunaan oleh lingkungan, ukuran rumah,
jenis bisnis yang dilayani, atau tipe bangunan. HANA juga membantu Centrica
menunjukkan kepada pelanggannya pola penggunaan energy mereka dalam
penggunaan waktu nyata alat online dan seluler.

Platform Analitik
Vendor database komersial telah mengembangkan analitik berkecapatan
tinggi khusus platform yang menggunakan teknologi relasional dan non-relasional
dioptimalkan untuk menganalisis kumpulan data besar. Platform analitik ini,
seperti IBM Netezza dan Oracle Exadata, menampilkan sistem perangkat kerasperangkat lunak yang telah dikonfigurasi sebelumnya yang dirancang khusus
untuk pemrosesan kueri dan analitik. Sebagai contoh, IBM Netezza menghadirkan
database, server, dan komponen penyimpanan yang terintegrasi erat nents yang
menangani kueri analitik komoleks 10 hingga 100 kali lebih cepat daripada sistem
nasional. Platform analitik juga mencakup sistem dalam memori dan NoSQL
sistem manajemen database non-relasional.
Gambar 6.12 mengilustrasikan infrastruktur intelejen bisnis kontenporer
menggunakan teknologi yang baru saja kami jelaskan. Data terkini dan historis
diekstrak dari beberapa sistem operasional bersama dengan data Web, mesin data
yang dihasilkan data audio/visual tidak terstruktur, dan data dari sumber eksternal.
Infrastruktur intelejen bisnis kontenporer menampilkan kepabilitas dan alat untuk
mengelola dan menganalisis jumlah besar dan jenis data yang berbeda dari
berbagai sumber. Kueri yang udah digunakan dan alat pelaporan untuk pengguna
bisnis biasa dan perangkat analitik yang lebih canggih untuk pengguna yang sudah
termasuk mahir.
Download