Nama : Andi Dwi Wulandari NIM : 1993140044 Kelas : Manajemen A 2019 Menggunakan Database untuk Meningkatkan Kinerja dan Pengambilan Keputusan Bisnis Bisnis menggunakan database untuk melacak transaksi dasar, seperti pembayaran pemasok, memproses pesanan, melacak pelanggan, dan membayar karyawan. Tetapi mereka juga membutuhkan database untuk memberikan informasi yang akan membantu perusahaan menjelaskan bisnis dengan lebih efisien, dan membantu manajer dan karyawan menentukan keputusan dengan baik. Jika suatu perusahaan ingin mengetahui produk mana yang paling popular atau siapa pelanggannya yang paling menguntungkan, jawabannya ada pada datanya. Tantangan dan Big Data Hingga sekitar lima tahun yang lalu, sebagian besar data yang dikumpulkan oleh organisasi terdiri dari data transaksi yang dapat dengan mudah masuk ke dalam baris dan kolom relasional sistem manajemen basis data. Sejak itu, telah terjadi ledakan data dari lalu lintas web, pesan email, dan konten media social (tweet dan pesan status), serta data yang dihasilkan mesin dari sensor (digunakan dalam pengukur pintar, sensor pabrikan, dan pengukur listrik) atau dari elektronik sistem perdagangan. Data ini mungkin tidak trstruktur atau semi terstruktur dan karenanya tidak cocok untuk produk database relasional yang mengatur data dalam bentuk kolom dan baris. Kami sekarang menggunakan istilah Big Data (data besar) untuk menggambarkan kumpulan data ini dengan volume yang sangat besar sehingga melebihi kemampuan DBMS biasa tangkat, simpan, dan analisis. Big data tidak mengacu pada kuantitas tertentu, tetapi biasanya mengacu pada data dalam kisaran petabyte dan Exabyte, dengan kata lain, miliaran hingga triliunan catatan, semua dari sumber yang berbeda. Big data diproduksi dalam jumlah yang jauh lebih besar dan jauh lebih cepat daripada data tradisional. Misalnya, mesin jet tunggal mampu menghasilkan 10 terabyte data hanya dalam 30 menit, da nada lebih dari 25.000 penerbangan maskapai setiap hari. Meskipun “tweet” terbatas pada masing-masing 140 karakter, Twitter menghasilkan lebih dari 8 terabyte data setiap hari. Menurut ke firma riset teknologi international data center (IDC), data lebih banyak meningkat dua kali lipat setiap dua tahun, sehingga jumlah data yang tersedia untuk organisasi meroket. Bisnis tertarik pada Big data karena mereka dapat mengungkapkan lebih banyak pola dan anomali yang menarik dibandingkan kumpulan data yang lebih kecil, dengan potensi untuk disediakan wawasan baru tentang perilaku pelanggan, pola cuaca, pasar keungan aktivitas, atau fenomena lainnya. Namun, untuk mendapatkan nilai bisnis dari ini data, organisasi membutuhkan teknologi dan alat baru yang mampu mengelola dan menganalisis data non-tradisional bersama dengan data perusahaan tradisional mereka. Infrastruktur Intelejen Bisnis Misalnya anda menginginkan informasi yang ringkas dan andal tentang operasi saat ini, tren, dan perubahan di seluruh perusahaaan. Jika anda bekerja disebuah perusahaan besar, data yang anda butuhkan mungkin harus disatukan dari sistem yang terpisah, seperti penjualan, manufaktur, dan akuntansi, bahkan dari sumber eksternal, seperti data demografis atau pesaing. Anda mungkin semakin membutuhkannya untuk menggunakan Big data. Sebuah infrastruktur kontemporer untuk intelejen bisnis memiliki serangkaian alat untuk memperoleh informasi yang berguna dari semua jenis data yang berbeda yang digunakan oleh bisnis saat ini, termasuk semi-terstruktur dan tidak terstruktur Big data dalam jumlah yang besar. Kemampuan ini mencakup gudang data dan data mart, hadoop, komputasi dalam memori, dan platform analitik. Gudang Data dan Data Mart Alat tradisional untuk menganalisis data perusahaan selama dua decade terakhir telah menjadi gudang data. Gudang data adalah database yang menyimpan arus dan data historis minat potensial bagi pengambil keputusan di seluruh perusahaan. Data berasal dari banyak sistem transaksi operasional inti, seperti sistem untuk penjualan, akun pelanggan, dan manufakturs, dan mungkin termasuk data dari transaksi situs web. Gudang data mengekstrak arus dan data historis dari berbagai sistem operasional di dalam organisasi. Data ini digabungkan dengan data dari sumber eksternal dan diubah dengan mengoreksi data yang tidak akurat dan tidak lengkap serta merestrukturisasi data untuk pelaporan dan analisis manajemen sebelum dimuat ke dalam gudang data. Gudang data membuat data tersedia untuk diakses siapa saja sesuai kebutuhan, tapi tidak bisa diubah. Sistem gudang data juga menyediakan berbagai ad hoc dan alat kueri standard, alat analitis dan pelaporan fasilitas grafis. Perusahaan sering membangun gudang data di seluruh perusahaan, tempat pusat gudang data melayani seluruh organisasi, atau mereka menciptakan yang lebih kecil, desentral-gudang berukuran besar yang disebut data mart. Data mart adalah bagian dari gudang data dimana bagian data organisasi yang diringkas atau sangat terfokus ditempatkan dalam database terpisah untuk populasi pengguna tertentu. Sebagai contoh, sebuah perusahaan mungkin mengembangkan pemasaran dan penjualan data mart untuk menangani pelanggan informasi tomer. Penjual Buku Barnes & Noble biasa menyimpan serangkaian data mart- satu untuk data tempat penjualan di toko eceran, satu lagi untuk toko buku perguruan tinggi penjualan, dan sepertiga untuk penjualan online. Hadoop Produk DBMS relasional dan gudang data tidak cocok untuk organisasi dan menganalisis big data atau data yang tidak mudah masuk ke dalam kolom dan baris digunakan dalam model data mereka. Untuk menangani data tidak terstruktur dan semi-terstruktur dalam jumlah besar, serta data terstruktur, organisasi menggunakan Hadoop. Hadoop adalah kerangka perangkat lunak sumber terbuka yang dikelola oleh Apache Softrware Foundation yang memungkinkan pemrosesan parallel terdistribusi besar jumlah data di computer murah. Ini memecahkan masalah big data turun ke sub-masalah, mendistribusikannya di antara hingga ribuan inexpen-sive node pemrosesan computer, dan kemudian menggabungkan hasilnnya menjadi kumpulan data yang lebih kecil dan lebih mudah dianalasis. Anda mungkin pernah menggunakan Hadoop untuk menemukan tiket pesawat yang terbaik di internet, mendapatkan petunjuk arah ke restoran, menelusuri Google, atau terhubung dengan teman di Facebook. Hadoop terdiri dari beberapa layanan utama : Sistem File Terdistribusi Hadoop (HDFS) untuk menyimpan data dan MapReduce untuk data parallel yang berkinerja tinggi dalam pengolahan. HDFS menghubungkan sistem file pada banyak node di file Kluster Hadoop untuk mengubahnya menjadi satu sistem file besar. MapReduce milik Hadoop tadinya terinspirasi oleh sistem MapReduce Google untuk memecah pemrosesan yang sangat besar dasaset dan menugaskan pekerjaan ke berbagai node dalam sebuah cluster. HBase, Hadoop database nonrelasional, menyediakan akses cepat ke data yang disimpan di HDFS dan sebuah platform transaksional untuk menjalankan aplikasi real-time skala tinggi. Hadoop dapat memproses data apapun dalam jumlah besar, termasuk data terstruktur, data tradisional, data yang terstruktur secara longgar seperti feed Facebook dan Twitter, data kompleks seperti file log server Web, serta audio dan video data yang tidak terstruktur. Hadoop berjalan pada sekelompok server yang tidak mahal, dan prosesor bisa ditambahkan atau dihapus sesuai kebutuhan. Perusahaan menggunakan Hadoop untuk menganalisis volume data yang sangat besar serta untuk area pementasan untuk tidak terstruktur dan semi terstruktur. Data turet sebelum masuk ke gudang data. Facebook menyimpan banyak datanya pada cluster Hadoop yang sangat besar, yang menampung sekitar 100 petabyte, sekitar 10.000 kali lebih banyak informasi daripada Perpustakaan Kongres. Yahoo menggunakan Hadoop untuk melacak perilaku pengguna sehingga dapat mengubah halaman beranda agar sesuai dengan minat mereka. Firma riset ilmu hayati NextBio menggunakan Hadoop dan HBase untuk memproses datanya perusahaan farmasi yang melakukan penelitian genomic. Vendor database teratas seeprti IBM, Hewlett-Packard, Oracle, dan Microsoft memiliki Hadoop sendiri distribusi perangkat lunak. Vendor lain menawarkan alat untuk memindahkan data masuk dan keluar Hadoop atau untuk menganalisis data dalam Hadoop. Komputasi dalam Memori Cara lain untu memfasilitasi analisis big data adalah dengan menggunakan komputasi dalam memori, yang terutama mengandalkan memori utama (RAM) computer untuk penyimpanan data. (DBMS konvensional menggunakan sistem penyimpanan disk). Pengguna mengakses data yang disimpan di memori utama sistem, sehingga menghilangkan kemacetan dari pengambilan dan membaca data dalam database tradisional terbasis disk dan memperpendek secara dramatis waktu respons kueri. Pemrosesan dalam memori memungkinkan kumpulan data yang sangat besar, sebesar ukuran data mart atau gudang data kecil, hingga seluruhnya berada dalam memori. Perhitungan bisnis yang rumit dulu jam atau hari bisa diselsesaikan dalam hitungan detik dan ini bahkan bisa dicapai pada perangkat genggam. Bab sebelumnya menjelaskan beberapa kemajuan kontemporer teknologi perangkat keras computer yang memungkinkan pemrosesan dalam memori, seperti itu sebagai prosesor berkecepatan tinggi yang kuat, pemrosesan multi inti, dan computer jatuh harga memori. Teknologi ini membantu perusahaan mengoptimalkan penggunaan memori dan mempercepat kinerja pemrosesan sekaligus menurunkan biaya. Produk komersial terkemuka untuk komputasi dalam memori termasuk SAP’s High Permormance Analytics Appliance (HANA) dan Oracle Exalytics. Masing-masing menyediakan satu set komponen perangkat lunak terintegrasi, termasuk perangkat lunak basis data dalam memori dan perangkat lunak analitik khusus, yang berjalan pada perangkat keras yang dioptimalkan dalam memori pekerjaan komputasi. Centrica, utilitas gas dan listrik, menggunakan HANA untuk menangkap dan menganalisis dengan cepat sejumlah besar data yang dihasilkan oleh pengukur pintar. Perusahaan mampu menganalisis penggunaan setiap 15 menit, memberikan gambaran yang lebih jelas tentang penggunaan oleh lingkungan, ukuran rumah, jenis bisnis yang dilayani, atau tipe bangunan. HANA juga membantu Centrica menunjukkan kepada pelanggannya pola penggunaan energy mereka dalam penggunaan waktu nyata alat online dan seluler. Platform Analitik Vendor database komersial telah mengembangkan analitik berkecapatan tinggi khusus platform yang menggunakan teknologi relasional dan non-relasional dioptimalkan untuk menganalisis kumpulan data besar. Platform analitik ini, seperti IBM Netezza dan Oracle Exadata, menampilkan sistem perangkat kerasperangkat lunak yang telah dikonfigurasi sebelumnya yang dirancang khusus untuk pemrosesan kueri dan analitik. Sebagai contoh, IBM Netezza menghadirkan database, server, dan komponen penyimpanan yang terintegrasi erat nents yang menangani kueri analitik komoleks 10 hingga 100 kali lebih cepat daripada sistem nasional. Platform analitik juga mencakup sistem dalam memori dan NoSQL sistem manajemen database non-relasional. Gambar 6.12 mengilustrasikan infrastruktur intelejen bisnis kontenporer menggunakan teknologi yang baru saja kami jelaskan. Data terkini dan historis diekstrak dari beberapa sistem operasional bersama dengan data Web, mesin data yang dihasilkan data audio/visual tidak terstruktur, dan data dari sumber eksternal. Infrastruktur intelejen bisnis kontenporer menampilkan kepabilitas dan alat untuk mengelola dan menganalisis jumlah besar dan jenis data yang berbeda dari berbagai sumber. Kueri yang udah digunakan dan alat pelaporan untuk pengguna bisnis biasa dan perangkat analitik yang lebih canggih untuk pengguna yang sudah termasuk mahir.