Modul 10 Database dan Sistem Manajemen Database TUJUAN INSTRUKSIONAL KHUSUS (TIK) : Setelah mempelajari modul ke-10, mahasiswa diharapkan mampu : Menjelaskan pentingnya data diorganisasikan; Menjelaskan bagaimana data diorganisasikan, disimpan, diakses dan digunakan; Menjelaskan jenis-jenis pengolahan; Menjelaskan perbedaan media penyimpan primer dan sekunder; Menjelaskan pengertian database dan pengaruhnya pada pemrosesan data; Menjelaskan pengertian system manajemen database (DBMS); Menjelaskan fungsi dan cara DBMS; Melakukan pengolahan data dengan konsep DBMS; Menjelaskan peran dari pengelola database; Menjelaskan kerugian dan keuntungan DBMS; Menjelaskan perkembangan knowledge discovery in database (KDD). 1. PENDAHULUAN Manajemen Data merupakan bagian dari manajemen Sumber Daya Informasi. Sumber Daya Data disimpan dalam data sekunder yang dapat berbentuk berurutan (sequential), atau akses langsung (direct access), magnetic tape merupakan media penyimpanan sequential, magnetic disk merupakan media penyimpanan akses langsung serta compact disk merupakan media penyimpanan yang canggih dan dapat menyimpan data. Modul ke-10 / Hal.1 Sebelum orang mengenal database, banyak mengalami kesulitan dalam manejemen data. Konsep database dibangun diatas indeks dan kaitan untuk mencapai suatu hubungan logis antara beberapa file. Perangkat Lunak yang mengelola database disebut sistem manajemen database (database management system) – DBMS- yang memberikan keuntungan yang nyata bagi yang menggunakan komputer sebagai suatu sistem informasi. Semua DBMS memiliki pengolah bahasa deskripsi data (data description language processor) yang digunakan untuk menciptakan database, mengelola serta menyediakan isi database. Orang yang bertanggung jawab atas database dan DBMS adalah pengelola database (database administration) – DBA. 2. HIRARKI DATA Dalam mengorganisasikan data dikenal istilah hirarkhi data yang terdiri dari : elemen data (field), record dan file. Yang disebut dengan elemen data (data element) adalah unit data terkecil, tidak dapat dibagi lagi menjadi unit yang berarti. Dalam record gaji, elemen data (field) berupa nama, nomor pegawai, nomor jaminan sosial, upah dan jumlah tanggungan keluarga. Record, merupakan hirarki setingkat lebih tinggi dari elemen data. Satu record terdiri dari semua elemen data (field) yang berhubungan dengan obyek atau kegiatan tertentu. Semua record sejenis disusun menjadi satu file. File adalah kumpulan record data yang berhubungan dengan suatu subyek tertentu. 3. MANAJEMEN DATA Manajemen data adalah bagian dari manajemen sumber daya informasi yang mencakup semua kegiatan yang memastikan bahwa sumber daya perusahaan akurat, mutakhir, aman dari gangguan dan tersedia bagi pengguna/pemakai. Kegiatan Manajemen data : a. Pengumpulan Data e. Keamanan b. Integritas dan pengujian f. Organisasi c. Penyimpanan g. Pengambilan. d. Pemeliharaan Modul ke-10 / Hal.2 4. PENYIMPANAN SEKUNDER Semua komputer meliputi sejenis penyimpanan sekunder untuk melengkapi penyimpanan yang berada dalam CPU dengan mengacu pada penyimpanan berurutan dan penyimpanan akses langsung. Penyimpanan berurutan, adalah suatu organisasi atau penyususunan data di suatumedium penyimpanan yang terdiri dari satu record mengikuti satu record lain dalam suatu urutan tertentu.. sebagian media penyimpanan komputer hanya dapat memproses data yang disusun secara berurutan. Contohnya yaitu Pita magnetic. Penyimpanan akses langsung (direct access strorage). Adalah suatu cara mengorganisasikan data yang memungkinkan record-record ditulis dan dibaca tanpa pencarian secara berurutan. DASD (direct access strorage device), unit perangkat keras yang memungkinkan penyimpanan secara akses langsung , alat ini memiliki mekanisme membaca dan menulis langsung yang dapat diarahkan ke lokasi manapun dalam medium penyimpanan, piringan magnetik, floopy disk , hard disk dan compact disk DASD adalah medium file master yang baik. File master adalah gambaran konseptual dari salah satu sumber daya perusahaan atau elemen lingkungan sebagai contoh adalah file master persediaan, piutang, pelanggan dsb. Penggunaan DASD lainnya adalah sebagai medium penyimpan sementara untuk menampung data semi terproses. Piringan magnetik telah terbukti tidak terkalahkan sebagai DASD. Teknologi DASD baru adalah Compact Disk, Laser Disk atau Optical Disk, menggambarkan data dengan kombinasi goresan-goresan halus diatas permukaan piringan yang diciptakan oleh sinar laser. Goresan-goresan ini berupa parit-parit yang dibakar atau dicetak diatas permukaan piringan. Sinar laser berintensitas rendah digunakan untuk membaca goresan-goresan tersebut. 5. HUBUNGAN PENYIMPANAN SEKUNDER DENGAN PEMROSESAN Ada dua cara dalam mengolah data. Pengolahan batch dan pengolahan online. Pengolahan batch mencakup pengumpulan semua transaksi dan pemrosesan sekaligus, dalam batch. Pengolahan on-line mencakup pengolahan transaksi satu Modul ke-10 / Hal.3 persatu, kadang pada saat transaksi itu terjadi transaksi lain. Karenanya berorientasi transaksi maka sering disebut pemrosesan transaksi. Pengolahan Batch dapat dilaksanakan dengan menggunakan media penyimpanan berurutan atau akses langsung. Kelemahan sistem ini adalah kenyataan bahwa file baru menjadi mutakir setelah dilakukan siklus harian. Ini berarti manajemen tidak selalu memiliki informasi paling mutakir yang menggambarkan sistem fisik. Pengolahan on-line memerlukan akses langsung, dikembangkanuntuk mengatasi file yang ketinggalan jaman. Terobosan teknologi yang memungkinkan pengolahan on-line adalah penyimpanan piringan magnetik. Sistem real-time adalah suatu sistem yang mengendalikan sistim fisik. Sistem ini mengharuskan komputer merespons dengan cepat pada status sistem fisik. Istilah realtime digunakan untuk menggambarkan sistem on-line yang bereaksi pada kegiatan sistem fisik secara cukup cepat sehingga dapat mengendalikan sistem itu. Sistem ini adalah bentuk khusus dari sistem on-line yang diperluas kemampuannya dengan menggunakan sumber daya konseptual untuk menentukan operasi dari sistem fisik. 6. KEBANGKITAN ERA DATABASE Pada era sebelum dipergunalkannya database, terdapat kendala pada medium penyimpanan, dimana record pada pita magnetik harus diproses secara berurutan. Oleh karenanya dicari jalan keluar dengan cara mengarah ke organisasi logis (logical organization) yaitu mengintegrasikan data dari beberapa lokasi fisik yang berbeda dan merupakan cara pengguna melihat data. Selanjutnya berbagai cara dikembangkan untuk memenuhi kebutuhan-kebutuhan tersebut dengan menggunakan integrasi logis, yaitu menggunakan inverted files dan linked list. Inverted file adalah suatu file yang disimpan dalam suatu urutan tertentu dan dirancang untuk memecahkan masalah yang berupa permintaan manajer atas suatu laporan yang hanya mendaftarkan record-record tertentu dari file. Linked list adalah suatu field yang berisi link atau pointer. File yang berisi link field disebut linked list dan berfungsi menghindari penggunaan indeks untuk mendapatkan akses yang lebih cepat. Modul ke-10 / Hal.4 Inverted file dan linked list memberikan suatu cara untuk mengintegrasikan secara logis record-record yang tersebar secara fisik dalam satu file Integrasi logis antara beberapa file. Suatu modifikasi bahasa pemrograman COBOL dengan menggunakan link untuk saling menghubungkan record-record dalam satu file dengan record-record yang berhubungan secara logis di file-file lain. Sistem ini disebut IDS (integrated data store) dan merupakan langkah awal menuju satu database terintegrasi dari beberapa file. 7. KONSEP DATABASE Database adalah suatu koleksi data komputer yang terintegrasi, diorganisasikan dan disimpan dengan suatu cara yang memudahkan pengambilan kembali. Integrasi lagis dari record-record dalam banyak file ini disebut konsep database yang bertujuan untuk meminimumkan pengulangan data (duplikasi data artinya data yang sama disimpan dalam beberapa file) dan mencapai independensi data (kemampuan untuk membuat perubahan dalam struktur data tanpa membuat perubahan pada program yang memproses data). Independensi data diperoleh dengan menempatkan spesifikasi data dalam tabel data dan kamus yang terpisah secara fisik dari program. Program mengacu pada tabel untuk mengakses data. Hirarkhi data dalam konsep system database yaitu Database, File, Record, dan Elemen Data. 8. STRUKTUR DATABASE Integrasi logis file dapat diperoleh dengan hubungan eksplisit dan hubungan implisit. Hubungan eksplisit , antara record dari beberapa fille dengan menyusun record-record tersebut dalam suatu hirarkhis, yang disebut struktur hirarkhis, dimana setiap catan pada suatu tingkat dapat dihubungkan ke berbagai record setingkat lebih rendah. Meskipun struktur hirarkhis mempunyai kemampuan luar biasa dalam mengatasi kendala-kendala fisik, namun penggunaan hubungan eksplisit tersebut masih mempunyai kelemahan Modul ke-10 / Hal.5 Hubungan implisit, hubungan antar record yang tidak harus dinyatakan secara eksplisit, link field khusus tidak perlu disertakan dalam record. Pendekatan ini disebut dengan struktur relasional dan menggunakan hubungan implisit, yaitu hubungan yang dapat dinyatakan secara tidak langsung dari record data yang telah ada. Keuntungan dari steruktur relasional bagi CBIS (computer based information system, sistem informasi berbasis kamputer) adalah fleksibilitas yang ditawarkannya dalam rancangan dan penggunaan database. Pengguna dan spesialis informasi dibebaskan dari keharusan mengidentifikasi semua informasi yang diperlukan sebelum menciptakan database. 9. PERANGKAT LUNAK DATABASE Perangkat lunak yang mengatur dan memelihara integrasi logis antar file, baik eksplisit maupun implisit disebut DBMS (database management system). DBMS berbasis komputer mikro pertama yang sangat terkenal adalah dBASE II, III dan IV . selanjutnya pengembangan DBMS berfokus pada pasar komputer mikro dan telah menerapkan struktur relasional. Microsoft Access adalah suatu contoh sistem manajemen database relasional untuk komputer mikro. 10. MENCIPTAKAN DATABASE Proses menciptakan database mencakup tiga tahap, yaitu menentukan kebutuhan data, menjelaskan data, dan memasukkan data ke dalam database. a. Menentukan kebutuhan data. Mendefenisikan kebutuhan data adalah langkah kunci dalam CBIS. Ada dua pendekatan dalam tahap ini yaitu pendekatan berorientasi proses dengan cara mengikuti langkah-langkah yang telah ditetapkan yaitu mendefinisikan masalah, menetapkan data untuk diproses sebagai informasi kemudian mendefinisikan informasi yang diperlukan selanjutnya memproses dan mengolah informasi, dan proses terakhir adalah masalah. Yang mengambil keputusan dalam pemecahan kedua adalah pendekatan model perusahaan. Pendekatan ini untuk mengatasi kelemahan pendekatan yang pertama Modul ke-10 / Hal.6 (sukar mengaitkan data suatu sistem ke data sistem lain). Oleh karenanya diatasi dengan menentukan seluruh kebutuhan data perusahaan dan kemudian menyimpan data tersebut dalam database. b. Menjelaskan data. Setelah elemen-elemen data yang diperlukan ditentukan, maka elemen data tersebut dijelaskan dalam bentuk kamus data (data dictionary). Kamus data adalah suatu ensiklopedi dari informasi yang berkenaan dengan data organisasi/perusahaan, dan penjelasan ini dikomunikasikan kepada komputer melalui data description language - DDL, yang menghasilkan skema. Subskema mencerminkan kebutuhan para pemakai individual. c. Memasukkan data. Setelah skema dan subskema diciptakan data dapat dimasukkan kedalam database. Hal ini dapat dilakukan dengan memasukkan data langsung ke dalam DBMS, membaca data dari pita atau piringan atau menscan data secara optis. Data siap untuk digunakan setelah berada dalam database. 11. MENGGUNAKAN DATABASE Pemakai database dapat berupa orang atau program aplikasi. Orang biasanya menggunakan database dari terminal dan mengambil data dan informasi dengan menggunakan query language. Query adalah permintaan informasi dari database, dan query language adalah bahasa khusus yang user friendly yang memungkinkan komputer menjawab query. Tujuh langkah dalam DBMS : a. Data Manipulation Language (DML) menentukan DBMS data apa yang diperlukan. b. DBMS memeriksa skema dan subskema untuk menguji bahwa data ada dalam database. Modul ke-10 / Hal.7 c. DBMS meneruskan permintaan data ke sistem operasi. d. DBMS mengambil data dan memasukkannya ke dalam area penyimpanan buffer khusus dalam penyimpanan primer. e. Data tersebut ditransfer ke dalam area input program aplikasi. f. DBMS mengembalikan pengendalian ke program aplikasi. g. Program aplikasi menggunakan data. 12. SUATU MODEL DBMS Model yang menunjukkan elemen2 utama DBMS adalah : a. Data Description Language Prosessor, mengubah kamus data menjadi skema database. Ini merupakan DDL yang telah dijelaskan sebelumnya. semua DBMS memiliki DDL. b. Performance Statistics Processor, memelihara statistik yang mengidentifikasi data apa yang sedang digunakan, siapa yang menggunakan dan seterusnya. Statistik ini digunakan dalam mengelola database. DBMS berbasis komputer mikro biasanya tidak menyertakan elemen ini. c. Modul Backup/ Recovery, secara periodik dibuat suatu backup dari database. Apabila terjadi kerusakan database, maka backup database merekonstruksi database tersebut . modul backup/recovery menyelesaikan rekonstruksi tersebut. d. Manajer Database, adalah elemen paling penting karena menangani permintaan data para pemakai. Query language dan DML adalah bagian dari manajer database. Manajer database juga menghasilkan statistik kinerja yang diproses oleh performance statistics processor dan semua DBMS menyertakan elemen ini. 13. PENGELOLA DATABASE Seorang spesialis informasi yang bertanggung jawab atas database disebut pengelola database (DataBase Administrator, DBA ). DBA mempunyai tugas utama, yaitu perencanaan, penerapan, operasi dan keamanan. Modul ke-10 / Hal.8 a. Perencanaan database mencakup sama dengan para manajer untuk mendefinisikan skema dan subskema. DBA berperan penting dalam memilih DBMS. b. Penerapan database terdiri dari menciptakan database yang sesuai dengan spesifikasi DBMS yang dipilih serta menetapkan dan menegakkan kebijakan dan prosedur penggunaan database. c. Operasi database mencakup menawarkan program pendidikan kepada pemakai database dan menyediakan bantuan saat diperlukan. d. Keamanan database meliputi pemantauan kegiatan database dengan menggunakan statistik yang disediakan DBMS. Selain itu, DBA memastikan bahwa database tetap aman. 14. PENEMUAN PENGETAHUAN DALAM DATABASE Knowledge Discovery in Database ( KDD ) adalah istilah yang menjelaskan semua kegiatan pada data yang tersimpan dalam database yang mencakup : a. Data Warehousing, adalah perkembangan dari konsep database yang menyediakan sumberdaya data yang lebih baik bagi para pemakai dan memungkinkan pemakai untuk memanipulasi dan menggunakan data tersebut secara intuitif. b. Data Warhouse ini umumnya dilakukan di mainframe. c. Data Mart, adalah database yang berisi data yang menjelaskan satu segmenoperasi perusahaan, misalnya data mart pemasaran, data mart sumberdaya manusia dsb. d. Data Mining, adalah proses menemukan hubungan dalam data yang tidak diketahui oleh pemakai. Data mining membantu pemakai dengan mengungkapkan berbagai hubungan dan menyajikannya dengan yang dapat dimengerti sehingga dapat menjadi dasar pengembilan keputusan. KDD dan konsep integral data warehousing dan data mining menggambarkan suatu cara yang inovativ dengan memanfaatkan komputer untuk menyediakan data Modul ke-10 / Hal.9 yang secara normal tidak diidentifikasi oleh para pemakai sebagai solusi untuk pemecahan masalah. Ada tujuh langkah dalam KDD : a. Mendifinisikan data dan tugas. b. Mendapatkan data c. Membersihkan data. d. Mengembangkan hipotetis dan model pencarian. e. Menggali data, mencari pola2 baru dan pengetahuan baru. f. Menguji dan memastikan seberapa jauh data yang dipilih dapat digunakan. g. Menafsirkan dan menggunakan dalam menafsirkan data dan membuat keputusan dalam pemecahan masalah. 15. MENEMPATKAN DATABASE DAN DBMS DALAM PERSPEKTIF. DBMS memungkinkan untuk menciptakan database dalam penyimpanan akses langsung komputer memelihara isinya dan menyediakan isi tersebut bagi pemakai tanpa pemrograman khusus yang mahal. Keuntungan DBMS : a. Mengurangi pengulangan data. b. Mencapai independensi data. c. Mengintegrasikan data dari beberapa file. d. Mengambil data dan informasi secara cepat. e. Meningkatkan keamanan. Kerugian DBMS : a. Memperoleh perangkat lunak yang mahal. b. Memperoleh konfigurasi perangkat keras yang besar. c. Mempekerjakan dan mempertahankan staf DBA. Database terkomputerisasi maupun DBMS bukanlah prasyarat mutlak untuk pemecahan masalah. Namun mereka memberikan dasar-dasar penggunaan komputer sebagai suatu sistem informasi bagi para spesialis informasi dan pemakai. Modul ke-10 / Hal.10 16. IKHTISAR Data diorganisasikan menjadi file, tiap file berisi record-record, dan setiap record terdiri dari elemen-elemen data (field). Tingkatan tersebut ada dalam konsep database. Manajemen data adalah subset dari IRM yang melaksanakan fungsi pengumpulan, pengujian dan integritas, penyimpanan, pemeliharaan, keamanan, organisasi dan pengambilan data. Alat penyimpanan sekunder ada dua jenis, yaitu berurutan dan akses langsung. Aplikasi pemakai menentukan apakah pengolahan batch atau online yang digunakan. Pengolahan batch dapat dilaksanakan dengan menggunakan media penyimpanan berurutan atau akses langsung. Sedangkan pengolahan online memerlukan akses langsung. Istilah realtime digunakan untuk menggambarkan system online yang bereaksi pada kegiatan system fisik secara cukup cepat sehingga dapat mengendalikan system tersebut. Pada era sebelum database, kinerja system menderita karena kendala penyimpanan fisik. Kesulitan-kesulitan ini sebagian diatasi dengan menggunakan inverted files dan link list. Data dalam database dikelola oleh system manajemen database (DBMS). System awalnya dirancang untuk mainframe, yang saat ini telah ada dalam versi komputer mikro dan melibatkan struktur relasional. Langkah pertama menciptakan database adalah menentukan kebutuhan data dengan mengikuti pendekatan berorientasi masalah. Elemen-elemennya kemudian dijelaskan dalam kamus data, dan penjelasan tersebut dikomunikasikan kepada komputer melalui data description language (DDL) yang menghasilkan skema. Subskema mencerminkan kebutuhan para pemakai individual. Setelah skema dan subskema ditentukan maka data dapat dimasukkan. Pemakai database dapat berupa orang atau program aplikasi. Orang menggunakan query language dan program menggunakan DML. DBMS bekerja sama dengan system operasi untuk menyediakan isi database bagi para pemakai. Semua DBMS memiliki DDL prosesor dan manajer database, tetapi pada versi mikro biasanya tidak menyertakan performance statistics processor atau modul Modul ke-10 / Hal.11 backup/recovery. DBMS dapat mengurangi pengulangan data, mencapai independensi data, mengintegrasikan data dari beberapa file, memperoleh data atau informasi secara cepat, dan meningkatkan keamanan. Orang yang bertanggung jawab atas sumber daya data perusahaan disebut pengelola database (database administrator) – DBA. DBA memiliki empat bidang tanggung jawab yang berhubungan dengan database, yaitu perencanaan, penerapam, operasi, dan keamanan. Beberapa DBA dipimpin oleh seorang manajer DBA. Para pemakai database yang besar dapat terlibat dalam kegiatan penemuan pengetahuan dalam database (KDD) seperti data warehouse, data mart, dan data mining. Data mining berdasarkan verifikasi dimulai dengan hipotesis pemakai tentang apa yang ia yakini berdasarkan penemuan sebagai parameter database query. Data mining mengembangkan kemampuan pemakai dengan mengidentifikasi pola data yang biasanya diharapkan pemakai. Proses penemuan pengembangan dalam database bersifat berulang, yang mengulangi langkah-langkah seperti perolehan data, pembersihan data, model pencarian, dan model prediksi, hingga kebutuhan pemakai tercapai. 17. PERTANYAAN / DISKUSI : 1. Apa yang dimaksud dengan database dan system manajemen database ? 2. Sebutkan dua jenis utama penyimpanan sekunder ! dan jelaskanlah ! 3. Sebutkan dua cara utama pengolahan data ! dan jelaskanlah masing-masingnya secara terstruktur ! 4. Apa yang dimaksud dengan pengorganisasian secara fisik pengorganisasian logis ? 5. Apa yang dimaksud dengan file, record, dan elemen data (field) ? 6. Sebutkan dan jelaskan tugas dari database administrator (DBA) ! 7. Apa yang dimaksud dengan hubunga eksplisit dan implicit ? Jelaskanlah ! 8. Jelaskan pendekatan dasar untuk menentukan kebutuhan data ? 9. Apa yang dimaksud dengan data warehouse dan data mining ? 10. Sebutkan keuntungan dan kerugian dari DBMS ? Modul ke-10 / Hal.12 dan 18. 1. DAFTAR ACUAN : Hansen, Gary W. dan Hansen, James V., Database Management and Design, 2nd ed., Prentice Hall, New Jersey, 1996. 2. McLeod, Raymond, Management Information System, 7th ed., Prentice Hall, New Jersey, 1998. 3. McNurlin, Barbara C,; Sparague, Ralph H Jr., Information Systems Management in Practice, 4th ed., Prentice Hall, New Jersey, 1998. 4. http://www.cs.ui.ac.id/kuliah/IKI310410 -----o0o----- Modul ke-10 / Hal.13