S Sistem ste Manajemen a aje e Basis as s Data ata Sistem Basis Data Terdistribusi Teknik Informatika Universitas Pasundan Caca E. Supriana, S.Si.,MT. [email protected] 2 Pengantar • • • File processing/pemrosesan file menggunakan prinsip setiap aplikasi memiliki data tersendiri. Hal ini mempengaruhi efesiensi dan efektifitas sehingga muncul konsep data base system. Konsep ini mendasarkan pada prinsip bahwa data dibuat, disediakan dan dikelola secara terpusat/sentral. Konsep ini mengakibatkan program aplikasi tidak lagi tergantung pada perubahan data b ik secara logic baik l i maupun fisik fi ik dan d juga j sebaliknya, ini disebut data independence. 3 Perbedaan file processing dengan database system 4 Perbedaan file processing dengan database system 5 Distributed Data Processing Merupakan sekumpulan peralatan pemrosesan yang saling terhubung melalui jaringan yang mengerjakan tugas-tugas tertentu. Pemrosesan terdistribusi dapat dikelompokan berdasarkan beberapa kriteria yaitu : • • • • Degree Coupling : tinggi atau rendah ? Jumlah data yang salingg digunakan g dibandingkan g dengan g jumlah j pemrosesan p lokal. Struktur antar hubungan : kuat atau lemah ? Jika komponen p dapat p di share dikatakan kuat Saling tergantungan antar komponen : kuat atau lemah dalam mengekseskusi proses. Keselarasan antar komponen. komponen 6 Distributed Data Processing Pemrosesan terdistribusi berkembang karena kebutuhan untuk dapat memecahkan masalah besar dan kompleks dengan menggunakan berbagai macam aturan divide and conquer. y Alasan lain yang mendasar adalah struktur organisasi yang berubah menjadi terdistribusi, karena perkembangan pemrosesan terdistribusi inilah maka kemudian berkembang distributed database system. system y 7 Distributed Database System Merupakan p sekumpulan p database yyangg saling terhubung secara logical dan secara fisik terdistribusi p pada berbagai g tempat p melalui jaringan computer. y Sistem y yangg mengelola g database terdistribusi dan menyediakan mekanisme agar g distribusi transparent p adalah distributed database management system ( (DDBMS). ) y 8 Database terpusat pada jaringan 9 Sistem Database Terdistribusi 10 DC = Data Communications component DBMS = local DBMS l l DDBMS = Distributed DBMS component GDD = Global data Dictionary 11 Karakteristik DDBMS y y y y y y y Antarmuka aplikasi untuk berinteraksi dengan pengguna (end-user), (end user), program aplikasi, dan DBMS lainnya dalam basis data terdistribusi. Validasi yang menganalisis permintaan data untuk kebenaran sintaks. Transformasi untuk menguraikan permintaan yang kompleks (complex query) menjadi komponen permintaan data atomik. Optimasi query untuk menemukan strategi akses terbaik. (f (fragmen d b database yang harus h di k diakses oleh l h query, dan d bagaimana harus update data, jika ada, akan disinkronkan) Pemetaan untuk menentukan lokasi data fragmen lokal dan jauh (remote). (remote) Antarmuka I/O untuk membaca atau menulis data dari atau ke penyimpanan permanen lokal. Memformat untuk mempersiapkan data untuk presentasi kepada pengguna akhir atau ke program aplikasi. 12 Karakteristik DDBMS y y y y y Keamanan untuk memberikan privasi data pada database baik lokal dan jauh (remote). (remote) Backup dan pemulihan untuk menjamin ketersediaan dan pemulihan database dalam kasus k kegagalan l (error). ( ) Fitur DB administrasi untuk administrator database. Concurrency control untuk mengatur akses simultan data dan untuk menjamin konsistensi data di seluruh fragmen database dalam DDBMS. Transaksi pada manajemen untuk memastikan bahwa data bergerak dari satu kondisi konsisten ke kondisi yang lain. lain Kegiatan ini mencakup sinkronisasi transaksi lokal dan jauh serta transaksi yang didistribusikan di seluruh segmen. 13 Komponen DDBMS y y y y y Computer Workstations N Network k HW & SW Communications Media Transaction Processor (TP), (TP) komponen perangkat lunak dalam komputer yang meminta data, disebut juga Transaction Manager atau Application Processor Data Processor (DP), komponen perangkat lunak dalam komputer yang menyimpan dan mengeluarkan data, disebut juga Data Manager. 14 Keuntungan sistem database terdistribusi • Pengelolaan secara transparan data terdistribusi dan replicated. replicated – Mengurangi ketergantungan data – Transparansi jaringan – Transparansi T i replikasi lik i – Transparansi fragmentasi • • • • • • Mengacu pada struktur organisasi Meningkatkan kemampuan untuk share dan otonomi local Meningkatkan g ketersediaan data Meningkatkan kehandalan Meningkatkan unjuk kerja Memudahkan pengembangan system 15 Kelemahan sistem database terdistribusi • • • • • • • • Kompleksitas manajemen Control integritas lebih sulit Biaya y ppengembangan g g Keamanan Kurangg standarisasi Menambahkan kebutuhan penyimpanan Lebih sulit dalam mengatur lingkungan data Menambah biaya pelatihan. 16 17 •Transaction Processor (TP), komponen perangkat lunak dalam komputer yang meminta data, disebut juga Transaction Manager atau Application Processor •Data Processor (DP), komponen perangkat lunak dalam komputer yang menyimpan dan mengeluarkan data, disebut juga Data Manager. •Setiap TP dapat mengakses data dari setiap DP dan setiap DP dapat melayani akses data dari TP atau akses data lokal 18 19 Single--Site Processing, Single Single Single--Site Data (SPSD) Dalam pengolahan satu situs, skenario SPSD, semua proses dilakukan dil k k pada d satu hhost kkomputer (server prosesor-tunggal, Server multiprosesor, sistem mainframe)) dan semua data disimpan p di sistem lokal disk komputer host. Pengolahan tidak bisa dilakukan di sisi pengguna akhir dari sistem. y Skenario Sk i seperti ti kh khas d darii kkebanyakan b k mainframe i f dan midrange DBMS komputer server. DBMS terletak ppada komputer p host, yang y g diakses oleh dumb terminal yang terhubung. y Skenario ini juga khas dari generasi pertama dari single user database mikrokomputer. single-user mikrokomputer y 20 21 Multiple--Site Processing, Single Multiple Single--Site Data (MPSD) Berdasarkan skenario MPSD, beberapa p proses berjalan pada komputer yang berbeda berbagi g repositori p data tunggal. gg y Biasanya, skenario MPSD memerlukan file server jjaringan g menjalankan j aplikasi p konvensional yang diakses melalui jaringan. y Banyak aplikasi akuntansi multi user berjalan di bawah jaringan komputer pribadi sesuai dengan deskripsi tersebut. tersebut y 22 23 Multiple--Site Processing, Multiple Multiple Multiple--Site Data (MPMD) y y y Skenario MPMD menggambarkan DBMS sepenuhnya didistribusikan dengan dukungan beberapa prosesor data dan prosesor transaksi di beberapa situs. Tergantung pada tingkat dukungan untuk berbagai jenis DBMS terpusat, DDBMS diklasifikasikan sebagai homogen atau heterogen. DDBMS homogen h mengintegrasikan i ik hhanya satu jjenis i DBMS terpusat melalui jaringan. Dengan demikian, DBMS yang sama akan berjalan pada platform server yang berbeda (server tunggal prosesor, Server multiprosesor, server farms, atau server blades). DDBMS heterogen mengintegrasikan berbagai jenis DBMS terpusat melalui jaringan. Sebuah DDBMS sepenuhnya h heterogen akan k mendukung d k DBMS yang berbeda b b d yang mungkin bahkan mendukung model data yang berbeda (relasional, hirarkis, atau jaringan) berjalan di bawah sistem komputer p yang y g berbeda,, seperti p mainframe dan PC. 24 DDBMS Transparency [1] Sebuah sistem basis data terdistribusi membutuhkan karakteristik fungsional yyangg dapat p dikelompokkan p dan digambarkan sebagai transparansi features. y DDBMS fitur transparansi memiliki sifat g pengguna p gg umum yyangg memungkinkan akhir untuk merasa seperti menggunakan sebuah database. y 25 DDBMS Transparency [2] fitur transparansi DDBMS adalah: y Transparansi distribusi, distribusi yang memungkinkan database terdistribusi untuk diperlakukan sebagai database logis tunggal. Jika DDBMS menunjukkan transparansi distribusi, pengguna tidak perlu tahu: o Bahwa data dipartisi-berarti baris tabel dan kolom dibagi secara vertikal maupun horizontal dan disimpan di antara beberapa situs. o Bahwa data dapat direplikasi di beberapa situs. situs o Lokasi data. y Transparansi transaksi, yang memungkinkan transaksi untuk memperbarui data pada lebih dari satu situs jaringan. Transparansi Transaksi memastikan bahwa transaksi akan seluruhnya selesai atau dibatalkan, dengan demikian mempertahankan integritas database. 26 DDBMS Transparency [3] Transparansi kegagalan (failure), yang menjamin j i bahwa b h sistem i akan k terus beroperasi b i jika jik terjadi kegagalan node. Fungsi yang hilang karena kegagalan g g akan diganti g oleh simpul p jaringan j g lain. y Transparansi kinerja, yang memungkinkan sistem untuk melakukan seolah-olah itu adalah DBMS tterpusat. t Si Sistem t tidak tid k akan k menderita d it penurunan kinerja karena penggunaannya pada jjaringan g atau karena pperbedaan pplatform jjaringan. g Transparansi kinerja juga memastikan bahwa sistem akan menemukanbiaya yang paling hemat untuk mengakses data jauh. jauh y 27 28 29 30 12 Perintah CJ Date y y y Dengan munculnya database relasional, kebanyakan vendor mengimplementasikan versi database terdistribusi mereka sendiri, umumnya menyoroti kekuatan produk mereka masing-masing. Untuk membuat perbandingan database terdistribusi lebih mudah, CJ Date merumuskan 12 "perintah" atau prinsipprinsip dasar database terdistribusi. terdistribusi Meskipun tidak ada DDBMS yang memenuhi semua perinteh tersebut,, pprinsip p p tersebut merupakan sasaran yang bermanfaat. 31 12 Perintah CJ Date 1. 2. 3. 4. 5. Local site independence. setiap situs lokal setempat dapat bertindak independen, otonom, situs adalah DBMS. Setiap situs yang terpusat bertanggung jawab atas keamanan, konkurensi kontrol, backup, dan recovery. Central site independence. Tidak ada situs dalam j i jaringan bbergantung pada d situs i pusat atau situs i lainnya. l i Semua situs memiliki kemampuan yang sama. System independence. Kegagalan tidak terpengaruh oleh sistem failures. failures setiap node terus beroperasi bahkan dalam kasus kegagalan node atau perluasan jaringan. Location transparency. Para pengguna tidak perlu mengetahui g lokasi data untuk mengambil g data tersebut. Fragmentasi transparency. Data fragmentasi adalah transparan kepada pengguna, yang melihat hanya satu database logis. Pengguna tidak perlu tahu nama fragmen d t b database untuk t k mengambil bil mereka. k 32 12 Perintah CJ Date Replication transparency. Hanya melihat satu database logis. p memilih fragmen g database untuk Para DDBMS transparan mengakses. Untuk pengguna, DDBMS mengelola semua fragmen transparan. 7. Distributed query processing. Sebuah query didistribusikan dapat dilaksanakan di beberapa situs DP berbeda berbeda. Pertanyaan optimasi dilakukan secara transparan oleh DDBMS. 8. Distributed transaction processing. Sebuah transaksi dapat memperbarui data pada beberapa situs yang berbeda, dan transaksi dijalankan secara transparan. transparan 9. Hardware independence. Sistem harus berjalan pada platform perangkat keras. 10. Operating system independence. Sistem harus berjalan pada platform sistem operasi. 11. Network independence. Sistem ini harus berjalan pada platform jaringan. 12. System S independence. i d d D b Database harus h mendukung d k produk d k database apapun vendor. 6. 33