BAB I PENDAHULUAN 1.1 LATAR BELAKANG Ketika komputer digunakan sebagai media penyimpanan informasi, berbagai usaha dilakukan untuk membuat struktur data yang dapat menentukan format, tipe, panjang, relasi antar data, dan bagaimana data tersebut ditempatkan pada media simpanan agar mudah diproses untuk menghasilkan informasi yang dibutuhkan. Selain struktur data, untuk menghasilkan informasi dibutuhkan juga satu sistem yang merupakan kumpulan data yang dapat digunakan terus menerus oleh beberapa pengguna, sistem yang kemudian dikenal sebagai basisdata (database). Basisdata adalah kumpulan data yang terhubung secara logik, yang dirancang untuk memenuhi kebutuhan informasi organisasi. Basisdata yang banyak digunakan saat ini adalah basisdata relasional (relational database), memiliki kemudahan dalam melakukan simpanan dan pengambilan data. Basisdata relasional merupakan basisdata yang mengijinkan tingkat kebebasan data yang tinggi, menyediakan aturan substansial yang sesuai dengan semantik data, konsistensi data, kerangkapan data, serta memungkinkan adanya perluasan manipulasi data yang berorientasi pada set (set-oriented). Setiap tabel pada basisdata relasional direpresentasikan dalam bentuk tabel dua-dimensi yang terdiri dari baris dan kolom, baris pada tabel akan berkorespondensi dengan record dan kolom berkorespondensi dengan atribut. World-Wide-Web yang dikenal sebagai web adalah sistem standar yang diterima secara universal untuk penyimpanan, pengambilan, format dan penyajian informasi melalui sebuah jaringan internet yang berfungsi sebagai media transportasi informasi. Semua tipe informasi digital termasuk teks, grafik dan suara dapat ditempatkan dan diolah pada web (Turban, 2003). Dengan kemampuan tersebut, web menjadi sebuah sumberdaya informasi yang sangat luas dan dapat menjadi tujuan pencarian informasi. Sebagai sumberdaya informasi, data yang ditempatkan pada web adalah data yang tersebar dan terkoneksi pada jaringan yang luas. Sebelumnya web dianggap sebagai sebuah kumpulan dokumen-dokumen tidak terstruktur yang terkoneksi satu dengan yang lain, saat ini sejumlah sumber data terstruktur sudah mulai digunakan pada web dengan menggunakan database gateways sebagai penyelaras. Meskipun bentuk data yang terdapat pada web sangat beragam, akan tetapi bentuk data dengan format tidak terstruktur sangat mendominasi dibanding data dengan format terstruktur, seperti HTML (HyperText Mark-up Language) data dan SGML (Standard Generalized Mark-up Language) data, yang kemudian dikenal sebagai data semi terstruktur (semi-structured). Data semi tertruktur adalah data yang menggunakan struktur pohon sebagai skema, penggunaan struktur pohon ini memungkinkan data semi terstruktur direpresentasikan dalam berbagai bentuk skema. Alasan digunakannya data semi terstruktur adalah adanya keinginan untuk mengolah sumberdaya web sebagai sebuah basisdata yang tidak dibatasi oleh skema tertentu, keinginan untuk memiliki sebuah format data yang fleksibel untuk kebutuhan pertukaran data antar basisdata yang berbeda (Connolly, 2003). Seperti diketahui, saat ini beragam informasi dapat ditempatkan pada web, baik dari bidang pendidikan, usaha, pemerintahan, sosial, budaya, sampai pada hiburan. Pada bidang pendidikan, khususnya pendidikan tinggi, web dapat dimanfaatkan untuk mempublikasikan lulusan dan alumni suatu perguruan tinggi. Publikasi ini dapat digunakan oleh pemerintah untuk mendapatkan data tenaga kerja potensial dan ahli, selain itu dapat dimanfaatkan oleh perusahaan yang membutuhkan tenaga kerja yang profesional dan bermutu sesuai bidang usaha, bahkan dapat dimanfaatkan oleh perguruan tinggi tersebut untuk memberikan informasi mutu pendidikan yang mereka lakukan yang tercermin pada data lulusan dan alumninya. Hal tersebut di atas dapat diwujudkan dengan mengumpulkan semua data lulusan atau alumni dari berbagai perguruan tinggi untuk ditempatkan pada web, pengumpulan data yang berasal dari sumberdata yang berbeda memiliki kemungkinan adanya perbedaan format, skema, bahkan struktur diantara sumberdata tersebut. Untuk mengatasi perbedaan yang ada dapat dilakukan dengan melakukan integrasi data, dengan membangun format standard atau lebih dikenal sebagai skema konseptual global, yang digunakan sebagai acuan dalam merepresentasikan data yang akan ditempatkan pada web. Skema konseptual global ini yang nantinya akan digunakan oleh perguruan tinggi lain jika akan menempatkan data lulusan mereka kedalam web, sehingga dengan adanya 2 skema konseptual global ini data lulusan yang berasal dari sumberdata yang berbeda terlihat sebagai satu sumberdata. Integrasi data tidak hanya dapat dilakukan pada sumberdata yang bersifat heterogen, akan tetapi dapat juga dilakukan pada sumberdata yang homogen dengan skema yang berbeda, misal saja beberapa sumberdata yang menggunakan relasional basisdata dalam merepresentasikan data lulusan, menggunakan tabel (file), atribut, dan relationship yang berbeda, karena dapat terjadi adanya nama atribut yang sama tetapi memiliki arti yang berbeda atau sebaliknya. Demikian juga dengan sumberdata yang menggunakan data semi terstruktur, dimana model data ini dapat menggunakan bentuk struktur pohon yang berbeda dalam merepresentasikan datanya tentunya perlu untuk diintegrasikan. 1.2 TUJUAN PENULISAN Tujuan penelitian ini adalah merancang skema konseptual global data semi terstruktur berbasis XML, yang dapat digunakan sebagai media integrasi data dari beberapa sumberdata untuk ditempatkan data pada web. 1.3 MANFAAT PENULISAN Manfaat penelitian ini adalah menghasilkan rancangan skema konseptual global untuk integrasi data secara skematik pada data semi terstruktur berbasis XML, dan memberikan solusi atau alternatif untuk mengembangkan dan perawatan data yang berkelanjutan. 1.4 RUANG LINGKUP Lingkup kajian dalam penelitian ini adalah: 1. Analisis terhadap sumber data yang digunakan yaitu sumber data yang terkait dengan informasi alumni pada Perguruan Tinggi dengan sumber data adalah basisdata Alumni yang menggunakan model data relasional. 2. Perancangan skema konseptual global dilakukan dengan mengintegrasikan skema dari sumber data dengan tidak memperhatikan unsur semantik dari skema tersebut. 3