Integrasi Data Semiterstruktur Secara Skematik Berbasis XML

advertisement
BAB I
PENDAHULUAN
1.1
LATAR BELAKANG
Ketika komputer digunakan sebagai media penyimpanan informasi, berbagai usaha
dilakukan untuk membuat struktur data yang dapat menentukan format, tipe, panjang,
relasi antar data, dan bagaimana data tersebut ditempatkan pada media simpanan agar
mudah diproses untuk menghasilkan informasi yang dibutuhkan. Selain struktur data,
untuk menghasilkan informasi dibutuhkan juga satu sistem yang merupakan kumpulan
data yang dapat digunakan terus menerus oleh beberapa pengguna, sistem yang kemudian
dikenal sebagai basisdata (database). Basisdata adalah kumpulan data yang terhubung
secara logik, yang dirancang untuk memenuhi kebutuhan informasi organisasi. Basisdata
yang banyak digunakan saat ini adalah basisdata relasional (relational database),
memiliki kemudahan dalam melakukan simpanan dan pengambilan data.
Basisdata relasional merupakan basisdata yang mengijinkan tingkat kebebasan data
yang tinggi, menyediakan aturan substansial yang sesuai dengan semantik data,
konsistensi data, kerangkapan data, serta memungkinkan adanya perluasan manipulasi
data yang berorientasi pada set (set-oriented). Setiap tabel pada basisdata relasional
direpresentasikan dalam bentuk tabel dua-dimensi yang terdiri dari baris dan kolom, baris
pada tabel akan berkorespondensi dengan record dan kolom berkorespondensi dengan
atribut.
World-Wide-Web yang dikenal sebagai web adalah sistem standar yang diterima
secara universal untuk penyimpanan, pengambilan, format dan penyajian informasi
melalui sebuah jaringan internet yang berfungsi sebagai media transportasi informasi.
Semua tipe informasi digital termasuk teks, grafik dan suara dapat ditempatkan dan
diolah pada web (Turban, 2003). Dengan kemampuan tersebut, web menjadi sebuah
sumberdaya informasi yang sangat luas dan dapat menjadi tujuan pencarian informasi.
Sebagai sumberdaya informasi, data yang ditempatkan pada web adalah data yang
tersebar dan terkoneksi pada jaringan yang luas.
Sebelumnya web dianggap sebagai sebuah kumpulan dokumen-dokumen tidak
terstruktur yang terkoneksi satu dengan yang lain, saat ini sejumlah sumber data
terstruktur sudah mulai digunakan pada web dengan menggunakan database gateways
sebagai penyelaras. Meskipun bentuk data yang terdapat pada web sangat beragam, akan
tetapi bentuk data dengan format tidak terstruktur sangat mendominasi dibanding data
dengan format terstruktur, seperti HTML (HyperText Mark-up Language) data dan
SGML (Standard Generalized Mark-up Language) data, yang kemudian dikenal sebagai
data semi terstruktur (semi-structured).
Data semi tertruktur adalah data yang menggunakan struktur pohon sebagai skema,
penggunaan struktur pohon ini memungkinkan data semi terstruktur direpresentasikan
dalam berbagai bentuk skema. Alasan digunakannya data semi terstruktur adalah adanya
keinginan untuk mengolah sumberdaya web sebagai sebuah basisdata yang tidak dibatasi
oleh skema tertentu, keinginan untuk memiliki sebuah format data yang fleksibel untuk
kebutuhan pertukaran data antar basisdata yang berbeda (Connolly, 2003).
Seperti diketahui, saat ini beragam informasi dapat ditempatkan pada web, baik dari
bidang pendidikan, usaha, pemerintahan, sosial, budaya, sampai pada hiburan. Pada
bidang pendidikan, khususnya pendidikan tinggi, web dapat dimanfaatkan untuk
mempublikasikan lulusan dan alumni suatu perguruan tinggi. Publikasi ini dapat
digunakan oleh pemerintah untuk mendapatkan data tenaga kerja potensial dan ahli,
selain itu dapat dimanfaatkan oleh perusahaan yang membutuhkan tenaga kerja yang
profesional dan bermutu sesuai bidang usaha, bahkan dapat dimanfaatkan oleh perguruan
tinggi tersebut untuk memberikan informasi mutu pendidikan yang mereka lakukan yang
tercermin pada data lulusan dan alumninya.
Hal tersebut di atas dapat diwujudkan dengan mengumpulkan semua data lulusan
atau alumni dari berbagai perguruan tinggi untuk ditempatkan pada web, pengumpulan
data yang berasal dari sumberdata yang berbeda memiliki kemungkinan adanya
perbedaan format, skema, bahkan struktur diantara sumberdata tersebut. Untuk mengatasi
perbedaan yang ada dapat dilakukan dengan melakukan integrasi data, dengan
membangun format standard atau lebih dikenal sebagai skema konseptual global, yang
digunakan sebagai acuan dalam merepresentasikan data yang akan ditempatkan pada
web. Skema konseptual global ini yang nantinya akan digunakan oleh perguruan tinggi
lain jika akan menempatkan data lulusan mereka kedalam web, sehingga dengan adanya
2
skema konseptual global ini data lulusan yang berasal dari sumberdata yang berbeda
terlihat sebagai satu sumberdata.
Integrasi data tidak hanya dapat dilakukan pada sumberdata yang bersifat
heterogen, akan tetapi dapat juga dilakukan pada sumberdata yang homogen dengan
skema yang berbeda, misal saja beberapa sumberdata yang menggunakan relasional
basisdata dalam merepresentasikan data lulusan, menggunakan tabel (file), atribut, dan
relationship yang berbeda, karena dapat terjadi adanya nama atribut yang sama tetapi
memiliki arti yang berbeda atau sebaliknya. Demikian juga dengan sumberdata yang
menggunakan data semi terstruktur, dimana model data ini dapat menggunakan bentuk
struktur pohon yang berbeda dalam merepresentasikan datanya tentunya perlu untuk
diintegrasikan.
1.2
TUJUAN PENULISAN
Tujuan penelitian ini adalah merancang skema konseptual global data semi
terstruktur berbasis XML, yang dapat digunakan sebagai media integrasi data dari
beberapa sumberdata untuk ditempatkan data pada web.
1.3
MANFAAT PENULISAN
Manfaat penelitian ini adalah menghasilkan rancangan skema konseptual global
untuk integrasi data secara skematik pada data semi terstruktur berbasis XML, dan
memberikan solusi atau alternatif untuk mengembangkan dan perawatan data yang
berkelanjutan.
1.4
RUANG LINGKUP
Lingkup kajian dalam penelitian ini adalah:
1.
Analisis terhadap sumber data yang digunakan yaitu sumber data yang terkait
dengan informasi alumni pada Perguruan Tinggi dengan sumber data adalah
basisdata Alumni yang menggunakan model data relasional.
2.
Perancangan skema konseptual global dilakukan dengan mengintegrasikan skema
dari sumber data dengan tidak memperhatikan unsur semantik dari skema tersebut.
3
Download