VI-109 Membangun Relasi Antar Dataset Dalam Pengorganisasian

advertisement
Membangun Relasi Antar Dataset Dalam Pengorganisasian Koleksi Data Spasial
R.V. Hari Ginardi
Jurusan Teknik Informatika, Fakultas Teknologi Informasi, ITS – Surabaya
Abstrak: Berbagai pendekatan telah dilakukan intuk mengorganisasikan koleksi data spasial baik yang
berupa dataset bertipe vektor maupun raster. Dengan semakin pesatnya penggunaan citra dari
penginderaan jauh (remote sensing), serta metoda-metoda pengolahan citra digital untuk mendukung
proses-proses pemetaan maupun analisa spasial, jumlah dan volume data spasial pada institusi-institusi
yang menyimpan koleksi data spasial bertumbuh dengan cepat. Pengorganisasian data spasial yang ada
saat ini mengandalkan fungsi-fungsi yang memungkinkan pemakai mencari dataset yang memenuhi kriteria
yang diberikan melalui user query. Cara ini cukup memadai untuk lembaga penyedia data spasial yang
homogen, seperti pada instansi yang menyediakan citra satelit atau foto udara.
Pada instansi yang mengolah data-data spasial, seperti pada lembaga-lembaga riset atau lembaga yang
mengkordinasikan proses-proses pemetaan, koleksi data spasial yang dikelola berkembang menjadi
heterogen dengan banyaknya dataset-dataset yang merupakan hasil sementara atau hasil proses lanjutan
dataset awal. Paper ini akan memberikan pemikiran baru dalam mengorganisasikan koleksi data spasial
dengan membangun relasi antar dataset sehingga pemakai dapat melacak proses-proses yang telah
berlangsung dalam pengolahan data spasial. Manfaat penting lainnya dari metoda ini adalah
dimungkinkannya dilakukan evaluasi kualitas maupun produktifitas koleksi data spasial yang dimiliki.
Dengan merekonstruksi histori pembuatan data spasial dengan menggunakan model data unweighteddirected-acyclic-graph (unweighted-DAG), dapat dibangun topologi koleksi data spasial berdasarkan proses
pembuatannya, sehingga dapat diamati berbagai parameter dan indikator relasi antar dataset. Angka-angka
parameter dan indikator relasi ini dapat dimanfaatkan untuk mengevaluasi penggunaan suatu dataset dalam
koleksi data spasial, mengelompokkan data spasial secara otomatis, sebagai masukan untuk quality
assurance, serta membantu dalam pembaruan (updating) data spasial. Metoda rekonstruksi serta evaluasi
relasi data spasial yang diusulkan ini menggunakan metadata baku ISO dan FGDC sebagai data primernya
sehingga tidak bergantung pada format dan tipe data spasial yang diorganisasikan.
Kata kunci: Katalog data spasial, Rekonstruksi histori, Organisasi data spasial
1.
Pendahuluan
Pencarian data pada clearinghouse data spasial umumnya dilakukan dengan melakukan
pencarian berdasarkan kata kunci dan beberapa option pilihan tipe data seperti citra satelit, foto
udara, peta dasar, dan semacamnya. Penyimpanan dan pengak-sesan data spasial pada
clearinghouse ditingkatkan efisiensinya dengan mengapli-kasikan metadata sebagai basis data
untuk query.
Pencarian dengan cara di atas akan menghasilkan output pilihan dataset yang memenuhi kriteria
pencarian yang diberikan. Dalam realitasnya, pemakai clearinghouse ingin tahu juga datasetdataset yang berkaitan dengan dataset yang ditampilkan oleh query. Pertanyaan dari pemakai
yang ingin dijawab oleh query misalnya: “dataset mana saja yang dihasilkan oleh dataset ini?”,
atau “dataset mana saja yang digunakan untuk menghasilkan dataset ini?”
Riset ini beranjak dari situasi di atas dan hasil riset ini diharapkan dapat digunakan atau dalam
clearinghouse data spasial di Indonesia
2.
Pengorganisasian data raster
Remote sensing berperan penting dalam proses pemetaan dan sistem informasi geografis
dengan kemampuannya untuk meng-akuisisi informasi yang berkaitan dengan bumi
menggunakan berbagai metoda penginderaan, baik yang menggunakan sensor aktif maupun
pasif. Untuk penyimpanan dan pendistribusian data raster dari remote sensing, Badan Kordinasi
Survey dan Pemetaan Nasional (Bakosurtanal) mengadopsi standard metadata dari Federal
Geographic Data Committee (FGDC) serta ISO, dan membangun interoperabilitas data geospasial di dalam Infrastruktur Data Spasial Nasional, IDSN (Puntodewo and Nataprawira, 2004).
Permasalahan yang kemudian timbul adalah pengorganisasian arsip data remote sensing.
Integrasi data spasial vektor ke dalam atribut basis data telah lebih siap diaplikasikan dengan
telah tersedianya “spatially-enabled database system”, sementara pengintegrasian citra remote
sensing ke dalam database atau sistem katalog masih sangat terbatas.
VI-109
Sejumlah metoda dalam automasi pemrosesan maupun analisis citra telah dikembangkan oleh
para periset untuk meningkatkan produktifitas citra remote sensing. Pengembangan tersebut
umumnya dilakukan terhadap koleksi citra yang homogen, misalnya koleksi dataset citra NOAA,
koleksi dataset citra Landsat-TM, SAR, atau IKONOS. Dalam realisasinya, dalam suatu koleksi
terdapat pula dataset-dataset citra yang merupakan hasil pengolahan dari citra remote sensing.
Dataset-dataset ini mempunyai tingkat informasi yang lebih tinggi dibandingkan citra yang
digunakan sebagai inputnya.
Pada lembaga yang menjadi pusat arsip data remote sensing atau pengelola katalog data
remote sensing seperti Bakosurtanal, raster data yang ada telah berkembang dan dari koleksi
data awal telah dihasilkan beberapa level data hasil pengolahan citra / raster untuk berbagai
keperluan analisis maupun presentasi. Koleksi yang sudah menjadi multi-level ini membutuhkan
metoda pengorganisasian yang berbeda dibandingkan dengan koleksi data yang levelnya
homogen. Amhar (2001) mengorganisasikan koleksi data spasial yang multi-level dengan
memperkenalkan pengelompokan data spasial berdasarkan status pemrosesan data tersebut.
Pengelompokan ini memberikan pijakan untuk mengorganisasi data raster, yang telah dimulai
dengan menggunakan kodifikasi kode level dalam perencanaan pemberian nama yang unik pada
setiap data spasial dalam suatu koleksi data spasial.
Tabel 1 berikut menunjukkan
pengelompokan data raster berdasarkan level pemrosesannya.
Tabel 1 Pengorganisasian Data Raster seperti yang Diusulkan Amhar (2001)
Kelompok
DB0-R
DB1-R
DB1-ZR
DB2-GR
DB3-GR
Keterangan
Data raster awal (raw)
Data raster ter-rektifikasi
DEM
Hasil analisis / klasifikasi
Peta hasil / presentasi
Dengan mengorganisasikan koleksi raster data berdasarkan relasi proses pembuatannya,
diharapkan ada perbaikan pada layanan infrastruktur data spasial, sebagai contoh semakin
berkembangnya alteratif query pada sistem katalog data spasial.
3.
Metadata Citra Remote Sensing
Pengorganisasian citra remote sensing dan data raster lainnya dalam suatu sistem katalog data
spasial akan lebih efisien jika didukung dengan deskripsi informasi tentang data raster tersebut.
Dengan deskripsi tentang data yang disebut metadata ini, akses langsung ke data raster yang
umumnya berukuran besar dapat diminimalisir. Metadata umumnya berupa daftar informasi yang
dapat diinterpretasikan oleh kompujter maupun manusia (human readable dan machine
readable).
Clearinghouse data spasial menyediakan fasilitas untuk pencarian data yang umumnya
mengandalkan pencarian teks kata kunci tertentu dan menampilkan daftar dataset-dataset dalam
koleksi yang memiliki atribut atau informasi sesuai dengan kata kunci yang diberikan. Hasil
querynya umumnya disajikan dalam bentuk daftar dataset citra serta deskripsi pokok tentang
dataset tersebut termasuk link ke metadatanya. Dengan membuka metadata tersebut, akan
diperoleh info lebih detail tentang penyedia data tersebut serta informasi lainnya.
Bakosurtanal mengadopsi standard metadata dari FGDC dan ISO untuk clearinghouse data
spasial Indonesia (Sukmayadi et al., 2004). Metadata standard tersebut telah menggunakan basis
XML seperti yang ditetapkan dalam standard FGDC Remote Sensing Extension Version 2, dan
ISO 19139 (implementasi XML untuk ISO 19115).
ISO 19115 serta implementasinya tidak sepenuhnya mendukung elemen informasi yang
dibutuhkan untuk mendeskripsikan citra remote sensing atau data spasial berformat raster
lainnya. Untuk itu, beberapa standard lanjutan telah didefinisikan. FGDC telah memiliki extension
untuk metadata remote sensing, FGDS-STD-012-2002 (FGDC, 2002), sementara ISO telah
memiliki ISO 19115-2 untuk metadata informasi geografis, serta ISO 19130 untuk informasi
sensor dan data model untuk citra serta data grid. Standard-standard ini bersifat kompatibel
dengan standard yang telah didefinisikan sebelumnya.
4.
Rekonstruksi Proses Pembuatan Data Raster
Pengorganisasian data spasial berikut ini didesain dengan acuan data raster sesuai dengan
ketersediaan data. Metoda pengorganisasian ini penggunaannya tidak terbatas hanya pada data
VI-110
raster, prinsip yang ditawarkan ini memungkinkan untuk diaplikasikan pada tipe data spasial
secara umum. Sejumlah karakteristik dari data raster yang tersedia telah diidentifikasi yang
meliputi:
-
-
-
Setiap data raster atau citra remote sensing beserta metadatanya diidentifikasikan sebagai
sebuah dataset
Koleksi data adalah kumpulan semua dataset yang diorganisasikan dalam suatu system
katalog
Setiap dataset memiliki identifikasi yang unik. Identitas yang unik ini biasanya
diimplementasikan dengan pemberian nama file yang unik, sehingga aturan penamaan file
sangat penting.
File-file metadata disimpan secara local pada tempat yang sama dengan server system
katalog, sementara data rasternya dapat tersimpan di media penyimpanan di mana saja.
Metadata menyimpan link yang akan menghubungkan metadata dengan lokasi penyimpanan
data rasternya.
Sistem katalog data spasial dapat berisi dataset-dataset dengan berbagai jenis sensor serta
beragam level pemrosesan. Terminologi data spasial heterogen digunakan untuk koleksi
seperti ini.
Proses rekonstruksi keterkaitan antar dataset berdasarkan proses pembuatannya hanya
dimungkinkan jika langkah-langkah proses pembuatan tiap dataset tercatat / terekam. Pencatatan
tersebut dapat dilakukan dalam file terpisah atau di dalam dataset masing-masing. Metoda yang
dibahas di sini mengasumsikan bahwa informasi proses pembuatan tercatat di setiap metadata
dataset. Informasi proses pembuatan mencatat antara lain nama-nama dataset yang digunakan
secara langsung dalam pembuatan dataset itu yang selanjutnya disebut “dataset sumber”.
Walaupun dalam metadata hanya ada daftar dataset sumber yang digunakan secara langsung
dalam pembuatan suatu dataset, proses rekonstruksi yang diusulkan ini akan mampu
menampilkan daftar lengkap semua dataset sumber yang telah digunakan, baik langsung
maupun tidak langsung.
4.1 Parameter pada katalog data spasial
Beberapa parameter yang digunakan selama ini dalam katalog-katalog data spasial telah
memberikan peluang untuk membantu pemakai dalam memilih sejumlah dataset yang memenuhi
kriteria-kriteria tertentu. Hasil pemilihan dengan parameter-parameter tersebut tidak dapat
menunjukkan atau mengukur apakah ada keterkaitan antara satu dengan lainnya ditinjau dari
proses pembuatannya. Parameter-parameter yang dimaksud di sini adalah:
a. Batas spasial (kata kunci: di mana?). Parameter ini umumnya dinyatakan dengan batasbatas kordinat, atau pemilihan batas luar polygon (bounding box) jika pemilihan dilakukan
melalui antar muka grafis. Walaupun kriteria ini membantu pemakai dalam membatasi
lingkup kawasan yang akan dipilih dan menghasilkan hanya dataset-dataset yang sesuai
dengan area yang diinginkan, daftar dataset yang dihasilkan tidak mencerminkan apakah
ada relasi di antara dataset-dataset tersebut.
b. Batas temporal atau rentang waktu (kata kunci: kapan?). Jika hasil pemilihan dengan
batas spasial saja menghasikan terlalu banyak dataset, penyaringan lebih lanjut dapat
dilakukan dengan membatasi pilihan dataset berdasarkan rentang waktu. Informasi yang
digunakan untuk data temporal ini adalah waktu pembuatan dataset atau waktu akuisisi
citra satelit. Dataset-dataset foto udara yang merupakan satu seri pemotretan dapat
dihasilkan dengan kombinasi parameter spasial dan temporal.
c. Kategori analisis atau tema tertentu (katakunci: jenis aplikasi). Dari metadata, seringkali
kita dapat memperoleh informasi tentang isi dataset sesuai hasil analisis yang telah
dibuat atau dapat dibuat dengan dataset tersebut, misalnya kata-kata kunci: pertanian,
kehutanan, geologi, meteorologi, perkotaan, dan sebagainya.
d. Batasan spektral (kata kunci: spectral band). Penggunaan kriteria ini jarang ditemukan
dalam katalog yang ada saat ini, namun informasi ini dapat bermanfaat bagi pemakai
yang sudah mengetahui batasan informasi spektral yang dibutuhkan untuk analisis
tertentu yang ingin dilakukan, misalnya keberadaan band spektrum warna merah dan
Near Infrared untuk analisa yang berkaitan dengan vegetasi.
Sistem-sistem katalog data spasial yang ada umumnya menggunakan parameter-parameter di
atas, yang sering juga diwakili dengan kata kunci "apa", "kapan" dan "di mana". Masing-masing
VI-111
dataset output yang dihasilkan dari pemilihan data (query) dengan parameter-parameter di atas
adalah dataset yang independen, dalam artian terpilihnya dataset tersebut sepenuhnya karena
informasi yang ada dalam dataset itu memenuhi kriteria pencarian yang diberikan. Sistem
pencarian seperti ini sudah mencukupi untuk instansi yang memproduksi citra remote sensing,
terutama data awal (citra yang belum diolah), namun kurang dapt mendukung kebutuhan instansi
yang mempunyai fngsi kordinasi data spasial seperti Bakosurtanal, di mana proses perjalanan
dataset mulai dari data awal hingga hasil-hasil pengolahannya perlu diinventarisir atau
diorganisasikan.
4.2 Hubungan antar dataset berdasarkan level pemrosesannya
Untuk menghasilkan suatu produk akhir pemetaan dari sejumlah citra awal (raw dataset),
dibutuhkan beberapa langkah pemrosesan. Pada setiap langkahnya, suatu dataset baru akan
terbentuk dengan menggunakan algoritma tertentu. Dataset-dataset yang digunakan sebagai
dataset awal, dataset-dataset hasil tiap pemrosesan hingga dataset hasil akhir pemetaan tersebut
dapat dikelompokkan berdasarkan level pemrosesannya. Dataset yang berasal dari sensor
remote sensing (misalnya foto udara atau citra satelit) dapat dikategorikan sebagai dataset
dengan level terendah (level-0) sedangkan dataset yang merupakan hasil akhir pemetaan dapat
dikategorikan sebagai level tertinggi. Berdasarkan level pemrosesan ini, pendekatan untuk
menentukan jumlah level dan jenis levelnya dapat menggunakan konsep pengelompokan data
spasial yang diperkenalkan oleh Amhar (2001), yang dapat dilihat pada Tabel 1. Selanjutnya,
kodifikasi level pemrosesan akan menggunakan ketentuan sebagai berikut: raw dataset
diklasifikasikan sebagai level-0; hasil rektifikasinya diklasifikasikan sebagai level-1; citra hasil
analisis atau tematik diklasifikasikan sebagai level-2; dan citra hasil akhir pemetaan atau
presentasi diklasifikasikan sebagai level-4. Gambar 1 berikut ini menunjukkan skema
pemrosesan citra digital dalam pembuatan peta.
Gambar 1
Klasifikasi Level Data Berdasarkan Level Pemrosesan
Arah panah pada diagram dalam Gambar 1 di atas menunjukkan arah pemrosesan data. Dalam
prakteknya, hanya proses yang telah dilewati oleh dataset yang dapat dicatat atau direkam dalam
tiap dataset. Histori pemrosesan dataset hanya dapat mencatat sumber langsung yang
digunakan pada setiap dataset. Pada setiap dataset dapat tercatat satu atau lebih dataset yang
digunakannya sebagai dataset sumber (source dataset). Mengacu pada Gambar 1 di atas, daftar
dataset sumber yang dapat dicatat pada setiap dataset adalah sebagai berikut:
Tabel 2 Link antar Dataset
Dataset
DB0-IKO1
DB0-IKO2
DB0-IKO3
DB1-IKO1
DB1-IKO2
VI-112
Dataset sumber
(none)
(none)
(none)
DB0-IKO1
DB0-IKO2
Keterangan
Raw dataset
Raw dataset
Raw dataset
1:1 geo-rectification
1:1 geo-rectification
DB1-IKO3
DB2-city1
DB2-veg1
DB2-them1
DB3-citybelt
DB0-IKO3
DB1-IKO1,
DB1-IKO2,
DB1-IKO3
DB1-IKO1,
DB1-IKO2,
DB1-IKO3
DB2-veg1
DB2-them1
1:1 geo-rectification
contoh mosaicking
contoh analisis NDVI
contoh hasil GIS
contoh peta hasil
Dengan menggunakan informasi yang diekstraksi dari seluruh dataset sesuai Tabel 2 di atas,
dapat ditelusuri histori masing-masing dataset. Untuk dataset DB3-citybelt misalnya, dapat
dilakukan penelusuran sebagai berikut:
DB3-citybelt dibuat
menggunakan DB2-them1,
yang menggunakan DB2-veg1,
yang menggunakan
(DB1-IKO1, DB1-IKO2, dan DB1-IKO3),
yang menggunakan
(DB0-IKO1, DB0-IKO2, dan DB0-IKO3).
Penelusuran ini menunjukkan bahwa histori lengkap proses pembuatan suatu dataset dapat
direkonstruksi tanpa memerlukan struktur yang kompleks. Setiap dataset hanya perlu mencatat
dataset-dataset yang digunakan secara langsung sebagai dataset sumbernya dalam
metadatanya. Link ke dataset sumber tersebut hanya perlu dicatat satu kali saat pembentukan
metadata suatu dataset.
4.3 Struktur Data DAG untuk Pemodelan Histori
Untuk pengorganisasian histori proses pembuatan, diperlukan struktur data yang mendukung
karakteristik proses pengolahan data spasial seperti yang digambarkan dalam Gambar 1 dan
Tabel 2. Dengan mengamati karakteristik proses yang biasanya merupakan alur sekuensial dan
mendukung multi-input, struktur data yang paling mendekati representasi model data yang diolah
adalah Directed Acyclic Graph (DAG). Dengan representasi graph ini, setiap dataset dinyatakan
sebagai node, dan setiap relasi ke dataset sumbernya dinyatakan sebagai vertex. Gambar 2
berikut ini menunjukkan representasi graph pengorganisasian histori proses pembuatan dataset
DB3-citybelt yang digunakan sebagai contoh dalam Gambar 1 dan Tabel 2.
Gambar 2
Representasi Proses Pembuatan Dataset dengan Graph
Koleksi data spasial dapat terpartisi menjadi sejumlah grup jika terdapat proses pembuatan yang
terpisah. Proses yang terpisah ini umumnya terjadi karena perbedaan coverage spasial atau
VI-113
coverage temporal. Pemisahan menjadi grup-grup ini membentuk struktur disjoint graph. Datasetdataset yang sama sekali tidak digunakan oleh dataset lainnya dalam suatu koleksi juga akan
membentuk suatu disjoint graph.
Dengan terbangunnya graph histori pemrosesan data spasial ini, terbuka jalan untuk melakukan
sejumlah analisis yang mengacu pada struktur DAG. Beberapa contoh pengolahan atau analisis
lebih lanjut yang akan diamati adalah:
a. Untuk masing-masing node (dataset), dapat ditelusuri seluruh node yang merupakan
dataset sumber dalam pembuatan dataset tersebut, baik sumber langsung maupun tidak
langsung
b. Untuk masing-masing node (dataset), dapat ditelusuri seluruh node yang merupakan
produk dataset tersebut baik secara langsung maupun tidak langsung
c. Untuk masing-masing dataset, dapat dievaluasi berapa banyak dataset yang telah
memanfaatkannya sebagai dataset sumber, baik secara langsung maupun tidak
langsung, demikian juga sebaliknya, dapat diketahui dataset mana yang tidak pernah
digunakan sama sekali
d. Untuk setiap pasangan node, dapat ditelusuri apakah ada keterkaitan di antaranya
e. Struktur graph yang terbentuk akan mempermudah rekonstruksi proses pembuatan suatu
dataset dapat dilakukan jika ada pembaruan data sumber (updating)
f. Dengan mengamati pengelompokan disjoint graph histori dataset, dapat diamati
pengelompokan dan ketergantungan dataset dalam suatu koleksi data spasial.
4.4 Membangun dan mengukur relasi antar dataset
Dengan menggunakan model data DAG seperti yang telah dibahas pada sub-bab sebelumnya,
secara visual tampak bahwa dalam satu kumpulan dataset tergambar adanya semacam topology
yang menggambarkan seberapa dekat atau jauh satu dataset terhadap dataset lain yang berelasi
dengannya. Jika besaran relasi antara dua dataset dapat diukur atau ditentukan, peluang untuk
melakukan evaluasi-evaluasi terhadap koleksi data spasial menjadi lebih terbuka. Untuk
menentukan seberapa kuat relasi antara satu dataset dengan dataset lainnya, kandidat-kandidat
parameter berikut ini dapat dipertimbangkan:
a. Jarak. Jarak antara dua dataset adalah jarak terpendek yang menghubungkan dua
dataset tersebut, baik secara langsung ataupun melalui dataset lainnya. Dalam
perencanaan ini, tidak dilakukan pembobotan terhadap nilai tiap edge, dengan kata lain
semua proses dianggap sama pentingnya jika dikaitkan dengan relasi antar dataset.
Dengan asumsi ini, model struktur data yang digunakan adalah unweighted-directacyclic-graph (unweighted-DAG). Semakin besar nilai jarak, nilai relasi semakin rendah
(berbanding terbalik)
b. Jumlah dataset sumber yang digunakan (total sources). Dari penelusuran histori, dapat
diketahui jumlah keseluruhan dataset yang digunakan baik secara langsung maupun
tidak langsung untuk menghasilkan dataset pertama dan dataset kedua.
c. Jumlah dataset sumber bersama (common sources). Dari jumlah seluruh dataset sumber
yang digunakan, dapat diamati jumlah dataset sumber yang digunakan sebagai dataset
sumber oleh dataset yang pertama dan juga oleh dataset yang kedua. Semakin besar
jumlah dataset sumber bersama, dapat diasumsikan bahwa kedua dataset mempunyai
kemiripan proses dan kemiripan konten yang juga tinggi.
d. Jumlah dataset hasil keseluruhan (total target). Dari penelusuran histori, dapat diketahui
jumlah keseluruhan dataset baik secara langsung maupun tak langsung oleh dataset
pertama dan kedua.
e. Jumlah dataset target bersama (common target). Dari jumlah seluruh dataset target yang
dihasilkan, dapat diamati jumlah dataset target yang merupakan output bersama kedua
dataset. Semakin besar jumlah dataset target bersama, semakin tinggi pula kemiripan
konten kedua dataset.
Dari kelima kandidat parameter di atas, hanya tiga kandidat pertama (butir a, b dan c) yang stabil
sejak suatu dataset dihasilkan, tidak bergantung pada proses-proses pengolahan data
selanjutnya. Kandidat butir d dan e dapat digunakan jika pengukuran relasi ingin dilakukan
dengan juga memperhitungkan adanya output bersama. Dengan demikian, ada tiga kemungkinan
perhitungan nilai relasi yang dapat dipertimbangkan, yaitu:
VI-114
Relasi antara dua dataset berdasarkan relasi inputnya:
(1)...........................Я = 100 (ΣC/ΣS)/Δ
Relasi antara dua dataset berdasarkan relasi outputnya:
(2)................... Я1 = 100 (ΣR/ΣT)/Δ
Relasi antara dua dataset berdasarkan relasi input dan outputnya:
(3) ...................Я2 = Я + Я1
dimana: Δ = Jarak antar dataset; ΣC = Jumlah dataset sumber bersama; ΣS = Jumlah dataset sumber
yang digunakan; ΣR = Jumlah dataset output bersama; ΣT = Jumlah dataset output yang dihasilkan.
Dengan pertimbangan akan kestabilan nilai yang diperoleh, nilai relasi yang direkomendasikan
untuk digunakan adalah relasi antara dua dataset berdasarkan relasi inputnya saja (Я). Sub-bab
berikut akan menunjukkan ujicoba perhitungan relasi ini pada suatu contoh skema pemrosesan
data spasial.
4.5 Evaluasi
Struktur graph pada Gambar 3 berikut ini menggambarkan rekonstruksi aliran proses pembuatan
dataset / peta dalam suatu koleksi data spasial. Arah panah dalam gambar ini menunjukkan arah
proses (dari sumber menunjuk ke hasil). Penelusuran histori pembuatan suatu dataset dapat
dilakukan dengan melakukan penelusuran pada arah kebalikannya. Sebagai contoh, dataset R21
dibuat dengan menggunakan dataset R11, R12 dan R13 sebagai inputnya.
Gambar 3
Contoh Skema Aliran Proses Pembuatan Dataset Hasil Rekonstruksi
Berdasarkan Gambar 3 ini, akan dihitung nilai relasi antara pasangan-pasangan dataset dengan
menggunakan rumus (1) di atas. Hasil perhitungan untuk pasangan-pasangan dataset yang
dipilih disajikan dalam Tabel 4. Dengan memperhatikan nilai relasi () yang diperoleh dan
dibandingkan dengan posisi node-node yang mewakili dataset tersebut dalam graph, dapat
disimpulkan bahwa nilai relasi yang diperoleh dengan metode ini dapat digunakan sebagai
besaran untuk pengukuran relasi antar dataset dilihat dari histori pembuatannya. Jika relasi
antara dua dataset bernilai nol, dapat disimpulkan bawah kedua dataset itu tidak mempunyai
keterkaitan dalam proses pembuatannya, dengan demikian kedua dataset tersebut merupakan
bagian dari struktur graph yang terpisah, atau kedua dataset merupakan data awal (raw dataset).
Jika relasi antara dua dataset bernilai 100, maka salah satu dataset dipastikan merupakan
dataset sumber satu-satunya bagi dataset pasangannya, Sebagai dataset input satu-satunya,
diasumsikan bahwa isi dataset hasil hanya bergantung pada isi dataset sumber satu-satunya
tersebut sehingga nilai relasinya sangat tinggi. Contoh relasi yang bernilai 100 adalah hubungan
antara raw dataset dengan dataset hasil rektifikasinya (misalnya R01 dengan R11).
VI-115
Tabel 4.3
Contoh Perhitungan Rrelasi dengan Acuan Kode Node di Gambar 3.
Dataset pertama
Dataset
kedua
Jarak
terdekat
(Δ)
Total
sumber
digunakan
(ΣS)
Total sumber
bersama
(ΣC)
digunakan oleh
dataset
pasangan?
Relasi
R01
R11
1
1
1
ya
100
R21
R22
2
8
2
tidak
12,5
R21
R23
n/a
10
0
tidak
0
R21
R31
1
7
7
ya
100
R21
R01
2
6
1
ya
8,33
R01
R02
n/a
0
0
tidak
0
R11
R12
n/a
2
0
tidak
0
R22
R31
3
9
2
tidak
7,41
R22
R23
n/a
8
0
tidak
0
5. Kesimpulan dan tindak lanjut
Penelitian ini memberikan suatu alternatif baru dalam mengorganisasikan data spasial dalam
suatu katalog sistem yang menggunakan metadata yang mengacu pada standar ISO maupun
FGDC sebagai data primernya. Dari penjabaran pada sub-bab sub-bab sebelumnya, dapat
diperoleh kesimpulan sebagai berikut:
Relasi antar dataset dalam koleksi dapat direkonstruksi dengan acuan proses
pembuatannya. Hasil rekonstruksi ini sangat bermanfaat bagi lembaga-lembaga yang
mengoleksi data spasial karena rekonstruksi ini memungkinkan evaluasi lebih lanjut atas
kualitas maupun produktifitas data spasial yang dimiliki
Dengan adanya mekanisme untuk mengukur nilai relasi antara dua dataset, dapat
diamati seberepa independen suatu dataset terhadap dataset lainnya. Perhitungan ini
juga dapat digunakan lebih lanjut untuk proses pengelompokan atau klasterisasi dataset
secara otomatis.
Metoda yang digunakan dalam riset ini menggunakan metadata yang baku, sehingga
implementasinya tidak bergantung pada perangkat lunak tertentu atau platform tertentu.
Walaupun pembahasan dalam paper ini difokuskan pada citra remote sensing karena titik
awal ide pengorganisasiannya adalah untuk data raster, namun metoda ini dapat
diterapkan untuk data spasial tipe apa saja sejauh metadatanya menggunakan metadata
baku untuk data spasial
Riset ini juga membuka peluang-peluang untuk topik-topik riset lanjutan, antara lain meliputi:
Indikator relasi yang disajikan dalam paper ini bersifat stabil, nilainya tidak berubah meskipun ada
penambahan dataset ke dalam koleksi atau adanya proses-proses pembuatan dataset baru
dengan menggunakan dataset yang ada. Walaupun konsep ini dirasa cukup baik, indikator relasi
yang dihasilkan mengabaikan adanya kemungkinan adanya dataset output bersama yang
mungkin memberikan pengaruh pada penilaiaan indikator relasi
Relasi yang diperhatikan dalam riset ini hanya mengacu pada histori pembuatan suatu dataset,
dalam artian, hanya daftar dataset-dataset yang digunakan sebagai input yang diperhatikan dan
dimasukkan dalam proses perhitungan indikator relasi. Pada penelitian selanjutnya ada
kemungkinan untuk melibatkan parameter-parameter lain yang dapat dihasilkan dari analisis
tertentu, misalnya kemiripan isi (content similarity) atau keseragaman waktu akuisisi (time-series
images)
Referensi:
Amhar, F. (2001): Konsep Terpadu Sistem Basis Data Untuk Infrastruktur Data Spasial Nasional, Forum
Nasional Tata Ruang 2001 (Integrated Concept of Database System for National Spatial Data Infrastructure,
National Forum of Spatial Planning). Bakosurtanal internal report
BAKOSURTANAL (2005). Panduan Pembangunan Metadata Data Spasial (Spatial Data Metadata
Development Guideline). Technical Working Group Clearinghouse, Marine and Coastal Resource
Management, Bakosurtanal, Cibinong – Indonesia. Bakosurtanal Internal Report.
Bang-Jensen, J., Gutin, G.Z. (2008). Digraphs: Theory, Algorithms and Applications. Springer Monographs
in Mathematics (2nd ed.), Springer-Verlag, London
VI-116
Bose, R., Frew, J. (2004). Composing Lineage Metadata with XML for Custom Satellite-Derived Products.
Proceedings of the IEEE 16th International Conference on Scientific and Statistical Database Management
(SSDBM’04), pp. 275-284
Li Q., Wang S., Chen B. (2005). Remote Sensing Image Distribute System Supported by Metadata.
Proceedings of IGARSS 2005, Volume 2, 25-29 July 2005, pp. 791-794,
Matindas, R W., Puntodewo, Purnawan, B. (2004). Development of National Spatial Data Infrastructure in
Indonesia.
FIG
Working
Week
2004,
Athens
–
Greece.
http://www.fig.net/pub/athens/papers/ts02/ts02_1_matindas_et_al.pdf , diakses 30 Jan 2009
Puntodewo, Nataprawira R. (2004). Indonesian Geospatial Data Clearinghouse. 3rd FIG Regional
Conference for Asia and the Pacific, Jakarta 2004, http://www.fig.net/pub/jakarta/papers/ts_02/
ts_02_2_puntodewo_nataprawira.pdf , diakses 30 Jan 2009
Ruan, N.; Huang, N.; Hong, W. (2006). Semantic-Based Image Retrieval in Remote Sensing Archive: An
Ontology Approach. Proceedings of IGARSS 2006, pp. 2903 - 2906
Sukmayadi D., Amhar F., Adhibroto A., Prijanto A. (2004). Geo-Spatial Database Design and Implementation
at the Mapping Center for Topographic & Spatial Arrangement (PDRTR) of BAKOSURTANAL, 3rd FIG
Regional Conference, http://www.fig.net/ pub/jakarta/papers/ts_02/ts_02_3_sukmayadi_etal.pdf, diakses 30
Jan 2009
VI-117
Download