DATA WAREHOUSE USULAN PEMANFAATAN

advertisement
DATA WAREHOUSE
USULAN PEMANFAATAN DATA WAREHOUSE UNTUK SISTEM IRIGASI
OTOMATIS PADA DESA KELATING, KERAMBITAN, TABANAN
Oleh :
Samuel Aprilius Efendi
1304505109
Dosen :
I Putu Agus Eka Pratama, ST MT
Jurusan Teknologi Informasi
Fakultas Teknik Universitas Udayana
2015
ABSTRAK
Datawarehouse di perusahaan yang sebenarnya dapat berakibat langsung bagi kegiatan
bisnis. Seperti kita ketahui bahwa data warehouse merupakan komponen penting bagi suatu
perusahaan untuk penyimpanan data-data yang penting dan menghasilkan informasi yang tentunya
dapat berguna bagi para eksekutif dalam pengambilan keputusan. Bagi perusahaan besar, data
warehouse adalah hal yang sangat riskan dan tentunya sangat dijaga keberadaannya. Maka dari
itu, dalam paper ini akan membahas tentang data warehouse, serta penerapan nya dalam bidang
pertanian di tanah air kita, hubungannya dengan data mining dan data mart serta contoh gagasan
ide untuk penerapan data warehouse di bidang perkebunan. Metode analisa yang digunakan adalah
metode pengumpulan data melalui artikel dan e- journal yang dapat ditemukan dengan pencarian
menggunakan internet. Data tersebut dikumpulkan dan dicari kebenarannya untuk dituangkan
kedalam paper ini.
Kata kunci: Datawarehouse, Data mart, Data mining, ETL,OLTP, Bisnis Intelijen
DAFTAR ISI
ABSTRAK ............................................................................................................ i
DAFTAR ISI ........................................................................................................ ii
BAB I
1.1
1.2
1.3
1.4
PENDAHULUAN
Latar Belakang ....................................................................................
Rumusan Masalah ...............................................................................
Tujuan & Manfaat ...............................................................................
Desain Solusi ........................................................................................
BAB II
TINJAUAN PUSTAKA
2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.1.5
2.1.5.1
2.1.5.2
2.1.6
Landasan Teori ....................................................................................
Data Warehouse ..................................................................................
Bussiness Intelligence (BI) ..................................................................
Data Mart .............................................................................................
Data Mining .........................................................................................
ETL (Extraction, Transformation, Loading) .......................................
Kelebihan ETL ..................................................................................
Kekurangan ETL ..............................................................................
OLTP ....................................................................................................
1
2
2
2
4
4
4
5
5
6
6
6
7
BAB III DASAR PEMROGRAMAN PHP
3.1
3.2
3.3
Analisa ................................................................................................. 8
Kesimpulan .......................................................................................... 8
Lampiran ............................................................................................. 9
BAB I
PENDAHULUAN
1.1
Latar Belakang
Kebutuhan akan bahan pangan yang semakin meningkat membuat petani menjadi
kewalahan terus – menerus menambah jumlah produksi mereka, dibutuhkan sebuah sistem
otomatis yang dapat menunjang dan mempermudah pekerjaan mereka, tetapi mereka harus
mengolah data yang banyak jumlahnya, dan hal tersebut akan memakan waktu yang tidak masuk
akal apabila harus dikerjakan oleh manusia.
Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data
jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi “pengetahuan”
dari data. Metodologi tradisional untuk menganalisis data yang ada, tidak dapat menangani data
dalam jumlah besar. Para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang
menjawab kebutuhan ini, yaitu datawarehouse. Teknologi ini sekarang sudah ada dan
diaplikasikan oleh perusahaan perusahaan untuk memecahkan berbagai permasalahan bisnis.
Data warehouse merupakan metode dalam perancangan database, yang menunjang
DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data
warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam
perancangan
database
tradisional
menggunakan
warehouse normalisasi bukanlah cara yang terbaik.
normalisasi,
sedangkan
pada
data
1.2
Rumusan Masalah
Berdasarkan latar belakang diatas penulis mencoba merumuskan masalah yang akan
diangkat dan dibahas dalam penulisan ini sebagai berikut:
1. Pendahuluan mengenai data warehouse. Latar belakang masalah munculnya kebutuhan
irigasi otomatis dengan menggunakan mesin.
2. Pengertian dan pembahasan mengenai data warehouse, data mart, bisnis intelijen, ETL,
dan OLTP yang menjelaskan tentang kegunaan serta mekanisme masing – masing
teknologi tersebut.
3. Pembahasan gagasan penerapan ide irigasi otomatis terhadap desa yang dituju.
4. Kesimpulan gagasan ide irigasi otomatis dan dampak yang diharapkan dari ide penulis.
1.3
Tujuan dan Manfaat
Tujuan dari penelitian ini adalah untuk mencari solusi dari meningkatnya kebutuhan
pangan dari penduduk local dengan cara melakukan irigasi otomatis, membahas konsep kerja serta
kegunaannya, kekurangan dan kelebihannya. Penulis juga ingin mencari tahu apakah data
warehouse ini bisa menjadi solusi bagi latar belakang diatas. Diharapkan dengan adanya makalah
ini dapat membantu pembaca memahami hubungan data warehouse dengan kehidupan sehari-hari
serta membantu petani local untuk dapat memajukan hasil produksi dengan menerapkan metode
irigasi otomatis yang digagas oleh penulis.
1.4
Desain Solusi
Berikut merupakan desain solusi yang ditawarkan oleh penulis untuk menunjang sistem
irigasi sehingga dapat menjadi sistem irigasi otomatis pada desa Kelating, Kecamatan
Kerambitan, Kabupaten Tabanan.
Gambar 1 Desain Solusi Irigasi Otomatis
Dari gambar diatas diketahui bahwa petani akan mencatat kondisi yang dibutuhkan untuk
melakukan proses irigasi pada waktu tertentu, kemudian Petani tersebut akan memberikan data mentah
tersebut kepada seorang admin. Admin kemudian akan memasukan data tersebut kedalam database.
Kemudian dari beberapa database dari beberapa admin akan digabungkan menjadi satu ke
sebuah data warehouse terpadu yang kemudian akan dibuatkan menjadi data mart agar dapat diakses
oleh admin yang lainnya untuk mencari-cari data apabila dibutuhkan dikemudian hari. Informasi tersebut
termasuk banyaknya air yang dibutuhkan, luas areal pertanian yang akan di irigasi, kemiringan tanah,
kelembapan tanah, suhu desa pada saat itu, tingkat humus dalam tanah, serta tipe tanaman yang akan
diirigasi.
Selain itu admin juga akan menggunakan data yang diakses dari data mart untuk diinputkan
kedalam sistem irigasi otomatis yang akan dipasang ke beberapa lokasi stratetis terkait irigasi di desa
kelating, kecamatan kerambitan, kabupaten tabanan. Untuk Admin dapat login sebagai admin kedalam
sistem untuk melakukan edit data apabila terjadi perubahan dalam data irigasi terkait waktu tertentu jika
terdapat kesalahan juga dapat diperbaiki. Admin disini bekerja sama dengan petani serta teknisi yang
berada di desa Kelating untuk melakukan input informasi terkait irigasi kedalam sistem irigasi otomatis
yang dipasang ke beberapa lokasi di desa Kelating. Selain melakukan maintenance terhadap system,
admin juga dapat melakukan sosialisasi dan pengajaran mengenai pengelolaan tanah serta pengairan agar
penduduk desa Kelating dapat memanfaatkan sistem yang tersedia dengan baik dan sebagaimana
semestinya.
BAB II
LANDASAN TEORI
2.1
Landasan Teori
Pada Bab ini, penulis akan menjelaskan mengenai teknologi-teknologi pendukung yang
digunakan untuk solusi dari formulasi permasalahan yang diangkat oleh penulis dari studi kasus Desa
Kelating Kecamatan Kerambitan, Kabupaten Tabanan. Berikut adalah penjelasannya :
2.1.1
Data Warehouse
Data Warehouse merupakan koleksi data yang memiliki sifat object-oriented, time-variant, dan
terintegrasi dalam sebuah koleksi data sebagai pendukung dalam proses pengambilan keputusan.
Data Warehouse berperan sebagai gudang data, yang nantinya data-data yang ada di dalamnya
dapat digunakan untuk diolah sewaktu-waktu diperlukan. Data Warehouse digunakan untuk ruang
lingkup yang lebih spesifik seperti pada suatu organisasi atau perusahaan.
Data Warehouse hanya dapat dilakukan dengan menggunakan 2 server atau lebih. Data Warehouse
dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format
yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecahpecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep Data
Warehouse itu sendiri. Dengan kata lain informasi dikumpulkan dari data yang terpisah yang kemudian
disatukan menjadi sebuah ringkasan.
2.1.2
Business Intelligence (BI)
Istilah Business Intelligence (BI) pertama kali didengungkan pada tahun 1958 oleh seorang
peniliti IBM yaitu Hans Peter Luhn. Business Intelligence (BI) adalah sekumpulan alat dan teknik yang
dapat mengubah data bisnis dari sebuah perusahaan menjadi sebuah infromasi yang aktual dan
akurat untuk proses pengambilan keputusan, agar dapat digunakan oleh orang-orang yang tepat
dengan tujuan paling tepat.
Business Intelligence bekerja dengan melakukan ekstraksi data-data operasional perusahaan dan
mengumpulkannya dalam sebuah Data Warehouse. Selama proses ekstraksi juga dapat dilakukan
transformasi dengan menerapkan berbagai formula, agregasi, maupun validasi sehingga didapat data
yang sesuai dengan kepentingan analisis bisnis. Selanjutnya data pada Data Warehouse diproses
menggunakan berbagai analisis statistik dalam proses Data Mining, sehingga didapat berbagai
kecenderungan atau pattern dari data. Hasil penyederhanaan dan peringkasan ini disajikan
kepada end user yang biasanya merupakan pengambil keputusan bisnis.
2.1.3
Data Mart
Data Mart merupakan bagian dari Data Warehouse yang mendukung pada tingkat
departemen atau fungsi bisnis tertentu pada perusahaan dengan kata lain, sebuah data mart adalah
bentuk sederhana dari sebuah gudang data yang difokuskan pada subjek tunggal (atau area
fungsional), seperti Penjualan, Keuangan, atau Marketing.Data Mart sering dibangun dan
dikendalikan oleh satu departemen dalam sebuah organisasi. Mengingat subjek tunggal fokus
departemen tersebut, data mart biasanya menggambar data dari hanya beberapa sumber. Sumber
bisa
sistem
operasional
internal,
data
warehouse
pusat,
atau
data
eksternal.
Jika dibandingkan dengan Data Warehouse, Data Mart memfokuskan pada kebutuhan pemakai
terkait dalam sebuah departemen atau fungsi bisnis. Data Mart biasanya tidak mengandung data
operasional secara rinci seperti pada Data Warehouse melainkan sebuah ringkasan yang diberikan
kepada pengguna tertentu sehingga lebih mudah dipahami dan dinavigasikan.
2.1.4
Data Mining
Data Mining merupakan proses yang berfungsi untuk ekstraksi atau penggalian pengetahuan
dan informasi baru berdasarkan data yang telah ada dan berjumlah banyak pada database. Data
Mining, menggunakan kecerdasan buatan (Artificial Inteligence), statistik, perumusan matematis, dan
sebagainya dalam mengalasia, dan mengolah data menjadi sebuah hasil yang akan membantu
pengambil keputusan dalam memberikan suatu keputusan. Perbedaan Data Mining dengan Data
Warehouse adalah teknologi yang terdapat pada Data Warehouse dimanfaatkan penuh untuk
melakukan Data Mining. Data Warehouse digunakan untuk melakukan OLAP (On-line Analytical
Processing), sedangkan Data Mining digunakan untuk melakukan penemuan informasi yang
informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (tentunya ditambah
visualisasi). Dalam prakteknya, Data Mining juga mengambil data dari Data Warehouse. Hanya saja
aplikasi
dari
Data
Mining
lebih
khusus
dan
lebih
spesifik
dibandingkan
OLAP
mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi Data Mining, banyak lagi
bidang ilmu yang turut memperkaya Data Mining seperti, information science (ilmu informasi), high
performance
computing,
visualisasi,
machine
learning,neural
networks
(jaringan
syaraf
tiruan), information retrieval dan information extraction, pengenalan pola, hingga image
processing (pengolahan citra) juga digunakan dalam rangka melakukan Data Mining terhadap
dataimage/spatial.
2.1.5
ETL (Extraction, Transformation, Loading)
Proses ETL (Extraction, Transformation, Loading) merupakan proses yang harus dilalui dalam
pembentukan data warehouse. ETL adalah suatu proses mengambil dan mengirim data dari data
sumber ke data warehouse. Dalam proses pengambilan data, data harus bersih agar didapat kualitas
data yang baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang tidak eksis lagi, ada
beberapa data yang null, dan lain sebagainya. Pendekatan tradisional pada proses ETL mengambil
data dari data sumber, meletakan pada staging area, dan kemudian mentransform dan mengload ke data warehouse. Berikut adalah gambaran proses ETL.
Berdasarkan gambar Skema Proses ETL di atas, data diekstrak dari sumber data (data source)
menggunakan data extraction tool melalui koneksi apapun yang tersedia. Kemudian data
ditransormasikan menggunakan serangkaian rutinitas transformasi. Proses transformasi sebagian
besar ditentukan oleh format data output yang diinginkan. Kualitas data dan pemeriksaan integritas
dilakukan sebagai bagian dari proses transformasi dan tindakan korektif yang telah disisipkan pada
proses
trasformasi.
Proses
transformasi
dan
pemeriksaan
integritas
data
dilakukan
dalam staging area. Seteah data tersebut telah bertransformasi dalam format data yang ditargetkan,
data tersebut kemudian dimuat ke dalam data warehouse dan data tersebut siap untuk
dipresentasikan dalam bentuk informasi.
Proses ini biasanya dirancang dari end backwards, dimana required output harus dirancang terebih
dahulu. Oleh karena itu, proses ini menginformasikan secara tepat data apa saja yang diperlukan dari
sumber data. Rutinitas dirancang dan dikembangkan untuk melaksanakan proses yang ditulis khusus
untuk mencapai output yang diinginkan dan hanya data yang diperlukan untuk output yang masuk
dalam proses ekstraksi Selain itu, desainoutput harus menggabungkan semua fakta dan dimensi yang
dibutuhkan untuk menyajikan baik pada tingkat agregasi yang dibutuhkan oleh Business
Intelligence dan kebutuhan masa depan. Aturan bisnis yang menentukan bagaimana agregasi akan
tercapai dan hubungan antara berbagai entitas baik sumber maupun sasaran yang dirancang dan
selanjutnya dikodekan dalam suatu rutinitas untuk melaksanakan proses ETL. Pendekatan ini
mengarah pada dependensi yang sempit di suatu rutinitas pada setiap tahapan proses. Terlepas dari
kenyataan bahwa terdapat tiga tahap efektif, desain ETL sering dikarakteristikan sebagai proses
monolitik
dikarenakan
target
yang
telah
ditentukan
dengan
sangat
jelas.
Selain tools yang disediakan oleh produsen database, terdapat sejumlah tools yang tersedia
dipasaran yang menerapkan pendekatan ini dan menyediakan platform yang kuat, produktivitas, dan
fleksibilitas.
2.1.5.1 Kelebihan ETL
1. Developing Time
Perancangan dari output backwards memastikan bahwa data hanya relevan untuk solusi
yang telah diekstrak dan diproses dimana berpotensi untuk mengurangi pengembangan,
ekstraksi, dan proses yang berlebihan yang pada akhirnya akan memiliki pengaruh besar
dalam penggunaan waktu.
2. Targeted Data
Dikarenakan target telah ditentukan pada proses loading, maka data warehouse hanya
terisi data yang relevan untuk melakukan presentasi.
3. Administration Overhead
Mengurangi konten data warehouse menyederhanakan aturan keamanan yang
diimplementasikan sehingga menghasilkan administration overhead.
4. Tools Availability
Jumlah ketersediaan tools produktif yang menerapkan ETL memberikan fleksibilitas
pendekatan dan kemudahan untuk memilih tools yang paling sesuai. Perkembangan tools di
pasaran menyebabkantools tersebut memiliki fungsi-fungsi yang sangat kompetitif.
2.1.5.2 Kekurangan ETL
1. Flexibility
Hanya menargetkan data yang relevan sebagai output yang berarti bahwa setiap
kebutuhan masa depan yang mungkin membutuhkan data yang tidak termasuk dalam
rancangan awal, perlu ditambahkan ke dalam rutinitas ETL. Karena sifat ketergantungan yang
sangat erat antara rutinitas yang dikembangkan, hal ini sering mengarah kepada kebutuhan
mendasar untuk melakukan desain ulang dan pengembangan dimana sebagai hasilnya akan
adanya peningkatan pada waktu dan biaya yang diperlukan.
2. Hardware
Kebanyakan third-party tools memanfaatkan engine mereka sendiri untuk melaksanakan
proses
ETL
sehingga
untuk
menggunakan
tools
tersebut
memerlukan
investasi hardware tambahan untuk mengimplementasikan ETL engine dari tools tersebut.
3. Skill Investment
Penggunaan third-party tools untuk melakukan proses ETL memaksa pengembang untuk
belajar bahasa script dan proses yang baru
4. Learning Curve
Menerapkan third-party tools yang menggunakan proses dan bahasa asing, berpengaruh
pada learning curve yang tersirat pada setiap teknologi baru pada sebuah organisasi dan
sering berakhir dengan ketidaktahuan dan kebingungan karena kurangnya pemahaman dan
pengalaman.
2.1.6
OLTP (Online Transaction Processing)
OLTP adalah singkatan dari Online Transaction Processing. OLTP merupakan suatu aplikasi
atau
program
yang
digunakan
dalam
operasional
perusahaan
sehari-hari
seperti
melakukan insert (memasukan data), update (mengubah data) dan delete (menghapus data) berbagai
macam data, seperti penjualan, pembelian, produksi dan lain sebagainya. OLTP bertujuan untuk
memproses suatu transaksi secara langsung melalui komputer yang tergabung didalam jaringan.
Contohnya seperti aplikasi yang digunakan minimarket dalam melayani penjualan, jika ada suatu
transaksi penjualan, seorang kasir dapat langsung memasukan data kedalam aplikasi yang terhubung
didalam jaringan, sehingga pemrosesan data terbantu oleh adanya OLTP tersebut. Berdasarkan
datanya, OLTP menggunakan data asli atau hari ini dan dapat di update setiap saat. OLTP biasanya
memiliki ukuran yang relatif kecil.
BAB III
ANALISA DAN KESIMPULAN
3.1 Analisa
Sistem yang digunakan sudah memadai karena sudah banyak terdapat fasilitas yang
memudahkan masyarakat petani desa kelating diantaranya: Petani dapat dengan perantara
administrator memasukkan data mentah berupa informasi suhu, kelembapan, serta banyaknya air
yang diperlukan untuk melakukan irigasi setiap period eke dalam sistem. Administrator dapat
membantu petani mencari data dari desa lain yang menerapkan sistem serupa dengan bantuan data
mart. Masyarakat petani desa kelanting teringankan dengan adanya sistem pengairan/irigasi
otomatis dengan tidak perlu melakukan irigasi secara manual (terjun langsung ke lapangan), hanya
tinggal melakukan penanaman ataupun pemeliharaan serta panen hasil.
Kualitas pertanian serta perkebunan yang tersedia di alam desa Kelating dapat teririgasi dengan
baik dengan adanya sistem yang berisikan informasi irigasi serta melakukan irigasi secara
otomatis, hal memudahkan masyarakat petani desa kelating untuk menambah produktifitas mereka
karena tidak perlu melakukan irigasi secara manual.
3.2 Kesimpulan
Kesimpulan yang didapatkan oleh penulis adalah bahwasanya penerapan dan pemanfaatan
teknologi sangat memiliki dampak yang sangat penting bagi kehidupan manusia. Teknologi
membantu kehidupan manusia dalam berbagai bidang pekerjaan. Selain itu bagi masyarakat local
sebagai petani juga dapat dimudahkan dengan adanya berbagai fasilitas terotomatisasi yang dapat
disediakan oleh adanya teknologi.
Lampiran
Download