clustering data cuaca untuk pengenalan pola perioditas iklim

advertisement
ISSN 2087-6920
JURNAL TEKNOLOGI &
INDUSTRI
Vol. 3 No. 1; Juni 2014
CLUSTERING DATA CUACA UNTUK PENGENALAN POLA PERIODITAS
IKLIM WILAYAH PELAIHARI DENGAN METODE FUZZY C-MEANS
AHMAD RAMADHANI1, ANDI FARMADI 2, IRWAN BUDIMAN 2
1 Staf
2
pengajar Program Studi Teknik Informatika Politeknik Negeri Tanah Laut
Staf pengajar Program Studi Ilmu Komputer FMIPA Universitas Lambung Mangkurat
Naskah diterima: 02 Mei 2014; Naskah disetujui: 06 Juni 2014
ABSTRAK
Pada zaman sekarang banyaknya data yang ada, tidak selalu dibarengi dengan banyaknya
pengetahuan yang dihasilkan. Sehingga pada akhirnya data-data tersebut hanya menjadi kuburan
data yang tidak berguna. Penggalian suatu data menjadi pengetahuan adalah kegiatan yang sangat
berguna, karena pengetahuan tersebut bisa digunakan untuk memecahkan suatu masalah yang ada di
dalam masyarakat. Data mining merupakan salah satu teknik untuk menggali pengetahuan dari data,
salah satu metode data mining adalah klastering, dimana klastering biasanya digunakan untuk
mengelompokan objek-objek yang memiliki kemiripan dalam kelas atau segmen yang sama. Tanah
Laut merupakan daerah yang terkenal akan pertanian padi, perkebunan sawit, dan peternakan sapi,
dan semua itu sangat bergantung pada keadaan cuaca. Data tentang keadaan cuaca harian adalah
data tentang informasi keadaan cuaca tiap harinya. Pada penelitian ini dilakukan proses penggalian
data dengan cara mengelompokkan data keadaan cuaca harian, berupa data kecepatan angin, data
kelembaban udara, data penguapan, data temperatur, dan data curah hujan menjadi 4 kelompok
menggunakan algoritma fuzzy c-means. Hasil yang diperoleh dari peneltian ini adalah diperolehnya
4 klaster. Dari informasi 4 klaster tersebut, diproleh pengetahuan tentang kondisi cuaca dari tahun
1990-1999 yaitu kondisi cuaca pada periode tersebut setiap tahun menjadi semakin panas, dan
diketahui adanya pergeseran musim kemarau dan musim hujan lebih cepat 10 hari dari tahun 19901999.
Kata kunci: Data mining, klaster, fuzzy c-means, keadaan cuaca
PENDAHULUAN
Pada saat ini dengan berkembangnya teknologi informasi, maka makin banyak pula suatu sistem
basis data, baik secara manual maupun sudah terkomputerisasi. Namun banyaknya data yang ada, tidak
selalu dibarengi dengan pengetahuan yang dapat dihasilkan oleh data yang banyak tersebut. Sehingga
pada akhirnya data-data tersebut hanya menjadi sesuatu yang kurang berguna, misalnya data yang sudah
segunung hanya akan menjadi bagian dari arsip maupun laporan, padahal kalau data tersebut diolah akan
dapat menghasilkan pengetahuan yang tidak pernah disangka-sangka sebelumnya.
*Korespondensi penulis:
Telepon/nomor faks
Email
: 0512-21537
:
[57]
Data mining merupakan proses pencarian pola-pola yang menarik dan tersembunyi (hidden
pattern) dari suatu kumpulan data yang berukuran besar yang tersimpan dalam suatu basis data, seperti
data warehouse dan tempat penyimpanan data lainnya. Data mining juga didefinisikan sebagai bagian
dari proses penggalian pengetahuan dalam database yang dikenal dengan istilah Knowledge Discovery in
Database (KDD) (Sumathi & Sivanandam, 2006).
Cuaca merupakan salah satu variabel yang menentukan kondisi iklim. Cuaca adalah keadaan rata
-rata udara pada periode waktu sesaat. Iklim adalah keadaan rata-rata cuaca pada periode waktu tertentu.
Salah satu faktor yang berpengaruh langsung terhadap tipe atau variasi iklim adalah curah hujan. Curah
hujan adalah ketinggian air hujan yang terkumpul dalam tempat yang datar, tidak menguap, tidak meresap
dan tidak mengalir.
Kabupaten Tanah Laut merupakan salah satu kabupaten yang ada di Kalimantan selatan. Tanah
Laut merupakan daerah yang terkenal akan pertanian padi, perkebunan sawit, dan peternakan sapi. Jadi
secara ekonomis, Kabupaten Tanah Laut merupakan daerah yang cukup kaya, kaya akan alamnya. Karena
kekayaan yang bersumber dari alam inilah, maka faktor cuaca merupakan faktor terpenting di daerah ini.
Karena dengan adanya informasi tentang banjir, tentang kemarau, maka masyarakat dapat menghindari
kerugian dari kejadian alam tersebut.
Informasi tentang cuaca, apapun bentuknya asalkan dapat dipercaya dan valid, sungguh sangat
diperlukan oleh masyarakat. Salah satunya adalah penentuan perioditas iklim suatu wilayah, namun
karena sulitnya untuk menentukan perulangan masa atau periode cuaca secara manual, sehingga
diperlukan sebuah perangkat lunak yang dapat mengelompokkan data cuaca menurut kemiripan datanya.
Teknik data mining yang dapat digunakan untuk mengelompokkan data cuaca menurut
kemiripan datanya adalah menggunakan teknik clustering. Teknik clustering digunakan pada data mining
untuk mengelompokan objek-objek yang memiliki kemiripan dalam kelas atau segmen yang sama,
sementara objek-objek yang terletak pada kelas yang berbeda menunjukkan karakteristik yang berbeda
juga (Jain, Murthy, & Flynn, 1999).Perumusan Masalah
Berdasarkan latar belakang di atas dapat dirumuskan masalah yaitu bagaimana merancang sebuah sistem
yang bisa digunakan sebagai alat bantu dalam pengelolaan inventaris alat/ bahan laboratorium dasar
FMIPA UNLAM untuk mempermudah proses inventarisasi alat/bahan tersebut.
Adapun tujuan dari penelitian ini adalah membangun sebuah perangkat lunak yang dapat
mengelompokkan data cuaca menurut kemiripan datanya dengan menggunakan metode fuzzy c-means,
sehingga output yang dihasilkan oleh perangkat lunak tersebut dapat digunakan sebagai acuan untuk
menentukan pola perioditas iklim wilayah Pelaihari.
Manfaat yang diperoleh dari penelitian ini adalah:
(1).
Manfaat teoritis: diharapkan dapat menjadi referensi untuk penggunaan model Algoritma
Fuzzy C-Means bagi praktisi atau peneliti lain untuk diterapkan pada kasus penelitian
yang lain, dengan melihat karakteristik penggunaan algoritma ini dalam pengenalan pola
perioditas iklim suatu wilayah.
(2).
Manfaat praktis: diharapkan dapat membantu pihak BMKG wilayah Pelaihari dalam
memberikan pengetahuan kepada masyarakat tentang adanya suatu pola iklim di wilayah
Pelaihari.
[58]
(3).
Manfaat kebijakan: diharapkan
akan dilakukan penelitian lebih lanjut baik dari
pemerintah maupun instansi terkait untuk mendapatkan hasil penelitian yang lebih
maksimal, sehingga pengetahuan yang akan diberikan kepada masyarakat akan lebih
berguna dan bermanfaat.
METODE PENELITIAN
Jenis Penelitian
Jenis penelitian ini adalah pembuatan aplikasi dan analisa klaster.
Alat dan Bahan
Alat-alat yang digunakan dalam penelitian adalah sebagai berikut: Processor Intel Atom, RAM
1GB, Harddisk 250 GB, VGA 237 MB, Sistem operasi Microsoft Windows 7, Delphi XE, XAMPP,
Mcrosoft Word, Microsoft Excel. Adapun bahan atau materi yang digunakan dalam penelitian ini adalah
data keadaan cuaca yang didapatkan dari BMKG Stasiun Tanah Ambungan (PG Pelaihari). Data yang
digunakan adalah kecepatan angin harian, kelembaban udara harian, penguapan harian, temperatur harian,
dan curah hujan harian.
Prosedur Kerja
Prosedur penelitian yang di pakai pada kesempatan ini adalah model KDD Prosess :
Model KDD Proses (Fayyad, 1996)
Data Preparation
Pada tahap ini struktur basis data akan dipersiapkan sehingga mempermudah proses mining.
Proses preparation ini mencakup tiga hal utama yaitu:
1.
Data Selection
Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga
pemilihan atribut-atribut yang disesuaikan dengan proses data mining. Dalam penelitian kali ini, data
yang digunakan sudah berupa data yang siap pakai, artinya data yang didapatkan sudah berupa target
data.
2.
Data Preprocessing
Pada tahap ini masalah yang harus dihadapi adalah noisy data dan missing values. Proses
cleaning data pelu dilakukan agar data bersih dari duplikasi data, data yang tidak konsisten, atau
kesalahan cetak. Sehingga data yang telah melewati proses ini siap untuk di proses di data mining. Pada
[59]
penelitian ini, data yang digunakan adalah data yang sudah konsisten, sehingga proses pembersihan data
hanya dilakukan pada data yang missing value saja.
3.
Data Transformation
Setelah melakukan pembersihan data yang menyeluruh, maka akan dilakukan tahapan
selanjutnya yaitu tahap merubah data (data transformation). Pada tahap ini hal pertama yang dilakukan
adalah integrasi data yakni tahap penggabungan data dari berbagai tabel.
Pola
Pola disini adalah tahap pemilihan algoritma yang digunakan untuk melakukan proses data
mining. Tahap ini bisa juga disebut sebagai proses data mining, karena pada tahap ini, data yang telah
ditransformasikan akan diolah dengan algoritma yang dipilih. Algoritma yang digunakan adalah Fuzzy CMeans.
Interpretasi / Evaluasi
Pada tahap ini dilakukan evaluasi dan penginterpretasian dari pola yang diperoleh berdasarkan
hasil dari clustering data menggunakan metode fuzzy c-means. Jika hasil yang didapatkan belum sesuai,
maka proses akan diulang kembali ke tahap proses clustering data.
Knowledge
Tahap ini merupakan bagian akhir dari proses KDD dimana dilakukan pemeriksaan apakah pola
atau informasi yang ditemukan bertentangan dengan fakta yang ada. Pola informasi yang dihasilkan dari
proses data mining harus ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan.
PEMBAHASAN
Perbandingan Hasil
Untuk menjamin bahwa pusat klaster yang dihasilkan oleh aplikasi yang dibuat sudah benar,
maka perlu adanya perbandingan hasil pusat klaster. Hasil dari program matlab dipilih karena algoritma
fuzzy c-means sudah ada dalam bentuk fungsi didalam program matlab tersebut, sehingga bisa dipastikan
bahwa hasil dari matlab sudah benar. Berikut adalah pusat cluster hasil dari aplikasi yang dibagun :
Pusat Cluster Yang Dihasilkan Aplikasi
Sedangkan hasil dari aplikasi Matlab pada penelitian ini, proses berhenti setelah iterasi ke-94. Pusat
cluster yang didapatkan oleh aplikasi Matlab pada iterasi terakhir adalah :
[60]
Pusat Cluster (V) Yang Terbentuk pada iterasi terakhir
V1
4.734
89.4049
1.6278
26.6364
80.472
V2
2.5952
88.202
3.0581
26.8999
2.3178
V3
9.2976
81.8235
4.2794
27.7967
1.2545
V4
3.4907
88.8472
2.0089
26.614
29.5815
Jadi bisa dikatakan bahwa hasil yang didapatkan oleh aplikasi yang dibangun sudah 100% benar (sesuai
standar Matlab). Berdasarkan pusat cluster diatas, dapat diperoleh informasi tentang cluster yang
terbentuk, yaitu :
(1) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 4, 734 , ratarata kelembaban udara sebesar 89,4049 , rata-rata penguapan sebesar 1,6278, rata-rata
temperatur sebesar 26,6364 , dan rata-rata curah hujan sebesar 80,472.
(2) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 3,4907 , ratarata kelembaban udara sebesar 88,8472 , rata-rata penguapan sebesar 2,0089, rata-rata
temperatur sebesar 26,6614 , dan rata-rata curah hujan sebesar 29,5815.
(3) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 2,5952 , ratarata kelembaban udara sebesar 88,202 , rata-rata penguapan sebesar 3,0581, rata-rata
temperatur sebesar 26,8999 , dan rata-rata curah hujan sebesar 2,3178.
(4) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 9,2976 , ratarata kelembaban udara sebesar 81,8235 , rata-rata penguapan sebesar 4,2794, rata-rata
temperatur sebesar 27,7967 , dan rata-rata curah hujan sebesar 1,2545.
Interpretasi
Ada dua hal yang bisa diinterpretasikan dari hasil penelitian ini, yaitu:
1.
Trend dari beberapa variabel data
Trend Kecepatan Angin
Trend Kelembaban Udara
[61]
Trend Penguapan
2.
Trend Temperatur
Pergeseran Musim
Telah terjadi pergeseran untuk awal musim kemarau dan awal musim hujan sebanyak 10 hari
lebih cepat seperti yang dilihat pada gambar grafik dibawah ini.
Awal Musim Kemarau 1990
Awal Musim Kemarau 1999
Awal Musim Hujan 1990
Awal Musim Hujan 1999
Knowledge
Pemantauan perubahan iklim wilayah Pelaihari sebenarnya dapat dilakukan dengan melakukan
pemantauan kondisi iklim ekstrim. Namun karena banyaknya data yang digunakan hanya 10 tahun,
sedangkan perubahan iklim adalah berubahnya baik pola dan intensitas unsur iklim pada periode waktu
yang dapat dibandingkan (biasanya terhadap rata rata 30 tahun), maka bisa dikatakan bahwa sangat sulit
untuk mengatakan bahwa telah terjadi perubahan iklim di wilayah Pelaihari.
[62]
Namun tidak bisa disangkal pula, dalam sepulah tahun (1990-1999) telah terjadi perubahanperubahan pada kondisi cuaca di Pelaihari. Contohnya adalah meningkatnya kecepatan angin,
menurunnya kelembaban udara, meningkatnya penguapan, dan juga meningkatnya suhu di Pelaihari. Jadi
bisa dikatakan bahwa selama sepuluh tahun tersebut keadaan cuaca daerah pelaihari mengalami
perubahan menjadi semakin panas. Dan juga telah terjadi pergeseran untuk awal musim kemarau dan
musim hujan sebanyak 10 hari lebih cepat.
KESIMPULAN
Kesimpulan yang dapat diambil dari penelitian ini adalah Aplikasi yang dikembangkan pada
penelitian ini bisa dikatakan sudah berhasil dibuat, dan dapat mengahasilkan 4 (empat) pusat klaster.
Knowledge yang didapatkan yaitu diketahui adanya perubahan pada kondisi cuaca di Pelaihari dalam
kurun waktu 10 tahun (1990-1999), seperti meningkatnya kecepatan angin, meningkatnya temperatur,
meningkatnya penguapan, dan menurunnya kelembaban udara. Juga telah terjadinya pergeseran awal
untuk musim kemarau dan musim hujan sebanyak 10 hari lebih cepat.
UCAPAN TERIMA KASIH
Penulis mengucapkan terima kasih yang sebesar-besarnya kepada orang tua dan seluruh keluarga
dan juga teman-teman Ilmu Komputer FMIPA UNLAM atas segalanya yang telah mereka berikan baik
doa, dukungan, motivasi, semangat yang sangat membantu dalam penyelesaian skripsi ini. Tak lupa
penulis mengucapkan terima kasih kepada Bapak Andi Farmadi S.Si, M.T., selaku pembimbing utama
dan Bapak Irwan Budiman, S.T., M.Kom., selaku pembimbing pendamping yang sudah memeberikan
arahan dan saran-saran selama pelaksanaan penelitian hingga selesainya penyusunan skripsi ini serta
terima kasih kepada Bapak Muliadi S.Kom, M.Cs. dan Bapak Dodon T. Nugrahadi, S.Kom, M.Eng.,
selaku dosen penguji yang juga memberikan saran dan kritik yang membantu menyempurnakan
penyelesaian skripsi.
DAFTAR PUSTAKA
Aldrian, E. (2010). Pengenalan Dampak Perubahan Iklim. Cisarua: Diklat Teknis pengolahan dan
Analisa Kualitas Udara BMKG.
Dagaetano, A. (1996). Delineation Of Mesoscale Climate Zones In The Northeastern United States Using
A Novel Approach To Cluster Analysis. Journal Of Climate, 9.
Dunham, M. (2003). Data Mining Introuctory and Advanced Topics. New Jersey: Prentice Hall.
Haryoko, U. (2002). Pewilayahan hujan untuk menentukan pola hujan wilayah Kabupaten Indramayu.
Indramayu: BMKG.
Hidayat, S. (2010). Arsitektur Tropis. Jakarta: Pusat Pengembangan Bahan Ajar - Universitas Mercu
Buana.
Jain, A. K., Murthy, M. N., & Flynn, P. J. (1999). Data Clustering : A Review. ACM Computing Surveys,
Vol. 31, No. 3.
[63]
Juaeni, I., Yuliani, D., Ayahbi, R., Noersomadi, Hardjana, T., & Nurzaman. (2009). Pengelompokkan
Wilayah Curah Hujan Kalimantan Barat Berbasis Metode WARD dan Fuzzy Clustering.
LAPAN.
Klawonn, F., & Hoppner, F. (2001). A New Approach To Fuzzy Partitioning. Proc. Of The Joint 9th
IFSA World Congress And 20th NAFIPS Iternational Conference. Canada: Vancouver.
Mimmack, G., Mason, S., & Galphin, J. (2000). Choice Of Distance Matrices In Cluster Analysis :
Defining Regions. Journal Of Climate, 14.
Nasrullah. (2011). PERUBAHAN IKLIM DAN TREND DATA IKLIM. Jakarta: BMKG.
Prihastuti Harsani, I. M. (2011). Predikisi curah hujan bulanan menggunakan Time Series (Single
Exponential Smoothing) dan KNN (K-Nearest Neighbor).
Sharma, S. (1996). Applied Multivariate Techniques. United States: A Willey-Interscience Publication.
Sumathi, S., & Sivanandam, S. (2006). Introduction to Data Mining and its Applications. Spinger: Verlag
Berlin Heidelberg.
Utami, F. D., & Sutikno. (2009). Pengelompokkan zona musim (ZOM) dengan fuzzy K-Means Clustering.
Fakultas Mipa ITS.
[64]
Download