ISSN 2087-6920 JURNAL TEKNOLOGI & INDUSTRI Vol. 3 No. 1; Juni 2014 CLUSTERING DATA CUACA UNTUK PENGENALAN POLA PERIODITAS IKLIM WILAYAH PELAIHARI DENGAN METODE FUZZY C-MEANS AHMAD RAMADHANI1, ANDI FARMADI 2, IRWAN BUDIMAN 2 1 Staf 2 pengajar Program Studi Teknik Informatika Politeknik Negeri Tanah Laut Staf pengajar Program Studi Ilmu Komputer FMIPA Universitas Lambung Mangkurat Naskah diterima: 02 Mei 2014; Naskah disetujui: 06 Juni 2014 ABSTRAK Pada zaman sekarang banyaknya data yang ada, tidak selalu dibarengi dengan banyaknya pengetahuan yang dihasilkan. Sehingga pada akhirnya data-data tersebut hanya menjadi kuburan data yang tidak berguna. Penggalian suatu data menjadi pengetahuan adalah kegiatan yang sangat berguna, karena pengetahuan tersebut bisa digunakan untuk memecahkan suatu masalah yang ada di dalam masyarakat. Data mining merupakan salah satu teknik untuk menggali pengetahuan dari data, salah satu metode data mining adalah klastering, dimana klastering biasanya digunakan untuk mengelompokan objek-objek yang memiliki kemiripan dalam kelas atau segmen yang sama. Tanah Laut merupakan daerah yang terkenal akan pertanian padi, perkebunan sawit, dan peternakan sapi, dan semua itu sangat bergantung pada keadaan cuaca. Data tentang keadaan cuaca harian adalah data tentang informasi keadaan cuaca tiap harinya. Pada penelitian ini dilakukan proses penggalian data dengan cara mengelompokkan data keadaan cuaca harian, berupa data kecepatan angin, data kelembaban udara, data penguapan, data temperatur, dan data curah hujan menjadi 4 kelompok menggunakan algoritma fuzzy c-means. Hasil yang diperoleh dari peneltian ini adalah diperolehnya 4 klaster. Dari informasi 4 klaster tersebut, diproleh pengetahuan tentang kondisi cuaca dari tahun 1990-1999 yaitu kondisi cuaca pada periode tersebut setiap tahun menjadi semakin panas, dan diketahui adanya pergeseran musim kemarau dan musim hujan lebih cepat 10 hari dari tahun 19901999. Kata kunci: Data mining, klaster, fuzzy c-means, keadaan cuaca PENDAHULUAN Pada saat ini dengan berkembangnya teknologi informasi, maka makin banyak pula suatu sistem basis data, baik secara manual maupun sudah terkomputerisasi. Namun banyaknya data yang ada, tidak selalu dibarengi dengan pengetahuan yang dapat dihasilkan oleh data yang banyak tersebut. Sehingga pada akhirnya data-data tersebut hanya menjadi sesuatu yang kurang berguna, misalnya data yang sudah segunung hanya akan menjadi bagian dari arsip maupun laporan, padahal kalau data tersebut diolah akan dapat menghasilkan pengetahuan yang tidak pernah disangka-sangka sebelumnya. *Korespondensi penulis: Telepon/nomor faks Email : 0512-21537 : [57] Data mining merupakan proses pencarian pola-pola yang menarik dan tersembunyi (hidden pattern) dari suatu kumpulan data yang berukuran besar yang tersimpan dalam suatu basis data, seperti data warehouse dan tempat penyimpanan data lainnya. Data mining juga didefinisikan sebagai bagian dari proses penggalian pengetahuan dalam database yang dikenal dengan istilah Knowledge Discovery in Database (KDD) (Sumathi & Sivanandam, 2006). Cuaca merupakan salah satu variabel yang menentukan kondisi iklim. Cuaca adalah keadaan rata -rata udara pada periode waktu sesaat. Iklim adalah keadaan rata-rata cuaca pada periode waktu tertentu. Salah satu faktor yang berpengaruh langsung terhadap tipe atau variasi iklim adalah curah hujan. Curah hujan adalah ketinggian air hujan yang terkumpul dalam tempat yang datar, tidak menguap, tidak meresap dan tidak mengalir. Kabupaten Tanah Laut merupakan salah satu kabupaten yang ada di Kalimantan selatan. Tanah Laut merupakan daerah yang terkenal akan pertanian padi, perkebunan sawit, dan peternakan sapi. Jadi secara ekonomis, Kabupaten Tanah Laut merupakan daerah yang cukup kaya, kaya akan alamnya. Karena kekayaan yang bersumber dari alam inilah, maka faktor cuaca merupakan faktor terpenting di daerah ini. Karena dengan adanya informasi tentang banjir, tentang kemarau, maka masyarakat dapat menghindari kerugian dari kejadian alam tersebut. Informasi tentang cuaca, apapun bentuknya asalkan dapat dipercaya dan valid, sungguh sangat diperlukan oleh masyarakat. Salah satunya adalah penentuan perioditas iklim suatu wilayah, namun karena sulitnya untuk menentukan perulangan masa atau periode cuaca secara manual, sehingga diperlukan sebuah perangkat lunak yang dapat mengelompokkan data cuaca menurut kemiripan datanya. Teknik data mining yang dapat digunakan untuk mengelompokkan data cuaca menurut kemiripan datanya adalah menggunakan teknik clustering. Teknik clustering digunakan pada data mining untuk mengelompokan objek-objek yang memiliki kemiripan dalam kelas atau segmen yang sama, sementara objek-objek yang terletak pada kelas yang berbeda menunjukkan karakteristik yang berbeda juga (Jain, Murthy, & Flynn, 1999).Perumusan Masalah Berdasarkan latar belakang di atas dapat dirumuskan masalah yaitu bagaimana merancang sebuah sistem yang bisa digunakan sebagai alat bantu dalam pengelolaan inventaris alat/ bahan laboratorium dasar FMIPA UNLAM untuk mempermudah proses inventarisasi alat/bahan tersebut. Adapun tujuan dari penelitian ini adalah membangun sebuah perangkat lunak yang dapat mengelompokkan data cuaca menurut kemiripan datanya dengan menggunakan metode fuzzy c-means, sehingga output yang dihasilkan oleh perangkat lunak tersebut dapat digunakan sebagai acuan untuk menentukan pola perioditas iklim wilayah Pelaihari. Manfaat yang diperoleh dari penelitian ini adalah: (1). Manfaat teoritis: diharapkan dapat menjadi referensi untuk penggunaan model Algoritma Fuzzy C-Means bagi praktisi atau peneliti lain untuk diterapkan pada kasus penelitian yang lain, dengan melihat karakteristik penggunaan algoritma ini dalam pengenalan pola perioditas iklim suatu wilayah. (2). Manfaat praktis: diharapkan dapat membantu pihak BMKG wilayah Pelaihari dalam memberikan pengetahuan kepada masyarakat tentang adanya suatu pola iklim di wilayah Pelaihari. [58] (3). Manfaat kebijakan: diharapkan akan dilakukan penelitian lebih lanjut baik dari pemerintah maupun instansi terkait untuk mendapatkan hasil penelitian yang lebih maksimal, sehingga pengetahuan yang akan diberikan kepada masyarakat akan lebih berguna dan bermanfaat. METODE PENELITIAN Jenis Penelitian Jenis penelitian ini adalah pembuatan aplikasi dan analisa klaster. Alat dan Bahan Alat-alat yang digunakan dalam penelitian adalah sebagai berikut: Processor Intel Atom, RAM 1GB, Harddisk 250 GB, VGA 237 MB, Sistem operasi Microsoft Windows 7, Delphi XE, XAMPP, Mcrosoft Word, Microsoft Excel. Adapun bahan atau materi yang digunakan dalam penelitian ini adalah data keadaan cuaca yang didapatkan dari BMKG Stasiun Tanah Ambungan (PG Pelaihari). Data yang digunakan adalah kecepatan angin harian, kelembaban udara harian, penguapan harian, temperatur harian, dan curah hujan harian. Prosedur Kerja Prosedur penelitian yang di pakai pada kesempatan ini adalah model KDD Prosess : Model KDD Proses (Fayyad, 1996) Data Preparation Pada tahap ini struktur basis data akan dipersiapkan sehingga mempermudah proses mining. Proses preparation ini mencakup tiga hal utama yaitu: 1. Data Selection Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses data mining. Dalam penelitian kali ini, data yang digunakan sudah berupa data yang siap pakai, artinya data yang didapatkan sudah berupa target data. 2. Data Preprocessing Pada tahap ini masalah yang harus dihadapi adalah noisy data dan missing values. Proses cleaning data pelu dilakukan agar data bersih dari duplikasi data, data yang tidak konsisten, atau kesalahan cetak. Sehingga data yang telah melewati proses ini siap untuk di proses di data mining. Pada [59] penelitian ini, data yang digunakan adalah data yang sudah konsisten, sehingga proses pembersihan data hanya dilakukan pada data yang missing value saja. 3. Data Transformation Setelah melakukan pembersihan data yang menyeluruh, maka akan dilakukan tahapan selanjutnya yaitu tahap merubah data (data transformation). Pada tahap ini hal pertama yang dilakukan adalah integrasi data yakni tahap penggabungan data dari berbagai tabel. Pola Pola disini adalah tahap pemilihan algoritma yang digunakan untuk melakukan proses data mining. Tahap ini bisa juga disebut sebagai proses data mining, karena pada tahap ini, data yang telah ditransformasikan akan diolah dengan algoritma yang dipilih. Algoritma yang digunakan adalah Fuzzy CMeans. Interpretasi / Evaluasi Pada tahap ini dilakukan evaluasi dan penginterpretasian dari pola yang diperoleh berdasarkan hasil dari clustering data menggunakan metode fuzzy c-means. Jika hasil yang didapatkan belum sesuai, maka proses akan diulang kembali ke tahap proses clustering data. Knowledge Tahap ini merupakan bagian akhir dari proses KDD dimana dilakukan pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta yang ada. Pola informasi yang dihasilkan dari proses data mining harus ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. PEMBAHASAN Perbandingan Hasil Untuk menjamin bahwa pusat klaster yang dihasilkan oleh aplikasi yang dibuat sudah benar, maka perlu adanya perbandingan hasil pusat klaster. Hasil dari program matlab dipilih karena algoritma fuzzy c-means sudah ada dalam bentuk fungsi didalam program matlab tersebut, sehingga bisa dipastikan bahwa hasil dari matlab sudah benar. Berikut adalah pusat cluster hasil dari aplikasi yang dibagun : Pusat Cluster Yang Dihasilkan Aplikasi Sedangkan hasil dari aplikasi Matlab pada penelitian ini, proses berhenti setelah iterasi ke-94. Pusat cluster yang didapatkan oleh aplikasi Matlab pada iterasi terakhir adalah : [60] Pusat Cluster (V) Yang Terbentuk pada iterasi terakhir V1 4.734 89.4049 1.6278 26.6364 80.472 V2 2.5952 88.202 3.0581 26.8999 2.3178 V3 9.2976 81.8235 4.2794 27.7967 1.2545 V4 3.4907 88.8472 2.0089 26.614 29.5815 Jadi bisa dikatakan bahwa hasil yang didapatkan oleh aplikasi yang dibangun sudah 100% benar (sesuai standar Matlab). Berdasarkan pusat cluster diatas, dapat diperoleh informasi tentang cluster yang terbentuk, yaitu : (1) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 4, 734 , ratarata kelembaban udara sebesar 89,4049 , rata-rata penguapan sebesar 1,6278, rata-rata temperatur sebesar 26,6364 , dan rata-rata curah hujan sebesar 80,472. (2) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 3,4907 , ratarata kelembaban udara sebesar 88,8472 , rata-rata penguapan sebesar 2,0089, rata-rata temperatur sebesar 26,6614 , dan rata-rata curah hujan sebesar 29,5815. (3) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 2,5952 , ratarata kelembaban udara sebesar 88,202 , rata-rata penguapan sebesar 3,0581, rata-rata temperatur sebesar 26,8999 , dan rata-rata curah hujan sebesar 2,3178. (4) Kelompok data cuaca yang terdiri atas data rata-rata kecepatan angin sebesar 9,2976 , ratarata kelembaban udara sebesar 81,8235 , rata-rata penguapan sebesar 4,2794, rata-rata temperatur sebesar 27,7967 , dan rata-rata curah hujan sebesar 1,2545. Interpretasi Ada dua hal yang bisa diinterpretasikan dari hasil penelitian ini, yaitu: 1. Trend dari beberapa variabel data Trend Kecepatan Angin Trend Kelembaban Udara [61] Trend Penguapan 2. Trend Temperatur Pergeseran Musim Telah terjadi pergeseran untuk awal musim kemarau dan awal musim hujan sebanyak 10 hari lebih cepat seperti yang dilihat pada gambar grafik dibawah ini. Awal Musim Kemarau 1990 Awal Musim Kemarau 1999 Awal Musim Hujan 1990 Awal Musim Hujan 1999 Knowledge Pemantauan perubahan iklim wilayah Pelaihari sebenarnya dapat dilakukan dengan melakukan pemantauan kondisi iklim ekstrim. Namun karena banyaknya data yang digunakan hanya 10 tahun, sedangkan perubahan iklim adalah berubahnya baik pola dan intensitas unsur iklim pada periode waktu yang dapat dibandingkan (biasanya terhadap rata rata 30 tahun), maka bisa dikatakan bahwa sangat sulit untuk mengatakan bahwa telah terjadi perubahan iklim di wilayah Pelaihari. [62] Namun tidak bisa disangkal pula, dalam sepulah tahun (1990-1999) telah terjadi perubahanperubahan pada kondisi cuaca di Pelaihari. Contohnya adalah meningkatnya kecepatan angin, menurunnya kelembaban udara, meningkatnya penguapan, dan juga meningkatnya suhu di Pelaihari. Jadi bisa dikatakan bahwa selama sepuluh tahun tersebut keadaan cuaca daerah pelaihari mengalami perubahan menjadi semakin panas. Dan juga telah terjadi pergeseran untuk awal musim kemarau dan musim hujan sebanyak 10 hari lebih cepat. KESIMPULAN Kesimpulan yang dapat diambil dari penelitian ini adalah Aplikasi yang dikembangkan pada penelitian ini bisa dikatakan sudah berhasil dibuat, dan dapat mengahasilkan 4 (empat) pusat klaster. Knowledge yang didapatkan yaitu diketahui adanya perubahan pada kondisi cuaca di Pelaihari dalam kurun waktu 10 tahun (1990-1999), seperti meningkatnya kecepatan angin, meningkatnya temperatur, meningkatnya penguapan, dan menurunnya kelembaban udara. Juga telah terjadinya pergeseran awal untuk musim kemarau dan musim hujan sebanyak 10 hari lebih cepat. UCAPAN TERIMA KASIH Penulis mengucapkan terima kasih yang sebesar-besarnya kepada orang tua dan seluruh keluarga dan juga teman-teman Ilmu Komputer FMIPA UNLAM atas segalanya yang telah mereka berikan baik doa, dukungan, motivasi, semangat yang sangat membantu dalam penyelesaian skripsi ini. Tak lupa penulis mengucapkan terima kasih kepada Bapak Andi Farmadi S.Si, M.T., selaku pembimbing utama dan Bapak Irwan Budiman, S.T., M.Kom., selaku pembimbing pendamping yang sudah memeberikan arahan dan saran-saran selama pelaksanaan penelitian hingga selesainya penyusunan skripsi ini serta terima kasih kepada Bapak Muliadi S.Kom, M.Cs. dan Bapak Dodon T. Nugrahadi, S.Kom, M.Eng., selaku dosen penguji yang juga memberikan saran dan kritik yang membantu menyempurnakan penyelesaian skripsi. DAFTAR PUSTAKA Aldrian, E. (2010). Pengenalan Dampak Perubahan Iklim. Cisarua: Diklat Teknis pengolahan dan Analisa Kualitas Udara BMKG. Dagaetano, A. (1996). Delineation Of Mesoscale Climate Zones In The Northeastern United States Using A Novel Approach To Cluster Analysis. Journal Of Climate, 9. Dunham, M. (2003). Data Mining Introuctory and Advanced Topics. New Jersey: Prentice Hall. Haryoko, U. (2002). Pewilayahan hujan untuk menentukan pola hujan wilayah Kabupaten Indramayu. Indramayu: BMKG. Hidayat, S. (2010). Arsitektur Tropis. Jakarta: Pusat Pengembangan Bahan Ajar - Universitas Mercu Buana. Jain, A. K., Murthy, M. N., & Flynn, P. J. (1999). Data Clustering : A Review. ACM Computing Surveys, Vol. 31, No. 3. [63] Juaeni, I., Yuliani, D., Ayahbi, R., Noersomadi, Hardjana, T., & Nurzaman. (2009). Pengelompokkan Wilayah Curah Hujan Kalimantan Barat Berbasis Metode WARD dan Fuzzy Clustering. LAPAN. Klawonn, F., & Hoppner, F. (2001). A New Approach To Fuzzy Partitioning. Proc. Of The Joint 9th IFSA World Congress And 20th NAFIPS Iternational Conference. Canada: Vancouver. Mimmack, G., Mason, S., & Galphin, J. (2000). Choice Of Distance Matrices In Cluster Analysis : Defining Regions. Journal Of Climate, 14. Nasrullah. (2011). PERUBAHAN IKLIM DAN TREND DATA IKLIM. Jakarta: BMKG. Prihastuti Harsani, I. M. (2011). Predikisi curah hujan bulanan menggunakan Time Series (Single Exponential Smoothing) dan KNN (K-Nearest Neighbor). Sharma, S. (1996). Applied Multivariate Techniques. United States: A Willey-Interscience Publication. Sumathi, S., & Sivanandam, S. (2006). Introduction to Data Mining and its Applications. Spinger: Verlag Berlin Heidelberg. Utami, F. D., & Sutikno. (2009). Pengelompokkan zona musim (ZOM) dengan fuzzy K-Means Clustering. Fakultas Mipa ITS. [64]