PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA OLEH HENDRA LUKITO NRP : G 651030184 PROGRAM STUDI ILMU KOMPUTER SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2007 xix PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA HENDRA LUKITO G 651030184 Tesis Sebagai salah satu syarat untuk memperoleh gelar Magister Sains Pada Program Studi Ilmu Komputer PROGRAM STUDI ILMU KOMPUTER SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2007 xxi SEMINAR SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR Nama : Hendra Lukito Nomor Pokok : G 651030184 Program Studi : Ilmu Komputer Judul Penelitian : Perumusan Pola Penyebaran Demam Berdarah Melalui Datamining Pada Database Dinas Kesehatan DKI Jakarta Komisi Pembimbing : Prof. Dr. Ir. Marimin, M.Sc ( Ketua ) Dr.drh. Hamdani Nasution ( Anggota ) Kelompok / Bidang Studi : Keteknikan dan Teknologi Informasi Hari / Tanggal : Kamis, 18 Januari 2007 Waktu : 09.00 – 10.00 Tempat : Ruang Sidang Fateta, IPB Darmaga, Bogor xx SURAT PERNYATAAN Saya menyatakan dengan sebenar – benarnya bahwa segala pernyataan dalam tesis saya berjudul : PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA Merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan Komisi Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini belum pernah diajukan untuk memperoleh gelar atau capaian akademik lainnya pada program sejenis di perguruan tinggi lain. Semua data dan informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa kebenarannya. Jakarta, 15 Maret 2007 Yang Membuat Pernyataan HENDRA LUKITO i ABSTRACT HENDRA LUKITO, The Formulation of Demam Berdarah Dengue Spread Pattern Through Datamining of Dinas Kesehatan DKI Jakarta Database. Supervised by MARIMIN and HAMDANI NASUTION. The Objectives of this research were to identify the most important attributes and to formulate decision rules from Dinas Kesehatan DKI Jakarta database. The real survailance data set used collected from Dinas Kesehatan Jakarta from 2004 until 2005 which include DBD data in Jakarta area. We used data set only from Central Jakarta and South Jakarta area. There are two main steps considered for identification of the pattern of DBD, data mining process building which using Classification based association algorithm and creates application program to implement the algorithm. Three steps procedures are implemented for data mining process building. The first step is to deal with missing values. The second step is the discretization, where, each variable is devided into limited number of values groups. The thrid step is creating rule mining and classification. There are 68 data with yellow DBD condition and 134 data with red DBD condition and weather data set consisted of 14 variabels data such as: temperatures, rainy, humadity and sunny. The maximum predictive accuracy for DBD with red condition is 88% and for DBD with yellow condition is 77%. The decision rules are used to predict the condition of DBD. Prediction result from application will be used to forecast the future condition of DBD at certain district. Keywords : DBD (Demam Berdarah Dengue), Datamining, Fuzzy rule base, Winter’s forecast method. ii RINGKASAN HENDRA LUKITO, Perumusan Pola Penyebaran Demam Berdarah Melalui Datamining Pada Database Dinas Kesehatan DKI Jakarta, Dibawah bimbingan Prof. Dr. Ir. Marimin, M.Sc, Dr. drh. Hamdani Nasution. Siklus DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus yang meningkat setiap tahunnya, membuat data survailance tentang DBD yang di catat secara rutin oleh Dinas Kesehatan DKI Jakarta akan menjadi semakin besar, akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat dimanfaatkan oleh semua pihak, hanya pihak tertentu saja yang dapat memanfaatkan data tersebut secara maksimal. Selain hal tersebut, pada permasalahan DBD terdapat suatu hipotesa awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti dengan suhu, curah hujan dan penyinaran matahari. Dengan menerapkan konsep data mining pada database DBD dan data set cuaca, diharapkan dapat ditemukan pola keterkaitan antar variabel, pada akhirnya dapat dirumuskan pola penyebaran DBD . Tujuan penelitian ini adalah Merumuskan suatu sistem peringatan dini prediksi meledaknya DBD dan cara penanggulangannya, sehingga dari penelitian ini diharapakan akan didapat manfaat untuk membantu dalam memprediksi pola penyebaran DBD pada daerah DKI Jakarta, dan diambilnya suatu tindakan pencegahan agar DBD tersebut tidak meluas penyebarannya dengan menerapkan sistem pakar tata laksana DBD. Dalam penelitian ini digunakan datamining untuk menggali pola keterkaitan antar variabel pada database DBD khususnya di wilayah Jakarta Selatan dan Jakarta Pusat dan data cuaca pada wilayah yang sama. Metode yang digunakan adalah metode Classification based on Predictive Association Rules (CPAR). Output yang didapat dari pencarian dengan menggunakan CPAR tersebut berupa aturan – aturan dengan kaidah aturan IF – THEN, yang selanjutnya digunakan dalam membangun suatu sistem pakar untuk mengidentifikasi kemungkinan terjadi iii DBD di suatu wilayah didasarkan pada keadaan cuaca di wilayah tersebut. Sistem pakar berbasiskan logika fuzzy ini diberi nama Aplikasi DBD. Aplikasi DBD dibangun menggunakan Matlab 7.0 R 14, dengan menggunakan fungsi toolbox fuzzy untuk membangun SIF (Sistem Inferensi Fuzzy) dan fasilitas GUI (graphical users interface) untuk antarmukanya. Data masukkan yang digunakan adalah data cuaca yang meliputi suhu udara, curah hujan, penyinaran matahari, kelembaban udara. Data tersebut menjadi acuan untuk melakukan prediksi terhadap kondisi DBD serta tatalaksana tentang DBD. Data cuaca ini kemudian di dekomposisi menjadi himpunan – himpunan fuzzy. Evaluasi aturan fuzzy kemudian diubah menjadi suatu harga numerik untuk menetukan aksi dari output, atau disebut defuzzifikasi. Metode defuzzifikasi yang digunakan adalah metode centroid. Dengan menggunakan himpunan fuzzy, aturan atau rule dan metode defuzzifikasi, maka dapat disusun sistem inferensi fuzzy dengan menggunakan toolbox fuzzy (fuzzy logic toolbox) pada Matlab7.0 R14, proses inferensi yang digunakan adalah model fuzzy Mamdani. Hasil prediksi dari aplikasi DBD ini dapat digunakan oleh pihak – pihak yang berkepentingan dalam hal penganggulangan wabah DBD, sehingga mereka dapat melakukan tindakan cegah dini dari kemungkinan terjadinya wabah DBD disuatu wilayah. Untuk melakukan prediksi pada tahun selanjutnya dimana data cuaca belum diketahui, maka digunakan metode Winter’s yang dapat memprediksi kemungkinan keadaan cuaca berdasarkan pada data cuaca di tahun sebelumnya, sehingga Aplikasi DBD ini dapat digunakan dalam memprediksi kemungkinan terjadinya DBD di tahun yang akan datang. Hasil prediksi menggunakan datamining pada database Dinkes DKI Jakarta dikaitkan dengan data cuaca menghasilkan aturan sebanyak 22 aturan untuk Jakarta Selatan dan 29 aturan untuk Jakarta Pusat. Dari hasil penelitian ini dapat disimpulkan sebagai berikut : Penerapan datamining dengan metode CPAR pada database DINKES DKI Jakarta dikaitkan dengan variabel cuaca, menemukan adanya keterkaitan, yaitu : Kelembaban udara , iv Penyinaran matahari dan Curah hujan menjadi penentu utama apakah terjadi wabah DBD pada suatu wilayah, Sebagai tindakan cegah dini wabah DBD, maka diprediksikan kemungkinan wabah DBD untuk tahun 2007 di wilayah Jakarta Selatan adalah : Sepanjang tahun 2007 kemungkianan terjadi wabah DBD dengan kondisi merah, kecuali pada minggu ke 31, 34 dan 35 kondisi wabah DBD menurun sesuai dengan factor cuaca ke kondisi kuning. Dari kesimpulan hasil penelitian tersebut maka dapat diberikan saran – saran sebagai berikut : Perlu ditambahkan atribut – atribut selain atribut cuaca, misalnya data atribut kepadatan penduduk, data bebas jentik suatu wilayah dan data geografis dll yang mempunyai potensi untuk mempengaruhi terjadinya wabah DBD disuatu wilayah, Pengelompokkan atribut lebih dipersempit rentangnya sehingga diharapkan dapat dihasilkan aturan yang lebih detil dan lebih baik. Kata kunci : Demam Berdarah Dengue (DBD), Datamining, Fuzzy rule base, Metode prediksi Winter’s. v Judul Penelitian : Perumusan Pola Penyebaran Demam Berdarah Melalui Data Mining Pada Database Dinas Kesehatan DKI Jakarta Nama : Hendra Lukito NRP : G651030184 Program Studi : Ilmu Komputer Menyetujui, Komisi Pembimbing Prof. Dr. Ir. Marimin, M.Sc Ketua Dr. drh. S.Hamdani Nasution Anggota Mengetahui, Ketua Program Studi Ilmu Komputer Dr. Sugi Guritman Tanggal Ujian : 01 Maret 2007 Dekan Sekolah Pascasarjana Prof. Dr. Ir. Khairil Anwar N, MS Tanggal Lulus : vi KATA PENGANTAR Puji syukur penulis sampaikan kehadirat Allah SWT, atas berkah dan rahmatNya, akhirnya penulis dapat menyelesaikan tugas penelitian ini dengan judul ”PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA”. Tugas penelitian ini dibuat untuk memenuhi salah satu persyaratan studi pada program Studi Ilmu Komputer, Sekolah Pascasarjana IPB. Tugas penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh karena itu ijinkan penulis untuk menyampaikan ucapan terima kasih yang sebesar – sebesarnya kepada : 1. Bapak Prof. Dr. Ir. Marimin, M.Sc dan Bapak Dr. drh. Sjahrun Hamdani Nasution, selaku Dosen pembimbing, yang telah sangat membantu dalam membimbing dan mengarahkan penulis, sehingga ide yang sederhana ini dapat menjadi sesuatu yang berguna. 2. Staf pengajar dan karyawan di Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB yang telah membantu selama masa menimba ilmu di kampus Baranangsiang, dan Karyawan Pascasarjana IPB,khususnya ibu Henny, yang telah sangat membantu. 3. Orang Tua tercinta Bapak dan Ibu Suparman, yang selalu mendoakan penulis di dalam setiap nafasnya, dan menjadi motivasi penulis dalam mengejar ilmu sehingga bisa menjadi yang lebih tinggi lagi. ”Terima Kasih atas doanya dan karya ini saya persembahkan untuk Bapak dan Ibu berdua ”. 4. Bapak dan Mama Bambang Pribadi yang mendukung dan mengerti dengan situasi serta kondisi sebagai seorang mahasiswa. 5. Istriku tercinta Santhy Lestari dan anak – anak tersayang, Shafira, Farhan dan Jasmine yang selalu memberi dukungan penuh dan menjadi penyejuk disaat rasa lelah dan jenuh mulai datang me nghampiri. ” Semoga ini bisa menjadi vii motivasi bagi kalian nanti untuk melangkah di masa depan dan kalian harus bisa lebih dari Babab saat ini ”. 6. Rekan – rekan mahasiswa Pascasarjana Ilmu Komputer angkatan ”Matrix”, yang telah membantu dalam memberi saran dan masukkan, khususnya kepada dokter Syafeii yang telah membantu dalam memberikan data dan menjadi tempat penulis berkonsultasi tentang DBD, Herwanto yang telah sangat – sangat membantu dalam mengolah data menggunakan algoritma CPAR yang telah dimodifikasinya, Nana Supriatna yang sama – sama jatuh bangun dalam menyusun tesis ini. Rekan - rekan satu bimbingan Bapak Marimin, khususnya, mas Janawir, mas Hari dan Rein atas dukungan soft copy dan hard copy tesisnya. 7. Segenap keluarga yang telah memberikan dukunga n moral dan spirit, ”tanpa dukungan kalian, karya ini mungkin tidak akan tersusun sebaik ini”. 8. Pimpinan dan rekan sejawat di kantor tempat penulis bekerja, baik selama bekerja di PT. Mitratama, Bapak Viktor Pardede (alm), Bapak Haryanto, dan selama penulis bekerja di PT. Charoen Pokphand Indonesia, khususnya Bapak Bambang Pangestoe dan Bapak Jimmy Perangin angin yang telah mengijinkan penulis untuk menyelesaikan langkah terakhir dalam langkah yang cukup panjang ini. 9. Semua pihak yang telah sangat membantu dalam penulisan ini namun tidak dapat penulis sebutkan satu persatu. ”Terima kasih atas dukungan kalian semua, sehingga tesis ini dapat menjadi sesuatu yang berguna ”. Berbagai usaha telah penulis upayakan guna terselesaikannya tugas penelitian ini dengan baik, namun penulis menyadari akan kekurangan dan keterbatasan penulis. Oleh karena itu penulis memohon maaf apabila terdapat kesalahan. Akhir kata penulis berharap agar tesis ini dapat berguna bagi masyarakat dalam memerangi masalah DBD yang selalu terjadi. Amin Jakarta, Februari 2007 Penulis viii RIWAYAT HIDUP Penulis dilahirkan di Balikpapan pada tanggal 21 Oktober 1974, sebagai anak pertama dari 2 bersaudara pasangan bapak H. Suparman S dan ibu Hj. Purbawati Chalid. Pendidikan dasar di tempuh diberbagai tempat di wilayah Indonesia karena orang tua yang bertugas sebagai seorang Tentara TNI AD, antara lain di Singaraja, Kupang, dan menyelesaikannya di Bima – NTB tahun 1986. Pendidikan menengah pertama di selesaikan di SMPN 1 Denpasar Bali tahun 1989. Pendidikan menengah atas penulis jalani di 2 tempat yaitu di SMU 2 Ujung pandang dan diselesaikan di SMA 4 Jogjakarta dengan mengambil jurusan Biologi pada tahun 1992. Pendidikan sarjana ditempuh di Universitas Pembangunan Nasional ” Veteran” Jogjakarta dengan mengambil jurusan Teknik Geologi, Fakultas Teknologi Mineral dan diselesaikan pada tahun 1998. Tahun 2003, penulis meneruskan menimba ilmu di program Pascasarjana IPB, Institut Pertanian Bogor pada program ilmu Komputer . Setelah menyelesaikan kuliah tingkat Sarjana penulis bekerja di PT. Mitratama dan bekerja paruh waktu di PT. Yanmar Indonesia (1998 – 2005). Sejak November 2005, penulis bergabung di PT. Charoen Pokphand Indonesia sebagai tenaga analisis data di bidang Security dan Community Development. Saat ini penulis berdomisili di Cilangkap, Jakarta Timur dan dari hasil perkawinan penulis dengan Santhy Lestari, dikaruniai 3 orang anak, Shafira Larasati, M Farhan dan Jasmine Azahra. ix DAFTAR ISI Halaman SURAT PERNYATAAN i ABSTRACT ii RINGKASAN iii LEMBAR PENGESAHAN KATA PENGANTAR vi RIWAYAT HIDUP viii DAFTAR ISI ix DAFTAR GAMBAR xiii DAFTAR TABEL xv DAFTAR LAMPIRAN I II v xvii PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Tujuan 3 1.3 Ruang Lingkup 3 1.4 Manfaat Penelitian 4 TINJAUAN PUSTAKA 5 2.1 Demam Berdarah Dengue (DBD) 5 2.1.1 Definisi 5 2.1.2 Penyebab DBD 5 2.1.3 Kasus DBD di wilayah DKI Jakarta 6 2.2 Data Mining 7 2.2.1 Klasifikasi dan Prediksi 10 2.2.2 Metodologi Datamining 11 x 2.2.3 Teknik Datamining 12 2.2.3.1 Association Rule 12 2.2.3.2 Classification Based Association 13 2.2.4 Algoritma Appriori 14 2.2.5 Membuat Association Rule berdasarkan 16 Frequent Itemset 2.2.6 Classification based on Predictive 17 Association Rules (CPAR) 2.3 2.4 2.5 III 2.2.6.1 Membuat Rule dalam CPAR 18 2.2.7 18 Membangun Model Prediksi Sistem Fuzzy 20 2.3.1 Himpunan Fuzzy 20 2.3.2 Fungsi Keanggotaan 20 2.3.3 Operator Himpunan Fuzzy 21 2.3.4 Fungsi Implikasi 22 2.3.5 Sistem Inferensi Fuzzy (FIS) 23 Prakiraan / Forecasting 25 2.4.1 Teknik Prakiraan Pemulus Eksponensial 25 2.4.2 Metode Winters 26 Penelitian terdahulu 28 2.5.1 30 Perbedaan dari penelitian sebelumnya METODOLOGI 31 3.1 Kerangka Pemikiran 31 3.2 Tata Laksana 34 3.2.1 Pengumpulan Data 34 3.2.2 Data Yang Digunakan 34 3.2.3 Pengolahan Data 36 xi 3.3. Pembuatan Program Aplikasi 38 3.3.1 Data mining 38 3.3.2 Pembentukan Basis Aturan 39 3.3.3 Aplikasi DBD 39 3.3.4 Prediksi Cuaca Menggunakan Metode 40 Winter’s IV PERANCANGAN SISTEM 41 4.1 Gambaran Umum Sistem 41 4.2 Analisa Kebutuhan Sistem 42 4.3 Desain Sistem 42 4.3.1 Tahapan Data mining 42 4.3.2 Tahapan Aplikasi DBD 44 4.4 V Antar muka 50 IMPLEMENTASI SISTEM 51 5.1 Implementasi Sistem 51 5.2 Pembangunan Sistem Data mining 52 5.2.1 52 Pembentukan Sampel Positif dan Sampel Negatif 5.2.2 5.3 5.4 Pembentukan Basis Aturan / Rule Base 53 Program Aplikasi 55 5.3.1 Input Sistem 55 5.3.2 Proses Evaluasi Sistem 58 5.3.3 Output Sistem 65 5.3.4 Prediksi DBD Tahun Selanjutnya 66 Kompleksitas Sistem 67 xii VI VII PENGUJIAN DAN PEMBAHASAN 68 6.1 Mekanisme Pengujian 68 6.2 Pembentukan Model Dengan Data Training 68 6.3 Pelatihan Dengan Data Testing 72 6.4 Pembahasan 73 6.5 Penerapan Aplikasi DBD Per Kecamatan 74 6.5.1 Pembentukan Model Dengan Data Training 75 6.5.2 Pembahasan 81 6.5 Prediksi DBD Tahun 2007 84 6.6 Implikasi Manajerial 89 KESIMPULAN DAN SARAN 92 7.1 Kesimpulan 92 7.2 Saran 93 DAFTAR PUSTAKA 94 LAMPIRAN 96 xiii DAFTAR GAMBAR Halaman Gambar 1 Jumlah Kasus DBD Bersumber Survailans Aktif RS per Bulan 6 di DKI Jakarta, 2001 – 2006 ( s/d 17 mei 2006) Gambar 2 Peningkatan data dalam 2 dekade terakhir (Sumber: Fayyad, 7 Piatetsky-Shapiro dan Smyth, 1996) Gambar 3 Pembuatan Model dalam Datamining (adaptasi dari 9 Berry,MJA and Linoff,GS) Gambar 4 Model Proses Pembuatan Datamining 11 Gambar 5 Langkah – Langkah Membangun Model Prediksi 19 Gambar 6 Fungsi Keanggotaan “USIA” dengan representasi Sigmoid 21 Gambar 7 Fungsi Implikasi MIN 23 Gambar 8 Fungsi implikasi DOT 23 Gambar 9 Data mining, multimodel dan fuzzy Model (adaptasi dari 29 Hirota et al) Gambar 10 Sistem Peringatan Dini Prediksi Meledaknya DBD dan Cara 32 Penanggulannya Gambar 11 Tahapan Penelitian 33 Gambar 12 Arsitektur system Aplikasi DBD 37 Gambar 13 Model Aplikasi DBD 41 Gambar 14 Fuzzifikasi Suhu 46 Gambar 15 Fuzzifikasi Curah Hujan 47 Gambar 16 Fuzzifikasi Penyinaran Matahari 47 Gambar 17 Fuzzifikasi Kelembaban Udara 48 Gambar 18 Antarmuka Aplikasi DBD 50 Gambar 19 Tabel Data Selama 1 Tahun 55 Gambar 20 Grafik Selama 2 Tahun 56 Gambar 21 Antar muka Aplikasi DBD 57 xiv Halaman Gambar 22 Tatalaksana Berdasarkan SOP Dinkes DKI Jakarta 57 Gambar 23 FIS Editor Untuk Data Atribut Cuaca dan Kondisi DBD, 58 Wilayah Jakarta Selatan Gambar 24 Membership Function Untuk Atribut Suhu 59 Gambar 25 Membership Function Untuk Atribut Curah Hujan 60 Gambar 26 Membership Function Untuk Atribut Matahari 60 Gambar 27 Membership Function Untuk Atribut Kelembaban 61 Gambar 28 Rule Editor Jakarta Selatan 62 Gambar 29 Rule Editor Jakarta Pusat 63 Gambar 30 Rule Viewer Untuk Jakarta Selatan 64 Gambar 31 Rule Viewer Untuk Jakarta Pusat 64 Gambar 32 Tombol Mendapatkan Output dan Input Data 65 Gambar 33 Interface Metode Winter’s 66 Gambar 34 Prediksi Suhu Tahun 2007 Dengan Metode Winter’s 85 Gambar 35 Prediksi Curah Hujan Tahun 2007 Dengan Metode Winter’s 85 Gambar 36 Prediksi Matahari Tahun 2007 Dengan Metode Winter’s 85 Gambar 37 Prediksi Kelembaban Tahun 2007 Dengan Metode Winter’s 86 Gambar 38 Hasil Prediksi DBD Tahun 2006 – 2007 Wilayah Kebayoran 87 Baru Gambar 39 Hasil Prediksi DBD Tahun 2006 – 2007 Wilayah Tebet 88 xv DAFTAR TABEL Halaman Tabel 1 Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu 6 Wilayah Tabel 2 Transaksi Penjualan Barang 15 Tabel 3 Contoh Data Penjualan yang Bersifat Musiman 26 Tabel 4 Contoh Hasil Penerapan Metode Winter’s 28 Tabel 5 Atribut yang Digunakan Dalam Algoritma CPAR 43 Tabel 6 Atribut Cuaca dan Himpunan Fuzzy 45 Tabel 7 Selang Nilai untuk Hasil Output pada Hi mpunan Fuzzy 49 Tabel 8 Input dan Output Aplikasi DBD 50 Tabel 9 Tabel Diskrit Untuk Wilayah Yakarta Selatan 52 Tabel 10 Sampel Data Positif 53 Tabel 11 Sampel Data Negatif 53 Tabel 12 Hasil Pemasukkan Data Untuk Wilayah Jakarta Selatan 54 Tabel 13 Data Survailans DBD Tahun 2005 Minggu 1 - 4 69 Tabel 14 Data Survailans DBD Tahun 2004 Minggu 1 - 4 69 Tabel 15 Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan 69 Tahun 2005 Tabel 16 Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan 69 Tahun 2004 Tabel 17 Aturan Data Training Dengan GSR 99% 69 Tabel 18 Aturan Data Training Dengan GSR 80% 70 Tabel 19 Aturan Data Training Dengan GSR 60% 71 Tabel 20 Aturan Data Training Dengan GSR 20% 71 Tabel 21 Aturan Data Training Dengan GSR 10% 72 Tabel 22 Data Testing Untuk Wilayah Jakarta Selatan 73 Tabel 23 Data DBD Untuk Wilayah Jakarta Selatan 73 xvi Tabel 24 Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil. 76 Jak-Pus Tabel 25 Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil. 76 Jak - Sel Tabel 26 Aturan Data Training Dengan GSR 99% 76 Tabel 27 Aturan Data Training Dengan GSR 20% 77 Tabel 28 Aturan Data Training Dengan GSR 10% 78 Tabel 29 Aturan Data Training Dengan GSR 99% 79 Tabel 30 Aturan Data Training Dengan GSR 60% 80 Tabel 31 Aturan Data Training Dengan GSR 20% 80 Tabel 32 Aturan Data Training Dengan GSR 10% 81 Tabel 33 Data Cuaca Jakarta Selatan Tahun 2005 84 Tabel 34 Data Cuaca Jakarta Selatan Tahun 2006 84 Tabel 35 Hasil Prediksi Cuaca Tahun 2007 86 xvii DAFTAR LAMPIRAN Lampiran 1 Cara Perolehan Dan Pengolahan Data 95 Lampiran 2 Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2004 97 Lampiran 3 Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2005 98 Lampiran 4 Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2004 99 Lampiran 5 Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2005 100 Lampiran 6 Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2004 101 Lampiran 7 Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2005 102 Lampiran 8 Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2004 103 Lampiran 9 Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2005 104 Lampiran 10 Aturan – Aturan Hasil Datamining Menggunakan Metode 105 CPAR Lampiran 11 Hasil Prediksi Cuaca Menggunakan Metode Winter’s Tahun 112 2007 xviii 1 BAB I PENDAHULUAN 1. Latar Belakang Data mining sebagai cabang baru dalam ilmu komputer yang mulai berkembang sejak tahun 1990, saat ini mulai banyak diaplikasikan pada beberapa aspek kehidupan, hal ini di dukung oleh semakin bertambah besarnya data yang dikumpulkan pada kegiatan bisnis modern dan kehidupan modern. Akan tetapi sering terjadi data yang dikumpulkan tersebut menjadi tidak berguna, karena tidak semua pihak mengerti dan dapat menggunakan, sehingga data tersebut harus di konversi menjadi informasi dan pengetahuan yang berguna. Data mining adalah proses dalam mencari berbagai model, kesimpulan dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003). Dalam proses tersebut digunakan berbagai macam alat bantu data analisis yang berasal dari beberapa cabang ilmu pengetahuan seperti statistik, neural network dan lain lain untuk mendapatkan pola dan hubungan dalam data tersebut untuk membuat suatu predeksi yang valid. Dalam perkembangannya, terdapat 2 tujuan utama dari data mining, prediksi dan diskripsi. Prediksi menggunakan beberapa variable dari data set yang digunakan untuk memprediksi sesuatu dari variable dari yang dikehendaki, sedangkan deskripsi lebih memfokuskan pada menemukan pola dari suatu data sehingga dapat dengan mudah di interprestasikan oleh penggunanya. Penelitian di bidang kesehatan dengan mengimplementasikan data mining untuk memprediksi penyebaran suatu penyakit telah banyak di lakukan, antara lain penelitian yang dilakukan oleh Brossette et.al (2000), dimana mereka menerapkan Data mining surveillance system (DMSS) dalam mendeteksi infeksi nosocomial di Amerika dengan menggunakan data dari RS Universitas Alabama di Birmingham selama 15 bulan. DMSS di design untuk menemukan pola – pola yang berguna yang mungkin tidak dapat di temukan oleh sistem tradisional. Metode data mining yang coba di terapkan dalam DMSS adalah association rules. Penelitian lain yang juga mencoba memprediksi tentang penyakit adalah penelitian yang dilakukan oleh Scales dan Embrechts (2003), mereka mencoba 2 memprediksi penyakit serangan jantung kardiovaskular. Metode data mining yang coba diterapkan oleh mereka adalah metode artificial neural network dan fuzzy logic analisis, dari penelitian mereka metode ini memberikan hasil yang cukup efektif. Penelitian terakhir dalam bidang kesehatan dengan menggunakan datamining dilakukan oleh Herwanto (2006), dari database pasien diabetes yang dimiliki oleh RS Pertamina, diolah dengan menggunakan datamining, sehingga didapat aturan – aturan yang dapat membantu dalam memprediksi kapan dan pada kondisi apa gula seseorang dapat naik dan mengakibatkan gangguan yang serius. Demam Berdarah Dengue (DBD), adalah suatu penyakit yang disebabkan oleh nyamuk Aedes Aegypti dan merupakan penyakit yang sangat gampang sekali terjadi di masyarakat. Pengelolaan lingkungan tempat tinggal yang belum seragam dalam penanganannya, juga sangat memungkin terjadi wabah DBD, walaupun lingkungan di sekitar rumah kita telah dikelola dengan baik, hal ini disebabkan karena radius terbang dari nyamuk tersebut ± 100m dari tempat mereka berkembang biak. Selain hal tersebut, pada permasalahan DBD terdapat suatu hipotesa awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti dengan suhu, curah hujan dan penyinaran matahari. Datamining dengan berbagai keunggulannya dan berbagai macam metode yang ada, di coba diterapkan pada database Demam Berdarah Dengue (DBD) yang disusun oleh Dinas Kesehatan (DINKES) DKI Jakarta setiap tahun dalam rangka mengantisipasi dan memonitor penyebaran suatu penyakit (Data Surveilans Penyakit Tahun 2004, Dinkes Propinsi DKI Jakarta, 2005). Siklus DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus yang meningkat setiap tahun, membuat data yang dikumpulkan menjadi semakin membesar, akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat dimanfaatkan oleh semua pihak, hanya pihak tertentu saja yang dapat memanfaatkan data tersebut secara maksimal. Dengan menerapkan konsep data mining pada database DBD dan data set cuaca, diharapkan dapat ditemukan pola keterkaitan antar variable data, nilai – nilai pengetahuan yang dapat di gali dan pada akhirnya, dapat dirumuskan pola penyebaran dari DBD . 3 Secara umum rumusan substansi penelitian ini dapat dinyatakan sebagai berikut : “Apakah konsep data mining yang di dukung dengan system pakar dapat diterapkan dalam database DBD, sehingga di peroleh perumusan pola penyebaran DBD di daerah DKI Jakarta”. 2. Tujuan Penelitian Tujuan penelitian ini adalah : a. Menerapkan data mining dengan metode Classification based on Predictive Association Rules (CPAR) pada database DINKES DKI Jakarta untuk menemukan pola dari DBD yang terus berulang dan relasinya dengan faktor – faktor alam seperti suhu, penyinaran matahari , curah hujan dan kelembaban. b. Merumuskan suatu sistem peringatan dini prediksi meledaknya DBD (selanjutnya di sebut “Aplikasi DBD”) dan cara penanggulangannya, sehingga dapat digunakan oleh semua pihak yang berkepentingan. 3. Ruang Lingkup Obyek Penelitian di batasi pada : a. Analisis konsep – konsep data mining pada database DBD, guna mendapatkan pola keterkaitan antar variabel. b. Merumuskan model pola penyebaran DBD di daerah Jakarta Pusat dan Jakarta Selatan dengan berdasarkan kondisi yang memicu ledakan DBD dengan menerapkan sistem pakar. c. Data yang digunakan dalam penelitian ini adalah : - Data primer Kejadian DBD di DKI Jakarta yang meliputi 2 wilayah (Pusat, Selatan) selama tahun 2004 – 2005. - Data primer suhu, curah hujan dan kelembaban udara di wilayah Jakarta Selatan dan Jakarta Pusat selama tahun 2004 – 2005. 4 4. Manfaat Penelitian Manfaat dari penelitian ini untuk dapat menambah : a. Dari segi Metodologi : untuk menguji konsep data mining dan metode yang digunakan pada suatu data yang besar dan membantu dalam menemukan pola keterkaitan dari data tersebut. b. Dari segi Substansi : untuk membantu dalam memprediksi pola penyebaran DBD pada daerah DKI Jakarta, sehingga dapat di ambil suatu tindakan pencegahan agar DBD tersebut tidak meluas penyebarannya dengan menerapkan sistem pakar tata laksana DBD. 5 BAB II TINJAUAN PUSTAKA 2.1. Demam Berdarah Dengue (DBD) 2.1.1. Definisi Demam Berdarah dengue (DBD) adalah demam virus akut yang ditularkan oleh nyamuk Aedes Aegypti, disertai sakit kepala, nyeri otot, sendi dan tulang, penurunan jumlah sel darah putih dan timbulnya ruam – ruam pada kulit. DBD ini sering pula disertai dengan pembesaran hati serta manifestasi pendarahan dan apabila terjadi kegagalan sirkulasi darah dan pasien terjatuh maka penderita dapat mengalami apa yang disebut dengue shock syndrome (DSS) (DINKES DKI Jakarta, Demam Berdarah Aedes Aegypti, www.dinkesdkijarta.gov). 2.1.2. Penyebab DBD DBD adalah penyakit pada daerah tropis seperti halnya Indonesia, ditularkan oleh nyamuk Aedes aegypti yang menggigit di siang dan sore hari. Nyamuk ini membawa virus yang terdiri dari 1 diantara 4 serotipe virus yang berbeda antigen. Virus ini termasuk dalam kelompok Flavivirus dan serotipenya adalah DEN-1, DEN-2, DEN-3, DEN-4. Infeksi oleh salah satu jenis serotipe ini akan memberikan kekebalan seumur hidup tetapi tidak menimbulkan kekebalan terhadap serotipe yang lainnya, sehingga seseorang yang hidup dalam daerah endemis DBD dapat mengalami infeksi sebanyak 4 kali dalam hidupnya. Masa tunas virus dengue berkisar 3 – 15 hari. Pada demam dengue (Dengue Fever) permulaan sakit biasanya mendadak. Pada umumnya ditemukan sindrom trias yaitu demam tinggi, nyeri pada anggota badan dan timbulnya ruam pada kulit. Lama demam berkisar 4 – 5 hari. Ruam berupa bercak kemerah-merahan bersifat makulopapular yang hilang pada penekanan. Penderita demam dengue mengalami pembesaran kelenjar getah bening servikal. Beberapa ahli menyebut pembesaran ini sebagai tanda Castelani dan merupakan ciri khas pada demam dengue. Pada demam dengue jarang dijumpai manifestasi perdarahan Faktor resiko penting pada DBD adalah serotipe virus dan faktor penderita seperti umur dan status imunitas. 6 2.1.3. Kasus DBD di Wilayah DKI Jakarta Untuk wilayah DKI Jakarta sejak tahun 2001 sampai dengan 2006 ini, kasus DBD merupakan kasus yang terus menerus terjadi, bahkan sudah bisa disebut sebagai suatu siklus tahunan yang terus berulang, bahkan pada tahun 2004 bulan februari dan maret, terjadi KLB DBD (7072 kasus) untuk wilayah DKI Jakarta secara umum. 8000 7000 6000 KASUS 5000 4000 3000 2000 1000 0 JAN PEB MAR APRIL MEI JUNI JULI AGST SEP OKT NOP DES 2001 919 1016 1091 625 907 651 706 511 341 244 232 194 2002 84 386 689 933 1131 879 489 328 207 192 205 227 2003 540 784 1454 2318 2745 2685 1070 474 380 473 471 677 2004 1625 7072 7052 1478 702 573 500 368 281 305 256 428 2005 1172 2484 1625 1236 1469 1347 1385 2524 1903 2147 2624 3537 2006 2470 2433 2876 2981 1310 Gambar 1. Jumlah Kasus DBD Bersumber Surveilans Aktif RS Per Bulan di DKI Jakarta, 2001 – 2006 (s.d 17 Mei 2006) Proses pengendalian nyamuk Aedes aegypti sebagai vector pembawa penyakit DBD dilakukan dengan berbagai cara, antara lain : Fogging (penyemprotan di daerah yang posistif atau negative DBD), pemberian abate sebagai cara pengendalian jentik nyamuk, program 3M berkesinambungan diseluruh wilayah DKI Jakarta. yang dilakukan secara 7 Untuk melihat keefektifitasan dan sebagai kontrol dari kegiatan tersebut pihak Dinkes DKI Jakarta mencoba untuk memetakan daerah kecamatan di wilayah DKI Jakarta menjadi 3 bagian berdasarkan laporan survailence tentang kejadian DBD, yaitu : Tabel 1. Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu Kecamatan KATEGORI KETENTUAN MERAH Dalam 1 minggu terjadi lebih dari 5 kasus DBD KUNING Dalam 1 minggu terjadi 1- 5 kasus DBD HIJAU 2.2 Dalam 3 minggu berturut-turut tidak terjadi kasus DBD. Data Mining Dalam 2 dekade ini telah terjadi peningkatan data yang sangat besar dari segala sektor dalam kehidupan sehari-hari. Di estimasikan setiap bulannya terjadi peningkatan data 20x lebih cepat dari bulan sebelumnya (Fayyad, PiatetskyShapiro dan Smyth 1996). Hal ini dapat mengakibatkan terjadinya penumpukan data yang berakibat pada kemungkinan tersisihnya data – data penting yang berguna. Data mining atau Knowledge discovery in Database (KDD) mempunyai kemampuan untuk melakukan pencarian dan menemukan data penting yang tersisih tersebut. Gambar 2. Peningkatan Data Dalam 2 Dekade Terakhir (Sumber : Fayyad, Piatetsky-Shapiro dan Smyth ,1996) 8 Berbagai definisi dari data mining dari beberapa refrensi, adalah sebagai berikut ; Data mining adalah proses dalam mencari berbagai model, kesimpulan dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003). Data mining adalah proses menyarikan informasi dari kumpulan – kumpulan data (Brookshear, 2003) . Dari berbagai definisi tersebut, dapat di ambil suatu kesimpulan bahwa data mining berkaitan dengan mencari pola dan relasi yang tersembunyai dalam data yang besar dengan tujuan prediksi atau deskripsi. Terdapat 2 jenis data mining, yaitu directed data mining dan undirected data mining. Directed data mining digunakan jika sudah diketahui secara pasti apa yang akan di prediksi, sehingga proses pencarian pola dan relasi dapat langsung diarahkan pada tujuan tertentu, misalnya untuk membuat prediksi tentang sesuatu yang tidak kita ketahui, model ini sering di sebut model prediksi. Model seperti ini menggunakan pengalaman untuk menentukan nilainya. Salah satu kunci dari model prediksi ini adalah data yang cukup besar dengan hasil yang sudah diketahui, sehingga dapat digunakan dalam melatih model tersebut. Undirected data mining berkaitan dengan menelusuri pola dan relasi dalam data, pada undirected data mining ini, tujuan yang ingin dicapai adalah bagaimana model yang kita buat dapat memberikan solusi atas persoalan yang kita permodelkan. Dalam prakteknya, data mining sering merupakan gabungan dari keduanya. Proses dalam data mining adalah suatu proses yang interaktif dan iterative, melibatkan beberapa langkah dengan beberapa pertimbangan yang harus di buat oleh penggunanya. Fayyad, Piatetsky-Shapiro dan Smyth (1996) memberikan beberapa langkah dasar dalam mempersiapkan data mining 1. Mempersiapkan data set : memilih data, atau memfokuskan pada sample data yang akan kita cari pola atau relasinya 2. Membersihkan data dan memproses data 3. Mengurangi data, dalam proses ini menemukan feature yang berguna untuk merepresentasikan data disesuaikan dengan tujuan 9 4. Menyesuaikan tujuan dari data mining dengan metode data mining yang ada, seperti clustering, regression, classification, fuzzy 5. Explorasi analisis, model dan hipotesis, dalam proses ini di pilih algoritma, metode yang akan digunakan dalam mencari pola dari suatu data set. 6. Proses Data mining, mencari pola dan relasi dari data set. 7. Interpretasi pola – pola yang di dapat , dalam proses ini proses dapat berulang (iteratif) dari 1 sampai 7. Pada proses ini juga dapat dilengkapi dengan visualisasi dari pola yang didapat. 8. Menggunakan hasil dari pola dan relasi yang ditemukan. Pada proses ini dilakukan pemeriksaan dan perbaikan Langkah – langkah dasar ini di ilustrasikan pada gambar 3, Gambar 3 . Pembuatan Model dalam DataMining (adaptasi dari Berry and Linoff) 10 2.2.1. Klasifikasi dan Prediksi Klasifikasi dan prediksi adalah dua bentuk analisis data yang bisa digunakan untuk mengekstrak model dari data yang berisi kelas-kelas atau untuk memprediksi trend data yang akan datang. Klasifikasi memprediksi data dalam bentuk katagori, sedangkan prediksi memodelkan fungsi-fungsi dari nilai yang kontinyu. Klasifikasi data dilakukan dengan dua tahapan. Pada tahap pertama, model dibentuk dengan menentukan kelas-kelas data. Model dibentuk dengan menganalisa database tuples yang dinyatakan dengan atribut.Dalam konteks klasifikasi, data tuples disebut juga disebut Data sample. Data sample ini membentuk training data set yang selanjutnya dianalisa untuk membangun model. Setiap sample yang membentuk training set disebut training sample dan secara acak dipilih dari sample population. Karena label kelas dari setiap training sample telah diketahui, maka tahapan ini disebut juga supervised learning. Supervised learning ini kebalikan dari unsupervised learning, dimana pada unsupervised learning label kelas dari setiap training sample tidak diketahui. Pada tahap kedua, model digunakan untuk klasifikasi. Pertama, akurasi model prediksi (atau classifier) ditentukan menggunakan data test. Sample ini secara acak dipilih, independent dengan training sample. Akurasi dari model pada test set adalah prosentase dari sample test set yang diklasifikasikan oleh model dengan benar. Untuk setiap sample test, label kelas yang telah diketehui dibandingkan dengan model kelas prediksi yang telah dilatih untuk sample tersebut. Jika akurasi dari model bisa diterima, maka model bisa digunakan untuk mengklasifikasikan data tuples dimana label kelasnya tidak diketahui. Misalnya, classification rule yang telah dihasilkan dari analisis data dari pelanggan yang ada dapat digunakan untuk memprediksi credit rating dari pelanggan baru. Prediksi bisa dipandang sebagai pembentukan dan penggunaan model untuk menguji kelas dari sample yang tidak berlabel, atau untuk menguji nilai atau rentang nilai dari suatu atribut. Dalam pandangan ini, klasifikasi dan regresi adalah dua jenis masalah prediksi, dimana klasifikasi digunakan untuk memprediksi nilai-nilai diskrit atau nominal, sedangkan regresi digunakan untuk memprediksi nilai-nilai yang kontinyu. Untuk selanjutnya penggunaan istilah prediction untuk memprediksi kelas yang berlabel disebut classification, dan 11 pengggunaan istilah prediksi untuk memprediksi nilai-nilai yang kontinyu sebagai prediction (Han & Kamber, 2001). 2.2.2 Metodologi Data mining Ada beberapa konsep yang penting pada data mining. Konsep pertama berkaitan dengan mencari pola di dalam data. Biasanya berupa kumpulan data yang sering muncul. Tetapi secara umum berupa suatu daftar atau pola data yang muncul lebih sering dari yang diharapkan saat dilakukan secara acak. Konsep yang kedua adalah sampling, yang bertujuan untuk memperoleh keterangan mengenai populasi dengan mengamati hanya sebahagian saja dari populasi itu. Hal lain yang juga penting yang berhubungan dengan data mining adalah validasi model prediksi yang muncul dari algoritma data mining. Model digunakan untuk membuat prediksi tentang suatu record yang menggambarkan keadaan nyata yang baru, dan model terbatas hanya merefleksikan basis data histori dimana model tersebut dibuat. Model adalah deskripsi dari data historis dimana model tersebut dibangun untuk bisa diterapkan ke data baru dengan tujuan membuat prediksi tentang nilai-nilai yang terputus atau untuk membuat pernyataan tentang nilai yang diharapkan, sedangkan Pola adalah suatu kejadian atau kombinasi kejadian dalam suatu basis data yang terjadi atau muncul lebih sering dari yang diharapkan (Berson et al., 2001). Gambar proses pembuatan datamining dengan menggunakan konsep Berson et al disajikan dalam gambar berikut ini Data Historis Pembuatan Model 143 Record Model Prediksi Gambar 4. Model proses pembuatan data mining Sumber: Berson, 2001. 12 2.2.3. Teknik Data mining Ada tiga hal pokok yang harus diperhatikan untuk keberhasilan penerapan data mining, yaitu; teknik data mining, data itu sendiri, dan model data. Teknik adalah pendekatan umum untuk memecahkan masalah, dan biasanya terdapat banyak cara yang bisa digunakan. Masing-masing cara mempunyai algoritma nya sendiri-sendiri. Istilah teknik digunakan untuk menunjukkan pendekatan konseptual untuk menyaring informasi dari data. Algoritma menunjukkan detil tahap demi tahap dari cara tertentu untuk mengimplementasikan suatu teknik. Data mining bisa berupa predictive atau descriptive. Perbedaan ini menunjukkan tujuan dari penggunaan data mining. Tujuan utama predictive data mining adalah mengotomatisasikan proses pembuatan keputusan dengan membuat model yang punya kemampuan untuk melakukan prediksi atau mengestimasi suatu nilai. Umumnya hasil dalam predictive data mining akan langsung ditindak lanjuti Sehingga tolok ukur yang paling penting pada model adalah akurasinya. Data mining sering juga bersifat descriptive. Tujuan utama descriptive data mining adalah untuk menggali pola yang ada di dalam data. Descriptive data mining sering menghasilkan action, tetapi bukan berupa urutan aksi yang bisa diotomatisasikan secara langsung dari hasil model (Berry & Linoff, 2000). Descriptive mining, yaitu proses untuk menemukan karakteristik penting dari data dalam suatu basis data. Clustering, Association, dan Sequential mining adalah beberapa contoh dari teknik descriptive mining. Predictive mining, yaitu proses untuk menemukan pola dari data untuk membuat prediksi. Classification, Regression dan Deviation adalah teknik dalam predictive mining. 2.2.3.1 Association Rule Association rule merupakan salah satu teknik data mining yang paling banyak digunakan dalam penelusuran pola pada sistem pembelajaran unsupervised. Metodologi ini akan mengambil seluruh kemungkinan pola-pola yang diamati dalam basis data. Association rule menjelaskan kejadian-kejadian yang sering muncul dalam suatu kelompok. Misalnya metodologi ini bisa digunakan untuk menganalisa produk-produk mana saja yang sering dibeli oleh 13 seorang pelanggan secara bersamaan (analisa keranjang belanja). Hasil analisis tersebut bisa digunakan untuk menentukan peletakan produk di toko. Satu itemset adalah himpunan bagian A dari semua kemungkinan item I. Satu itemset yang mengandung i item disebut i-itemset. Prosentase transaksi yang mengandung itemset disebut support. Untuk suatu itemset yang akan diamati, support-nya harus lebih besar atau sama dengan nilai yang dinyatakan oleh user, sehingga itemset tersebut dikatakan sering muncul (frequent). Bentuk umum aturan asosiasi adalah A1,A2,…,An → B1,B2,…,Bm, yang berarti jika item Ai muncul, item Bj juga muncul dengan peluang tertentu. Misalkan X adalah itemset. transaksi T dikatakan mengandung X jika dan hanya jika X ⊆ T. Aturan X ⇒ Y menyatakan himpunan basis data transaksi dengan tingkat kepercayaan (confidence) C, jika C% dari transaksi dalam D yang mengandung X juga mengandung Y. Rule X ⇒ Y mempunyai support dalam transaksi set D jika S% dari transaksi dalam basis data berisi X ∪ Y. Tingkat kepercayaan menunjukkan kekuatan implikasi, dan support menunjukkan seringnya pola terjadi dalam rule. Sebagai contoh diberikan aturan : A, B ⇒ C dengan S = 0.01 dan C = 0.8. Hal ini berarti bahwa 80% dari semua pelanggan yang membeli A dan B juga membeli C, dan 1% dari semua pelanggan membeli ketiga item tersebut. Mining association rule dilakukan dalam dua tahap, yaitu 1. Mencari semua association rule yang mempunyai minimum support S min dan minimum confidence Cmin. Itemset dikatakan sering muncul (frequent) jika Support(A) ≥ Smin. 2. Menggunakan itemset yang besar untuk menentukan association rule untuk basis data yang mempunyai tingkat kepercayaan C di atas nilai minimum yang telah ditentukan (Cmin.). 2.2.3.2 Classification-Based Association Saat ini, salah satu teknik data mining telah dikembangkan adalah dengan menerapkan konsep association rule mining dalam masalah klasifikasi. Ada beberapa metode yang bisa digunakan, antara lain association rule clustering system (ARCS) dan associative classification (Han & Kamber, 2001). Metode 14 ARCS melakukan association rule mining didasarkan pada clustering kemudian menggunakan aturan yang dihasilkan untuk klasifikasi. ARCS, melakukan association rule mining dalam bentuk Aquant1 ∧ Aquant2 ⇒ Acat, dimana bentuk Aquant1 dan Aquant2 adalah data test yang atributnya punya rentang nilai, Acat menunjukkan label kelas untuk atribut kategori yang diberikan dari training data. Metode associative classification mining menghasilkan aturan dalam bentuk condset ⇒ y, dimana condset adalah sekumpulan item dan y adalah label kelas. Aturan yang sesuai dengan minimum support tertentu disebut frequent. Rule mempunyai support s jika s% dari sample dalam data set yang mengandung condset dan memiliki kelas y. Aturan yang sesuai dengan minimum confidence disebut accurate. Aturan mempunyai confidence c jika c% dari sample dalam data set yang mengandung condset memiliki kelas y. Jika beberapa rule mempunyai condset yang sama, maka rule dengan confidence tertinggi dipilih sebagai possible rule (PR). Metode associative classification mining menggunakan algoritma association rule, seperti algoritma Appriori untuk menghasilkan association rule, kemudian memilih sekelompok aturan yang mempunyai kualitas tinggi dan menggunakan aturan tersebut untuk memprediksi data. Associative classification masih kurang efisien karena seringkali menghasilkan aturan dalam jumlah yang besar (Yin & Han, 2003). Metode classification-based association lainnya adalah CPAR (Classification based on Predictive Association Rule). Algoritma ini mengambil ide dari FOIL (First Order Inductive Leaner) dalam menghasilkan aturan dan mengintegrasikannya dengan associative classification. 2.2.4. Algoritma Appriori Algoritma apriori menghitung seringnya itemset muncul dalam basis data melalui beberapa iterasi. Setiap iterasi mempunyai dua tahapan; menentukan kandidat dan memilih serta menghitung kandidat. Pada tahap pertama iterasi pertama, himpunan yang dihasilkan dari kandidat itemset berisi seluruh 1-itemset, yaitu seluruh item dalam basis data. Pada tahap kedua, algoritma ini menghitung support-nya mencari melalui keseluruhan basis data Pada akhirnya hanya iitemset dengan batas minimum tertentu saja yang dianggap sering muncul 15 (frequent). Sehingga setelah iterasi pertama, seluruh i-itemset yang sering muncul akan diketahui. Pada iterasi kedua, algoritma appriori mengurangi sekelompok kandidat itemset yang dihasilkan dari iterasi pertama dengan menghapus kandidat itemset yang tidak sering muncul. Penghapusan ini berdasarkan pengamatan yaitu apakah itemset tersebut sering muncul atau tidak. 1. k = 1 2. C1 = I (semua item) 3. While Ck > 0 ( a ). Sk = Ck ( b ).Ck + 1 = Semua himpunan dengan k=1 elemen yang terbentuk dengan menggabungkan dua itemset dalam sk ( c ). Ck + 1 = Ck + 1 ( d ). S = S + Sk ( e ). k + + 4. return S Tabel 2. Transaksi Penjualan Barang A B C D E Pelanggan 1 1 0 1 1 0 Pelanggan 2 0 1 1 0 1 Pelanggan 3 1 1 1 0 1 Pelanggan 4 0 1 0 0 0 Misalkan pada tabel 2, akan dicari seluruh itemset dengan minimal support Smin = 50%. Sehingga itemset dianggap sering muncul jika ia terdapat pada paling tidak di 50% transaksi. Dalam setiap iterasi, algoritma appriori membentuk kandidat set, menghitung jumlah kejadian dari setiap kandidat dan memilih itemset didasarkan pada minimum support yang telah ditentukan sebelumnya yaitu 50%. Pada tahap pertama iterasi pertama, semua item adalah kandidat. Algoritma appriori hanya menelusuri semua transaksi dalam basis data dan membuat daftar kandidat, yaitu ; C1 = [ (A), (B), (C), (D), (E) ] L1 = [ (A), (B), (C), (D), (E) ] 16 Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat dan berdasarkan nilai minimum support Smin, kemudian menentukan itemset yang sering muncul, setelah tahap ini kandidat berisi: L1 = [(A),(B), (C), (E) ] D dikeluarkan karena nilai S = 25%, hanya ada satu transaksi dari keseluruhan empat transaksi.. Untuk menelusuri himpunan 2-itemset, karena himpunan bagian (subset) dari 2itemset juga mempunyai minimum support yang sama, algoritma appriori menggunakan L1 * L1 untuk membuat kandidat. Operasi * didefinisikan sebagai berikut ; Lk * Lk = [X U Y dimana X,Y Ε Lk, (X∩Y=K-1 ), Untuk k =1 ⇒ |L1| . |(L1)-1)/2| = 4 . 3/2 = 6 Pada iterasi kedua kandidat berisi : C2 = [ (A,B), (A,C), (A,E), (B,C), (B,E), (C,E) ]. Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat dan berdasarkan nilai minimum support Smin, kemudian menentukan itemset yang sering muncul, setelah tahap ini kandidat berisi: L2 = [ (A,C), (B,C), (B,E), (C,E) ] Himpunan 3-itemset dihasilkan dari S2 menggunakan operasi yang sudah ditentukan sebelumnya L2 * L2. Langkah praktisnya, dari L2 dengan item yang pertama sama, yaitu (B,C), (B,E),dinyatakan pertama. Kemudian algoritma appriori akan mencek apakah 2-itemset (C,E), yang berisi item kedua dari (B,C), (B,E) terdapat pada L2 atau tidak. Karena (C,E) ada dalam L2, maka ( B,C,E ) menjadi kandidat 3-itemset. Karena tidak ada kandidat 4-itemset, maka algoritma ini berakhir. 2.2.5. Membuat Association Rule berdasarkan Frequent Itemset Tahap kedua dalam penelusuran assosiation rule didasarkan pada seluruh iitemset yang sering muncul, yang didapat dari tahap pertama. Untuk rule yang mengandung X1, X2, X3 → X4, rule tersebut dianggap bermakna jika kedua itemset tersebut X1, X2, X3, X4 dan X1, X2, X3 adalah frequent. Sehingga tingkat kepercayaan C dari rule tersebut dihitung sebagai hasil bagi dari support itemset, yaitu : 17 C = S(X1, X2, X3, X4) / S(X1, X2, X3). Strong association rule adalah rule dengan tingkat kepercayaan C diatas S min. Misalkan dari tabel 1 akan dicek apakah association rule (B,C) → E adalah strong rule. Pertama harus dipilih hubungan support dari tabel L2 dan L3. S(B,C) = 2, S(B,C,E) = 2 C((B,C) → E ) = S(B,C,E)/S(B,C) = 2/2 = 1 (100%) Karena tingkat kepercayaan adalah maksimal, maka jika transaksi berisi item B dan C maka transaksi tersebut juga berisi item E. 2.2.6. Classification based on Predictive Association Rules (CPAR) Klasifikasi pada penelitian ini menggunakan association rule, menurut Yin X, Han J, 2003, algoritma yang efektif untuk digunakan dalam masalah klasifikasi adalah CPAR. Pada algoritma ini klasifikasi diimplementasikan dalam tiga tahap: rule generation, rule evaluation dan classification. Pada proses rule generation, CPAR membangun rule dengan menambahkan literal satu persatu. Pada setiap tahapan proses, CPAR menghitung Gain dari setiap perhitungan. Setelah masing-masing sampel diproses untuk mendapatkan rule, sampel ini digunakan kembali didalam perhitungan Gain tetapi dengan mengurangi bobot dengan decay factor. Bobot sampel dikurangi hingga mencapai nilai minimum yang dihitung oleh parameter w yaitu bobot seluruh sampel positif. Bobot seluruh contoh pada awal proses diset 1. Setelah proses rule generation, CPAR mengevaluasi setiap rule untuk menentukan kekuatan prediksinya. Untuk rule r = p 1 ∧ p2 ... ∧ pn → c, CPAR mendefinisikan ekspektasi akurasi sebagai sebagai berikut : L.A = (nc+1) / (ntotal + f) Dimana L.A adalah Laplace Accuracy, f adalah jumlah kelas, ntotal adalah juimlah total sampel yang memenuhi body dari aturan, nc adalah jumlah sampel yang memenuhi kelas c. Klasifikasi berupa sekumpulan rule untuk setiap class, CPAR menggunakan s rules terbaik setiap kelas, yang dipilih berdasarkan Laplace accuracy. 18 Pada algoritmna CPAR nilai gain yang dipilih adalah nilai gain yang terbaik pada setiap iterasinya, sehingga untuk atribut yang nilai gain-nya hampir sama, maka CPAR melakukan pemilihan yang terbaik. Pemilihan atribut tersebut dilakukan dengan menghitung dan menerapkan gain similarity ratio. Semua atribut dengan nilai gain lebih besar dari best Gain x gain similarity ratio akan dipilih dan diproses lebih lanjut 2.2.6.1 Membuat Rule Dalam CPAR Dalam datamining, setiap aturan di-bangun dari dataset yang tersisa, CPAR hanya memilih literal yang terbaik dan mengabaikan seluruh literal lainnya. CPAR membuat rule s dengan menambahkan literal satu per satu. Setelah CPAR menemukan literal terbaik p, literal lainnya misalnya q yang Gain-nya mirip dengan p (misalnya hanya berbeda 1%) akan dicari. Selain terus membangun rule dengan menambahkan p ke r, q juga ditambahkan ke current rule r untuk membuat rule baru r’ 2.2.7 Membangun Model Prediksi Keberhasilan dalam membangun model prediksi dalam datamining lebih banyak tergantung pada proses bukan pada teknik yang digunakan, dan proses tersebut sangat tergantung pada data yang digunakan untuk menghasilkan model .Tantangan utama dalam membangun model prediksi adalah mengumpulkan data awal yang cukup dalam membangun suatu aturan - aturan. Dalam preclassified, hasilnya sudah diketahui, dan karenanya preclassified digunakan untuk melatih model, himpunan data tersebut disebut model set. Berry & Linoff memberikan langkah-langkah dasar dalam membangun model prediksi 1. Model dilatih menggunakan preclassified data, dengan mengambil sebagian data dari dataset yang disebut training set. Pada tahap ini, algoritma data mining mencari pola-pola dari nilai yang diprediksi. 2. Model diperbaiki menggunakan himpunan bagian lain dari data yang disebut test set. Model perlu diperbaiki agar tidak hanya bisa bekerja pada training set. 19 3. Performance model diestimasi atau membandingkan performance beberapa model, dengan menggunakan himpunan data ketiga, yang didapat dari gabungan himpunan data pertama dan kedua, yang disebut evaluation set. 4. Model diterapkan ke score set. Score set bukan preclassified, dan bukan bagian dari model set. Hasil dari data tersebut tidak diketahui. Predictive score akan digunakan untuk membuat keputusan. Dataset adalah preclassified data yang digunakan untuk membangun model. Dataset perlu dipecah ke dalam tiga komponan, training set, test set dan evaluation set. Gambar 5 menggambarkan langkah-langkah dasar dalam membangun model prediksi (Berry & Linoff, 2000) Training set digunakan untuk membangun model Training Set Test set digunakan untuk memperbaiki model Model (Kasar) Model (Perbaikan) Test Set Evaluation set digunakan untuk menilai akurasi yang diharapkan dari model saat diterapkan ke data di luar model set Evaluation Set Model yang terbaik Score Set diterapkan ke score set untuk menghasilkan prediksi Model (terbaik) Prediksi Gambar 5. Langkah-langkah membangun model prediksi Sumber: Berry & Linoff, 2000 20 2.3 Sistem Fuzzy Sistem fuzzy pertama kali diperkenalkan oleh Prof. L. A. Zadeh dari Barkelay pada tahun 1965. Sistem fuzzy merupakan penduga numerik yang terstruktur dan dinamis. Sistem ini mempunyai kemampuan untuk mengembangkan sistem intelijen dalam lingkungan yang tak pasti. Sistem ini menduga suatu fungsi dengan logika fuzzy. Dalam logika fuzzy terdapat beberapa proses yaitu penentuan himpunan fuzzy, penerapan aturan IF-THEN dan proses inferensi fuzzy (Marimin, 2002). 2.3.1. Himpunan Fuzzy Ada beberapa hal yang perlu diketahui dalam memahami sistem fuzzy yaitu, [Kusumadewi] variabel fuzzy, himpunan fuzzy, semesta pembicaraan dan domain. Variabel Fuzzy merupakan variabel yang akan dibahas dalam sistem fuzzy misalnya umur, temperatur, permintaan, dsb. Himpunan Fuzzy merupakan suatu group yang mewakili suatu kondisi tertentu dalam variabel fuzzy misalnya variabel umur dibagi atas 3 himpunan fuzzy yaitu muda, parobaya dan tua. Semesta Pembicaraan adalah keseluruhan nilai yang diperbolehkan untuk dioperasikan dalam suatu variabel fuzzy misalnya semesta pembicaraan variabel umur adalah 0 sampai 100. Domain adalah keseluruhan nilai yang diijinkan dalam semesta pembicaraan dan boleh dioperasikan dalam himpunan fuzzy misalnya domain umur muda 20 – 45, domain parobaya 25 – 65 dan domain tua 45 – 70. 2.3.2. Fungsi Keanggotaan Fungsi keanggotaan (membership function) adalah kurva yang menunjukkan pemetaan titik input data ke dalam nilai keanggotaan yang mempunyai interval 0 – 1. Ada beberapa fungsi keanggotaan yang digunakan antara lain representasi kurva sigmoid, trapesoid dan triangular. Contoh representasi fungsi keanggotaan sigmoid disajikan pada gambar 6. 21 Gambar 6 : Fungsi Keanggotaan ”USIA” dengan representasi Sigmoid . 2.3.3. Operator Himpunan Fuzzy Seperti himpunan biasa, ada beberapa operasi yang didefinisikan secara khusus untuk mengkombinasikan himpunan fuzzy. Ada 3 operator dasar yang diciptakan Zadeh yaitu operator AND, OR dan NOT. Nilai keanggotaan baru sebagai hasil dari operasi 2 himpunan disebut α -predikat. Operator AND merupakan operasi interseksi pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himpunan muda adalah µ MUDA[27] = 0,6 dan nilai keanggotaan 2 juta pada himpunan penghasilan TINGGI adalah µ GAJITINGGI[2juta]= 0,8, maka α -predikat untuk usia MUDA dan berpenghasilan TINGGI adalah nilai keanggotaan minimun : µ MUDA ∩ GAJITINGGI = min( µ MUDA[27], µ GAJITINGGI[2juta]) = min (0,6 ; 0,8) = 0,6 Operator OR merupakan operasi union pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengambil nilai keanggotaan terbesar antar elemen pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himp unan muda adalah µ MUDA[27]= 0,6 dan nilai keanggotaan 2 juta pada himpunan penghasilan TINGGI adalah µ GAJITINGGI[2juta]= 0,8, maka α -predikat untuk usia MUDA atau berpenghasilan TINGGI adalah nilai keanggotaan maksimum : µ MUDA ∩ GAJITINGGI = max( µ MUDA[27], µ GAJITINGGI[2juta]) 22 = max (0,6 ; 0,8) = 0,8 Operator NOT merupakan operasi komplemen pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengurangkan nilai keanggotaan elemen pada himpunan dari 1. Misal nilai keanggotaan umur 27 pada himpunan muda adalah µ MUDA[27]= 0,6 maka α -predikat untuk usia TIDAK MUDA adalah : µ MUDA’[27] = 1 - µ MUDA[27 = 1 - 0,6 = 0,4 2.3.4. Fungsi Implikasi Tiap aturan (proposisi) pada basis pengetahuan fuzzy akan berhubungan dengan suatu relasi fuzzy. Bentuk umum aturan yang digunakan dalam fungsi implikasi adalah : IF x is A THEN y is B x dan y adalah skalar sedang A dan B adalah himpunan fuzzy. Proposisi yang mengikuti IF disebut anteseden, sedangkan proposisi yang mengikuti THEN disebut konsekuen. Secara umum ada 2 fungsi implikasi yaitu fungsi implikasi Min (minimum) dan fungsi implikasi DOT (product). Misal bentuk aturan sebagai berikut : [R1] IF Permintaan NAIK AND Stok SEDIKIT THEN Produksi TINGGI Nilai keanggotaan Permintaan 8.000 pada himpunan Permintaan NAIK adalah µ NAIK[8.000]= 0,7 dan nilai keanggotaan Stok 10.000 pada himpunan Stok SEDIKIT adalah µ SEDIKIT[10.000]= 0,9 maka fungsi implikasi untuk Produksi TINGGI adalah perpotongan nilai keanggotaan minimum sehingga nilai keanggotaan Produksi TINGGI adalah µ TINGGI=0,7. Aplikasi Fungsi implikasi Min (minimum) memotong output diilustrasikan pada gambar 7. 23 Gambar 7 : Fungsi implikasi MIN Aplikasi Fungsi implikasi DOT (product) akan menskala output disajikan pada gambar 8. Gambar 8 : Fungsi implikasi DOT 2.3.5 Sistem Inferensi Fuzzy (SIF) Ada beberapa metode untuk merepresentasikan hasil logika fuzzy yaitu metode Tsukamoto, Mamdani dan Sugeno. Pada metode Tsukamoto, setiap konsekuen direpresentasikan dengan himpunan fuzzy dengan fungsi keanggotaan monoton. Output hasil inferensi masing-masing aturan adalah z, berupa himpunan biasa (crisp) yang ditetapkan berdasarkan α predikatnya. Hasil akhir diperoleh dengan menggunakan rata-rata terbobotnya. α 1 z1 + α 2 z2 z = –––––––––––– α 2+α 2 Pada metode Mamdani, aplikasi fungsi implikasi menggunakan MIN, sedang komposisi aturan menggunakan metode MAX. Metode Mamdani dikenal juga dengan metode MAX-MIN. Inferensi output yang dihasilkan berupa bilangan fuzzy maka harus ditentukan suatu nilai crisp tertentu sebagai output. Proses ini dikenal dengan defuzzifikasi. Ada beberapa metoda yang dipakai dalam defuzzifikasi antara lain metode centroid. Pada metode ini penetapan nilai crisp dengan cara mengambil titik pusat daerah fuzzy. 24 Metode Sugeno mirip dengan metode Mamdani, hanya output (konsekuen) tidak berupa himpunan fuzzy, melainkan berupa konstanta atau persamaan liniar. Ada dua model metode Sugeno yaitu model fuzzy Sugeno orde nol dan model fuzzy Sugeno orde satu. Bentuk umum model fuzzy Sugeno orde nol adalah : IF (x1 is A 1) o (x2 is A 2) o ….. o (xn is An) THEN z = k Bentuk umum model fuzzy Sugeno orde satu adalah : IF (x1 is A 1) o (x2 is A 2) o ….. o (xn is An) THEN z = p 1* x1 + … pn* xn + q Defuzzifikasi pada metode Sugeno dilakukan dengan mencari nilai rata-ratanya. Contoh aplikasi fuzzy pada datamining adalah pada penyelesaian masalah pemilihan pakaian berikut ini ; Diasumsikan faktor utama dalam pemilihan pakaian adalah sebagai berikut f1 = style, f2 = qualitas, f3 = harga, sehingga F = {f1,f2,f3}. Tingkatan umum yang digunakan pada seleksi adalah e1 = sangat baik , e2 = baik , e3 = sedang , e4 = buruk, sehingga E = {e1,e2,e 3,e4}. Untuk tiap-tiap potong pakaian “u”, faktor penentu evaluasi adalah didapat dari hasil survey. Sebagai contoh, jika hasil survey menunjukkan “style” faktor f1 = 60% untuk sangat baik, 20% untuk baik, 10% untuk sedang, 10% untuk buruk, sehingga faktor penentu evaluasi mempunyai vektor R1(u) : R1(u) = { 0.6, 0.2, 0.1, 0.1} Secara umum, kita dapat membuat faktor penentu evaluasi untuk vektor f2 dan f3 R2(u) = { 0.1,0.5, 0.3, 0.1 } R3(u) = { 0.1, 0.3, 0.4, 0.2} Sehingga berdasar hal diatas kita dapat membuat matrix evaluasi  R1(u )     R 2( u )   R 3(u )  =  0.6  0.1   0.1 0.2 0.5 0.1 0.3 0.1 0.1 0.3 0.4 0.2     25 Jika weight vector dari pembeli adalah W(u) = { 0.4, 0.4, 0.2 } Perkalian dari matrix W(u) dan R(u) adalah berdasarkan komposisi max – min fuzzy rules, dimana hasil evaluasi adalah digambarkan dalam fuzzy set D(u) = [ d1,d2,d 3,d4] : . D(u) = W(u) R(u) = [0.4 0.4 0.2] . 0.6 0.2 0.1 0.1   0.1 0.5 0.3 0.1  0.1 0.3 0.4 0.2 = [0.4 0.4 0.3 0.2] Dimana, d1 dihitung berdasarkan langkah-langkah berikut : d1 = (w1 ´ r11) V (w2 ´ r21) V (w3 ´ r31) = (0.4 ´ 0.6 ) V(0.4 ´ 0.1) V (0.2 ´ 0.1) = 0.4 V 0.1 V 0.1 = 0.4 Nilai untuk d2 , d3 , d4 hampir sama, dimana ´ dan V merepresentasikan operator min dan max. Karena komponen terbesar D(u) adalah d 1 = 0.4 dan d 2 = 0.4 di saat yang sama, sehingga analisa untuk pakaian ini berada diantara „sangat baik“ dan „baik“ 2.4. Prakiraan / Forecasting 2.4.1 Teknik Prakiraan Pemulusan Eksponensial Teknik ini pertama kali diperkenalkan pada tahun 1970 oleh George E P Box dan Gwilym M Jenkins dalam bukunya ” Time Series Analysis : Forecasting and Control”. Dasar dari teknik ini adalah , Pengamatan sekarang (Zt) tergantung pada 1 atau beberapa pengamatan sebelumnya (Zt-k) dengan kata lain, model time series dibuat karena secara statistik ada korelasi antar deret pengamatan untuk melihat adanya dependensi antar pengamatan . Kita dapat melakukan uji korelasi antar pengamatan yang dikenal sebagai auto correlation function (acf) 26 2.4.2 Metode Winters Teknik prakiraan dengan metode Winters digunakan untuk data yang mempunyai pola musiman dan kecenderungan. Sebagai contoh pola data yang bersifat musiman dan kecenderungan dapat dilihat pada tabel 3 . Data pada tabel 3 menunjukkan pola musiman kuartalan, dalam pengertian pola data antar kuartal untuk tahun yang berbeda mempunyai pola yang sama dengan periode yang tetap, yaitu selang 3 bulanan. Karena pola 3 bulanan, maka dalam 1 (satu) tahun terdapat 4 musim atau dalam hal ini dinotasikan dengan L = 4 Tabel 3. Contoh data penjualan yang bersifat musiman Tahun 1987 1988 1989 Kuartal Periode Penjualan (t) ( Xt) I 1 36 II 2 39 III 3 43 IV 4 34 I 5 38 II 6 41 III 7 50 IV 8 39 I 9 47 II 10 51 III 11 58 IV 12 47 Metode Winters didasarkan atas 3 persamaan pemulusa, yaitu untuk pola data stationer (St), kecenderungan (bt) dan indeks musiman (It). St = ? Xt / It-L + (1 – ? )(St-1 + bt -1) ………………(a) bt = ß(St - St-1 ) + (1 – ß ) bt-1 ………………………………….(b) It = d Xt / St + (1- d ) It-L ………………………....(c) Prakiraan untuk m periode mendatang dirumuskan sebagai berikut F t+m = (St + b t.m) I t -L + m ………………………..(d) Untuk melakukan prakiraan dengan metode Winters harus tersedia data histories minimal 2 tahun, hal ini karena kalau data yang tersedia hanya 1 tahun, 27 maka factor kecenderungan untuk kuartal tertentu tidak dapat diketahui. Kecenderungan pada kuartal tertentu hanya dapat diketahui apabila tersedia data, misalnya kuartal I tahun 1987 dan kuartal I tahun 1998. Insilisasi diperlukan dalam menggunakan teknik Winters ini, hal ini dapat dijelaskan sebagai berikut, misalkan untuk melakukan prakiraan pada periode ke5 (dengan m = 1), maka dari persamaan (d) diperlukan nilai S5 dari rumus (a) diperlukan nilai I0. Nilai I0 belum terdefinisi, untuk data pola musiman kuartalan seperti tabel 3 (L = 4), inisialisasi minimal diperlukan untuk menetapkan : a. Nilai indeks musiman pada setiap kuartal pada tahun pertama b. Factor kecenderungan kuartal terakhir pada tahun pertama ( b4 atau b awal), dan c. Nilai S 4 (atau S awal) Insialisasi indeks musiman pada tahun pertama ditetapkan dengan rumusan sebagai berikut : It = Xt / X ……….untuk setiap t = 1,2,3…L, dimana X=? Xi/ L Insialisasi b awal untuk data histories yang tersedia sebanyak 2L, ditetapkan dengan rumusan sebagai berikut : b awal = 1/L {(X L+1 – X1)/L + ( X L+2 – X2 )/L + …+(X L+L – XL)/L} Inisialisasi untuk S awal ditetapkan dengan menggunakan rumusan sebagai berikut : ? Xt + 3L 2 b awal – 2 b awal . ? t . I t S awal = ----------------------------------------------2L Nilai inisialisasi akan menentukan ukuran kecermatan prakiraan dan demikian juga dengan nilai parameter ?, ß, dan d. Sebagai contoh misalkan untuk data pada tabel 3, parameter pemulus yang digunakan adalah ? = 0.2, ß = 0.1 dan d = 0.05 dan sebagai himpunan periode / data uji adalah periode t = 6 s/d t = 12. Dengan menggunakan parameter m = 1, maka hasil perhitungan dapat dilihat pada tabel 4. Jika dilakukan prakiraan untuk periode ke 13 atau kuartal I tahun 1990, dengan m=1 , berarti periode dasarnya adalah t = 12, sehingga : 28 F12 + 1 = (S12 + b12).I9; dimana I9 adalah indeks musiman kuartal I pada tahun sebelumnya (1989), jika I9 belum diketahui maka dicari dengan memuluskan indeks musiman kuartal I tahun 1988 atau I8. Tabel 4. Contoh hasil penerapan metode Winters (? = 0.2, ß = 0.1 dan d = 0.05) Kuartal 1987 1988 1998 2.5. Data Pemulusan Pemulusan Pemulusan Ramalan jika Aktual Tunggal Musiman Trend m=1 1 36 0.95 2 39 1.01 3 43 1.10 4 34 45.03 0.83 1.00 5 38 44.84 0.94 0.88 6 41 44.67 1.01 0.78 46.32 7 50 45.43 1.10 0.77 50.11 8 39 46.31 0.83 0.79 38.55 9 47 47.65 0.94 0.84 44.38 10 51 48.91 1.01 0.88 48.89 11 58 50.30 1.02 1.02 48.89 12 47 49.58 1.09 0.85 56.58 Penelitian Terdahulu Penelitian di bidang kesehatan dengan menerapkan datamining dari suatu dataset yang ada, telah dilakukan oleh bebagai pihak. Pada umumnya hasil akhir yang akan mereka capai adalah didapatnya suatu pola, sehingga dari pola tersebut akan didapatkan prediksi tentang keadaaan tertentu . Beberapa penelitian yang telah dilakukan antara lain ; 1. Scales, Embrechts, Rensselaer, Polytechnic Institute, Department of Decision Science and Engineering System, New York, mereka mencoba untuk membuat suatu sistem arsitektur yang akan berfungsi sebagai alat diagnosa untuk penyakit jantung kardiovaskular. Diagnosa yang dilakukan oleh sistem mereka didasarkan pada dataset kesehatan yang ada. Tujuan akhir dari diagnosa ini adalah memisahkan antara penyakit jantung dan yang bukan penyakit jantung. Teknik mereka gunakan adalah Principle Component data mining yang Regression Analysis, 29 Partial Least Squares Regression, artificial neural network dan Neuralfuzzy Inference system. Dari hasil penelitian mereka sistem yang dibangun dengan neural-fuzzy memberikan tingkat keakurasian 92 %. 2. Breault, JL, Departement of Healt System Management, Tulane University Department of Family Practice, Alton Ochsner Medical Foundation. Breault mencoba untuk menerapakan datamining pada Pima Indian diabetic database (PIDD) yang ada di UC Irvine Machine Learning Labs. Pada dataset tersebut, Breault mencoba menerapakan datamining yang telah di implementasikan pada software ROSETTA, dimana tingkat keakurasiannya dapat ditingkat menjadi 73,8% sampai 95 % dari methode yang sebelumnya. 3. Ferren G, Merwe M, Fleming G, Murphy K ; Para peneliti ini tergabung dalam The South African council for Scientific and Industrial Research (CSIR) mencoba untuk menerapkan teori fuzzy expert system dan GIS untuk memprediksi penyebaran cholera di Afrika utara. Dimana mereka merancang sistem peringatan dini dengan menggunakan ArcGIS dan fuzzy logic serta boolean algebra sebagai tools dalam mengolah pola data yang telah ada. 4. Hirota et al (1996), mencoba menggambarkan hirarki dari data mining, fuzzy model dan turunannya Knowledge Discovery (datamining) pattern Multi Model pattern and Fuzzy Model rules rules Gambar 9. Data mining, multimodel dan fuzzy model (adaptasi dari Hirota, 1996) 30 5. Herwanto, 2006, dalam tesis Pascasarjana di fakultas Ilkom, IPB yang berjudul “Pembangunan Sistem Data mining untuk Mendiagnosa Penyakit Diabetes Menggunakan Algoritma CPAR (Classification Based on Predictive Association Rules)”, mencoba untuk menerapkan datamining pada database penyakit diabetes yang dimiliki oleh RS Pertamina untuk menemukan kaitan antar variable data. Dari data ini dibangun sebuah system yang dapat melakukan prediksi diagnosa penyakit. Hasil prediksi berupa kemungkinan diagnosa penyakit yang diderita pasien. Aturan yang digunakan untuk melakukan prediksi diagnosa penyakit diambil dari hasil proses data mining menggunakan algoritme CPAR . Dari hasil penelitian tersebut dapat ditarik suatu kesimpulan : Pemeriksaan glukosa darah 2 jam pp (Gpost), glukosa urin 2 jam pp (Upost), glukosa darah puasa (Glun) menjadi penentu utama untuk menentukan apakah pasien positif diabetes atau negatif diabetes. 2.5.1. Perbedaan dari penelitian sebelumnya Pada penelitian ini penulis mencoba menggabungkan kemampuan dari data mining dengan metode Classification based on Predictive Association Rules (CPAR) dalam mencari suatu pola variable – variable yang telah ada, kemudian dalam membangun suatu sistem arsitektur untuk memprediksi pola penyebaran demam berdarah digunakan sistem pakar dengan menggunakan sistem logika fuzzy dan sistem prakiraan dengan menggunakan metode Winters. 31 BAB III METODOLOGI 3.1. Kerangka Pemikiran Penelitian tentang prediksi meledaknya wabah suatu penyakit sudah banyak dilakukan oleh para peneliti. Mereka mencoba mencari pola dan relasi dari data set yang ada, kemudian mencoba memprediksi atau membuat suatu model sehingga dapat digunakan untuk mencegah terjadinya wabah penyakit dikemudian hari. Demam Berdarah adalah suatu siklus yang terus berulang terjadi di DKI Jakarta dan menimbulkan kerugian jiwa dan material yang tidak sedikit. Sehingga perlu kiranya mendapat perhatian khusus dari pemerintah DKI Jakarta dengan menciptakan suatu sistem peringatan dini yang dapat mengurangi kemungkinan KLB. Berdasarkan pemikiran tersebut, perlu kiranya dilakukan upaya penanganan agar dampak dari merebaknya demam berdarah dapat segera di antisipasi. Sebagai langkah awal maka dilakukan studi pustaka mengenai DBD untuk memahaminya. Kemudian dilakukan identifikasi permasalahan yang akan di teliti dan faktor – faktor yang terkait dengannya dan alternatif solusi penyelesaiannya. Selanjutnya dilakukan pengumpulan data tentang DBD dan faktor – faktor yang terkait antara lain suhu dan curah hujan. Berdasarkan data set yang didapat, di coba untuk menerapkan konsep – konsep data mining, untuk mendapatkan pola dan relasi yang saling berkaitan dari data tersebut. Penulis mencoba menerapkan konsep dan metode dari data mining pada data set dinas kesehatan DKI Jakarta, yang mencatat tentang wabah demam berdarah pada tahun 2004-2005. Diharapkan dapat di temukan adanya pola – pola dan relasi antar data tersebut, hubungannya dengan suhu dan iklim di Jakarta pada saat pencatatan, sehingga dapat di buat model prediksinya menggunakan sistem pakar. Untuk mengetahui tingkat keakuratan hasil yang diperoleh dari model prediksi tersebut, maka dibuatkan program aplikasi sebagai implementasi dari model tersebut, dengan menggunakan program aplikasi tersebut maka dapat dilakukan pengujian 32 untuk melihat hasil keakuratan hasil yang diperoleh dari model tersebut. Secara garis besar blok diagram sistem peringatan dini prediksi meledak DBD dan cara penanggulangannya, dapat disajikan pada gambar 10 Gambar 10. Sistem Peringatan Dini Prediksi Meledak DBD Dan Cara Penanggulangannya Untuk menjabarkan kerangka pemikiran tersebut, dijabarkan dalam tahapan penelitian yang disajikan pada gambar 11. Tahapan tersebut utamanya terdiri dari : Studi pustaka, identifikasi masalah, pengumpulan data, pengolahan dengan datamining, pembangunan aplikasi, dan prediksi menggunakan metode Winter’s. 33 Gambar 11. Tahapan Penelitian Sehingga berdasarkan pola pemikiran diatas, setelah dilakukan pengumpulan data – data cuaca yang meliputi suhu, curah hujan, kelembaban, dan penyinaran matahari serta data survailance DBD, data yang telah dikumpulkan ini dilakukan proses seleksi, pembersihan dan transformasi data jika diperlukan. Data yang telah di olah akan digunakan oleh datamining dengan metode CPAR, dimana setelah di olah oleh datamining, akan dihasilkan basis aturan yang akan digunakan 34 dalam mendesign prototype pola penyebaran DBD yang akan dibangun dengan software Matlab 7.0. Setelah melalui proses testing, apabila hasil yang diharapkan belum sesuai dengan yang diharapkan maka proses membangun sistem tersebut harus diulang kembali, akan tetapi jika hasilnya sudah sesuai dengan yang diharapkan, maka selanjutnya adalah melakukan proses prediksi akan terjadinya DBD melalui metode Winter’s, dan dari apa yang dihasilkan oleh prediksi tersebut, tahap selanjutnya adalah Merumuskan suatu sistem peringatan dini prediksi meledaknya DBD dan cara penanggulangannya. 3.2. Tata Laksana Dalam Penelitian ini akan dilaksanakan dalam 3 (tiga) tahap utama , yaitu tahap pengumpulan data, tahap kedua penentuan jenis data yang akan digunakan, dan selanjutnya adalah tahap pengolahan data. 3.2.1 Pengumpulan Data Dalam melakukan pengumpulan data, yang didasarkan pada hasil dari studi pustaka dan identifikasi masalah, maka dilakukan 2 (dua) tahap kegiatan, yaitu penentuan jenis dan sumber data, serta teknik pengambilan data 3.2.1.1 Jenis dan Sumber Data Berdasarkan jenis data dan informasi yang diperlukan, dalam membuat thesis ini, maka jenis dan sumber data dapat dikelompokkan kedalam data primer dan data sekunder. Data primer adalah data yang diperoleh langsung dari pakar maupun observasi langsung dilapangan. Sedangkan data sekunder adalah data yang didapat dari studi literatur, buku refrensi, jurnal, laporan penelitian, serta sumber lain yangdianggap akurat. 3.2.1.2 Teknik Pengambilan Data Data dan informasi dalam penelitian ini, dilakukan dengan 2 (dua) cara, yaitu metode akuisisi yang dilakukan dengan wawancara, diskusi masalah, dan deskripsi masalah tentang DBD dan cara penanggulangannya, Wawancara ini dilakukan di Dinas Kesehatan DKI Jakarta. Selain itu metode lain yang digunakan adalah melalui buku – buku refrensi dan sumber – sumber terpercaya lainnya. 3.2.2. Data Yang Digunakan Data dalam penelitian ini dibagi menjadi 2 (dua), yaitu data yang mencatat kejadian kasus DBD per kecamatan di wilayah DKI tahun 2004 – 2005 yang 35 dikeluarkan oleh Dinkes DKI Jakarta dan data cuaca dari BMG daerah Jakarta pada tahun 2004 – 2005 yang meliputi suhu udara, curah hujan, kelembaban udara dan penyinaran matahari. Semua data yang digunakan dalam penelitian dibatasi hanya pada wilayah Jakarta Selatan dan Jakarta Pusat. Untuk data survailens DBD diambil 2 tahun (2004 – 2005) karena data pada tahun 2003 merupakan masa peralihan antara sistem manual dengan sistem survailans, penerapan metode pengambilan data dengan sistem survailens melibatkan seluruh puskesmas di DKI Jakarta baru efektif pada tahun 2004. Daerah pemilihan sampel dilakukan didaerah Jakarta Selatan dan Jakarta Pusat dengan alasan sebagai berikut : a. Daerah Jakarta Selatan (mempunyai 10 kecamatan), secara ekonomi mempunyai penyebaran yang cukup beragam dari strata ekonomi lemah – strata ekonomi tinggi, dengan demikian di daerah Jakarta selatan penyebaran tingkat pemahaman tentang pemberantasan DBD pun diasumsikan beragam, dari yang perduli sampai yang tidak perduli b. Daerah Jakarta Pusat (mempunyai 8 kecamatan), secara ekonomi juga mempunyai penyebaran yang cukup beragam, selain itu di daerah Jakarta Pusat merupakan pusat pemerintahan dan perekonomian DKI Jakarta, dengan asumsi tersebut pola pemberantasan jentik DBD akan lebih intensif dari daerah lainnya. Data yang digunakan dalam membuat rule adalah sebanyak 97 data untuk Jakarta Selatan dengan rincian 36 untuk kemungkinan DBD dengan kondisi kuning, 61 untuk DBD kondisi Merah, sedangkan untuk Jakarta Pusat, digunakan data sebanyak 105 data, dengan rincian 32 untuk kemungkinan DBD kuning dan 73 untuk kemungkinan DBD Merah. Sedangkan untuk kondisi Hijau data tersebut tidak terjadi pada tahun 2004-2005, karena dilapangan kondisi daerah yang Hijau pun tidak terjadi, hal ini disebabkan karena klasifikasi dari Dinkes DKI Jakarta yang memungkin daerah tersebut dimasukkan klasifikasi Hijau, yaitu tidak terjadi DBD (0{ nol} Kejadian DBD) pada daerah tersebut selama 3 minggu berturut – turut. Sedangkan data cuaca dari dinas BMG digunakan data cuaca untuk daerah Jakarta Selatan dan Jakarta Pusat dengan parameter yang digunakan 36 a. Suhu rata – rata dalam 1 minggu b. Curah hujan rata – rata dalam 1 minggu c. Penyinaran matahari rata – rata dalam 1 minggu d. Kelembaban rata – rata dalam 1 minggu Semua data cuaca di ambil rata – rata per minggu dengan tujuan untuk menyamakan dengan data pencatatan survailens disusun dalam rekap per minggu 3.2.3. Pengolahan Data Langkah awal dari proses pembuatan model adalah identifikasi data yang ada. Data yang akan digunakan dalam pembuatan model penyebaran DBD adalah data kasus DBD yang dicatat per kecamatan di Jakarta per minggu pada tahun 2004-2005. Selain itu digunakan pula data cuaca di Jakarta pada tahun yang sama. Tahap selanjutnya adalah pemilihan data, jika data yang di perlukan tidak ada maka proses identifikasi data harus dilakukan kembali. Setelah data yang terpilih tersedia, maka diadakan validasi, eksplorasi dan pembersihan data dari data – data sampah yang mungkin tidak akan digunakan dan membuat data yang digunakan semakin membesar. Data terpilih yang akan digunakan juga harus di transformasikan atau disamakan satu dan lainnya, contoh, adanya ketidak seragaman dalam pencatatan data DBD dengan data cuaca, dimana data DBD di catat berdasarkan mingguan sedangkan data cuaca dicatat harian, sehingga diambil suatu keputusan untuk melakukan konversi data menjadi data perminggu. Jika dianggap data-data yang telah kita kumpulkan tersebut masih belum lengkap maka kita bisa menambahkan variabel yang bisa membantu dalam pembuatan model. Secara umum sampai pada tahap ini, arsitektur system pola penyebaran DBD dapat disajikan pada gambar 12. 37 Prediksi DBD & Penanggulanganya Data masukan dari pengguna Antar Muka Sistem Aplikasi DBD Sistem Inferensi Fuzzy ( Matlab 7.0 ) Aturan –aturan Hasil Datamining Antarmuka Sistem Datamining (pemilihan , pembersihan ,transformasi) database Gambar 12. Arsitektur system Aplikasi DBD (adapatasi dari Maeda ,1995) Berdasarkan gambar diatas, pada arsitektur sistem aplikasi DBD, dapat dibagi menjadi 2 bagian besar, yaitu pembentukan aturan melalui datamining, dan pembentukan Aplikasi DBD itu sendiri. Setelah dilakukan proses menggunakan datamining dengan menggunakan metode CPAR, akan didapatkan aturan – aturan hasil dari keterkaitan antara data – data yang ada, aturan – aturan tersebut akan di implementasikan dengan sistem inferensi fuzzy dengan menggunakan software Matlab 7.0 R 14. Hasil dari model yang didapat ini nantinya akan di tampilkan dengan suatu sistem antar muka Aplikasi DBD, pengguna dapat memasukkan data tentang suhu, curah hujan, kelembaban dan penyinaran matahari dari lokasi yang akan diprediksi. Data tersebut akan memicu proses inferensi sehingga pada akhirnya sistem tersebut akan memberikan keluaran berupa prediksi tentang meledaknya DBD, dalam kondisi Hijau, Kuning atau Merah serta tata laksana 38 cara penanggulannya dan untuk melakukan validasi akan digunakan prediksi metode Winters 3.3. Pembuatan Program Aplikasi 3.3.1. Data mining Metodologi data mining didasarkan pada tiga tahapan yang dilakukan untuk mendeteksi DBD di suatu wilayah. Ketiga tahapan tersebut adalah : a) menangani data yang tidak lengkap melalui ekstraksi,transformasi dan loading (ETL), b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit serta, c) Pencarian aturan (rule mining) dan klasifikasi. Pada tahap pertama, pemrosesan awal data survailens DBD dilakukan untuk menghapus data yang tidak lengkap dan mengekstrak data yang akan digunakan untuk mengelompokkan antara DBD kondisi kuning atau merah. Pada tahap kedua setiap data yang bernilai kontinyu didiskritkan (dirubah kedalam bentuk katagori). Hasil dari tahap pertama dan kedua diatas disimpan dalam working database. Pada tahap ketiga, algoritma CPAR digunakan untuk menghasilkan aturan-aturan, yang berguna dalam memprediksi kondisi DBD disuatu lokasi berdasrkan kondisi alam pada saat itu. 3.3.1.1. Menangani Data Yang Tidak Lengkap Melalui ETL Data yang terkumpul dan akan digunakan adalah data tentang DBD dan data cuaca yang terdiri dari suhu, kelembaban, penyinaran matahari dan curah hujan. Data DBD yang dikumpulkan adalah data yang tercatat per minggu untuk tiap kecamatan di suatu wilayah, sedangkan data cuaca adalah data yang dicatat per hari disuatu wilayah. Sehingga terdapat ketidaksamaan dalam memperlakukan data tersebut, agar dapat digunakan maka data cuaca di rubah menjadi data per minggu, dimana data yang ada diambil nilai rata – ratanya dalam 1 minggu. Data yang telah sama tersebut selanjutnya akan dirubah menjadi data diskrit. 3.3.1.2. Merubah Data Kontinyu Menjadi Data Diskrit Data sampel yang digunakan pada penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritma data mining CPAR bekerja dengan atributatribut yang nilainya nominal. Untuk menggunakan algoritma tersebut atribute yang bernilai numerik tersebut diganti dengan atribute yang bernilai nominal yang menunjukkan interval nilai dengan nilai-nilai diskrit. Proses ini dikenal sebagai 39 diskritisasi dan berisi transformasi dari variabel quantitatif kedalam variable kualitatif. 3.3.2. Pembentukan Basis Aturan Data yang diolah oleh metode CPAR, akan menghasilkan suatu basis aturan yang mempunyai aturan IF – THEN rules. Sistem berbasis aturan adalah suatu sistem penalaran yang membangun aturan – aturan yang merepresentasikan pengetahuan dan menggunakan aturan tersebut sebagai pengambil keputusan (Ignizio, 1991). Aturan – aturan ini selanjutnya mengolah fakta menjadi kesimpulan. Aturan – aturan yang didefinisikan dengan rule dinyatakan dalam IFTHEN atau IF – THEN – ELSE yang mempunyai struktur umum : IF (kondisi / premis ) THEN (aksi / konklusi ) Dimana : - IF merupakan suatu kondisi atau aturan yang berisi fakta – fakta yang dapat dinyatakan sebagai kalimat atau ekspresi matematika. Kondisi ini dapat berupa pernyataan benar atau salah - THEN merupakan aksi yang dilaksanakan jika kondisi IF bernilai benar (true) sedangkan aturan ELSE dilaksanakan jika kondisi IF bernilai salah (false) Dua atau lebih premis dapat dihubungkan dalam bentuk AND. Aturan – aturan IF-THEN dapat dibuat dari beberapa kondisi dan beberapa akibat menjadi bentuk IF F1 is A1 and F2 is A2 THEN Z is Y dan seterusnya. Efisiensi dapat dilakukan apabila saat penyusunan basis aturan ini pendapat pakar dapat langsung di implementasikan. 3.3.3. Aplikasi DBD Pada tahapan ini, aturan yang telah didapat dari hasil pengolahan dengan menggunakan datamining, selanjutnya diaplikasikan kedalam suatu program aplikasi sistem pakar yang dibangun dengan menggunakan program Matlab 7.0 R14. 40 Penyusunan sistem dimulai dengan memilih atribut – atribut yang akan digunakan. Atribut tersebut meliputi atribut cuaca dan kondisi DBD, atribut – atribut ini ini kemudian di dekomposisi menjadi himpunan – himpunan fuzzy. Evaluasi aturan fuzzy kemudian diubah menjadi suatu harga numerik untuk menentukan aksi dari hasil, proses ini desebut dengan defuzzifikasi. Metode defuzzifikasi yang akan digunakan dalam pembuatan sistem ini adalah metode centroid. Dengan menggunakan himpunan fuzzy, aturan atau rules dan metode defuzzifikasi, maka dapat disusun sebuah Fuzzy Inferensi Sistim (FIS) dengan menggunakan toolbox fuzzy pada software Matlab 7.0 R14. Sedangkan untuk antarmuka digunakan fasilitas GUI (Graphical User Interface) pada software yang sama. Sebagai hasil dari sistem ini adalah unit analisis DBD per kecamatan dari wilayah Jakarta Pusat atau Jakarta Selatan, sehingga pengguna dapat mengeetahui kemungkinan terjadinya DBD di kecamatan yang di prediksi. 3.3.4. Prediksi Cuaca Menggunakan Metode Winter’s Aplikasi DBD adalah aplikasi yang dibangun berdasarkan dari basis aturan yang dibangun dari atribut cuaca yang dikaitkan dengan kejadian DBD, sehingga dalam memprediksi kemungkinan wabah DBD, data yang diperlukan adalah data cuaca pada tahun yang akan di prediksi. Sebagai tindakan dalam melakukan cegah dini, maka dicoba untuk melakukan prediksi cuaca pada tahun yang akan dilakukan prediksi dengan menggunakan data cuaca minimal 2 tahun sebelumnya.Misalnya cuaca pada tahun 2007, maka diperlukan data tahun 2005 dan tahun 2006 sebagai dasar dalam melakukan prediksi kondisi cuaca. Data cuaca hasil prediksi inilah yang akan digunakan sebagai data masukkan kedalam aplikasi DBD, dan dapat digunakan sebagai dasar tindakan pencegahan dini dalam penanggulangan wabah DBD. . 41 BAB IV PERANCANGAN SISTEM 4.1. Gambaran Umum Sistem Sistem aplikasi yang dibangun pada penelitian ini dapat dibangkitkan prediksinya melalui pemasukkan data cuaca yang meliputi suhu, curah hujan, intensitas matahari dan kelembaban udara rata – rata per minggu. Setelah data tersebut diolah oleh aplikasi DBD, sistem ini akan memberikan status DBD pada daerah yang bersangkutan dan tata laksana penganggulangannya. Aplikasi ini dikembangkan dengan menggunakan metode pemprograman prosedural, dapat dijalankan oleh server pada lingkungan sistem operasi Microsoft Windows 95/98/NT/2000/XP dan dibangun dengan menggunakan software Matlab 7.0 R 14. Pengguna sistem adalah mereka yang langsung berhubungan dengan penatalaksanaan DBD misalnya Puskesmas, Sudin Kesehatan DKI Jakarta ataupun masyarakat umum dalam hal ini adalah dokter umum yang ingin mengetahui prediksi DBD di daerahnya. Dari hasil analisis kebutuhan maka dikembangkan model seperti ditunjukkan dalam Gambar 13. Gambar 13. Model Aplikasi DBD 42 4.2. Analisa Kebutuhan Sistem Pada penelitian ini, pengembangan sistem untuk menarik suatu kesimpulan yang merupakan cirri khas suatu sistem pakar, dilakukan dengan menerapkan metode logika fuzzy (fuzzy logic) sebagai dasar pendekatan pemecahan masalah. Penggunaan metode ini adalah upaya untuk mendekati mekanisme penalaran dalam melakukan penarikan kesimpulan kondisi DBD disuatu wilayah. Metode logika fuzzy adalah suatu metode pemecahan masalah yang hampir mendekati dengan cara nalar manusia dalam mengambil suatu kesimpulan 4.3. Desain Sistem Pada penelitian ini sistem dibangun menjadi melalui 2 tahap, yaitu : - Tahap pencarian pola melalui data mining dengan menggunakan metode CPAR, dimana aturan – aturan yang dihasilkan oleh data mining tersebut akan dioleh oleh sistem aplikasi DBD - Tahap implementasi dalam suatu system yang disebut aplikasi DBD, system ini dikembangkan melalui mekanisme penarikan kesimpulan dengan menggunakan metode logika fuzzy sebagai dasar pendekatan pemecahan masalah. Metode logika fuzzy ini adalah sebuah metode pemecahan masalah yang sangat dekat dengan cara berpikir manusia dalam melakukan penarikan kesimpulan. 4.3.1. Tahapan Data Mining Tahap pencarian pola melalui data mining didasarkan pada tiga tahapan yang dilakukan untuk mendeteksi DBD di suatu wilayah. Ketiga tahapan tersebut adalah a) menangani data yang tidak lengkap melalui ekstraksi, transformasi dan loading, b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit, c) memetakan basis aturan hasil mining dan klasifikasi. Pada tahap pertama, pemprosesan awal data survailens DBD dilakukan untuk menghapus data yang tidak lengkap dan mengekstrak data yang akan digunakan untuk mengelompokkan antara DBD kondisi kuning dan merah. Pada tahap kedua setiap data yang bernilai kontinyu didiskritkan, data sampel yang digunakan pada penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritma data mining CPAR bekerja dengan atribut-atribut yang nilainya nominal. Untuk menggunakan algoritma tersebut, attribute yang bernilai numerik tersebut diganti 43 dengan atribut bernilai nominal yang menunjukkan interval nilai dengan nilainilai diskrit. Proses ini dikenal sebagai diskritisasi dan berisi transformasi dari variabel quantitatif kedalam variable kualitatif. Hasil dari tahap pertama dan kedua diatas disimpan dalam working database Tabel 5. Atribut yang digunakan dalam algoritma CPAR Atribut Suhu Suhu Suhu Curah Hujan Curah Hujan Curah Hujan Curah Hujan Curah Hujan Matahari Matahari Matahari Kelembaban Kelembaban Kelembaban Keterangan Temperatur rendah Temperatur Normal temperatur tinggi Curah hujan sangat rendah Curah hujan rendah Curah hujan Normal Curah hujan lebat Curah hujan sangat lebat Penyinaran matahari rendah Penyinaran matahari Normal Penyinaran matahari penuh Kelembaban udara rendah / kering Kelembaban udara Normal Kelembaban udara tinggi / basah Nilai Kontinyu 20o – 24oC 24oC – 27oC > 27oC <5mm 5-20mm 20 – 50mm 50 - 100mm >100mm 0 - 35% 35 - 70% > 70% < 40% 40 - 75% >75% Nilai Diskrit 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Dasar pembagian atribut cuaca yang akan digunakan dalam menentukan nilai kontinyu adalah berdasarkan referensi dari dinas BMG DKI Jakarta untuk cuaca di wilayah DKI Jakarta dan sekitarnya. Atribut Suhu dibagi menjadi 3 klas, yaitu Temperatur rendah, normal, dan tinggi dengan kisaran suhu 20oC - lebih besar dari 27oC. Atribut untuk intensitas hujan dibagi menjadi 5 klas, yaitu curah hujan dengan intensitas sangat rendah, rendah, normal, lebat dan sangat lebat. Curah hujan yang diukur adalah curah hujan per hari pada jam 07.00 pagi dan diklasifikasikan berdasarkan mingguan atau per 7 hari. Atribut intensitas penyinaran matahari dibagi menjadi 3 klas, yaitu intensitas rendah, intensitas normal dan intensitas tinggi / penuh. Pengukuran ini dilakukan per hari dalam 1 bulan, kemudian dilakukan klasifikasi berdasarkan mingguan. Atribut kelembaban udara dibagi menjadi 3 klas, yaitu kelembaban rendah / kering, kelembaban normal, kelembaban tinggi / basah. Atribut kejadian DBD di suatu wilayah, dibagi menjadi 2, yaitu , Kuning dan Merah. Kondisi Hijau adalah kondisi dimana dalam 3 minggu berturut – turut tidak terjadi kasus DBD; Kondisi Kuning adalah kondisi dimana terjadi 1 sampai 44 5 kasus dalam suatu daerah pada 1 minggu; Kondisi Merah adalah kondisi dimana terjadi lebih dari 5 kasus dalam suatu daerah pada 1 minggu. Pada tahap ketiga, algoritma CPAR digunakan untuk menghasilkan aturanaturan, yang berguna untuk mendeteksi apakah kondisi alam saat itu akan memungkinkan terjadinya kondisi DBD kuning atau merah. Data cuaca dari BMG dimasukkan ke dalam atribut dan nilai diskrit yang akan digunakan dalam algoritma CPAR Dalam penelitian ini digunakan datamining dengan algoritma CPAR, dimana data yang telah dilakukan diskritisasi digunakan dalam algoritma tersebut, CPAR hanya memilih literal yang terbaik dan mengabaikan seluruh literal lainnya. CPAR membuat rule dari parameter cuaca yang dikaitkan dengan kondisi kuning atau merah, Setelah CPAR menemukan literal terbaik, literal lainnya yang Gain-nya mirip dengan literal sebelumnya (misalnya hanya berbeda 1%) akan terus dicari. Dari hasil literal tersebut didapat beberapa rule untuk tiap – tiap daerah Jakarta Pusat dan Jakarta Selatan. 4.3.1.1.Basis Aturan (Rule Base) Setelah CPAR memilih literal yang terbaik dari suatu gain similarity ratio yang ditetapkan, maka akan didapatkan beberapa aturan yang dapat digunakan sebagai dasar dalam merancang suatu sistem untuk memprediksi meletusnya DBD disuatu daerah. Prediksi yang berkaitan dengan DBD dibuat berdasarkan hasil proses data mining dan diperkuat oleh pendapat pakar, sedangkan tatalaksana penanggulangan DBD disusun berdasarkan SOP tatalaksana di Dinkes DKI Jakarta . Basis pengetahuan yang dikembangkan pada penelitian ini menggunakan kaidah aturan IF - THEN. Pada penelitian ini ada 2 klasifikasi prediksi yang digunakan yaitu kondisi Kuning dan Kondisi Merah. 4.3.2. Tahapan Aplikasi DBD Ada 3 (tiga) proses yangdilakukan oleh sistem ini yaitu proses masukkan (input), proses evaluasi, dan proses keluaran (output) 4.3.2.1.Proses Masukkan (Input) Pada proses input ini nilai masukkan yang diberikan divalidasi oleh sistem. Hal ini perlu dilakukan agar tidak terjadi kesalahan pada sistem saat prediksi dan penilaian dilakukan. Pada proses pemasukkan data, pengguna akan memasukkan nilai untuk semua atribut cuaca. Kemudian atribut tersebut akan 45 difuzzifikasi dan dibagi menjadi beberapa himpunan fuzzy dan diberi selang nilai. Selanjutnya sistem akan memproses data masukkan yang telah dimasukkan oleh pengguna dan dibuat menjadi dinamic link library (dll). Pada proses masukkan data, pengguna memasukkan nilai pada atribut cuaca yangdiberikan oleh sistem, dimana atribut tersebut akan difuzzifikasi oleh sistem yang kemudian akan dibagi menjadi beberapa himpunan fuzzy dan diberi selang nilai, seperti yang terlihat pada tabel 8 Tabel 6. Atribut Cuaca dan Himpunan Fuzzy Atribut Himpunan Fuzzy Domain / Representasi Fuzzy Selang Nilai Suhu Curah Hujan Matahari Kelembaban Rendah 0 < N < 24 Tr (0,0, 23, 24) Sedang 23 < N < 28 Tr (23, 24, 27, 28) Tinggi 27 < N < 50 Tr (27,28, 50,50) Sangat rendah 0 <N<5 Tr ( 0,0, 4, 5) Rendah 4 Tr ( 4, 5, 20, 21) Normal 19 < N < 50 Tr (19, 20, 49, 50) Lebat 49 < N < 101 Tr(49,50,100,101) Sangay Lebat 100 < N < 105 Tr(100,101,105) Rendah 0 < N < 35 Tr ( 0, 0, 34, 35) Sedang 34 < N < 71 Tr (34, 35, 70,71) Penuh 70 < N < 100 Tr (70,71,100,100) Kering 0 < N < 40 Tr(0, 0, 39,40) Normal 39 < N < 76 Tr (39,40,75,76) Basah 75 < N < 100 Tr (75,76,100,100) < N < 21 4.3.2.1.1. Fuzzifikasi Atribut Suhu Fungsi keanggotaan atau membershio function adalah suatu kurva yang menunjukkan pemetaan titik – titik input data ke dalam nilai keanggotaannya (sering juga disebut dengan derajat keanggotaan) yang memiliki interval antara 0 – 1. Dalam pembuatan aplikasi DBD untuk menentukan kondisi DBD disuatu wilayah, terdapat 4 atribut yang cuaca yang akan digunakan, yaitu suhu, curah hujan, matahari dan kelembaban sebagai fariabel fuzzy. Atribut cuaca ini 46 kemudian dibuatkan fuzzifikasinya, dan dibagi menjadi beberapa himpunan fuzzy dan diberi selang nilai dan untuk mempresentasikan himpunan fuzzy digunakan fungsi keanggotaan trapesium (Trapmf). Nilai x dari Trapmf ditentukan dari 5 parameter a,b,c dan d 0; x ≤ a  ( x − a ) /(b − a); a ≤ x ≤ b F(x;a,b,c,d) = 1; b ≤ x ≤ c (d − x) /(d − c ); c ≤ x ≤ d  0; x ≥ d Dalam aplikasi DBD, jumlah output dari kondisi DBD yanag dapat ditentukan ada 2 kemungkinan, yaitu kondisi DBD kuning dan kondisi DBD merah. 1. Fuzzifikasi suhu Fuzzifikasi suhu dibuat menjadi 3 himpunan fuzzy, yaitu rendah, sedang dan tinggi. Untuk merepresentasikan himpunan fuzzy digunakan kurva trapesium (Trapmf) seperti terlihat pada gambar 14 Gambar 14. Fuzzifikasi Suhu 2. Fuzzifikasi Curah Hujan Fuzzifikasi curah hujan terdiri dari 4 himpunan fuzzy yaitu sangat rendah, rendah, normal, lebat, sangat lebat. Untuk mempresintasikannya digunakan kurva trapesium (Trapmf), seperti terlihat pada gambar 15. 47 Gambar 15. Fuzzifikasi Curah Hujan 3. Fuzzifikasi Matahari Fuzzifikasi Matahari terdiri dari 3 himpunan fuzzy, yaitu penyinaran rendah, sedang, penuh. Untuk merepresentasikannya digunakan kurva trapesium (Trapmf) seperti terlihat pada gambar 16. Gambar 16. Fuzzifikasi Penyinaran Matahari 4. Fuzzifikasi Kelembabab Udara Fuzzifikasi kelembaban udara terdiri dari 3 himpunan fuzzy, yaitu kering, normal dan basah. Untuk merepresentasikannya digunakan kurva trapesium (Trapmf) seperti terlihat pada gambar 17. 48 Gambar 17. Fuzzifikasi Kelembaban Udara 4.3.2.2. Proses Evaluasi Di dalam proses evaluasi Aplikasi DBD terdapat 4 atribut cuaca dan 2 kondisi DBD yang akan dinilai. Proses inferensi adalah bagian terpenting dari pengembangan suatu sistem. Berikut ini adalah proses inferensi pada model fuzzy Mamdani menurut Marimin (2005) yang digunakan dalam proses evaluasi sistem Aplikasi DBD : 1. Fuzzikasi Input fuzzy diterima dan ditentukan derajat keanggotaannya. Apabila kondisi mempunyai aturan lebih dari satu maka diterapkan operator fuzzy 2. Operator fuzzy Operator fuzzy diperlukan apabila anteseden untuk suatu aturan lebih dari satu, dan digunakan untuk menentukan fungsi keanggotaan hasil inferensi setiap aturan tersebut. 3. Inferensi Nilai kebenaran untuk premise dari setiap aturan dihitung dan diterapkan pada bagian konklusi dari setiap aturan 4. Agregasi Penggabungan seluruh output gugus fuzzy menjadi sebuah output gugus fuzzy 5. Defuzzifikasi Proses pengubahan hasil fuzzy menjadi hasil yang mempunyai nilai tunggal (crips) 49 Pada Aplikasi DBD, identifikasi kondisi DBD diawali dengan proses pemasukkan data – data cuaca yang dibutuhkan dalam suatu mekanisme inferensi yang bekerja berdasarkan kaidah kepakaran untuk mengambil suatu kesimpulan. Untuk mendekati proses penalaran pakar dalam melakukan pengambilan keputusan, maka pada penelitian ini proses tersebut disimulasikan dengan menggunakan pendekatan logika fuzzy. 4.3.2.3.Proses Output Data yang dimasukkan dalam proses defuzzifikasi adalah suatu himpunan fuzzy yang diperoleh dari komposisi aturan – aturan fuzzy, sedangkan output merupakan suatu bilangan pada domain himpunan fuzzy tersebut (Kusumadewi, 2002). Setelah proses inferensi Mamdani yang terdiri dari fuzzifikasi , operasi fuzzi, metode implikasi, metode agregasi dan defuzifikasi dijalankan, maka akan diperoleh hasil defuzzifikasinya. Dalam penelitian ini metode defuzzifikasi yang digunakan adalah metode centroid. Keuntungan dalam menggunakan metode centroid adalah selain mudah dihitung, nilai defuzzifikasinya akan bergerak secara halus sehingga perubahan dari suatu topologi himpunan fuzzy ke topologi berikutnya akan bergerak dengan halus (Kusumadewi, 2002). Derajat keanggotaan pada kondisi DBD didapatkan berdasarkan hasil pemetaan nilai defuzzifikasi pada rentang nilai output seperti yang tertera pada tabel 7. Tabel 7. Selang Nilai Untuk Hasil Output Pada Himpunan Fuzzy Kondisi DBD Rentang Nilai Representasi Fuzzy Hijau 0 <N<1 Tr (0, 0, 0, 1 ) Kuning 1 <N<5 Tr (1, 1, 4, 5 ) Merah 4 < N < 100 Tr (4, 5, 100, 100 ) Data masukkan dan hasil proses (Input dan Output) pada Aplikasi DBD dapat dilihat pada tabel 8. 51 BAB V IMPLEMENTASI SISTEM Implementasi merupakan tahap peletakan sistem sehingga sistem siap dioperasikan. Tahap ini meliputi implementasi datamining untuk mencari aturan – aturan sebagai dasar inferensi, implementasi proses inferensi dengan menggunakan logika fuzzy, antarmuka untuk memasukkan data, dan terakhir adalah implementasi keluaran berupa prediksi DBD dan tatalaksananya. 5.1. Implentasi Sistem Proses pencarian aturan – aturan yang akan digunakan dalam membangun sistem ini dibangun dengan menggunakan datamining pada DBMS Oracle 9i. Selanjutnya aturan hasil datamining akan digunakan dalam proses inferensi fuzzy yang dibangun dengan perangkat lunak Matlab versi 7.0 R 14. Untuk mendapatkan hasil prediksi dari tahun selanjutnya akan digunakan perangkat lunak Minitab R 11 dengan sub sistem Metode Winter’s. Pengembangan aplikasi DBD memerlukan perangkat keras yang mendukung perangkat lunak yang digunakan, sehingga sistem ini dapat berjalan sesuai dengan fungsinya. • Spesifikasi perangkat keras yang digunakan : - Prosesor Intel Pentium IV atau yang setara - RAM 128 Mb atau lebih - Hard disk 20Gb atau lebih - CD-Rom 8x atau lebih - VGA Card 16 Mb atau lebih - Monitor resolusi minimal 800 x 600 pixel - Keyboard dan Mouse • Spesifikasi perangkat lunak yang digunakan : - OS Windows 98/ 2000 / XP - Matlab versi 7.0 - Minitab R 11 52 5.2. Pembangunan Sistem Data mining Pembangunan sistem data mining dengan algoritma CPAR menggunakan PL/SQL. Pada penelitian ini digunakan DBMS Oracle 9i. Pada tahap awal data yang berasal dari data BMG berupa data suhu, curah hujan, penyinaran matahari dan kelembaban udara rata – rata per minggu dan data DBD, diubah ke dalam bentuk kategori dengan ketentuan seperti pada tabel berikut dan selanjutnya dirubah menjadi data dalam bentuk diskrit. Data wilayah yang sudah dalam bentuk diskrit selanjutnya ditransformasi ke dalam bentuk array dua dimensi dan dilakukan proses cleaning dengan menghapus baris-baris yang tidak lengkap. Pada proses pembuatan sistem data mining sebagai contoh dipilih 20 baris sebagai data training. (secara lengkap ditampilkan pada lampiran 4). Berikut adalah contoh sampel data yang telah dirubah kedalam bentuk diskrit : Tabel 9 : Tabel Diskrit Untuk Wilayah Jakarta Selatan Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Temperatur (oC) 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 Curah hujan (mm) 4 5 4 4 5 5 6 4 4 6 4 5 4 4 5 6 4 Sinar matahari (%) Kelembaban(%) 10 14 9 14 9 14 9 14 9 14 9 14 9 14 9 14 10 13 9 14 9 14 10 14 11 13 10 14 10 13 11 13 10 14 DBD 15 15 15 16 16 16 16 16 16 16 16 16 16 16 16 16 15 5.2.1. Pembentukan Sampel Positif dan Sampel Negatif Kolom terakhir pada sampel data menunjukkan kelas. Angka 15 menunjukkan kelas DBD pada kondisi kuning dan 16 menunjukkan kelas DBD pada kondisi merah. Data training kemudian dipisahkan menjadi sampel positif (data kejadian DBD pada kondisi merah) dan sampel negatif (data kejadian DBD 53 pada kondisi kuning). Sampel data positif diberikan dalam Tabel 10, sedangkan sampel negatif diberikan dalam Tabel 11. Tabel 10 : Sampel Data Positif Minggu 4 5 6 7 8 9 10 11 12 13 14 15 16 Suhu (oC) 3 3 3 2 3 3 3 3 3 3 3 3 3 Curah hujanmm) 4 5 5 6 4 4 6 4 5 4 4 5 6 Sinar matahari(%) 9 9 9 9 9 10 9 9 10 11 10 10 11 Kelembaban (%) 14 14 14 14 14 13 14 14 14 13 14 13 13 DBD 16 16 16 16 16 16 16 16 16 16 16 16 16 Tabel 11 : Tabel Ssampel Negatif Minggu 1 2 3 17 Suhu (oC) 3 3 3 3 Curah hujan(mm) 4 5 4 4 Sinar matahari (%) 10 9 9 10 Kelembaban (%) 14 14 14 14 DBD 15 15 15 15 5.2.2. Pembentukan Basis Aturan / Rule Base Setelah di kelompokkan kedalam sampel positif dan negatif, dan dibentuk dalam array 2 (dua) dimensi, selanjutnya pada data tersebut ditentukan aturan yang akan di cari, jika aturan yang ingin dicari adalah pada DBD kondisi kuning maka sesuai dengan aturan yang telah ditetapkan, maka kita masukkan data: Kondisi DBD = (jumlah data negatif, jumlah data posif, bobot). - Jumlah data negatif / positif sesuai dengan wilayah yang akan di prediksi - Bobot yang dimasukkan 0.1 s/d 1 Dari hasil pemasukkan data (61,36,0.99) dan (61,36, 0.8) untuk wilayah Jakarta Selatan, dapat dilihat pada tabel berikut ini. (data selengkapnya dapat dilihat pada lampiran 5 ) 54 Tabel 12. Hasil Pemasukkan Data Untuk Wilayah Jakarta Selatan 61,36,0.99 1 2 3 61,36,0.8 1 1 13 11 4 Kuning Kuning Kuning 0.64 0.61 0.45 13 11 Kuning Kuning 0.64 0.61 Dari data tersebut dapat diterjemahkan sebagai berikut : Kolom 1 menunjukkan keterkaitan antar data, jika angka pada kolom 1 menunjukkan nilai yang berkelanjutan, contoh 1, 2, 3 artinya antar data tersebut tidak berkaitan sehingga kaidah aturan yang digunakan adalah IF 1 Then. Sedangkan jika angka pada kolom 1 menunjukkan perulangan, contoh 1, 1, 2, 3,3 berarti 1 dan 1 ada keterkaitan data, dimana kaidah aturannya IF 1 and 1 Then , untuk 2 mempunyai kaidah aturan hanya IF 2 Then, sedangkan untuk 3 dan 3 mempunyai kaidah aturan IF 3 and 3 Then. Kolom 2 menunjukkan nilai diskrit dari atribut data yang digunakan, agar dapat diaplikasikan, nilai ini selanjutnya akan dikembalikan kedalam nilai kontinyu. Kolom 3 menunjukkan kondisi DBD . Kolom 4 menunjukkan tingkat keakurasian dari aturan tersebut. Sehingga dari data pada tabel 12 dapat dibaca sebagai berikut : Untuk data (61, 36, 0.99) If 13 then kuning (dengan tingkat keakurasian / Laplace akurasi : 0.64 %); If 11 then kuning (dengan tingkat keakurasian : 0.61 %); If 4 then kuning (dengan tingkat keakurasian : 0.45 %). Untuk data (61, 36, 0.8) Hasil yang diperoleh dapat dibaca sebagai berikut : If 13 and 11 then kuning (dengan tingkat keakurasian : 0.63 %) Hasil yang didapat dari pemasukkan beberapa data tersebut, dicari hasil dengan tingkat akurasian yang paling tinggi, sehingga dari data tersebut dapat digunakan sebagai dasar pembuatan basis aturan / rule base dari pola keterkaitan antara data suhu, curah hujan, penyinaran matahari, kelembaban dan data DBD. 55 5.3. Program Aplikasi 5.3.1. Input Sistem Untuk memudahkan penggunaan aplikasi oleh pemakai maka dibuat program antarmuka yang dibangun dengan menggunakan modus grafik. Dua proses yang digunakan yaitu proses prediksi diagnosa dan proses terapi. Aturan untuk kedua proses tersebut dibangun berdasarkan hasil proses data mining dan diperkuat oleh pendapat pakar Adapun fungsi-fungsi yang dimiliki oleh aplikasi ini adalah: A. Aplikasi Prediksi data tahunan 1. Memasukkan data melalui papan ketik yang meliputi: suhu, curah hujan, penyinaran matahari dan kelembaban . Data yang dimasukkan adalah data rata – rata mingguan selama 1 tahun / 52 minggu. Gambar 19. Tabel data selama 1 tahun 2. Menampilkan hasil dari prediksi dengan mode grafik. Grafik yang akan ditampilkan sebanyak 2 gambar, sehingga dapat dilakukan prediksi oleh pengguna 56 Gambar 20. Grafik selama 2 tahun B. Aplikasi Prediksi Penyebaran DBD 1. Memilih lokasi / wilayah yang akan dilakukan prediksi, untuk saat ini hanya terdapat 2 (dua) pilihan, yaitu Jakarta Selatan dan Jakarta Pusat. Jika tidak dilakukan pilihan oleh pengguna, maka default yang akan digunakan oleh aplikasi ini adalah Jakarta Selatan. 2. Memilih status pengguna, yang terdiri dari : Dokter umum, Puskesmas, Sudinkesmas, Dinkes 3. Memasukkan data melakui papan ketik yang meliputi: suhu, curah hujan, penyinaran matahari dan kelembaban. Salah satu hal yang harus dicatat adalah data yang akan dimasukkan kedalam aplikasi ini adalah data rata – rata mingguan. 4. Melakukan prediksi penyebaran DBD. Hasil prediksi ini berupa kemungkinan antara merah dan kuning. Aturan yang digunakan untuk melakukan prediksi penyebaran DBDini diambil dari hasil proses data mining menggunakan algoritma CPAR. 57 Gambar 21. Antar muka Aplikasi DBD 5. Memberikan langkah – langkah tindakan preventif / tatalaksana DBD. Dari hasil prediksi penyebaran DBD akan diberikan langkah – langkah tindakan preventif yang disesuaikan dengan status dari pengguna aplikasi iniAplikasi Prediksi Penyebaran DBD Gambar 22. Tatalaksana Berdasarkan SOP Dinkes DKI Jakarta 58 Proses Evaluasi Sistem Dalam proses evaluasi, sistem Aplikasi DBD menggunakan 4 (empat) atribut data cuaca yang akan dipakai sebagai data masukkan, dan 2 (dua) klas kondisi DBD yang akan menentukan kondisi DBD berdasarkan kondisi cuaca yang dimasukkan kedalam sistem ini. Pengembangan aplikasi ini menggunakan proses inferensi. Proses inferensi yangdigunakan dalam proses evaluasi sistem pakar Aplikasi DBD adalah model fuzzy Mamdani, yang terdiri dari fuzzifikasi, operasi fuzzy, metode implikasi, metode agregasi dan defuzzifikasi. Prose evaluasi sistem Aplikasi DBD dilakukan dengan menggunakan perangkat lunak Matlab 7.0 R 14. Evaluasi aturan fuzzy yang terbentuk dari aturan – aturan berdasarkan atribut data cuaca, akan diubah menjadi satu harga numerik untuk menentukan tindakan dari hasil keluaran (output), proses ini dikenal dengan proses defuzzifikasi. Metode deffuzikasi yang digunakan adalah metode centroid. Sistem inferensi fuzzy dibangun dengan menggunakan FIS editor pada fuzzy logic toolbox Matlab 7.0. FIS editor untuk data atribut cuaca dan klas kondisi DBD ditampilkan pada gambar 23 Gambar 23. FIS Editor Untuk Data Atribut Cuaca dan Kondisi DBD, Wilayah Jakarta Selatan 59 Terdapat 3 (tiga ) proses yang dilakukan oleh sistem pada proses evaluasi sistem, yaitu proses masukkan (input), proses evaluasi, proses keluaran (output). 5.3.2.1. Proses Input Pada proses input, system akan memproses data yang dimasukkan oleh pengguna dan dibuat menjadi dinamic link library (dll), sehingga dapat digunakan oleh system lainnya. Berikut adalah gambar membership function editor untuk data cuaca yang digunakan pada perangkat lunak Matlab 7.0 Gambar 24. Membership Function Untuk Atribut Suhu. 60 Gambar 25. Membership Function Untuk Atribut Curah Hujan. Gambar 26. Membership Function Untuk Atribut Matahari. 61 Gambar 27. Membership Function Atribut Kelembaban. 5.3.2.2. Proses Evaluasi Representasi pengetahuan secara sistematis untuk menentukan kondisi DBD dibuat menggunakan kaidah yang didefinisikan dengan aturan yang dinyatakan dalam bentuk IF – THEN. Secara umum dengan menggunakan prinsip – prinsip penyusunan komposisi aturan, dari atribut cuaca yang terdiri dari suhu ( terdiri dari 3 atribut), Curah hujan (5 atribut), Penyinaran matahari (3 atribut) dan Kelembaban udara (3 atribut), dan Kondisi DBD (3 atribut) maka didapatkan aturan sebanyak 405 aturan / kecamatan, sehingga untuk 18 kecamatan akan menghasilkan 7290 aturan. Berikut adalah sebagian dari aturan – aturan yang disusun secara konvensional dalam menentukan kondisi DBD berdasarkan atribut cuaca : 1. If (suhu is rendah) and (curah hujan is sangat rendah) and (matahari is rendah) and (kelembaban is kering ) then (kondisi DBD is kuning). 2. If (suhu is rendah) and (curah hujan is sangat lebat) and (matahari is rendah) and (kelembaban is kering) then (kondisi DBD is merah). 62 3. If (suhu is tinggi) and (curah hujan is sangat rendah) and (matahari is penuh) and (kelembaban is normal) then (kondisi DBD is hijau). Aturan – aturan tersebut digunakan dalam proses evaluasi, akan tetapi dari 405 aturan tersebut, tidak semua dapat dipergunakan dalam menentukan kondisi DBD. Dengan adanya aturan yang dihasilkan oleh datamining, maka dari 405 aturan tersebut, dapat di pilih aturan mana yang mempunyai keakurasian tertinggi dalam menentukan kemungkinan kondisi DBD disuatu wilayah. Dari 405 aturan tersebut dapat di reduksi menjadi 22 aturan untuk wilayah Jakarta Selatan dan 29 aturan untuk wilayah Jakarta Pusat. Berikut adalah gambar rule editor atau tampilan aturan yang digunakan dalam membangun prediksi kondisi DBD pada perangkat lunak Matlab 7.0, yang didasarkan pada komposisi aturan hasil datamining. Gambar 28. Rule Editor Jakarta Selatan 63 Gambar 29. Rule Editor Jakarta Pusat Berikut adalah gambar rule viewer untuk kondisi DBD, yang digunakan dalam aplikasi DBD pada perangkat lunak Matlab 7.0 64 Gambar 30. Rule Viewer untuk Jakarta Selatan. Gambar 31. Rule Viewer untuk Jakarta Pusat. 65 5.3.2.3. Proses Output Setelah pengguna memasukkan data cuaca yang terdiri dari suhu, curah hujan, kelembaban, dan penyinaran matahari, maka pengguna menekan tombol ”Periksa”, dimana sebagai aksinya, sistem akan memproses data yang telah dimasukkan oleh pengguna. Pengguna akan dapat langsung melihat prediksi kondisi DBD di wilayah tersebut, kuning atau merah. Untuk melihat tindakan yang harus dilakukan sesuai dengan tatalaksana SOP yang telah ditetapkan oleh Dinkes DKI Jakarta, maka pengguna harus menekan tombol ”Lihat Tindakan”. Pengguna dapat mengulang proses pemasukkan data dengan menekan tombol ”Ulangi Lagi”, dan melakukan proses kembali. Gambar 32. Tombol Mendapatkan Output dari Input Data. Output Sistem Pembuatan antarmuka pada sistem Aplikasi DBD menggunakan fasilitas GUI pada Matlab 7.0, Output yang dihasilkan oleh sistem adalah kondisi DBD berdasarkan data cuaca yang dimasukkan oleh pengguna dan hasil proses defuzzifikasi. 66 Prediksi DBD Tahun Selanjutnya Prediksi DBD yang dibangun menggunakan basis aturan, dalam membangun hasil prediksinya adalah berdasarkan data cuaca yang meliputi suhu, kelembaban, penyinaran matahari dan curah hujan. Sehingga untuk memprediksi DBD ditahun selanjutnya agar dapat digunakan sebagai dasar dari tindakan pencegahan dini DBD di wilayah DKI Jakarta diperlukan data cuaca di wilayah yang bersangkutan. Data cuaca yang digunakan dalam membangun basis aturan adalah data cuaca yang telah dicatat oleh dinas BMG. Untuk memprediksi DBD tahun selanjutnya, maka harus digunakan data cuaca hasil dari prediksi data cuaca tahun – tahun sebelumnya, misalnya untuk memprediksi data cuaca tahun 2007, maka digunakan data cuaca tahun 2005 dan 2006. Untuk memprediksi data cuaca ini maka digunakan software Minitab dengan menggunakan metode Winter’s. Metode ini melakukan prediksi data cuaca pada tahun 2007 didasarkan pada data cuaca minimal 2 tahun sebelumnya. Data cuaca akan dimasukkan sebagai data dalam bentuk cell, data tersebut akan digunakan sebagai variabel yang akan diprediksi. Selanjutnya pengguna menentukan panjang periode dari variabel sebelumnya. Pengguna juga menentukan level, trend dan season dan jumlah yang akan diprediksi. Gambar 33. Interface Metode Winter’s 67 Kompleksitas Sistem Kompleksitas merupakan ukuran konerja sebuah algoritma. Kinerja sebuah algoritma tergantung pada faktor internal dan eksternal. Faktor internal yaitu tingkat efisiensi dalam : - Waktu yang digunakan untuk melaksanakan algoritma. - Memori yang diperlukan dalam menjalankan algoritma. Faktor eksternal terdiri dari : - Ukuran input yang digunakan sebuah algoritma. - Kecepatan komputer yang digunakan untuk melaksanakan algoritma. Potongan koding program berikut ini terdapat dalam fungsi banyak_data.m yang digunakan dalam mengolah data masukkan yang diberikan oleh pengguna. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 tahun=get(handles.edit1,'String'); conn = database('hendra', '', ''); curs = exec(conn, ['select * from hendra where tahun = ''', tahun, '''']) curs=fetch(curs); A=curs.Data uA=size(A); if uA(1)>1 for i=1:uA(1) Di eksekusi sebanyak n kali k=1; for j=3:uA(2) Di eksekusi sebanyak m kali B(i,k)=str2num(mat2str(cell2mat(A(i,j)))); k=k+1; End End Secara garis besar potongan koding program diatas terdiri dari 2 iterasi, yaitu pada baris 8 dan 10. Baris 10 iterasi dilakukan sebanyak m kali, dengan kompleksitasnya O(m), akan tetapi karena pada iterasi ini di eksekusi sebanyak n kali, maka kompleksitasnya menjadi O(mn). Secara keseluruhan komplesitas dari program ini adalah O(mn). 68 BAB VI PENGUJIAN DAN PEMBAHASAN 6.1. Mekanisme Pengujian Pengujian dilakukan terhadap model data mining yang dibangun. Tujuan pengujian adalah untuk menemukan model yang ideal. Sebelum dilakukan pengujian terlebih dahulu dilakukan pembentukan model. Pembentukan model menggunakan data training adapun pengujian model menggunakan data testing. Data training dan data testing memuat informasi tentang data input berupa suhu udara, curah hujan, penyinaran matahari, kelembaban udara dan data output berupa kondisi DBD (pada kondisi hijau, kuning, atau kondisi merah). Model yang sudah terbentuk dibandingkan dengan hasil pengujian pada data testing. Semakin sama hasil perbandingan output kedua model berarti model semakin akurat. Pengujian dilakukan terhadap data training dengan mengambil data sampel berdasarkan prosentase. Pada kedua kelompok data tersebut algoritme data mining digunakan untuk mencari pola-pola dari nilai yang diprediksi. Selanjutnya model diperbaiki dengan menggunakan sampel data lain agar tidak hanya bisa bekerja dengan data training. 6.2. Pembentukan Model Dengan Data Training Proses pembentukan model data mining menggunakan algoritme CPAR. Pembentukan dilakukan dengan mengambil sebanyak 202 sampel (tahun 2004 – 2005), dari sampel tersebut 105adalah berasal dari data DBD untuk wilayah Jakarta Pusat dan 97 berasal dari data wilayah Jakarta Selatan. Data tersebut adalah kejadian DBD di suatu kecamatan di wilayah tersebut, dalam hal ini untuk wilayah Jakarta pusat terdapat 8 (delapan) kecamatan, sedangkan Jakarta selatan 10 (sepuluh) kecamatan. Dari data rata – rata ini diklasifikasikan kedalam pembagian kondisi DBD (hijau, kuning dan merah) yang telah disepakati bersama. Karakteristik sampel data bisa dilihat pada Tabel 13 dan 14, sedangkan pada Tabel 15 dan 16 adalah Nilai rata-rata kasus DBD per kecamatan per wilayah 69 Tabel 13 . Data Survalaince DBD Tahun 2005 Minggu 1 - 14 Minggu Jakarta Pusat Jakarta Selatan 1 25 29 2 30 49 3 42 78 4 50 74 5 54 102 6 71 140 7 98 192 8 87 149 9 67 124 10 44 110 11 35 71 12 37 69 13 44 68 12 182 231 13 127 154 14 39 58 Tabel 14. Data Survailance DBD Tahun 2004 Minggu 1 – 14 Minggu Jakarta Pusat Jakarta Selatan 1 41 40 2 36 78 3 35 103 4 55 112 5 57 138 6 90 173 7 102 170 8 260 421 9 438 652 10 417 636 11 272 318 Tabel 15. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2005 Minggu Jakarta Pusat Jakarta Selatan 1 3 3 2 4 5 3 5 8 4 6 7 5 7 10 6 9 14 7 12 19 8 11 15 9 8 12 10 6 11 11 4 7 12 5 7 13 6 7 14 5 6 Tabel 16. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2004 Minggu Jakarta Pusat Jakarta Selatan 1 5 4 2 5 8 3 4 10 4 7 11 5 7 14 6 11 17 7 13 17 8 33 42 9 55 65 10 52 64 11 34 32 12 23 23 13 16 15 14 10 16 Hasil proses data mining dari 97 sampel pada wilayah Jakarta Selatan Kecamatan Kebayoran Baru, dengan berbagai variasi gain similarity ratio (GSR) dapat dilihat pada Tabel 17 sampai dengan Tabel 21 Tabel 17. Aturan Data Training Dengan GSR 99% No. 1 2 3 4 5 6 Aturan IF Kelembaban udara tinggi / basah (>75%) Then Merah IF Penyinaran matahari sedang (35% - 70%) Then Merah IF Curah hujan rendah 5-20mm Then Merah IF Kelembaban udara Normal (60% - 75%) Then Kuning IF Penyinaran matahari penuh (> 70%) Then Kuning IF Curah hujan sangat rendah (<5mm) Then Kuning Akurasi Laplace 0.71 0.71 0.7 0.64 0.61 0.45 Data pada Tabel 17. pada Gain similarity 99% didapatkan sebanyak 6 baris aturan, data tersebut menunjukkan bahwa aturan IF Kelembaban udara tinggi / basah (>75%) Then Merah serta IF Penyinaran matahari sedang (35% - 70%) Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah , 14 83 161 70 sebesar 71%, ini berarti pada kelembaban udara tinggi / basah dan pada penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang, Aturan IF Kelembaban udara Normal (60% - 75%) Then Kuning mempunyai Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 64%. Ini berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya kelembaban udara berkisar pada 60% - 75%, situasi ini masih memungkinkan nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara >75%. Tabel 18. Aturan Data Training Dengan GSR 80% No. 1 2 3 4 5 Aturan IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang (35 - 70%) Then Merah IF Curah hujan rendah (5-20mm) Then Merah IF Kelembaban udara Normal (60% - 75%) Then Kuning IF Penyinaran matahari penuh (> 70%) Then Kuning IF Curah hujan sangat rendah (<5mm) Then Kuning Akurasi Laplace 0.71 0.7 0.64 0.61 0.45 Pada tabel 18, dengan gain similarity 80% didapatkan 5 baris aturan, dari data tersebut, aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% – 70 %) Then Merah, mempunyai tingkat keakurasian 71%, ini berarti pada kondisi kelembaban udara tinggi yang disertai dengan penyinaran matahari sedang sangat memungkinkan terjadi DBD pada kondisi merah. Sedangkan pada aturan yang menhasilkan kondisi DBD kuning terdapat 3 aturan yang sama dengan gain similarity 99 % 71 Tabel 19. Aturan Data Training Dengan GSR 60% No. Aturan Akurasi Laplace 1 2 IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang ( 35% - 70%) Then Merah IF Curah hujan rendah 5-20mm Then Merah IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh ( > 70%) Then kuning 0.71 0.70 3 0.63 Pada tabel 19, dengan gain similarity rasio 60%, didapatkan aturan untuk DBD pada kondisi merah sama dengan pada gain similarity 80%, akan tetapi untuk kondisi kuning, didapatkan suatu aturan IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh (> 70%) Then kuning, sehingga jika pada saat kondisi kelembaban udara normal dan penyinaran matahari penuh, maka dapat terjadi DBD dengan jumlah pasien 1-5 orang per kecamatan. Tabel 20. Aturan Data Training Dengan GSR 20% No. 1 2 3 Aturan IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh (> 70%) Then kuning IF Curah hujan sangat rendah (<5mm) Then Kuning Akurasi Laplace 0.71 0.63 0.45 Pada Gain similarity 20 %, didapatkan 3 aturan, 1 aturan untuk kondisi merah, yaitu aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah, dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku pada gain similarity ini adalah aturan IF Curah hujan sangat rendah (<5mm) Then Kuning, akan tetapi tingkat keakurasiannya hanya 45%. 72 Tabel 21. Aturan Data Training Dengan GSR 10% No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang ( 35 - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Temperatur sedang (24oC – 27oC ) then Merah 0.71 2 3 4 5 0.65 IF Kelembaban udara Normal (60%- 75%) and Penyinaran matahari penuh ( > 70%) Then Kuning IF Curah hujan sangat rendah (<5mm) Then Kuning IF temperatur tinggi (> 27oC ) Then Kuning 0.63 0.45 0.40 Pada gain similarity 10% didapatkan 5 baris aturan, dimana terdapat 2 aturan untuk kondisi merah dan 3 aturan untuk kondisi kuning. Untuk merah terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak didapatkan, yaitu pada temperature sedang (24oC – 27oC) juga memungkinkan untuk terjadi DBD pada kondisi merah, akan tetapi hal ini hanya akan terjadi jika kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 %. Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan terjadi jika kondisi Temperatur Tinggi (>27oC), kemungkinan hal ini terjadi dan mempengaruhi adalah sebesar 40%. 6.3. Pelatihan Dengan Data Testing Pelatihan dengan data testing dilakukan dengan mengambil data cuaca sebanyak 52 minggu untuk wilayah Jakarta Selatan dan 52 minggu untuk wilayah Jakarta Pusat. Karakteristik sampel data bisa dilihat pada Tabel 22. Karakteristik umum data testing wilayah Jakarta Selatan, dan Tabel 23. Data DBD untuk wilayah Jakarta Selatan. 73 Tabel 22. Data Testing Untuk Wilayah Jakarta Selatan Minggu Suhu (oC) Kelembaban(%) Radiasi (%) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 27.1 26.8 25.9 26.0 26.9 27.2 27.9 27.0 26.8 28.0 26.8 27.5 27.7 26.8 83.3 85.1 88.9 78.0 85.8 83.4 84.1 84.9 86.9 76.0 82.7 84.9 85.1 88.0 41.0 73.9 31.0 15.7 36.8 42.4 26.7 25.9 26.9 76.6 22.0 49.0 55.9 50.0 Curah Hujan (mm) 7.0 11.2 13.8 19.1 9.5 7.7 15.3 10.2 1.3 0.4 4.1 15.5 1.2 7.6 Tabel 23. Data DBD Untuk Wilayah Jakarta Selatan Minggu DBD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 179 227 171 132 126 148 161 186 149 142 165 182 119 174 Rata-rata DBD 17.9 22.7 17.1 13.2 12.6 14.8 16.1 18.6 14.9 14.2 16.5 18.2 11.9 17.4 Dari data yang akan digunakan pada tahun 2004 – 2005, untuk wilayah Jakarta Selatan 65% berada dalam kondisi kuning, 35% berada dalam kondisi merah. Untuk wilayah Jakarta Pusat, 85% kondisi kuning dan 15% kondisi merah. 6.4. Pembahasan Berdasarkan dari data yang digali menggunakan datamining, didapatkan beberapa aturan antara lain (untuk wilayah Jakarta Selatan) : Untuk kondisi merah 1. Kelembaban udara tinggi (> 75%) maka kondisi DBD merah 2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah 3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah 74 4. Temperatur sedang (24oC – 27oC) maka kondisi merah Jika dikaitkan dengan nyamuk Aedes aegypti sebagai vektor / pembawa virus DBD, maka hal ini dapat diterangkan sebagai berikut : Nyamuk Aedes aegypti adalah nyamuk khas daerah tropis, nyamuk ini menyenangi kondisi udara yang kelembabannya sedang – tinggi, sinar matahari tidak terlalu panas, suhu udara berkisar antara 24oC – 27oC dan untuk berkembang biak nyamuk ini membutuhkan media air yang bersih, biasanya nyamuk ini akan bertelur dia kolam, tempat – tempat yang dapat menampung air hujan, dll asalkan air tersebut cukup bersih. Berdasarkan dari aturan yang didapat dari penggalian datamining, maka kondisi tersebut semua terpenuhi, dengan kata lain pada kondisi tersebut, nyamuk akan berkembang biak sehingga akan timbul jentik – jentik nyamuk, dan nyamuk akan bergerak secara aktif. Pada saat bergerak inilah nyamuk akan menyebarkan virus DBD ke manusia. Berdasarkan pada prediksi ini maka, bagi pihak – pihak yang berwenang seharusnya segera mengambil langkah tindakan / tatalaksana sesuai SOP yang ada guna menghilangkan kemungkinan menyebarnya nyamuk Aedes Aegypti. Untuk kondisi kuning, 1. Kelembaban udara normal (60% - 75%) then kuning 2. Penyinaran matahari penuh(>70%) then kuning 3. Curah hujan sangat rendah (< 5mm) then kuning 4. Temperatur tinggi (> 27oC) then kuning Dari aturan yang didapat, jika dikaitkan dengan berkembang biak dan bergeraknya nyamuk Aedes Aegypti, maka sesuai dengan syarat / kondisi cuaca yang digemari oleh nyamuk tersebut, maka pada kondisi yang ada pada aturan ini pun nyamuk Aedes Aegypti pun masih cukup menyenangi untuk bergerak dan untuk berkembang biak, akan tetapi karena ada salah satu kondisi cuaca dimana suhu cukup tinggi (> 27oC), dimana nyamuk pada suhu ini tidak terlalu menyenangi, biasanya pada suhu ini mereka berkumpul ditempat yang cukup teduh, misalnya di pepohonan, sehingga walaupun nyamuk masih memungkinkan untuk bergerak tetapi tidak seaktif pada kondisi sebelumnya. 6.5. Penerapan Aplikasi DBD Per Kecamatan Aplikasi DBD yang telah dibahas sebelumnya adalah aplikasi DBD yang dibangun untuk wilayah kabupaten, dalam hal ini adalah Jakarta Pusat dan Jakarta 75 Selatan. Dari hasil prediksi tersebut dapat diketahui kemungkinan terjadinya wabah DBD diwilayah tersebut, akan tetapi terdapat kekurangan dari aplikasi penerapan per kabupaten tersebut, yaitu tenaga pelaksana di lapangan tidak mengetahui titik / lokasi awal dari penyebaran wabah DBD tersebut. Untuk meminimalisasi kekurangan tersebut, dicoba untuk menerapkan aplikasi tersebut sampai pada tingkat kecamatan. Kecamatan di wilayah Jakarta Pusat terdiri dari 8 kecamatan, yaitu: Cempaka putih, Gambir, Johar baru, Kemayoran, Menteng, Sawah besar, Senen, Tanah abang. Sedangkan di wilayah Jakarta Selatan terdiri dari 10 kecamatan, yaitu : Cilandak, Jagakarsa, Kebayoran baru, Kebayoran Lama, Mampang prapatan, Pancoran, Psr.Minggu, Pesanggrahan, Setia budi, Tebet. Data kejadian DBD di tiap – tiap kecamatan inilah yang akan dikaitkan dengan variable dari cuaca, untuk mendapatkan aturan – aturan yang nantinya dapat digunakan dalam memprediksi DBD di tiap – tiap kecamatan tersebut. Dalam pembahasan ini akan dibahas 2 kecamatan dari wilayah Jakarta Selatan yaitu Kecamatan Kebayoran Baru dan Tebet. Dasar pemilihan pembahasan 2 wilayah ini adalah karena berdasarkan data survailance, untuk wilayah Kebayoran Baru, prevelensi terjadinya kondisi Hijau selama tahun 2004 – 2005 paling banyak yaitu 17 minggu, sedangkan di kecamatan Tebet, kondisi hijau tidak pernah terjadi, artinya wabah DBD selalu terjadi di wilayah ini. 6.5.1. Pembentukan Model Dengan Data Training Seperti dalam langkah sebelumnya, pembentukan model data mining dilakukan dengan menggunakan algoritma CPAR. Data cuaca yang digunakan adalah data cuaca pada tahun 2004 – 2005 pada wilayah Jakarta Pusat dan Jakarta Selatan. Data yang digunakan sebanyak 16.285 sampel (data kejadian tahun 2004 – 2005 ), yang terdiri dari 5.932 sampel untuk Jakarta Pusat, 10.353 sampel untuk Jakarta Selatan. Dari sample data tersebut diklasifikasikan kedalam pembagian kondisi DBD (hijau, kuning, merah). Karakteristik sampel data dapat dilihat pada tabel 24 dan 25 untuk masing – masing wilayah. 76 Tabel 24. Data Survailance DBD Tahun 200 Untuk Kecamatan Wil. Jak-Pus Minggu KECAMATAN Cempaka Putih Gambir Johar baru Kemayoran Menteng Sawah Besar Senen Tanah Abang 1 1 3 0 7 4 3 1 6 2 6 2 2 3 5 7 1 4 3 6 5 3 4 5 5 2 12 4 4 3 8 8 8 11 2 6 5 7 8 4 8 3 5 10 9 6 10 9 9 10 12 2 5 14 7 12 12 11 16 16 14 9 8 Tabel 25. Data Survailance Tahun 2005 Untuk Kecamatan Wil. Jak-Sel Minggu KECAMATAN Cilandak Jagakarsa Kebayoran baru Kebayoran lama Mampang Pancoran Psr. Minggu Pesanggrahan Setia budi Tebet 1 3 2 2 8 1 5 2 0 0 6 2 4 3 5 7 3 5 8 3 4 7 3 7 5 9 10 8 5 7 6 2 19 4 9 9 16 14 4 5 3 2 5 7 5 11 10 6 17 4 10 16 4 7 17 6 21 14 15 17 5 12 28 2 7 19 7 10 24 16 27 13 20 23 13 13 33 Hasil proses data mining dari 10.353 sampel pada wilayah kecamatan di Jakarta Selatan, dengan berbagai variasi gain similarity rasio (GSR),pada kecamatan Kebayoran baru dapat dilihat pada tabel 26 – 28. Sedangkan untuk kecamatan Tebet dapat dilihat pada tabel 29 -32. Tabel 26. Aturan Data Training Dengan GSR 99 % No. 1 2 3 4 5 6 7 8 9 Aturan IF Kelembaban udara tinggi / basah ( >75%) Then Merah IF Penyinaran matahari sedang (35% - 70%) Then Merah IF Curah hujan rendah 5-20mm Then Merah IF Kelembaban udara Normal (60% - 75%) Then Kuning IF Penyinaran matahari penuh ( > 70%) Then Kuning IF Curah hujan rendah (5-20mm) Then Kuning IF Penyinaran matahari penuh (>70%) Then Hijau IF Temperatur tinggi ( > 27o C) Then Hijau IF Curah Hujan Sangat Rendah (< 5 mm) Then Hijau Akurasi Laplace 0.71 0.71 0.7 0.71 0.64 0.64 0.71 0.71 0.71 77 pada Gain similarity 99% didapatkan sebanyak 9 baris aturan, dari aturan tersebut dapat dilihat bahwa aturan IF Kelembaban udara tinggi / basah (>75%) Then Merah serta IF Penyinaran matahari sedang (35% - 70%) Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah , sebesar 71%, ini berarti pada kelembaban udara tinggi / basah dan pada penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang. Aturan IF Kelembaban udara Normal (60% - 75%) Then Kuning mempunyai Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 71%. Ini berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya kelembaban udara berkisar pada 60% - 75%, situasi ini masih memungkinkan nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara >75%. Selain itu pada kondisi DBD hijau, aturan yang memungkin terjadinya kondisi ini adalah IF Temperatur tinggi ( > 27o C) Then Hijau dan IF Curah Hujan Sangat Rendah (< 5 mm) Then Hijau mempunyai Akurasi Laplace sama kuatnya yaitu 71%, hal ini berarti pada kondisi tersebut kemungkinan nyamuk untuk berkembang biak sangat kecil. Tabel 27. Aturan Data Training Dengan GSR 20 % No. 1 2 3 4 Aturan IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh (> 70%) Then kuning IF Curah hujan rendah (5-20mm) Then Kuning IF Penyinaran matahari penuh (>70%) and Temperatur tinggi (> 27o C) and Curah hujan sangat rendah ( < 5mm) Then Hijau Akurasi Laplace 0.71 0.64 0.64 0.71 Pada Gain similarity 20 %, didapatkan 4 aturan, 1 aturan untuk kondisi merah, yaitu aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah, dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah 78 sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku pada gain similarity ini adalah aturan IF Kelembaban udara Normal (60% 75%) and Penyinaran matahari penuh (> 70%) Then kuning, dengan tingkat keakurasian 63%, maka pada kondisi dimana kelembaban udara normal dan penyinaran matahari penuh, nyamuk Aedes aegypti, tidak terlalu aktif untuk bergerak, karena kondisi cuaca yang tidak disenangi oleh nyamuk ini, sehingga penyebaran vektor dari DBD pun agak berkurang, untuk aturan IF Curah hujan sangat rendah (<5mm) Then Kuning, juga turut mempengaruhi dengan tingkat keakurasiannya hanya 64%, Pada aturan ke 4 didapat aturan untuk kondisi hijau, IF Penyinaran matahari penuh (>70%) and Temperatur tinggi (> 27o C) and Curah hujan sangat rendah (< 5mm) Then Hijau dengan tingkat keakurasian 71%, berdasarkan aturan ini, jika semua terpenuhi maka nyamuk Aedes Aegypti benar – benar dalam keadaan pasif atau tidak bergerak. Hal ini lebih disebabkan karena kondisi cuaca yang panas dimana pada kondisi ini nyamuk ini tidak menyenanginya. Tabel 28. Aturan Data Training Dengan GSR 10 % No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi / basah ( >75%) and Penyinaran matahari sedang ( 35 - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Temperatur sedang ( 24oC – 27oC ) then Merah 0.71 2 3 4 5 6 7 0.65 IF Kelembaban udara Normal (60%- 75%) and Penyinaran matahari penuh ( > 70%) Then Kuning IF Curah hujan rendah (5-20mm) Then Kuning IF temperatur tinggi ( > 27oC ) Then Kuning IF Penyinaran matahari penuh (>70%) and Temperatur tinggi ( > 27o C) and Curah hujan sangat rendah ( < 5mm) Then Hijau IF Kelembaban normal ( 60%-75%) Then Hijau 0.64 0.64 0.40 0.71 0.45 Pada gain similarity 10% didapatkan 7 baris aturan, dimana terdapat 2 aturan untuk kondisi merah, 3 aturan untuk kondisi kuning dan 2 aturan untuk kondisi hijau. Untuk merah terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak didapatkan, yaitu pada temperature sedang (24oC – 27oC) juga memungkinkan untuk terjadi DBD pada kondisi merah, akan tetapi hal 79 ini hanya akan terjadi jika kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 %. Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan terjadi jika kondisi Temperatur Tinggi (>27oC), akan tetapi karena kemungkinan hal ini terjadi dan mempengaruhi adalah sebesar 40%, maka hal ini dapat di abaikan. Sedangkan pada kondisi hijau terdapat tambahan aturan kondisi kelembaban normal, dengan keakurasian 45%. Kondisi kelembaban normal yang mempengaruhi kondisi DBD hijau sebelumnya juga muncul pada kondisi DBD kuning dengan keakurasian 63%, lebih dominan pengaruhnya pada kondisi DBD hijau, sehingga untuk kondisi Kelembaban normal pada kondisi DBD hijau dapat diabaikan. Tabel 29. Aturan Data Training Dengan GSR 99% No. 1 2 3 4 5 6 Aturan IF Kelembaban udara tinggi / basah (>75%) Then Merah IF Penyinaran matahari sedang (35% - 70%) Then Merah IF Curah hujan rendah 5-20mm Then Merah IF Kelembaban udara Normal (60% - 75%) Then Kuning IF Penyinaran matahari penuh ( > 70%) Then Kuning IF Curah hujan sangat rendah (<5mm) Then Kuning Akurasi Laplace 0.71 0.71 0.7 0.64 0.61 0.45 Data pada Tabel 29. pada Gain similarity 99% didapatkan sebanyak 6 baris aturan, data tersebut menunjukkan bahwa aturan IF Kelembaban udara tinggi / basah ( >75%) Then Merah serta IF Penyinaran matahari sedang (35% - 70%) Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah , sebesar 71%, ini berarti pada kelembaban udara tinggi / basah dan pada penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang, Aturan IF Kelembaban udara Normal (60% - 75%) Then Kuning mempunyai Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 64%. Ini berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh 80 nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya kelembaban udara berkisar pada 60% - 75%, situasi ini masih memungkinkan nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara >75%. Tabel 30. Aturan Data Training Dengan GSR 60% No. Aturan Akurasi Laplace 1 2 IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% - 70%) Then Merah IF Curah hujan rendah 5-20mm Then Merah IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh ( > 70%) Then kuning 0.71 0.70 3 0.63 Pada tabel 30, dengan gain similarity rasio 60%, didapatkan aturan untuk DBD pada kondisi merah sama dengan pada gain similarity 80%, akan tetapi untuk kondisi kuning, didapatkan suatu aturan IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh ( > 70%) Then kuning, sehingga jika pada saat kondisi kelembaban udara normal dan penyinaran matahari penuh, maka dapat terjadi DBD dengan jumlah pasien 1-5 orang per kecamatan. Tabel 31. Aturan data training dengan Gain similarity ratio 20% No. 1 2 3 Aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Kelembaban udara Normal (60% - 75%) and Penyinaran matahari penuh (> 70%) Then kuning IF Curah hujan sangat rendah (<5mm) Then Kuning Akurasi Laplace 0.71 0.63 0.45 Pada Gain similarity 20 %, didapatkan 3 aturan, 1 aturan untuk kondisi merah, yaitu aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah, dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku pada gain similarity ini adalah aturan IF Curah hujan sangat rendah (<5mm) 81 Then Kuning, akan tetapi tingkat keakurasiannya hanya 45%, sehingga dapat diabaikan. Tabel 32. Aturan Data Training Dengan GSR 10% No. 1 Aturan Akurasi Laplace IF Kelembaban udara tinggi / basah (>75%) and Penyinaran matahari sedang (35 - 70%) and Curah hujan rendah (5-20mm) Then Merah IF Temperatur sedang (24oC – 27oC ) then Merah 2 3 4 5 0.71 0.65 IF Kelembaban udara Normal (60%- 75%) and Penyinaran matahari penuh (> 70%) Then Kuning IF Curah hujan sangat rendah (<5mm) Then Kuning o IF temperatur tinggi ( > 27 C ) Then Kuning 0.63 0.45 0.40 Pada gain similarity 10% didapatkan 5 baris aturan, dimana terdapat 2 aturan untuk kondisi merah dan 3 aturan untuk kondisi kuning. Untuk merah terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak didapatkan, yaitu pada temperature sedang (24oC – 27oC) juga memungkinkan untuk terjadi DBD pada kondisi merah, akan tetapi hal ini hanya akan terjadi jika kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 %. Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan terjadi jika kondisi Temperatur Tinggi (>27oC), kemungkinan hal ini terjadi dan mempengaruhi adalah sebesar 40%. 6.5.2. Pembahasan Berdasarkan dari data yang digali menggunakan datamining, didapatkan beberapa aturan untuk kecamatan Kebayoran baru dan kecamatan Tebet, dimana kecamatan – kecamatan ini masuk dalam wilayah Jakarta Selatan : 6.5.2.1.Kecamatan Kebayoran Baru Aturan – aturan yang dapat digali menggunakan data mining untuk wilayah Kebayoran baru, dengan jumlah data sebanyak 755 data, didapatkan aturan – aturan sebagai berikut : Untuk kondisi DBD merah 1. Kelembaban udara tinggi ( > 75%) maka kondisi DBD merah. 2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah. 82 3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah. 4. Temperatur sedang (24oC – 27oC) maka kondisi merah. Untuk Kondisi DBD kuning 1. Kelembaban udara normal (60% - 75%) then kuning. 2. Penyinaran matahari penuh(>70%) then kuning. 3. Curah hujan rendah ( 5 – 20 mm) then kuning. Jika dikaitkan dengan nyamuk Aedes Aegypti sebagai vektor / pembawa virus DBD, maka hal ini dapat diterangkan sebagai berikut : Seperti telah diterangkan di bab 6.4, dimana nyamuk ini adalah nyamuk khas tropis yang menyukai kondisi udara yang lembab – hangat, yaitu suhu udara berkisar 24oC – 27oC, penyinaran matahari yang normal (35% - 70%), kelembaban udara tinggi (> 75%). Pada kondisi ini nyamuk ini akan aktif bergerak dan berkembang biak, pada saat bergerak inilah untuk membantu proses reproduksinya nyamuk – nyamuk ini me mbutuhkan darah manusia. Pada saat itu pula mereka menyebarkan virus DBD kedalam tubuh manusia yang telah mereka ambil darahnya. Untuk berkembang biak, mereka membutuhkan media air yang bersih dan ruangan yang agak gelap, curah hujan pada kondisi 5 – 20 mm/minggu cukup untuk memberikan media bagi nyamuk ini untuk berkembang biak, apalagi ditambah kondisi lingkungan yang mempunyai banyak ruang untuk air – air tersebut mengenang. Sehingga pada kondisi dimana air mengenang dan kondisi cuaca dimana proses penguapan dari air tersebut tidak cukup memadai, maka nyamuk Aedes Aegypti akan leluasa berkembang biak dan kemungkinan terjadinya wabah DBD pada kondisi kuning (1 – 5 org/kecamatan) atau kondisi merah (> 5 org/ kecamatan) sangat mungkin terjadi. Untuk Kondisi DBD hijau 1. Penyinaran matahari penuh (> 70%) 2. Temperatur tinggi (> 27oC) 3. Curah hujan sangat rendah (< 5mm) Berdasarkan aturan yang didapat untuk kondisi hijau, dapat diterangkan sebagai berikut : Pada kondisi cuaca dimana penyinaran matahari tinggi (> 70%), temperatur yang tinggi (> 27oC) dan curah hujan yang sangat rendah (< 5mm), maka pada kondisi ini nyamuk Aedes Aegypti tidak akan bergerak / pasif, karena 83 sifat dari nyamuk tersebut yang lebih menyenangi kondisi cuaca yang lembab – hangat. Untuk wilayah kecamatan Kebayoran baru, kondisi DBD hijau (3 minggu tidak terjadi DBD), hal ini karena keadaan lingkungan yang sebagian besar sudah berupa perumahan – perumahan elite, pertokoan dan perkantoran, dimana kesadaran akan kebersihan lingkungan mutlak diperlukan, disamping itu lahan yang memungkinkan air untuk menggenang juga semakin sedikit karena kegiatan ekonomi dan lalu lintas yang cukup tinggi di daerah ini. 6.5.2.2. Kecamatan Tebet Aturan – aturan yang berhasil digali dari data yang digunakan (1.308 data), adalah sebagai berikut : Untuk kondisi merah 1. Kelembaban udara tinggi (> 75%) maka kondisi DBD merah . 2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah. 3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah . 4. Temperatur sedang (24oC – 27oC) maka kondisi merah. Untuk kondisi kuning, 1. Kelembaban udara normal (60% - 75%) then kuning. 2. Penyinaran matahari penuh(>70%) then kuning. 3. Curah hujan sangat rendah (< 5mm) then kuning. 4. Temperatur tinggi (> 27oC) then kuning. Di kecamatan Tebet sepanjang tahun 2004 – 2005 kondisi DBD yang terjadi selalu dalam kondisi merah dan kuning (kondisi hijau tidak terjadi pada kecamatan ini), hal ini selain dari karena faktor – faktor cuaca yang mendukung dari perkembangan dan pergerakan nyamuk Aedes Aegypti, faktor lainnya adalah faktor lingkungan di kecamatan Tebet yang cenderung rapat antar rumah. Sehingga ketika turun hujan dapat mengakibatkan air yang menggenang dimana – mana disekitar rumah – rumah tersebut dan karena faktor teknis kerapatan antar rumah mengakibatkan sinar matahari yang membantu proses penguapan secara alamipun tidak dapat menembus, sehingga lingkungan ini sangat disukai oleh nyamuk untuk berkembang biak. 6.6. Prediksi DBD Tahun 2007 Berdasarkan data cuaca pada tahun 2005 dan 2006 maka dapat diprediksikan data cuaca untuk tahun 2007, yang meliputi data suhu, kelembaban, 84 curah hujan dan penyinaran matahari. Data cuaca tahun 2005 dan 2006 dapat dilihat pada tabel 24 dan tabel 25. Tabel 33. Data Cuaca Jakarta Selatan Tahun 2005 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Suhu (oC) 26 26 26 25 25 26 26 27 28 28 27 28 28 27 Curah hujan (mm) 4 24 5 21 10 16 9 7 6 0 22 9 6 3 Sinar matahari(%) 50 20 46 26 29 26 40 52 61 46 37 62 60 48 Kelembaban(%) 88 89 87 89 91 87 87 83 81 81 87 80 79 83 Tabel 34. Data Cuaca Jakarta Selatan tahun 2006 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Suhu (oC) 26 26 27 27 27 27 28 28 27 28 28 28 28 28 Curah hujan (mm) 12 14 4 8 11 15 4 3 4 1 6 10 2 8 Sinar matahari(%) 21 16 33 32 29 31 47 36 31 32 35 34 37 34 Kelembaban(%) 89 92 85 85 86 89 80 81 84 80 82 86 80 83 Berdasarkan data cuaca tersebut, dicoba untuk melakukan prediksi cuaca pada tahun 2007, dengan memasukkan data tersebut sebagai data masukkan pada metode Winter’s. Hasil prediksi dengan menggunakan metode Winters ditampilkan dalam gambar 34 sampai dengan 37, sedangkan hasil prediksi cuaca secara lengkap ditampilkan pada tabel 26 ( hasil lengkap pada lampiran 11). 85 Gambar 34. Prediksi Suhu tahun 2007 dengan metode Winter’s Gambar 35. Prediksi Curah Hujan tahun 2007 dengan metode Winter’s Gambar 36. Prediksi Penyinaran Matahari tahun 2007 dengan metode Winters 86 Gambar 37. Prediksi Kelembaban Udara tahun 2007 dengan metode Winters Tabel 35. Hasil Prediksi Cuaca tahun 2007 Minggu Suhu (oC) 1 26.05 2 25.56 3 27.03 4 25.85 5 26.35 6 26.11 7 27.35 8 27.61 9 27.37 10 27.39 11 27.89 12 27.65 13 27.41 Curah Hujan(mm) 6.93 8.13 2.07 4.93 7.16 6.27 2.89 2.23 1.13 5.35 3.47 3.75 1.22 Penyinaran Matahari ( %) 27.02 19.88 37.81 33.68 40.60 45.32 52.68 60.30 49.53 46.23 51.42 68.83 58.34 Kelembaban (%) 90.22 92.83 86.08 90.03 88.20 89.48 82.92 82.38 83.92 84.80 82.30 83.59 82.70 Berdasarkan data prediksi cuaca tahun 2007, dapat dilakukan prediksi DBD dengan menggunakan aplikasi DBD untuk di wilayah kecamatan Kebayoran baru dan di kecamatan Tebet, sehingga untuk melakukan tindakan pencegahan dini dapat segera dilakukan oleh pihak yang terkait, dalam hal ini dinas Kesehatan DKI Jakarta bekerjasama dengan seluruh komponen masyarakat. Hasil dari prediksi dengan menggunakan aplikasi DBD untuk tahun 2006 – 2008 untuk masing – masing kecamatan tersebut disajikan pada gambar 38 dan 39 . 87 Gambar 38. Hasil Prediksi DBD tahun 2006 – 2008 Kecamatan Kebayoran baru Dari gambar diatas dapat terlihat bahwa pada tahun 2007 kemungkinan terjadinya wabah DBD pada kondisi merah sangat mungkin terjadi (94%) karena selama tahun 2007 diprediksi cuaca di wilayah Jakarta Selatan mempunyai kelembaban udara tinggi, penyinaran matahari sedang, curah hujan rendah dan suhu udara rendah. Hal ini dapat memicu perkembangan dari populasi jentik / nyamuk Aedes Aegeypti. Sebagai tindakan cegah dini, maka seharusnya sejak awal tahun 2007, pihak dinas kesehatan telah melakukan sosialisasi pemberantasan jentik dari nyamuk Aedes Aegypti, sehingga diharapkan dapat menekan angka populasi dari nyamuk tersebut yang diharapkan juga dapat menurunkan secara signifikan dari kemungkinan terjadinya wabah DBD. Akan tetapi pada minggu 31 dan 35 karena faktor cuaca suhu tinggi, curah hujan yang sangat rendah sehingga kemungkinan tidak terjadi DBD. Hal ini disebabkan karena kondisi cuaca yang tidak terlalu memungkinkan tumbuhnya secara pesat jentik nyamuk Aedes Aegypti sebagai vektor virus DBD. Pada tahun 2008, berdasarkan data prediksi cuaca, hasil prediksi DBD dengan menggunakan aplikasi DBD, didapatkan hasil pada minggu 22, 27, 34 – 37 dan 51 tidak terjadi DBD (kondisi hijau), hal ini disebabkan karena kondisi cuaca yang tidak memungkinkan tumbuhnya jentik – jentik DBD, 88 sehingga kemungkinan tidak terjadi wabah DBD sangat besar. Akan tetapi selain minggu tersebut, kemungkinan terjadinya wabah DBD sangat besar (86%), sehingga tetap perlu diwaspadai dengan melakukan pencegahan dini di wilayah kecamatan ini. Gambar 39. Hasil Prediksi DBD tahun 2006 – 2008 Kecamatan Tebet Dari hasil prediksi aplikasi DBD, walaupun data cuaca yang digunakan sama dengan yang digunakan dalam memprediksi DBD di wilayah kecamatan Kebayoran baru, akan tetapi untuk wilayah Tebet, tidak terjadi dimana kondisi DBD pada kondisi hijau, kondisi yang terjadi adalah DBD pada kondisi kuning. Hal ini disebabkan karena pada daerah Tebet, faktor geografis dan lingkungannya sangat berpengaruh, dimana karena faktor lingkungan, air hujan walaupun sedikit tetap bisa menggenang karena walaupun matahari bersinar penuh, tetapi tidak bisa menjangkau langsung ke tanah, sehingga genangan ini tidak bisa menguap dan akhirnya menjadi tempat untuk nyamuk berkembang biak. 89 6.7. Implikasi Manajerial Penerapan datamining pada database DBD yang dimiliki oleh Dinkes DKI Jakarta, diharapkan dapat memberikan suatu gambaran tentang DBD jika dikaitkan dengan kondisi cuaca di suatu wilayah (khususnya dalam penelitian ini adalah wilayah Jakarta Selatan dan Jakarta Pusat). Adanya perbedaan faktor – faktor cuaca untuk setiap wilayah yang mempengaruhi terjadi wabah DBD juga harus mendapatkan perhatian dari pihak – pihak yang berkompeten dalam penanganan DBD, sehingga tidak salah dalam mengambil suatu keputusan dan pelasanaan tatalaksana DBD. Jika di lihat dari sisi pengguna, maka hasil aplikasi DBD ini dapat dibagi menjadi 2, yaitu : masyarakat umum dan Pemerintah. 1. Masyarakat Umum : Hasil prediksi demam berdarah yang didasarkan pada faktor cuaca di wilayah, maka masyarakat dapat mengetahui kemungkinan wabah DBD di wilayahnya, sehingga masyarakat dapat melakukan program cegah dini DBD dengan melakukan program – program yang telah dicanangkan oleh pemerintah, misalnya 3M, yaitu menutup, menguras, dan menimbun tempat – tempat yang memungkinkan tumbuhnya jentik nyamuk Aedes Aegypti. Selain tempat – tempat yang berada di luar rumah, maka masyarakat juga dapat membersihkan tempat di dalam rumah yang menjadi tempat favorit bagi nyamuk seperti korden, baju – baju yang bergelantungan dan tempat – tempat yang gelap dan lembab. Kegiatan pemberantasan ini minimal 1 x dalam seminggu, dan harus dilakukan secara serentak di wilayah yang diprediksi akan terjadi wabah DBD, mengingat radius terbang dari nyamuk Aedes aegypti cukup luas, yaitu 50 – 100 meter. 2. Pemerintah : Pemerintah dalam hal ini adalah Dinas Kesehatan DKI Jakarta secara khusus dan semua aparat pemerintah pada umumnya. Dari hasil prediksi DBD, maka Dinas Kesehatan dapat melakukan tata laksana sesuai dengan SOP yang telah diberlakukan dalam pemberantasan DBD, mengaktifkan kembali para Jumantik (Juru Uji Jentik) ke setiap pelosok – pelosok 90 daerah yang diperkirakan berpotensi terjadi wabah DBD, melakukan koordinasi dengan aparat pemerintahan dalam melakukan proses Penyemprotan / Fogging, dan melakukan koordinasi untuk melakukan kegiatan 3M secara massal disuatu wilayah. 3. Migrasi Sistem 3.1. Penerapan Aplikasi Secara Langsung Sistem pakar Aplikasi DBD dapat diterapkan oleh suatu instansi yang memerlukan informasi mengenai kemungkinan terjadinya wabah DBD diwilayahnya, berikut tatalaksana yang harus dilaksanakan dalam menanggulangi wanah DBD tersebut. Dalam mengaplikasikan sistem pakar Aplikasi DBD ini maka diperlukan beberapa hal, antara lain: - Sistem operasi PC , Windows XP. - Perangkat lunak Matlab 7.0 R 14 (1.40 GB). - Perangkat lunak Minitab R11 for Windows (1.53 MB) - Aplikasi DBD (18.4 MB) Langkah Migrasi : - Aplikasi DBD diletakkan kedalam folder Work yang terdapat dalam perangkat lunak Matlab (misal : D:\MATLAB7\work). - Selanjutnya aplikasi tersebut dapat diakses melalui perangkat lunak Matlab. - Untuk memprediksi data cuaca di tahun yang akan datang, maka diperlukan perangkat lunak Minitab dengan metode Winter’s. Data yang didapat hasil prediksi menggunakan metode Winter’s selanjutnya dapat digunakan dalam Aplikasi DBD. 3.2. Migrasi Sistem Dengan Membangun Aturan Baru Dalam menerapkan system ini pada lokasi yang baru, maka kita harus membangun ulang aturan – aturan yang akan dijadikan dasar dalam membangun prediksi DBD di wilayah tersebut. Adapun yang harus dipersiapkan dalam membangun aturan tersebut adalah sebagai berikut : 91 - Data cuaca dan data kejadian DBD di wilayah tersebut, pada tahun yang sama. - Program datamining yang mempunyai metode Assosiation rule (dapat digunakan metode CPAR, ataupun software Clementine). - Aplikasi DBD yang telah dibangun dengan Matlab 7.0 R14. Langkah – langkah yang harus dilakukan : - Mempersiapkan data cuaca dan data DBD. - Diolah dengan program datamining yang telah dipilih. - Aturan yang telah didapat, selanjutnya dimasukkan kedalam Aplikasi DBD yang telah ada. - Aturan yang terdapat di Aplikasi DBD, di edit dengan aturan – aturan yang baru. - Aplikasi di coba dengan data yang telah ada dan digunakan sebelumnya untuk membangun aturan – aturan. - Jika masih terdapat kesalahan, maka dapat diulang dalam mencari aturan – aturannya. - Jika tingkat kesalahan sudah masuk dalam batas toleransi, maka aplikasi DBD tersebut, dapat digunakan pada lokasi baru. 92 BABVII KESIMPULAN DAN SARAN 7.1. Kesimpulan Berdasarkan penelitian ini dapat disimpulkan beberapa hal, sebagai berikut : 1. Penerapan datamining dengan metode CPAR pada database DINKES DKI Jakarta dikaitkan dengan data cuaca, menemukan adanya keterkaitan, yaitu : Kelembaban udara , Penyinaran matahari dan Curah hujan menjadi penentu utama apakah terjadi wabah DBD pada suatu wilayah. 2. Pola prediksi DBD berbeda untuk wilayah Jakarta Pusat dan Jakarta Selatan. Wilayah Jakarta Selatan, Faktor cuaca yang memicu DBD kondisi merah adalah : Kelembaban udara tinggi, penyinaran matahari rendah - sedang, curah hujan normal dan suhu udara normal Faktor cuaca yang memicu DBD kondisi kuning adalah : Kelembaban udara normal, penyinaran matahari normal, curah hujan rendah, dan suhu udara normal - tinggi Faktor cuaca yang memicu DBD kondisi hijau adalah : Penyinaran matahari penuh, curah hujan sangat rendah, dan suhu udara tinggi Wilayah Jakarta Pusat, Faktor cuaca yang memicu DBD kondisi merah adalah : Penyinaran matahari rendah, curah hujan sedang - normal, kelembaban udara tinggi, suhu udara sedang. Faktor cuaca yang me micu DBD kondisi kuning adalah : Curah hujan sangat rendah, kelembaban udara normal, penyinaran matahari penuh, suhu udara tinggi. Faktor cuaca yang memicu DBD kondisi hijau adalah : Penyinaran matahari penuh, curah hujan sangat rendah, dan suhu udara tinggi. 3. Kemungkinan DBD per minggu per wilayah berdasarkan data kejadian ; Jakarta Selatan : Kondisi DBD Merah : Minggu ke 1-7, 13-20 dan 42-52; selebihnya kondisi DBD kuning dan sebagian hijau atau tidak terjadi DBD. Jakarta Pusat : Kondisi DBD Merah : Minggu ke 2-7, dan 10 – 12; Selebihnya kondisi DBD kuning dan sebagian hijau tidak terjadi DBD. 93 4. Sebagai tindakan cegah dini wabah DBD, maka diprediksikan kemungkinan wabah DBD untuk tahun 2007 di wilayah Jakarta Selatan adalah : Sepanjang tahun 2007 kemungkianan terjadi wabah DBD dengan kondisi merah, kecuali pada minggu ke 31, 34 dan 35 kondisi wabah DBD menurun sesuai dengan factor cuaca ke kondisi kuning dan hijau, sedangkan pada tahun 2008, walaupun pada minggu 22, 27, 34-37 dan 51 tidak terjadi DBD, akan tetapi tetap harus diwaspadai karena selain minggu – minggu tersebut kemungkinan DBD tetap terjadi. 5. Menurunkan nilai Gain Similarity Ratio dapat menggali aturan – aturan lain yang sebelumnya tersembunyi. 7.2.Saran Berdasarkan hasil penelitian ini, maka dapat disarankan : 1. Perlu ditambahkan atribut – atribut selain atribut cuaca, misalnya data atribut kepadatan penduduk, data bebas jentik suatu wilayah dan data geografis dll yang mempunyai potensi untuk mempengaruhi terjadinya wabah DBD disuatu wilayah. 2. Pengelompokkan atribut lebih dipersempit rentangnya sehingga diharapkan dapat dihasilkan aturan yang lebih detil dan lebih baik. 3. Dalam menggunakan Aplikasi DBD ini maka perlu dipersiapkan antara lain : • Perangkat lunak Matlab 7.0 R 14 dan Perangkat lunak Minitab R 11 for Windows. • Data cuaca rata – rata per minggu wilayah Jakarta Selatan dan Jakarta Pusat. 94 DAFTAR PUSTAKA 1. Adriaans P, Zantinge D, Data Mining, Addison-Wesley Longman, London, England, 1996. 2. Berry M.J.A, Linoff, G.S, mastering Data Mining “The Art Science of CRM”, Willey , 2000. 3. Brookshear,J.G, Computer Science, Suatu Pengantar, Edisi 7, Erlangga, 2003 . 4. Breault J.L, Data Mining Diabetic Database:”Are Rough sets a Useful Addition”, Depart. Of health system management, Tulane university, 2000. 5. Brosette S.E, A Data Mining System for Infection Control Surveillance, www.medmined.com/image/pdf/MIMPaper.pdf, 2000. 6. Box E.P.G, Jenkins, M Gwilym, Time Series Analysis : Forecasting and Control, 1970. 7. Coenen F, The LUCS-KDD Implementations of CPAR ( Classification Based on Predictive Association Rules), Department of Computer Science The University of Liverfool, 2004. 8. Corey M, Abbey M, Abramson I, Taub B, Oracle 8i: Data Warehousing, Osborne / McGraw-Hill. 2001. 9. Dinas Kesehatan Propinsi DKI Jakarta, “Data Surveilans Penyakit Tahun 2003”. 2004. 10. Dinas Kesehatan DKI Jakarta, Demam Berdarah Aedes Aegypti, www. Dinkesdkijakarta.gov. 2003. 11. Fayyad U, Piatetsky-Shapiro G, Smyth P, From Data Mining to Knowledge Discovery in Database, AAAI, 1996. 12. Ferren G, Merwe M, Fleaming G, Murphy K, Fuzzy Expert System and GIS for Cholera Health Risk Prediction in Southern Africa, The South African Council for Scientific and Industrial research (CSIR), 2004. 13. Grosman Robert, Data Mining Research : Opportunities and Challenges “ A Report of three NSF workshops on mining large, massive, and distributed data”, January 1999. 95 14. Herwanto, Pembangunan Sistem Data mining untuk Mendiagnosa Penyakit Diabetes Menggunakan Algoritma CPAR (Classification Based on Predictive Association Rules), Thesis Pascasarjana, IPB, 2006. 15. Hirota K and Pedrycz W, Linguistic Data Mining and Fuzzy Modeling, Procceding of IEEE fifth International Fuzzy System, New Orleans, LA, 1996. 16. Ishwar K Seti, Data mining : An Introduction, Intelligent Information Engineering Laboratory, Departement of Computer Science and Engineering, Oakland University, 2002 17. Jeffrey W, Data Mining : An Overview, CRS report for Congress, 2004. 18. Kantardzic M, Data Mining : Concepts, Models, Methods, and Algorithms, A john wiley & sons, inc., Publication, 2003. 19. Marimin, Teori dan Aplikasi Sistem Pakar dalam teknologi Manajerial, IPB Press, Bogor, 2002. 20. Ramachandran R, Application of fuzzy logic in data mining, computer science department university of Alabama, 1998. 21. Scales R, Embrechts M, Computational Intelligence Technique for Medical Diagnostics, Walter Lincoln Hawkins, 2002. 22. Sucahyo, Data Mining : Menggali Informasi yang Terpendam, www. Ilmu Komputer.com , 2003. 23. Yin X, Han J, CPAR : Classification based on Predictive Association Rules, University of Illinois at Urbana – Champaign, 2003. 24. Zimmermann HJ, Fuzzy Sets, Decission Making and Expert System, Kluwer Academic Publisher, Boston, 1987.