perumusan pola penyebaran demam berdarah melalui data

advertisement
PERUMUSAN POLA PENYEBARAN DEMAM
BERDARAH MELALUI DATA MINING PADA
DATABASE DINAS KESEHATAN DKI JAKARTA
OLEH
HENDRA LUKITO
NRP : G 651030184
PROGRAM STUDI ILMU KOMPUTER
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2007
xix
PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH
MELALUI DATA MINING PADA DATABASE DINAS
KESEHATAN DKI JAKARTA
HENDRA LUKITO
G 651030184
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
Pada Program Studi Ilmu Komputer
PROGRAM STUDI ILMU KOMPUTER
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2007
xxi
SEMINAR SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Nama
: Hendra Lukito
Nomor Pokok
: G 651030184
Program Studi
: Ilmu Komputer
Judul Penelitian
: Perumusan Pola Penyebaran Demam Berdarah
Melalui Datamining Pada Database Dinas Kesehatan
DKI Jakarta
Komisi Pembimbing
: Prof. Dr. Ir. Marimin, M.Sc ( Ketua )
Dr.drh. Hamdani Nasution ( Anggota )
Kelompok / Bidang Studi
: Keteknikan dan Teknologi Informasi
Hari / Tanggal
: Kamis, 18 Januari 2007
Waktu
: 09.00 – 10.00
Tempat
: Ruang Sidang Fateta, IPB Darmaga, Bogor
xx
SURAT PERNYATAAN
Saya menyatakan dengan sebenar – benarnya bahwa segala pernyataan dalam tesis
saya berjudul :
PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI
DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA
Merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan Komisi
Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini belum
pernah diajukan untuk memperoleh gelar atau capaian akademik lainnya pada
program sejenis di perguruan tinggi lain. Semua data dan informasi yang digunakan
telah dinyatakan secara jelas dan dapat diperiksa kebenarannya.
Jakarta, 15 Maret 2007
Yang Membuat Pernyataan
HENDRA LUKITO
i
ABSTRACT
HENDRA LUKITO, The Formulation of Demam Berdarah Dengue Spread Pattern
Through Datamining of Dinas Kesehatan DKI Jakarta Database. Supervised by
MARIMIN and HAMDANI NASUTION.
The Objectives of this research were to identify the most important attributes
and to formulate decision rules from Dinas Kesehatan DKI Jakarta database. The real
survailance data set used collected from Dinas Kesehatan Jakarta from 2004 until
2005 which include DBD data in Jakarta area. We used data set only from Central
Jakarta and South Jakarta area. There are two main steps considered for identification
of the pattern of DBD, data mining process building which using Classification based
association algorithm and creates application program to implement the algorithm.
Three steps procedures are implemented for data mining process building. The first
step is to deal with missing values. The second step is the discretization, where, each
variable is devided into limited number of values groups. The thrid step is creating
rule mining and classification. There are 68 data with yellow DBD condition and 134
data with red DBD condition and weather data set consisted of 14 variabels data such
as: temperatures, rainy, humadity and sunny. The maximum predictive accuracy for
DBD with red condition is 88% and for DBD with yellow condition is 77%. The
decision rules are used to predict the condition of DBD. Prediction result from
application will be used to forecast the future condition of DBD at certain district.
Keywords : DBD (Demam Berdarah Dengue), Datamining, Fuzzy rule base, Winter’s
forecast method.
ii
RINGKASAN
HENDRA LUKITO, Perumusan Pola Penyebaran Demam Berdarah Melalui
Datamining Pada Database Dinas Kesehatan DKI Jakarta, Dibawah bimbingan
Prof. Dr. Ir. Marimin, M.Sc, Dr. drh. Hamdani Nasution.
Siklus DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus
yang meningkat setiap tahunnya, membuat data survailance tentang DBD yang di
catat secara rutin oleh Dinas Kesehatan DKI Jakarta akan menjadi semakin besar,
akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat dimanfaatkan
oleh semua pihak, hanya pihak tertentu saja yang dapat memanfaatkan data tersebut
secara maksimal. Selain hal tersebut, pada permasalahan DBD terdapat suatu hipotesa
awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti dengan suhu,
curah hujan dan penyinaran matahari. Dengan menerapkan konsep data mining pada
database DBD dan data set cuaca, diharapkan dapat ditemukan pola keterkaitan antar
variabel, pada akhirnya dapat dirumuskan pola penyebaran DBD .
Tujuan penelitian ini adalah Merumuskan suatu sistem peringatan dini
prediksi meledaknya DBD dan cara penanggulangannya, sehingga dari penelitian ini
diharapakan akan didapat manfaat untuk membantu dalam memprediksi pola
penyebaran DBD pada daerah DKI Jakarta, dan diambilnya suatu tindakan
pencegahan agar DBD tersebut tidak meluas penyebarannya dengan menerapkan
sistem pakar tata laksana DBD. Dalam penelitian ini digunakan datamining untuk
menggali pola keterkaitan antar variabel pada database DBD khususnya di wilayah
Jakarta Selatan dan Jakarta Pusat dan data cuaca pada wilayah yang sama. Metode
yang digunakan adalah metode Classification based on Predictive Association Rules
(CPAR). Output yang didapat dari pencarian dengan menggunakan CPAR tersebut
berupa aturan – aturan dengan kaidah aturan IF – THEN, yang selanjutnya digunakan
dalam membangun suatu sistem pakar untuk mengidentifikasi kemungkinan terjadi
iii
DBD di suatu wilayah didasarkan pada keadaan cuaca di wilayah tersebut. Sistem
pakar berbasiskan logika fuzzy ini diberi nama Aplikasi DBD.
Aplikasi DBD dibangun
menggunakan Matlab 7.0 R 14, dengan
menggunakan fungsi toolbox fuzzy untuk membangun SIF (Sistem Inferensi Fuzzy)
dan fasilitas GUI (graphical users interface) untuk antarmukanya. Data masukkan
yang digunakan adalah data cuaca yang meliputi suhu udara, curah hujan, penyinaran
matahari, kelembaban udara. Data tersebut menjadi acuan untuk melakukan prediksi
terhadap kondisi DBD serta tatalaksana tentang DBD. Data cuaca ini kemudian di
dekomposisi menjadi himpunan – himpunan fuzzy. Evaluasi aturan fuzzy kemudian
diubah menjadi suatu harga numerik untuk menetukan aksi dari output, atau disebut
defuzzifikasi. Metode defuzzifikasi yang digunakan adalah metode centroid. Dengan
menggunakan himpunan fuzzy, aturan atau rule dan metode defuzzifikasi, maka
dapat disusun sistem inferensi fuzzy dengan menggunakan toolbox fuzzy (fuzzy logic
toolbox) pada Matlab7.0 R14, proses inferensi yang digunakan adalah model fuzzy
Mamdani.
Hasil prediksi dari aplikasi DBD ini dapat digunakan oleh pihak – pihak yang
berkepentingan dalam hal penganggulangan wabah DBD, sehingga mereka dapat
melakukan tindakan cegah dini dari kemungkinan terjadinya wabah DBD disuatu
wilayah. Untuk melakukan prediksi pada tahun selanjutnya dimana data cuaca belum
diketahui, maka digunakan metode Winter’s yang dapat memprediksi kemungkinan
keadaan cuaca berdasarkan pada data cuaca di tahun sebelumnya, sehingga Aplikasi
DBD ini dapat digunakan dalam memprediksi kemungkinan terjadinya DBD di tahun
yang akan datang.
Hasil prediksi menggunakan datamining pada database Dinkes DKI Jakarta
dikaitkan dengan data cuaca menghasilkan aturan sebanyak 22 aturan untuk Jakarta
Selatan dan 29 aturan untuk Jakarta Pusat.
Dari hasil penelitian ini dapat disimpulkan sebagai berikut : Penerapan
datamining dengan metode CPAR pada database DINKES DKI Jakarta dikaitkan
dengan variabel cuaca, menemukan adanya keterkaitan, yaitu : Kelembaban udara ,
iv
Penyinaran matahari dan Curah hujan menjadi penentu utama apakah terjadi wabah
DBD pada suatu wilayah, Sebagai tindakan cegah dini wabah DBD, maka
diprediksikan kemungkinan wabah DBD untuk tahun 2007 di wilayah Jakarta Selatan
adalah : Sepanjang tahun 2007 kemungkianan terjadi wabah DBD dengan kondisi
merah, kecuali pada minggu ke 31, 34 dan 35 kondisi wabah DBD menurun sesuai
dengan factor cuaca ke kondisi kuning. Dari kesimpulan hasil penelitian tersebut
maka dapat diberikan saran – saran sebagai berikut : Perlu ditambahkan atribut –
atribut selain atribut cuaca, misalnya data atribut kepadatan penduduk, data bebas
jentik suatu wilayah dan data geografis dll
yang mempunyai potensi untuk
mempengaruhi terjadinya wabah DBD disuatu wilayah, Pengelompokkan atribut
lebih dipersempit rentangnya sehingga diharapkan dapat dihasilkan aturan yang lebih
detil dan lebih baik.
Kata kunci : Demam Berdarah Dengue (DBD), Datamining, Fuzzy rule base, Metode
prediksi Winter’s.
v
Judul Penelitian
: Perumusan Pola Penyebaran Demam Berdarah Melalui
Data Mining Pada Database Dinas Kesehatan DKI
Jakarta
Nama
: Hendra Lukito
NRP
: G651030184
Program Studi
: Ilmu Komputer
Menyetujui,
Komisi Pembimbing
Prof. Dr. Ir. Marimin, M.Sc
Ketua
Dr. drh. S.Hamdani Nasution
Anggota
Mengetahui,
Ketua Program Studi
Ilmu Komputer
Dr. Sugi Guritman
Tanggal Ujian : 01 Maret 2007
Dekan Sekolah Pascasarjana
Prof. Dr. Ir. Khairil Anwar N, MS
Tanggal Lulus :
vi
KATA PENGANTAR
Puji syukur penulis sampaikan kehadirat Allah SWT, atas berkah dan rahmatNya, akhirnya penulis dapat menyelesaikan tugas penelitian ini dengan judul
”PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA
MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA”. Tugas
penelitian ini dibuat untuk memenuhi salah satu persyaratan studi pada program Studi
Ilmu Komputer, Sekolah Pascasarjana IPB.
Tugas penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh
karena itu ijinkan penulis untuk menyampaikan ucapan terima kasih yang sebesar –
sebesarnya kepada :
1. Bapak Prof. Dr. Ir. Marimin, M.Sc dan Bapak Dr. drh. Sjahrun Hamdani
Nasution, selaku Dosen pembimbing, yang telah sangat membantu dalam
membimbing dan mengarahkan penulis, sehingga ide yang sederhana ini
dapat menjadi sesuatu yang berguna.
2. Staf pengajar dan karyawan di Program Studi Ilmu Komputer, Sekolah
Pascasarjana IPB yang telah membantu selama masa menimba ilmu di
kampus Baranangsiang, dan Karyawan Pascasarjana IPB,khususnya ibu
Henny, yang telah sangat membantu.
3. Orang Tua tercinta Bapak dan Ibu Suparman, yang selalu mendoakan penulis
di dalam setiap nafasnya, dan menjadi motivasi penulis dalam mengejar ilmu
sehingga bisa menjadi yang lebih tinggi lagi. ”Terima Kasih atas doanya
dan karya ini saya persembahkan untuk Bapak dan Ibu berdua ”.
4. Bapak dan Mama Bambang Pribadi yang mendukung dan mengerti dengan
situasi serta kondisi sebagai seorang mahasiswa.
5. Istriku tercinta Santhy Lestari dan anak – anak tersayang, Shafira, Farhan dan
Jasmine yang selalu memberi dukungan penuh dan menjadi penyejuk disaat
rasa lelah dan jenuh mulai datang me nghampiri. ” Semoga ini bisa menjadi
vii
motivasi bagi kalian nanti untuk melangkah di masa depan dan kalian
harus bisa lebih dari Babab saat ini ”.
6. Rekan – rekan mahasiswa Pascasarjana Ilmu Komputer angkatan ”Matrix”,
yang telah membantu dalam memberi saran dan masukkan, khususnya kepada
dokter Syafeii yang telah membantu dalam memberikan data dan menjadi
tempat penulis berkonsultasi tentang DBD, Herwanto yang telah sangat –
sangat membantu dalam mengolah data menggunakan algoritma CPAR yang
telah dimodifikasinya, Nana Supriatna yang sama – sama jatuh bangun dalam
menyusun tesis ini. Rekan - rekan satu bimbingan Bapak Marimin,
khususnya, mas Janawir, mas Hari dan Rein atas dukungan soft copy dan hard
copy tesisnya.
7. Segenap keluarga yang telah memberikan dukunga n moral dan spirit, ”tanpa
dukungan kalian, karya ini mungkin tidak akan tersusun sebaik ini”.
8. Pimpinan dan rekan sejawat di kantor tempat penulis bekerja, baik selama
bekerja di PT. Mitratama, Bapak Viktor Pardede (alm), Bapak Haryanto, dan
selama penulis bekerja di PT. Charoen Pokphand Indonesia, khususnya Bapak
Bambang Pangestoe dan Bapak Jimmy Perangin angin yang telah
mengijinkan penulis untuk menyelesaikan langkah terakhir dalam langkah
yang cukup panjang ini.
9. Semua pihak yang telah sangat membantu dalam penulisan ini namun tidak
dapat penulis sebutkan satu persatu. ”Terima kasih atas dukungan kalian
semua, sehingga tesis ini dapat menjadi sesuatu yang berguna ”.
Berbagai usaha telah penulis upayakan guna terselesaikannya tugas penelitian
ini dengan baik, namun penulis menyadari akan kekurangan dan keterbatasan penulis.
Oleh karena itu penulis memohon maaf apabila terdapat kesalahan. Akhir kata
penulis berharap agar tesis ini dapat berguna bagi masyarakat dalam memerangi
masalah DBD yang selalu terjadi. Amin
Jakarta, Februari 2007
Penulis
viii
RIWAYAT HIDUP
Penulis dilahirkan di Balikpapan pada tanggal 21 Oktober 1974, sebagai anak
pertama dari 2 bersaudara pasangan bapak H. Suparman S dan ibu Hj. Purbawati
Chalid. Pendidikan dasar di tempuh diberbagai tempat di wilayah Indonesia karena
orang tua yang bertugas sebagai seorang Tentara TNI AD, antara lain di Singaraja,
Kupang, dan menyelesaikannya di Bima – NTB tahun 1986. Pendidikan menengah
pertama di selesaikan di SMPN 1 Denpasar Bali tahun 1989. Pendidikan menengah
atas penulis jalani di 2 tempat yaitu di SMU 2 Ujung pandang dan diselesaikan di
SMA 4 Jogjakarta dengan mengambil jurusan Biologi pada tahun 1992. Pendidikan
sarjana ditempuh di Universitas Pembangunan Nasional ” Veteran” Jogjakarta dengan
mengambil jurusan Teknik Geologi, Fakultas Teknologi Mineral dan diselesaikan
pada tahun 1998. Tahun 2003, penulis meneruskan menimba ilmu di program
Pascasarjana IPB, Institut Pertanian Bogor pada program ilmu Komputer .
Setelah menyelesaikan kuliah tingkat Sarjana penulis bekerja di PT.
Mitratama dan bekerja paruh waktu di PT. Yanmar Indonesia (1998 – 2005). Sejak
November 2005, penulis bergabung di PT. Charoen Pokphand Indonesia sebagai
tenaga analisis data di bidang Security dan Community Development.
Saat ini penulis berdomisili di Cilangkap, Jakarta Timur dan dari hasil
perkawinan penulis dengan Santhy Lestari, dikaruniai 3 orang anak, Shafira Larasati,
M Farhan dan Jasmine Azahra.
ix
DAFTAR ISI
Halaman
SURAT PERNYATAAN
i
ABSTRACT
ii
RINGKASAN
iii
LEMBAR PENGESAHAN
KATA PENGANTAR
vi
RIWAYAT HIDUP
viii
DAFTAR ISI
ix
DAFTAR GAMBAR
xiii
DAFTAR TABEL
xv
DAFTAR LAMPIRAN
I
II
v
xvii
PENDAHULUAN
1
1.1
Latar Belakang
1
1.2
Tujuan
3
1.3
Ruang Lingkup
3
1.4
Manfaat Penelitian
4
TINJAUAN PUSTAKA
5
2.1
Demam Berdarah Dengue (DBD)
5
2.1.1
Definisi
5
2.1.2
Penyebab DBD
5
2.1.3
Kasus DBD di wilayah DKI Jakarta
6
2.2
Data Mining
7
2.2.1
Klasifikasi dan Prediksi
10
2.2.2
Metodologi Datamining
11
x
2.2.3
Teknik Datamining
12
2.2.3.1 Association Rule
12
2.2.3.2 Classification Based Association
13
2.2.4
Algoritma Appriori
14
2.2.5
Membuat Association Rule berdasarkan
16
Frequent Itemset
2.2.6
Classification
based
on
Predictive
17
Association Rules (CPAR)
2.3
2.4
2.5
III
2.2.6.1 Membuat Rule dalam CPAR
18
2.2.7
18
Membangun Model Prediksi
Sistem Fuzzy
20
2.3.1
Himpunan Fuzzy
20
2.3.2
Fungsi Keanggotaan
20
2.3.3
Operator Himpunan Fuzzy
21
2.3.4
Fungsi Implikasi
22
2.3.5
Sistem Inferensi Fuzzy (FIS)
23
Prakiraan / Forecasting
25
2.4.1
Teknik Prakiraan Pemulus Eksponensial
25
2.4.2
Metode Winters
26
Penelitian terdahulu
28
2.5.1
30
Perbedaan dari penelitian sebelumnya
METODOLOGI
31
3.1
Kerangka Pemikiran
31
3.2
Tata Laksana
34
3.2.1
Pengumpulan Data
34
3.2.2
Data Yang Digunakan
34
3.2.3
Pengolahan Data
36
xi
3.3.
Pembuatan Program Aplikasi
38
3.3.1
Data mining
38
3.3.2
Pembentukan Basis Aturan
39
3.3.3
Aplikasi DBD
39
3.3.4 Prediksi Cuaca Menggunakan Metode
40
Winter’s
IV
PERANCANGAN SISTEM
41
4.1
Gambaran Umum Sistem
41
4.2
Analisa Kebutuhan Sistem
42
4.3
Desain Sistem
42
4.3.1
Tahapan Data mining
42
4.3.2
Tahapan Aplikasi DBD
44
4.4
V
Antar muka
50
IMPLEMENTASI SISTEM
51
5.1
Implementasi Sistem
51
5.2
Pembangunan Sistem Data mining
52
5.2.1
52
Pembentukan Sampel Positif dan Sampel
Negatif
5.2.2
5.3
5.4
Pembentukan Basis Aturan / Rule Base
53
Program Aplikasi
55
5.3.1
Input Sistem
55
5.3.2
Proses Evaluasi Sistem
58
5.3.3
Output Sistem
65
5.3.4
Prediksi DBD Tahun Selanjutnya
66
Kompleksitas Sistem
67
xii
VI
VII
PENGUJIAN DAN PEMBAHASAN
68
6.1
Mekanisme Pengujian
68
6.2
Pembentukan Model Dengan Data Training
68
6.3
Pelatihan Dengan Data Testing
72
6.4
Pembahasan
73
6.5
Penerapan Aplikasi DBD Per Kecamatan
74
6.5.1 Pembentukan Model Dengan Data Training
75
6.5.2 Pembahasan
81
6.5
Prediksi DBD Tahun 2007
84
6.6
Implikasi Manajerial
89
KESIMPULAN DAN SARAN
92
7.1
Kesimpulan
92
7.2
Saran
93
DAFTAR PUSTAKA
94
LAMPIRAN
96
xiii
DAFTAR GAMBAR
Halaman
Gambar 1
Jumlah Kasus DBD Bersumber Survailans Aktif RS per Bulan
6
di DKI Jakarta, 2001 – 2006 ( s/d 17 mei 2006)
Gambar 2
Peningkatan data dalam 2 dekade terakhir (Sumber: Fayyad,
7
Piatetsky-Shapiro dan Smyth, 1996)
Gambar 3
Pembuatan
Model
dalam
Datamining
(adaptasi
dari
9
Berry,MJA and Linoff,GS)
Gambar 4
Model Proses Pembuatan Datamining
11
Gambar 5
Langkah – Langkah Membangun Model Prediksi
19
Gambar 6
Fungsi Keanggotaan “USIA” dengan representasi Sigmoid
21
Gambar 7
Fungsi Implikasi MIN
23
Gambar 8
Fungsi implikasi DOT
23
Gambar 9
Data mining, multimodel dan fuzzy Model (adaptasi dari
29
Hirota et al)
Gambar 10
Sistem Peringatan Dini Prediksi Meledaknya DBD dan Cara
32
Penanggulannya
Gambar 11
Tahapan Penelitian
33
Gambar 12
Arsitektur system Aplikasi DBD
37
Gambar 13
Model Aplikasi DBD
41
Gambar 14
Fuzzifikasi Suhu
46
Gambar 15
Fuzzifikasi Curah Hujan
47
Gambar 16
Fuzzifikasi Penyinaran Matahari
47
Gambar 17
Fuzzifikasi Kelembaban Udara
48
Gambar 18
Antarmuka Aplikasi DBD
50
Gambar 19
Tabel Data Selama 1 Tahun
55
Gambar 20
Grafik Selama 2 Tahun
56
Gambar 21
Antar muka Aplikasi DBD
57
xiv
Halaman
Gambar 22
Tatalaksana Berdasarkan SOP Dinkes DKI Jakarta
57
Gambar 23
FIS Editor Untuk Data Atribut Cuaca dan Kondisi DBD,
58
Wilayah Jakarta Selatan
Gambar 24
Membership Function Untuk Atribut Suhu
59
Gambar 25
Membership Function Untuk Atribut Curah Hujan
60
Gambar 26
Membership Function Untuk Atribut Matahari
60
Gambar 27
Membership Function Untuk Atribut Kelembaban
61
Gambar 28
Rule Editor Jakarta Selatan
62
Gambar 29
Rule Editor Jakarta Pusat
63
Gambar 30
Rule Viewer Untuk Jakarta Selatan
64
Gambar 31
Rule Viewer Untuk Jakarta Pusat
64
Gambar 32
Tombol Mendapatkan Output dan Input Data
65
Gambar 33
Interface Metode Winter’s
66
Gambar 34
Prediksi Suhu Tahun 2007 Dengan Metode Winter’s
85
Gambar 35
Prediksi Curah Hujan Tahun 2007 Dengan Metode Winter’s
85
Gambar 36
Prediksi Matahari Tahun 2007 Dengan Metode Winter’s
85
Gambar 37
Prediksi Kelembaban Tahun 2007 Dengan Metode Winter’s
86
Gambar 38
Hasil Prediksi DBD Tahun 2006 – 2007 Wilayah Kebayoran
87
Baru
Gambar 39
Hasil Prediksi DBD Tahun 2006 – 2007 Wilayah Tebet
88
xv
DAFTAR TABEL
Halaman
Tabel 1
Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu
6
Wilayah
Tabel 2
Transaksi Penjualan Barang
15
Tabel 3
Contoh Data Penjualan yang Bersifat Musiman
26
Tabel 4
Contoh Hasil Penerapan Metode Winter’s
28
Tabel 5
Atribut yang Digunakan Dalam Algoritma CPAR
43
Tabel 6
Atribut Cuaca dan Himpunan Fuzzy
45
Tabel 7
Selang Nilai untuk Hasil Output pada Hi mpunan Fuzzy
49
Tabel 8
Input dan Output Aplikasi DBD
50
Tabel 9
Tabel Diskrit Untuk Wilayah Yakarta Selatan
52
Tabel 10
Sampel Data Positif
53
Tabel 11
Sampel Data Negatif
53
Tabel 12
Hasil Pemasukkan Data Untuk Wilayah Jakarta Selatan
54
Tabel 13
Data Survailans DBD Tahun 2005 Minggu 1 - 4
69
Tabel 14
Data Survailans DBD Tahun 2004 Minggu 1 - 4
69
Tabel 15
Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan
69
Tahun 2005
Tabel 16
Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan
69
Tahun 2004
Tabel 17
Aturan Data Training Dengan GSR 99%
69
Tabel 18
Aturan Data Training Dengan GSR 80%
70
Tabel 19
Aturan Data Training Dengan GSR 60%
71
Tabel 20
Aturan Data Training Dengan GSR 20%
71
Tabel 21
Aturan Data Training Dengan GSR 10%
72
Tabel 22
Data Testing Untuk Wilayah Jakarta Selatan
73
Tabel 23
Data DBD Untuk Wilayah Jakarta Selatan
73
xvi
Tabel 24
Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil.
76
Jak-Pus
Tabel 25
Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil.
76
Jak - Sel
Tabel 26
Aturan Data Training Dengan GSR 99%
76
Tabel 27
Aturan Data Training Dengan GSR 20%
77
Tabel 28
Aturan Data Training Dengan GSR 10%
78
Tabel 29
Aturan Data Training Dengan GSR 99%
79
Tabel 30
Aturan Data Training Dengan GSR 60%
80
Tabel 31
Aturan Data Training Dengan GSR 20%
80
Tabel 32
Aturan Data Training Dengan GSR 10%
81
Tabel 33
Data Cuaca Jakarta Selatan Tahun 2005
84
Tabel 34
Data Cuaca Jakarta Selatan Tahun 2006
84
Tabel 35
Hasil Prediksi Cuaca Tahun 2007
86
xvii
DAFTAR LAMPIRAN
Lampiran 1
Cara Perolehan Dan Pengolahan Data
95
Lampiran 2
Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2004
97
Lampiran 3
Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2005
98
Lampiran 4
Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2004
99
Lampiran 5
Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2005
100
Lampiran 6
Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2004
101
Lampiran 7
Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2005
102
Lampiran 8
Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2004
103
Lampiran 9
Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2005
104
Lampiran 10
Aturan – Aturan Hasil Datamining Menggunakan Metode
105
CPAR
Lampiran 11
Hasil Prediksi Cuaca Menggunakan Metode Winter’s Tahun
112
2007
xviii
1
BAB I
PENDAHULUAN
1. Latar Belakang
Data mining sebagai cabang baru dalam ilmu komputer yang mulai
berkembang sejak tahun 1990, saat ini mulai banyak diaplikasikan pada beberapa
aspek kehidupan, hal ini di dukung oleh semakin bertambah besarnya data yang
dikumpulkan pada kegiatan bisnis modern dan kehidupan modern. Akan tetapi
sering terjadi data yang dikumpulkan tersebut menjadi tidak berguna, karena tidak
semua pihak mengerti dan dapat menggunakan, sehingga data tersebut harus di
konversi menjadi informasi dan pengetahuan yang berguna.
Data mining adalah proses dalam mencari berbagai model, kesimpulan
dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003). Dalam proses
tersebut digunakan berbagai macam alat bantu data analisis yang berasal dari
beberapa cabang ilmu pengetahuan seperti statistik, neural network dan lain lain
untuk mendapatkan pola dan hubungan dalam data tersebut untuk membuat suatu
predeksi yang valid.
Dalam perkembangannya, terdapat 2 tujuan utama dari data mining, prediksi dan
diskripsi. Prediksi menggunakan beberapa variable dari data set yang digunakan
untuk memprediksi sesuatu dari variable dari yang dikehendaki, sedangkan
deskripsi lebih memfokuskan pada menemukan pola dari suatu data sehingga
dapat dengan mudah di interprestasikan oleh penggunanya.
Penelitian di bidang kesehatan dengan mengimplementasikan data mining
untuk memprediksi penyebaran suatu penyakit telah banyak di lakukan, antara
lain penelitian yang dilakukan oleh Brossette et.al (2000), dimana mereka
menerapkan Data mining surveillance system (DMSS) dalam mendeteksi infeksi
nosocomial di Amerika dengan menggunakan data dari RS Universitas Alabama
di Birmingham selama 15 bulan. DMSS di design untuk menemukan pola – pola
yang berguna yang mungkin tidak dapat di temukan oleh sistem tradisional.
Metode data mining yang coba di terapkan dalam DMSS adalah association rules.
Penelitian lain yang juga mencoba memprediksi tentang penyakit adalah
penelitian yang dilakukan oleh Scales dan Embrechts (2003), mereka mencoba
2
memprediksi penyakit serangan jantung kardiovaskular. Metode data mining yang
coba diterapkan oleh mereka adalah metode artificial neural network dan fuzzy
logic analisis, dari penelitian mereka metode ini memberikan hasil yang cukup
efektif. Penelitian terakhir dalam bidang kesehatan dengan menggunakan
datamining dilakukan oleh Herwanto (2006), dari database pasien diabetes yang
dimiliki oleh RS Pertamina, diolah dengan menggunakan datamining, sehingga
didapat aturan – aturan yang dapat membantu dalam memprediksi kapan dan
pada kondisi apa gula seseorang dapat naik dan mengakibatkan gangguan yang
serius.
Demam Berdarah Dengue (DBD), adalah suatu penyakit yang disebabkan
oleh nyamuk Aedes Aegypti dan merupakan penyakit yang sangat gampang sekali
terjadi di masyarakat. Pengelolaan lingkungan tempat tinggal yang belum seragam
dalam penanganannya, juga sangat memungkin terjadi wabah DBD, walaupun
lingkungan di sekitar rumah kita telah dikelola dengan baik, hal ini disebabkan
karena radius terbang dari nyamuk tersebut ± 100m dari tempat mereka
berkembang biak. Selain hal tersebut, pada permasalahan DBD terdapat suatu
hipotesa awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti
dengan suhu, curah hujan dan penyinaran matahari.
Datamining dengan berbagai keunggulannya dan berbagai macam metode
yang ada, di coba diterapkan pada database Demam Berdarah Dengue (DBD)
yang disusun oleh Dinas Kesehatan (DINKES) DKI Jakarta setiap tahun dalam
rangka mengantisipasi dan memonitor penyebaran suatu penyakit (Data
Surveilans Penyakit Tahun 2004, Dinkes Propinsi DKI Jakarta, 2005).
Siklus
DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus yang
meningkat setiap tahun, membuat data yang dikumpulkan menjadi semakin
membesar, akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat
dimanfaatkan oleh semua pihak, hanya pihak tertentu saja yang dapat
memanfaatkan data tersebut secara maksimal. Dengan menerapkan konsep data
mining pada database DBD dan data set cuaca, diharapkan dapat ditemukan pola
keterkaitan antar variable data, nilai – nilai pengetahuan yang dapat di gali dan
pada akhirnya, dapat dirumuskan pola penyebaran dari DBD .
3
Secara umum rumusan substansi penelitian ini dapat dinyatakan sebagai
berikut : “Apakah konsep data mining yang di dukung dengan system pakar dapat
diterapkan dalam database DBD, sehingga di peroleh perumusan pola penyebaran
DBD di daerah DKI Jakarta”.
2. Tujuan Penelitian
Tujuan penelitian ini adalah :
a.
Menerapkan data mining dengan metode Classification based on
Predictive Association Rules (CPAR) pada database DINKES DKI
Jakarta untuk menemukan pola dari DBD yang terus berulang dan
relasinya dengan faktor – faktor alam seperti suhu, penyinaran
matahari , curah hujan dan kelembaban.
b.
Merumuskan suatu sistem peringatan dini prediksi meledaknya
DBD
(selanjutnya
di
sebut
“Aplikasi
DBD”)
dan
cara
penanggulangannya, sehingga dapat digunakan oleh semua pihak
yang berkepentingan.
3. Ruang Lingkup
Obyek Penelitian di batasi pada :
a.
Analisis konsep – konsep data mining pada database DBD, guna
mendapatkan pola keterkaitan antar variabel.
b.
Merumuskan model pola penyebaran DBD di daerah Jakarta Pusat
dan Jakarta Selatan dengan berdasarkan kondisi yang memicu
ledakan DBD dengan menerapkan sistem pakar.
c.
Data yang digunakan dalam penelitian ini adalah :
-
Data primer Kejadian DBD di DKI Jakarta yang meliputi 2
wilayah (Pusat, Selatan) selama tahun 2004 – 2005.
-
Data primer suhu, curah hujan dan kelembaban udara di wilayah
Jakarta Selatan dan Jakarta Pusat selama tahun 2004 – 2005.
4
4. Manfaat Penelitian
Manfaat dari penelitian ini untuk dapat menambah :
a. Dari segi Metodologi : untuk menguji konsep data mining dan metode
yang digunakan pada suatu data yang besar dan membantu dalam
menemukan pola keterkaitan dari data tersebut.
b. Dari segi Substansi : untuk membantu dalam memprediksi pola
penyebaran DBD pada daerah DKI Jakarta, sehingga dapat di ambil
suatu tindakan pencegahan agar DBD tersebut tidak meluas
penyebarannya dengan menerapkan sistem pakar tata laksana DBD.
5
BAB II
TINJAUAN PUSTAKA
2.1.
Demam Berdarah Dengue (DBD)
2.1.1. Definisi
Demam Berdarah dengue (DBD) adalah demam virus akut yang ditularkan
oleh nyamuk Aedes Aegypti, disertai sakit kepala, nyeri otot, sendi dan tulang,
penurunan jumlah sel darah putih dan timbulnya ruam – ruam pada kulit. DBD ini
sering pula disertai dengan pembesaran hati serta manifestasi pendarahan dan
apabila terjadi kegagalan sirkulasi darah dan pasien terjatuh maka penderita dapat
mengalami apa yang disebut dengue shock syndrome (DSS) (DINKES DKI
Jakarta, Demam Berdarah Aedes Aegypti, www.dinkesdkijarta.gov).
2.1.2. Penyebab DBD
DBD adalah penyakit pada daerah tropis seperti halnya Indonesia,
ditularkan oleh nyamuk Aedes aegypti yang menggigit di siang dan sore hari.
Nyamuk ini membawa virus yang terdiri dari 1 diantara 4 serotipe virus yang
berbeda antigen. Virus ini termasuk dalam kelompok Flavivirus dan serotipenya
adalah DEN-1, DEN-2, DEN-3, DEN-4. Infeksi oleh salah satu jenis serotipe ini
akan memberikan kekebalan seumur hidup tetapi tidak menimbulkan kekebalan
terhadap serotipe yang lainnya, sehingga seseorang yang hidup dalam daerah
endemis DBD dapat mengalami infeksi sebanyak 4 kali dalam hidupnya. Masa
tunas virus dengue berkisar 3 – 15 hari. Pada demam dengue (Dengue Fever)
permulaan sakit biasanya mendadak. Pada umumnya ditemukan sindrom trias
yaitu demam tinggi, nyeri pada anggota badan dan timbulnya ruam pada kulit.
Lama demam berkisar 4 – 5 hari. Ruam berupa bercak kemerah-merahan bersifat
makulopapular yang hilang pada penekanan. Penderita demam dengue mengalami
pembesaran kelenjar getah bening servikal. Beberapa ahli menyebut pembesaran
ini sebagai tanda Castelani dan merupakan ciri khas pada demam dengue. Pada
demam dengue jarang dijumpai manifestasi perdarahan Faktor resiko penting
pada DBD adalah serotipe virus dan faktor penderita seperti umur dan status
imunitas.
6
2.1.3. Kasus DBD di Wilayah DKI Jakarta
Untuk wilayah DKI Jakarta sejak tahun 2001 sampai dengan 2006 ini,
kasus DBD merupakan kasus yang terus menerus terjadi, bahkan sudah bisa
disebut sebagai suatu siklus tahunan yang terus berulang, bahkan pada tahun 2004
bulan februari dan maret, terjadi KLB DBD (7072 kasus) untuk wilayah DKI
Jakarta secara umum.
8000
7000
6000
KASUS
5000
4000
3000
2000
1000
0
JAN
PEB
MAR
APRIL
MEI
JUNI
JULI
AGST
SEP
OKT
NOP
DES
2001
919
1016
1091
625
907
651
706
511
341
244
232
194
2002
84
386
689
933
1131
879
489
328
207
192
205
227
2003
540
784
1454
2318
2745
2685
1070
474
380
473
471
677
2004
1625
7072
7052
1478
702
573
500
368
281
305
256
428
2005
1172
2484
1625
1236
1469
1347
1385
2524
1903
2147
2624
3537
2006
2470
2433
2876
2981
1310
Gambar 1. Jumlah Kasus DBD Bersumber Surveilans Aktif RS Per Bulan di
DKI Jakarta, 2001 – 2006 (s.d 17 Mei 2006)
Proses pengendalian nyamuk Aedes aegypti sebagai vector pembawa penyakit
DBD dilakukan dengan berbagai cara, antara lain : Fogging (penyemprotan di
daerah yang posistif atau negative DBD), pemberian abate sebagai cara
pengendalian
jentik
nyamuk,
program
3M
berkesinambungan diseluruh wilayah DKI Jakarta.
yang
dilakukan
secara
7
Untuk melihat keefektifitasan dan sebagai kontrol dari kegiatan tersebut pihak
Dinkes DKI Jakarta mencoba untuk memetakan daerah kecamatan di wilayah
DKI Jakarta menjadi 3 bagian berdasarkan laporan survailence tentang kejadian
DBD, yaitu :
Tabel 1. Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu Kecamatan
KATEGORI
KETENTUAN
MERAH
Dalam 1 minggu terjadi lebih dari 5 kasus DBD
KUNING
Dalam 1 minggu terjadi 1- 5 kasus DBD
HIJAU
2.2
Dalam 3 minggu berturut-turut tidak terjadi
kasus DBD.
Data Mining
Dalam 2 dekade ini telah terjadi peningkatan data yang sangat besar dari
segala sektor dalam kehidupan sehari-hari. Di estimasikan setiap bulannya terjadi
peningkatan data 20x lebih cepat dari bulan sebelumnya (Fayyad, PiatetskyShapiro dan Smyth 1996). Hal ini dapat mengakibatkan terjadinya penumpukan
data yang berakibat pada kemungkinan tersisihnya data – data penting yang
berguna. Data mining atau Knowledge discovery in Database (KDD) mempunyai
kemampuan untuk melakukan pencarian dan menemukan data penting yang
tersisih tersebut.
Gambar 2. Peningkatan Data Dalam 2 Dekade Terakhir
(Sumber : Fayyad, Piatetsky-Shapiro dan Smyth ,1996)
8
Berbagai definisi dari data mining dari beberapa refrensi, adalah sebagai
berikut ;
Data mining adalah proses dalam mencari berbagai model, kesimpulan
dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003).
Data mining adalah proses menyarikan informasi dari kumpulan –
kumpulan data (Brookshear, 2003) .
Dari berbagai definisi tersebut, dapat di ambil suatu kesimpulan bahwa data
mining berkaitan dengan mencari pola dan relasi yang tersembunyai dalam data
yang besar dengan tujuan prediksi atau deskripsi. Terdapat 2 jenis data mining,
yaitu directed data mining dan undirected data mining. Directed data mining
digunakan jika sudah diketahui secara pasti apa yang akan di prediksi, sehingga
proses pencarian pola dan relasi dapat langsung diarahkan pada tujuan tertentu,
misalnya untuk membuat prediksi tentang sesuatu yang tidak kita ketahui, model
ini sering di sebut model prediksi. Model seperti ini menggunakan pengalaman
untuk menentukan nilainya. Salah satu kunci dari model prediksi ini adalah data
yang cukup besar dengan hasil yang sudah diketahui, sehingga dapat digunakan
dalam melatih model tersebut.
Undirected data mining berkaitan dengan menelusuri pola dan relasi dalam
data, pada undirected data mining ini, tujuan yang ingin dicapai adalah bagaimana
model yang kita buat dapat memberikan solusi atas persoalan yang kita
permodelkan. Dalam prakteknya, data mining sering merupakan gabungan dari
keduanya.
Proses dalam data mining adalah suatu proses yang interaktif dan iterative,
melibatkan beberapa langkah dengan beberapa pertimbangan yang harus di buat
oleh penggunanya. Fayyad, Piatetsky-Shapiro dan Smyth (1996) memberikan
beberapa langkah dasar dalam mempersiapkan data mining
1. Mempersiapkan data set : memilih data, atau memfokuskan pada
sample data yang akan kita cari pola atau relasinya
2. Membersihkan data dan memproses data
3. Mengurangi data, dalam proses ini menemukan feature yang berguna
untuk merepresentasikan data disesuaikan dengan tujuan
9
4. Menyesuaikan tujuan dari data mining dengan metode data mining
yang ada, seperti clustering, regression, classification, fuzzy
5. Explorasi analisis, model dan hipotesis, dalam proses ini di pilih
algoritma, metode
yang akan digunakan dalam mencari pola dari
suatu data set.
6. Proses Data mining, mencari pola dan relasi dari data set.
7. Interpretasi pola – pola yang di dapat , dalam proses ini proses dapat
berulang (iteratif) dari 1 sampai 7. Pada proses ini juga dapat
dilengkapi dengan visualisasi dari pola yang didapat.
8. Menggunakan hasil dari pola dan relasi yang ditemukan. Pada proses
ini dilakukan pemeriksaan dan perbaikan
Langkah – langkah dasar ini di ilustrasikan pada gambar 3,
Gambar 3 . Pembuatan Model dalam DataMining
(adaptasi dari Berry and Linoff)
10
2.2.1. Klasifikasi dan Prediksi
Klasifikasi dan prediksi adalah dua bentuk analisis data yang bisa digunakan
untuk mengekstrak model dari data yang berisi kelas-kelas atau untuk
memprediksi trend data yang akan datang. Klasifikasi memprediksi data dalam
bentuk katagori, sedangkan prediksi memodelkan fungsi-fungsi dari nilai yang
kontinyu. Klasifikasi data dilakukan dengan dua tahapan. Pada tahap pertama,
model dibentuk dengan menentukan kelas-kelas data. Model dibentuk dengan
menganalisa database tuples yang dinyatakan dengan atribut.Dalam konteks
klasifikasi, data tuples disebut juga disebut Data sample. Data sample ini
membentuk training data set yang selanjutnya dianalisa untuk membangun
model. Setiap sample yang membentuk training set disebut training sample dan
secara acak dipilih dari sample population. Karena label kelas dari setiap training
sample telah diketahui, maka tahapan ini disebut juga supervised learning.
Supervised learning ini kebalikan dari unsupervised learning, dimana pada
unsupervised learning label kelas dari setiap training sample tidak diketahui.
Pada tahap kedua, model digunakan untuk klasifikasi. Pertama, akurasi
model prediksi (atau classifier) ditentukan menggunakan data test. Sample ini
secara acak dipilih, independent dengan training sample. Akurasi dari model pada
test set adalah prosentase dari sample test set yang diklasifikasikan oleh model
dengan benar. Untuk setiap sample test, label kelas yang telah diketehui
dibandingkan dengan model kelas prediksi yang telah dilatih untuk sample
tersebut. Jika akurasi dari model bisa diterima, maka model bisa digunakan untuk
mengklasifikasikan data tuples dimana label kelasnya tidak diketahui. Misalnya,
classification rule yang telah dihasilkan dari analisis data dari pelanggan yang ada
dapat digunakan untuk memprediksi credit rating dari pelanggan baru.
Prediksi bisa dipandang sebagai pembentukan dan penggunaan model untuk
menguji kelas dari sample yang tidak berlabel, atau untuk menguji nilai atau
rentang nilai dari suatu atribut. Dalam pandangan ini, klasifikasi dan regresi
adalah dua jenis masalah prediksi, dimana klasifikasi digunakan untuk
memprediksi nilai-nilai diskrit atau nominal, sedangkan regresi digunakan untuk
memprediksi nilai-nilai yang kontinyu. Untuk selanjutnya penggunaan istilah
prediction untuk memprediksi kelas yang berlabel disebut classification, dan
11
pengggunaan istilah prediksi untuk memprediksi nilai-nilai yang kontinyu sebagai
prediction (Han & Kamber, 2001).
2.2.2 Metodologi Data mining
Ada beberapa konsep yang penting pada data mining. Konsep pertama
berkaitan dengan mencari pola di dalam data. Biasanya berupa kumpulan data
yang sering muncul. Tetapi secara umum berupa suatu daftar atau pola data yang
muncul lebih sering dari yang diharapkan saat dilakukan secara acak. Konsep
yang kedua adalah sampling, yang bertujuan untuk memperoleh keterangan
mengenai populasi dengan mengamati hanya sebahagian saja dari populasi itu.
Hal lain yang juga penting yang berhubungan dengan data mining adalah
validasi model prediksi yang muncul dari algoritma data mining. Model
digunakan untuk membuat prediksi tentang suatu record yang menggambarkan
keadaan nyata yang baru, dan model terbatas hanya merefleksikan basis data
histori dimana model tersebut dibuat. Model adalah deskripsi dari data historis
dimana model tersebut dibangun untuk bisa diterapkan ke data baru dengan tujuan
membuat prediksi tentang nilai-nilai yang terputus atau untuk membuat
pernyataan tentang nilai yang diharapkan, sedangkan Pola adalah suatu kejadian
atau kombinasi kejadian dalam suatu basis data yang terjadi atau muncul lebih
sering dari yang diharapkan (Berson et al., 2001).
Gambar proses pembuatan datamining dengan menggunakan konsep Berson et al
disajikan dalam gambar berikut ini
Data Historis
Pembuatan
Model
143
Record
Model
Prediksi
Gambar 4. Model proses pembuatan data mining
Sumber: Berson, 2001.
12
2.2.3. Teknik Data mining
Ada tiga hal pokok yang harus diperhatikan untuk keberhasilan penerapan
data mining, yaitu; teknik data mining, data itu sendiri, dan model data. Teknik
adalah pendekatan umum untuk memecahkan masalah, dan biasanya terdapat
banyak cara yang bisa digunakan. Masing-masing cara mempunyai algoritma nya
sendiri-sendiri.
Istilah teknik digunakan untuk menunjukkan pendekatan
konseptual untuk menyaring informasi dari data. Algoritma menunjukkan detil
tahap demi tahap dari cara tertentu untuk mengimplementasikan suatu teknik.
Data mining bisa berupa predictive atau descriptive. Perbedaan ini
menunjukkan tujuan dari penggunaan data mining. Tujuan utama predictive data
mining adalah mengotomatisasikan proses pembuatan keputusan dengan membuat
model yang punya kemampuan untuk melakukan prediksi atau mengestimasi
suatu nilai. Umumnya hasil dalam predictive data mining akan langsung ditindak
lanjuti Sehingga tolok ukur yang paling penting pada model adalah akurasinya.
Data mining sering juga bersifat descriptive. Tujuan utama descriptive data
mining adalah untuk menggali pola yang ada di dalam data. Descriptive data
mining sering menghasilkan action, tetapi bukan berupa urutan aksi yang bisa
diotomatisasikan secara langsung dari hasil model (Berry & Linoff, 2000).
Descriptive mining, yaitu proses untuk menemukan karakteristik penting
dari data dalam suatu basis data. Clustering, Association, dan Sequential mining
adalah beberapa contoh dari teknik descriptive mining.
Predictive mining, yaitu proses untuk menemukan pola dari data untuk
membuat prediksi. Classification, Regression dan Deviation adalah teknik dalam
predictive mining.
2.2.3.1 Association Rule
Association rule merupakan salah satu teknik data mining yang paling
banyak
digunakan
dalam
penelusuran
pola
pada
sistem
pembelajaran
unsupervised. Metodologi ini akan mengambil seluruh kemungkinan pola-pola
yang diamati dalam basis data. Association rule menjelaskan kejadian-kejadian
yang sering muncul dalam suatu kelompok. Misalnya metodologi ini bisa
digunakan untuk menganalisa produk-produk mana saja yang sering dibeli oleh
13
seorang pelanggan secara bersamaan (analisa keranjang belanja). Hasil analisis
tersebut bisa digunakan untuk menentukan peletakan produk di toko.
Satu itemset adalah himpunan bagian A dari semua kemungkinan item I.
Satu itemset yang mengandung i item disebut i-itemset. Prosentase transaksi
yang mengandung itemset disebut support. Untuk suatu itemset yang akan
diamati, support-nya harus lebih besar atau sama dengan nilai yang dinyatakan
oleh user, sehingga itemset tersebut dikatakan sering muncul (frequent).
Bentuk umum aturan asosiasi adalah A1,A2,…,An → B1,B2,…,Bm, yang
berarti jika item Ai muncul, item Bj juga muncul dengan peluang tertentu.
Misalkan X adalah itemset. transaksi T dikatakan mengandung X jika dan hanya
jika X ⊆ T. Aturan X ⇒ Y menyatakan himpunan basis data transaksi dengan
tingkat kepercayaan (confidence) C, jika C% dari transaksi dalam D yang
mengandung X juga mengandung Y. Rule X ⇒ Y mempunyai support dalam
transaksi set D jika S% dari transaksi dalam basis data berisi X ∪ Y. Tingkat
kepercayaan menunjukkan kekuatan implikasi, dan support menunjukkan
seringnya pola terjadi dalam rule. Sebagai contoh diberikan aturan : A, B ⇒ C
dengan S = 0.01 dan C = 0.8. Hal ini berarti bahwa 80% dari semua pelanggan
yang membeli A dan B juga membeli C, dan 1% dari semua pelanggan membeli
ketiga item tersebut.
Mining association rule dilakukan dalam dua tahap, yaitu
1. Mencari semua association rule yang mempunyai minimum support S min
dan minimum confidence Cmin. Itemset dikatakan sering muncul (frequent)
jika Support(A) ≥ Smin.
2. Menggunakan itemset yang besar untuk menentukan association rule
untuk basis data yang mempunyai tingkat kepercayaan C di atas nilai
minimum yang telah ditentukan (Cmin.).
2.2.3.2 Classification-Based Association
Saat ini, salah satu teknik data mining telah dikembangkan adalah dengan
menerapkan konsep association rule mining dalam masalah klasifikasi. Ada
beberapa metode yang bisa digunakan, antara lain association rule clustering
system (ARCS) dan associative classification (Han & Kamber, 2001). Metode
14
ARCS melakukan association rule mining didasarkan pada clustering kemudian
menggunakan aturan yang dihasilkan untuk klasifikasi. ARCS, melakukan
association rule mining dalam bentuk Aquant1 ∧ Aquant2 ⇒ Acat, dimana bentuk
Aquant1 dan Aquant2 adalah data test yang atributnya punya rentang nilai, Acat
menunjukkan label kelas untuk atribut kategori yang diberikan dari training data.
Metode associative classification mining menghasilkan aturan dalam bentuk
condset ⇒ y, dimana condset adalah sekumpulan item dan y adalah label kelas.
Aturan yang sesuai dengan minimum support tertentu disebut frequent. Rule
mempunyai support s jika s% dari sample dalam data set yang mengandung
condset dan memiliki kelas y. Aturan yang sesuai dengan minimum confidence
disebut accurate. Aturan mempunyai confidence c jika c% dari sample dalam data
set yang mengandung condset memiliki kelas y. Jika beberapa rule mempunyai
condset yang sama, maka rule dengan confidence tertinggi dipilih sebagai
possible rule (PR). Metode associative classification mining menggunakan
algoritma association rule, seperti algoritma Appriori untuk menghasilkan
association rule, kemudian memilih sekelompok aturan yang mempunyai kualitas
tinggi dan menggunakan aturan tersebut untuk memprediksi data. Associative
classification masih kurang efisien karena seringkali menghasilkan aturan dalam
jumlah yang besar (Yin & Han, 2003).
Metode
classification-based
association
lainnya
adalah
CPAR
(Classification based on Predictive Association Rule). Algoritma ini mengambil
ide dari FOIL (First Order Inductive Leaner) dalam menghasilkan aturan dan
mengintegrasikannya dengan associative classification.
2.2.4. Algoritma Appriori
Algoritma apriori menghitung seringnya itemset muncul dalam basis data
melalui beberapa iterasi. Setiap iterasi mempunyai dua tahapan; menentukan
kandidat dan memilih serta menghitung kandidat. Pada tahap pertama iterasi
pertama, himpunan yang dihasilkan dari kandidat itemset berisi seluruh 1-itemset,
yaitu seluruh item dalam basis data. Pada tahap kedua, algoritma ini menghitung
support-nya mencari melalui keseluruhan basis data Pada akhirnya hanya iitemset dengan batas minimum tertentu saja yang dianggap sering muncul
15
(frequent). Sehingga setelah iterasi pertama, seluruh i-itemset yang sering muncul
akan diketahui. Pada iterasi kedua, algoritma appriori mengurangi sekelompok
kandidat itemset yang dihasilkan dari iterasi pertama dengan menghapus kandidat
itemset yang tidak sering muncul. Penghapusan ini berdasarkan pengamatan yaitu
apakah itemset tersebut sering muncul atau tidak.
1. k = 1
2. C1 = I (semua item)
3. While Ck > 0
( a ). Sk = Ck
( b ).Ck + 1 = Semua himpunan dengan k=1 elemen yang terbentuk
dengan menggabungkan dua itemset dalam sk
( c ). Ck + 1 = Ck + 1
( d ). S = S + Sk
( e ). k + +
4. return S
Tabel 2. Transaksi Penjualan Barang
A
B
C
D
E
Pelanggan 1
1
0
1
1
0
Pelanggan 2
0
1
1
0
1
Pelanggan 3
1
1
1
0
1
Pelanggan 4
0
1
0
0
0
Misalkan pada tabel 2, akan dicari seluruh itemset dengan minimal support
Smin = 50%. Sehingga itemset dianggap sering muncul jika ia terdapat pada paling
tidak di 50% transaksi. Dalam setiap iterasi, algoritma appriori membentuk
kandidat set, menghitung jumlah kejadian dari setiap kandidat dan memilih
itemset didasarkan pada minimum support yang telah ditentukan sebelumnya yaitu
50%.
Pada tahap pertama iterasi pertama, semua item adalah kandidat. Algoritma
appriori hanya menelusuri semua transaksi dalam basis data dan membuat daftar
kandidat, yaitu ;
C1 = [ (A), (B), (C), (D), (E) ]
L1 = [ (A), (B), (C), (D), (E) ]
16
Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat
dan berdasarkan nilai minimum support Smin, kemudian menentukan itemset yang
sering muncul, setelah tahap ini kandidat berisi:
L1 = [(A),(B), (C), (E) ]
D dikeluarkan karena nilai S = 25%, hanya ada satu transaksi dari keseluruhan
empat transaksi..
Untuk menelusuri himpunan 2-itemset, karena himpunan bagian (subset) dari 2itemset juga mempunyai minimum support yang sama, algoritma appriori
menggunakan L1 * L1 untuk membuat kandidat. Operasi * didefinisikan sebagai
berikut ;
Lk * Lk = [X U Y dimana X,Y Ε Lk, (X∩Y=K-1 ),
Untuk k =1 ⇒ |L1| . |(L1)-1)/2| = 4 . 3/2 = 6
Pada iterasi kedua kandidat berisi :
C2 = [ (A,B), (A,C), (A,E), (B,C), (B,E), (C,E) ].
Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat
dan berdasarkan nilai minimum support Smin, kemudian menentukan itemset yang
sering muncul, setelah tahap ini kandidat berisi:
L2 = [ (A,C), (B,C), (B,E), (C,E) ]
Himpunan 3-itemset dihasilkan dari S2 menggunakan operasi yang sudah
ditentukan sebelumnya L2 * L2. Langkah praktisnya, dari L2 dengan item yang
pertama sama, yaitu (B,C), (B,E),dinyatakan pertama. Kemudian algoritma
appriori akan mencek apakah 2-itemset (C,E), yang berisi item kedua dari (B,C),
(B,E) terdapat pada L2 atau tidak. Karena (C,E) ada dalam L2, maka ( B,C,E )
menjadi kandidat 3-itemset.
Karena tidak ada kandidat 4-itemset, maka algoritma ini berakhir.
2.2.5. Membuat Association Rule berdasarkan Frequent Itemset
Tahap kedua dalam penelusuran assosiation rule didasarkan pada seluruh iitemset yang sering muncul, yang didapat dari tahap pertama. Untuk rule yang
mengandung X1, X2, X3 → X4, rule tersebut dianggap bermakna jika kedua
itemset tersebut X1, X2, X3, X4 dan X1, X2, X3 adalah frequent. Sehingga
tingkat kepercayaan C dari rule tersebut dihitung sebagai hasil bagi dari support
itemset, yaitu :
17
C = S(X1, X2, X3, X4) / S(X1, X2, X3).
Strong association rule adalah rule dengan tingkat kepercayaan C diatas S min.
Misalkan dari tabel 1 akan dicek apakah association rule (B,C) → E adalah strong
rule.
Pertama harus dipilih hubungan support dari tabel L2 dan L3.
S(B,C) = 2, S(B,C,E) = 2
C((B,C) → E ) = S(B,C,E)/S(B,C) = 2/2 = 1 (100%)
Karena tingkat kepercayaan adalah maksimal, maka jika transaksi berisi item B
dan C maka transaksi tersebut juga berisi item E.
2.2.6. Classification based on Predictive Association Rules (CPAR)
Klasifikasi pada penelitian ini menggunakan association rule, menurut Yin
X, Han J, 2003, algoritma yang efektif untuk digunakan dalam masalah klasifikasi
adalah CPAR. Pada algoritma ini klasifikasi diimplementasikan dalam tiga tahap:
rule generation, rule evaluation dan classification.
Pada
proses
rule
generation,
CPAR
membangun
rule
dengan
menambahkan literal satu persatu. Pada setiap tahapan proses, CPAR menghitung
Gain dari setiap perhitungan. Setelah masing-masing sampel diproses untuk
mendapatkan rule, sampel ini digunakan kembali didalam perhitungan Gain tetapi
dengan mengurangi bobot dengan decay factor. Bobot sampel dikurangi hingga
mencapai nilai minimum yang dihitung oleh parameter w yaitu bobot seluruh
sampel positif. Bobot seluruh contoh pada awal proses diset 1.
Setelah proses rule generation, CPAR mengevaluasi setiap rule untuk
menentukan kekuatan prediksinya. Untuk rule r = p 1
∧
p2
... ∧
pn → c, CPAR
mendefinisikan ekspektasi akurasi sebagai sebagai berikut :
L.A = (nc+1) / (ntotal + f)
Dimana L.A adalah Laplace Accuracy, f adalah jumlah kelas, ntotal adalah juimlah
total sampel yang memenuhi body dari aturan, nc adalah jumlah sampel yang
memenuhi kelas c.
Klasifikasi berupa sekumpulan rule untuk setiap class, CPAR menggunakan
s rules terbaik setiap kelas, yang dipilih berdasarkan Laplace accuracy.
18
Pada algoritmna CPAR nilai gain yang dipilih adalah nilai gain yang
terbaik pada setiap iterasinya, sehingga untuk atribut yang nilai gain-nya hampir
sama, maka CPAR melakukan pemilihan yang terbaik. Pemilihan atribut tersebut
dilakukan dengan menghitung dan menerapkan gain similarity ratio. Semua
atribut dengan nilai gain lebih besar dari best Gain x gain similarity ratio akan
dipilih dan diproses lebih lanjut
2.2.6.1 Membuat Rule Dalam CPAR
Dalam datamining, setiap aturan di-bangun dari dataset yang tersisa, CPAR
hanya memilih literal yang terbaik dan mengabaikan seluruh literal lainnya.
CPAR membuat rule s dengan menambahkan literal satu per satu. Setelah CPAR
menemukan literal terbaik p, literal lainnya misalnya q yang Gain-nya mirip
dengan p (misalnya hanya berbeda 1%) akan dicari. Selain terus membangun rule
dengan menambahkan p ke r, q juga ditambahkan ke current rule r untuk
membuat rule baru r’
2.2.7 Membangun Model Prediksi
Keberhasilan dalam membangun model prediksi dalam datamining lebih
banyak tergantung pada proses bukan pada teknik yang digunakan, dan proses
tersebut sangat tergantung pada data yang digunakan untuk menghasilkan model
.Tantangan utama dalam membangun model prediksi adalah mengumpulkan data
awal yang cukup dalam membangun suatu aturan - aturan. Dalam preclassified,
hasilnya sudah diketahui, dan karenanya preclassified digunakan untuk melatih
model, himpunan data tersebut disebut model set.
Berry & Linoff memberikan langkah-langkah dasar dalam membangun model
prediksi
1. Model dilatih menggunakan preclassified data, dengan mengambil sebagian
data dari dataset yang disebut training set. Pada tahap ini, algoritma data
mining mencari pola-pola dari nilai yang diprediksi.
2. Model diperbaiki menggunakan himpunan bagian lain dari data yang disebut
test set. Model perlu diperbaiki agar tidak hanya bisa bekerja pada training
set.
19
3. Performance model diestimasi atau membandingkan performance beberapa
model, dengan menggunakan himpunan data ketiga, yang didapat dari
gabungan himpunan data pertama dan kedua, yang disebut evaluation set.
4. Model diterapkan ke score set. Score set bukan preclassified, dan bukan
bagian dari model set. Hasil dari data tersebut tidak diketahui. Predictive score
akan digunakan untuk membuat keputusan.
Dataset adalah preclassified data yang digunakan untuk membangun
model. Dataset perlu dipecah ke dalam tiga komponan, training set, test set dan
evaluation set.
Gambar 5 menggambarkan langkah-langkah dasar dalam membangun model
prediksi (Berry & Linoff, 2000)
Training set
digunakan untuk
membangun model
Training
Set
Test set digunakan
untuk memperbaiki
model
Model
(Kasar)
Model
(Perbaikan)
Test Set
Evaluation set digunakan
untuk menilai akurasi
yang diharapkan dari
model saat diterapkan ke
data di luar model set
Evaluation
Set
Model yang terbaik
Score Set
diterapkan ke score set
untuk menghasilkan
prediksi
Model
(terbaik)
Prediksi
Gambar 5. Langkah-langkah membangun model prediksi
Sumber: Berry & Linoff, 2000
20
2.3 Sistem Fuzzy
Sistem fuzzy pertama kali diperkenalkan oleh Prof. L. A. Zadeh dari
Barkelay pada tahun 1965. Sistem fuzzy merupakan penduga numerik yang
terstruktur
dan
dinamis.
Sistem
ini
mempunyai
kemampuan
untuk
mengembangkan sistem intelijen dalam lingkungan yang tak pasti. Sistem ini
menduga suatu fungsi dengan logika fuzzy. Dalam logika fuzzy terdapat beberapa
proses yaitu penentuan himpunan fuzzy, penerapan aturan IF-THEN dan proses
inferensi fuzzy (Marimin, 2002).
2.3.1. Himpunan Fuzzy
Ada beberapa hal yang perlu diketahui dalam memahami sistem fuzzy
yaitu, [Kusumadewi] variabel fuzzy, himpunan fuzzy, semesta pembicaraan dan
domain. Variabel Fuzzy merupakan variabel yang akan dibahas dalam sistem
fuzzy misalnya umur, temperatur, permintaan, dsb. Himpunan Fuzzy merupakan
suatu group yang mewakili suatu kondisi tertentu dalam variabel fuzzy misalnya
variabel umur dibagi atas 3 himpunan fuzzy
yaitu muda, parobaya dan tua.
Semesta Pembicaraan adalah keseluruhan nilai yang diperbolehkan untuk
dioperasikan dalam suatu variabel fuzzy misalnya semesta pembicaraan variabel
umur adalah 0 sampai 100. Domain adalah keseluruhan nilai yang diijinkan dalam
semesta pembicaraan dan boleh dioperasikan dalam himpunan fuzzy misalnya
domain umur muda 20 – 45, domain parobaya 25 – 65 dan domain tua 45 – 70.
2.3.2. Fungsi Keanggotaan
Fungsi keanggotaan (membership function) adalah kurva yang menunjukkan
pemetaan titik input data ke dalam nilai keanggotaan yang mempunyai interval 0
– 1. Ada beberapa fungsi keanggotaan yang digunakan antara lain representasi
kurva sigmoid, trapesoid dan triangular. Contoh representasi fungsi keanggotaan
sigmoid disajikan pada gambar 6.
21
Gambar 6 : Fungsi Keanggotaan ”USIA” dengan representasi Sigmoid .
2.3.3. Operator Himpunan Fuzzy
Seperti himpunan biasa, ada beberapa operasi yang didefinisikan secara
khusus untuk mengkombinasikan himpunan fuzzy. Ada 3 operator dasar yang
diciptakan Zadeh yaitu operator AND, OR dan NOT. Nilai keanggotaan baru
sebagai hasil dari operasi 2 himpunan disebut α -predikat.
Operator AND merupakan operasi interseksi pada himpunan. α -predikat yang
dihasilkan diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen
pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himpunan
muda adalah µ MUDA[27] = 0,6 dan nilai keanggotaan 2 juta pada himpunan
penghasilan TINGGI adalah µ GAJITINGGI[2juta]= 0,8, maka α -predikat untuk
usia MUDA dan berpenghasilan TINGGI adalah nilai keanggotaan minimun :
µ MUDA ∩ GAJITINGGI = min( µ MUDA[27], µ GAJITINGGI[2juta])
= min (0,6 ; 0,8)
= 0,6
Operator OR merupakan operasi union pada himpunan. α -predikat yang
dihasilkan diperoleh dengan mengambil nilai keanggotaan terbesar antar elemen
pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himp unan
muda adalah µ MUDA[27]= 0,6 dan nilai keanggotaan 2 juta pada himpunan
penghasilan TINGGI adalah µ GAJITINGGI[2juta]= 0,8, maka α -predikat untuk
usia MUDA atau berpenghasilan TINGGI adalah nilai keanggotaan maksimum :
µ MUDA ∩ GAJITINGGI = max( µ MUDA[27], µ GAJITINGGI[2juta])
22
= max (0,6 ; 0,8)
= 0,8
Operator NOT merupakan operasi komplemen pada himpunan. α -predikat yang
dihasilkan diperoleh dengan mengurangkan nilai keanggotaan elemen pada
himpunan dari 1. Misal nilai keanggotaan umur 27 pada himpunan muda adalah
µ MUDA[27]= 0,6 maka α -predikat untuk usia TIDAK MUDA adalah :
µ MUDA’[27] = 1 - µ MUDA[27
= 1 - 0,6
= 0,4
2.3.4. Fungsi Implikasi
Tiap aturan (proposisi) pada basis pengetahuan fuzzy akan berhubungan dengan
suatu relasi fuzzy. Bentuk umum aturan yang digunakan dalam fungsi implikasi
adalah :
IF x is A THEN y is B
x dan y adalah skalar sedang A dan B adalah himpunan fuzzy. Proposisi yang
mengikuti IF disebut anteseden, sedangkan proposisi yang mengikuti THEN
disebut konsekuen. Secara umum ada 2 fungsi implikasi yaitu fungsi implikasi
Min (minimum) dan fungsi implikasi DOT (product).
Misal bentuk aturan sebagai berikut :
[R1] IF Permintaan NAIK AND Stok SEDIKIT THEN Produksi TINGGI
Nilai keanggotaan Permintaan 8.000 pada himpunan Permintaan NAIK adalah
µ NAIK[8.000]= 0,7 dan nilai keanggotaan Stok 10.000 pada himpunan Stok
SEDIKIT adalah µ SEDIKIT[10.000]= 0,9
maka fungsi implikasi untuk
Produksi TINGGI adalah perpotongan nilai keanggotaan minimum sehingga nilai
keanggotaan Produksi TINGGI adalah µ TINGGI=0,7.
Aplikasi Fungsi implikasi Min (minimum) memotong output diilustrasikan pada
gambar 7.
23
Gambar 7 : Fungsi implikasi MIN
Aplikasi Fungsi implikasi DOT (product) akan menskala output disajikan pada
gambar 8.
Gambar 8 : Fungsi implikasi DOT
2.3.5 Sistem Inferensi Fuzzy (SIF)
Ada beberapa metode untuk merepresentasikan hasil logika fuzzy yaitu metode
Tsukamoto, Mamdani dan Sugeno.
Pada metode Tsukamoto, setiap konsekuen direpresentasikan dengan himpunan
fuzzy dengan fungsi keanggotaan monoton. Output hasil inferensi masing-masing
aturan adalah z, berupa himpunan biasa (crisp) yang ditetapkan berdasarkan α predikatnya. Hasil akhir diperoleh dengan menggunakan rata-rata terbobotnya.
α 1 z1 + α 2 z2
z = ––––––––––––
α 2+α 2
Pada metode Mamdani, aplikasi fungsi implikasi menggunakan MIN, sedang
komposisi aturan menggunakan metode MAX. Metode Mamdani dikenal juga
dengan metode MAX-MIN. Inferensi output yang dihasilkan berupa bilangan
fuzzy maka harus ditentukan suatu nilai crisp tertentu sebagai output. Proses ini
dikenal dengan defuzzifikasi. Ada beberapa metoda yang dipakai dalam
defuzzifikasi antara lain metode centroid. Pada metode ini penetapan nilai crisp
dengan cara mengambil titik pusat daerah fuzzy.
24
Metode Sugeno mirip dengan metode Mamdani, hanya output (konsekuen) tidak
berupa himpunan fuzzy, melainkan berupa konstanta atau persamaan liniar. Ada
dua model metode Sugeno yaitu model fuzzy Sugeno orde nol dan model fuzzy
Sugeno orde satu.
Bentuk umum model fuzzy Sugeno orde nol adalah :
IF (x1 is A 1) o (x2 is A 2) o ….. o (xn is An) THEN z = k
Bentuk umum model fuzzy Sugeno orde satu adalah :
IF (x1 is A 1) o (x2 is A 2) o ….. o (xn is An) THEN z = p 1* x1 + … pn* xn + q
Defuzzifikasi pada metode Sugeno dilakukan dengan mencari nilai rata-ratanya.
Contoh aplikasi fuzzy pada datamining adalah pada penyelesaian masalah
pemilihan pakaian berikut ini ;
Diasumsikan faktor utama dalam pemilihan pakaian adalah sebagai berikut
f1 = style, f2 = qualitas, f3 = harga, sehingga F = {f1,f2,f3}. Tingkatan umum yang
digunakan pada seleksi adalah e1 = sangat baik , e2 = baik , e3 = sedang , e4 =
buruk, sehingga E = {e1,e2,e 3,e4}. Untuk tiap-tiap potong pakaian “u”, faktor
penentu evaluasi adalah didapat dari hasil survey. Sebagai contoh, jika hasil
survey menunjukkan “style” faktor f1 = 60% untuk sangat baik, 20% untuk baik,
10% untuk sedang, 10% untuk buruk, sehingga faktor penentu evaluasi
mempunyai vektor R1(u) :
R1(u) = { 0.6, 0.2, 0.1, 0.1}
Secara umum, kita dapat membuat faktor penentu evaluasi untuk vektor f2 dan f3
R2(u) = { 0.1,0.5, 0.3, 0.1 }
R3(u) = { 0.1, 0.3, 0.4, 0.2}
Sehingga berdasar hal diatas kita dapat membuat matrix evaluasi
 R1(u ) 


 R 2( u ) 
 R 3(u ) 
=
 0.6
 0.1

 0.1
0.2
0.5
0.1
0.3
0.1
0.1
0.3
0.4
0.2




25
Jika weight vector dari pembeli adalah
W(u) = { 0.4, 0.4, 0.2 }
Perkalian dari matrix W(u) dan R(u) adalah berdasarkan komposisi max – min
fuzzy rules, dimana hasil evaluasi adalah digambarkan dalam fuzzy set D(u) =
[ d1,d2,d 3,d4] :
.
D(u) = W(u) R(u) = [0.4
0.4
0.2]
.
0.6 0.2 0.1 0.1


0.1 0.5 0.3 0.1 
0.1 0.3 0.4 0.2
= [0.4
0.4
0.3
0.2]
Dimana, d1 dihitung berdasarkan langkah-langkah berikut :
d1
= (w1 ´ r11) V (w2 ´ r21) V (w3 ´ r31)
= (0.4 ´ 0.6 ) V(0.4 ´ 0.1) V (0.2 ´ 0.1)
= 0.4 V 0.1 V 0.1
= 0.4
Nilai untuk d2 , d3 , d4 hampir sama, dimana ´ dan V merepresentasikan operator
min dan max. Karena komponen terbesar D(u) adalah d 1 = 0.4 dan d 2 = 0.4 di saat
yang sama, sehingga analisa untuk pakaian ini berada diantara „sangat baik“ dan
„baik“
2.4.
Prakiraan / Forecasting
2.4.1 Teknik Prakiraan Pemulusan Eksponensial
Teknik ini pertama kali diperkenalkan pada tahun 1970 oleh George E P
Box dan Gwilym M Jenkins dalam bukunya ” Time Series Analysis : Forecasting
and Control”. Dasar dari teknik ini adalah , Pengamatan sekarang (Zt) tergantung
pada 1 atau beberapa pengamatan sebelumnya (Zt-k) dengan kata lain, model time
series dibuat karena secara statistik ada korelasi antar deret pengamatan untuk
melihat adanya dependensi antar pengamatan . Kita dapat melakukan uji korelasi
antar pengamatan yang dikenal sebagai auto correlation function (acf)
26
2.4.2
Metode Winters
Teknik prakiraan dengan metode Winters digunakan untuk data yang
mempunyai pola musiman dan kecenderungan. Sebagai contoh pola data yang
bersifat musiman dan kecenderungan dapat dilihat pada tabel 3 . Data pada tabel 3
menunjukkan pola musiman kuartalan, dalam pengertian pola data antar kuartal
untuk tahun yang berbeda mempunyai pola yang sama dengan periode yang tetap,
yaitu selang 3 bulanan. Karena pola 3 bulanan, maka dalam 1 (satu) tahun
terdapat 4 musim atau dalam hal ini dinotasikan dengan L = 4
Tabel 3. Contoh data penjualan yang bersifat musiman
Tahun
1987
1988
1989
Kuartal
Periode
Penjualan
(t)
( Xt)
I
1
36
II
2
39
III
3
43
IV
4
34
I
5
38
II
6
41
III
7
50
IV
8
39
I
9
47
II
10
51
III
11
58
IV
12
47
Metode Winters didasarkan atas 3 persamaan pemulusa, yaitu untuk pola
data stationer (St), kecenderungan (bt) dan indeks musiman (It).
St = ? Xt / It-L + (1 – ? )(St-1 + bt -1) ………………(a)
bt = ß(St - St-1 ) + (1 – ß ) bt-1 ………………………………….(b)
It = d Xt / St + (1- d ) It-L ………………………....(c)
Prakiraan untuk m periode mendatang dirumuskan sebagai berikut
F t+m = (St + b t.m) I t -L + m ………………………..(d)
Untuk melakukan prakiraan dengan metode Winters harus tersedia data
histories minimal 2 tahun, hal ini karena kalau data yang tersedia hanya 1 tahun,
27
maka factor kecenderungan untuk kuartal tertentu tidak dapat diketahui.
Kecenderungan pada kuartal tertentu hanya dapat diketahui apabila tersedia data,
misalnya kuartal I tahun 1987 dan kuartal I tahun 1998.
Insilisasi diperlukan dalam menggunakan teknik Winters ini, hal ini dapat
dijelaskan sebagai berikut, misalkan untuk melakukan prakiraan pada periode ke5 (dengan m = 1), maka dari persamaan (d) diperlukan nilai S5 dari rumus (a)
diperlukan nilai I0. Nilai I0 belum terdefinisi, untuk data pola musiman kuartalan
seperti tabel 3 (L = 4), inisialisasi minimal diperlukan untuk menetapkan :
a. Nilai indeks musiman pada setiap kuartal pada tahun pertama
b. Factor kecenderungan kuartal terakhir pada tahun pertama ( b4 atau b
awal),
dan
c. Nilai S 4 (atau S awal)
Insialisasi indeks musiman pada tahun pertama ditetapkan dengan
rumusan sebagai berikut :
It = Xt / X ……….untuk setiap t = 1,2,3…L, dimana
X=? Xi/ L
Insialisasi b awal untuk data histories yang tersedia sebanyak 2L, ditetapkan
dengan rumusan sebagai berikut :
b awal = 1/L {(X
L+1
– X1)/L + ( X
L+2
– X2 )/L + …+(X
L+L –
XL)/L}
Inisialisasi untuk S awal ditetapkan dengan menggunakan rumusan
sebagai berikut :
? Xt + 3L 2 b awal – 2 b awal . ? t . I t
S awal = ----------------------------------------------2L
Nilai inisialisasi akan menentukan ukuran kecermatan prakiraan dan
demikian juga dengan nilai parameter ?, ß, dan d.
Sebagai contoh misalkan untuk data pada tabel 3, parameter pemulus yang
digunakan adalah ? = 0.2, ß = 0.1 dan d = 0.05 dan sebagai himpunan periode /
data uji adalah periode t = 6 s/d t = 12. Dengan menggunakan parameter m = 1,
maka hasil perhitungan dapat dilihat pada tabel 4.
Jika dilakukan prakiraan untuk periode ke 13 atau kuartal I tahun 1990,
dengan m=1 , berarti periode dasarnya adalah t = 12, sehingga :
28
F12
+ 1
= (S12 + b12).I9; dimana I9 adalah indeks musiman kuartal I pada
tahun sebelumnya (1989), jika I9 belum diketahui maka dicari dengan
memuluskan indeks musiman kuartal I tahun 1988 atau I8.
Tabel 4. Contoh hasil penerapan metode Winters (? = 0.2, ß = 0.1 dan d = 0.05)
Kuartal
1987
1988
1998
2.5.
Data
Pemulusan
Pemulusan
Pemulusan
Ramalan jika
Aktual
Tunggal
Musiman
Trend
m=1
1
36
0.95
2
39
1.01
3
43
1.10
4
34
45.03
0.83
1.00
5
38
44.84
0.94
0.88
6
41
44.67
1.01
0.78
46.32
7
50
45.43
1.10
0.77
50.11
8
39
46.31
0.83
0.79
38.55
9
47
47.65
0.94
0.84
44.38
10
51
48.91
1.01
0.88
48.89
11
58
50.30
1.02
1.02
48.89
12
47
49.58
1.09
0.85
56.58
Penelitian Terdahulu
Penelitian di bidang kesehatan dengan menerapkan datamining dari suatu
dataset yang ada, telah dilakukan oleh bebagai pihak. Pada umumnya hasil akhir
yang akan mereka capai adalah didapatnya suatu pola, sehingga dari pola tersebut
akan didapatkan prediksi tentang keadaaan tertentu .
Beberapa penelitian yang telah dilakukan antara lain ;
1. Scales, Embrechts, Rensselaer, Polytechnic Institute, Department of
Decision Science and Engineering System, New York, mereka mencoba
untuk membuat suatu sistem arsitektur yang akan berfungsi sebagai alat
diagnosa
untuk penyakit jantung kardiovaskular.
Diagnosa yang
dilakukan oleh sistem mereka didasarkan pada dataset kesehatan yang
ada. Tujuan akhir dari diagnosa ini adalah memisahkan antara penyakit
jantung dan yang bukan penyakit jantung. Teknik
mereka gunakan adalah Principle Component
data mining yang
Regression
Analysis,
29
Partial Least Squares Regression, artificial neural network dan Neuralfuzzy Inference system. Dari hasil penelitian mereka sistem
yang
dibangun dengan neural-fuzzy memberikan tingkat keakurasian 92 %.
2. Breault, JL, Departement of Healt System Management, Tulane University
Department of Family Practice, Alton Ochsner Medical Foundation.
Breault mencoba untuk menerapakan datamining pada Pima Indian
diabetic database (PIDD) yang ada di UC Irvine Machine Learning Labs.
Pada dataset tersebut, Breault mencoba menerapakan datamining yang
telah di implementasikan pada software ROSETTA, dimana tingkat
keakurasiannya dapat ditingkat menjadi 73,8% sampai 95 % dari methode
yang sebelumnya.
3. Ferren G, Merwe M, Fleming G, Murphy K ; Para peneliti ini tergabung
dalam The South African council for Scientific and Industrial Research
(CSIR) mencoba untuk menerapkan teori fuzzy expert system dan GIS
untuk memprediksi penyebaran cholera di Afrika utara. Dimana mereka
merancang sistem peringatan dini dengan menggunakan ArcGIS dan fuzzy
logic serta boolean algebra sebagai tools dalam mengolah pola data yang
telah ada.
4. Hirota et al (1996), mencoba menggambarkan hirarki dari data mining,
fuzzy model dan turunannya
Knowledge Discovery (datamining)
pattern
Multi Model
pattern and
Fuzzy Model
rules
rules
Gambar 9. Data mining, multimodel dan fuzzy model
(adaptasi dari Hirota, 1996)
30
5. Herwanto, 2006, dalam tesis Pascasarjana di fakultas Ilkom, IPB yang
berjudul “Pembangunan Sistem Data mining untuk Mendiagnosa Penyakit
Diabetes Menggunakan Algoritma CPAR (Classification Based on
Predictive Association Rules)”, mencoba untuk menerapkan datamining
pada database penyakit diabetes yang dimiliki oleh RS Pertamina untuk
menemukan kaitan antar variable data. Dari data ini dibangun sebuah
system yang dapat melakukan prediksi diagnosa penyakit. Hasil prediksi
berupa kemungkinan diagnosa penyakit yang diderita pasien. Aturan yang
digunakan untuk melakukan prediksi diagnosa penyakit diambil dari hasil
proses data mining menggunakan algoritme CPAR . Dari hasil penelitian
tersebut dapat ditarik suatu kesimpulan : Pemeriksaan glukosa darah 2 jam
pp (Gpost), glukosa urin 2 jam pp (Upost), glukosa darah puasa (Glun)
menjadi penentu utama untuk menentukan apakah pasien positif diabetes
atau negatif diabetes.
2.5.1. Perbedaan dari penelitian sebelumnya
Pada penelitian ini penulis mencoba menggabungkan kemampuan dari
data mining dengan metode Classification based on Predictive Association Rules
(CPAR) dalam mencari suatu pola variable – variable yang telah ada, kemudian
dalam membangun suatu sistem arsitektur untuk memprediksi pola penyebaran
demam berdarah digunakan sistem pakar dengan menggunakan sistem logika
fuzzy dan sistem prakiraan dengan menggunakan metode Winters.
31
BAB III
METODOLOGI
3.1. Kerangka Pemikiran
Penelitian tentang prediksi meledaknya wabah suatu penyakit sudah
banyak dilakukan oleh para peneliti. Mereka mencoba mencari pola dan relasi dari
data set yang ada, kemudian mencoba memprediksi atau membuat suatu model
sehingga dapat digunakan untuk mencegah terjadinya wabah penyakit dikemudian
hari.
Demam Berdarah adalah suatu siklus yang terus berulang terjadi di DKI
Jakarta dan menimbulkan kerugian jiwa dan material yang tidak sedikit. Sehingga
perlu kiranya mendapat perhatian khusus dari pemerintah DKI Jakarta dengan
menciptakan suatu sistem peringatan dini yang dapat mengurangi kemungkinan
KLB.
Berdasarkan
pemikiran
tersebut,
perlu
kiranya
dilakukan
upaya
penanganan agar dampak dari merebaknya demam berdarah dapat segera di
antisipasi. Sebagai langkah awal maka dilakukan studi pustaka mengenai DBD
untuk memahaminya. Kemudian dilakukan identifikasi permasalahan yang akan
di teliti dan faktor – faktor yang terkait dengannya dan alternatif solusi
penyelesaiannya. Selanjutnya dilakukan pengumpulan data tentang DBD dan
faktor – faktor yang terkait antara lain suhu dan curah hujan. Berdasarkan data set
yang didapat, di coba untuk menerapkan konsep – konsep data mining, untuk
mendapatkan pola dan relasi yang saling berkaitan dari data tersebut. Penulis
mencoba menerapkan konsep dan metode dari data mining pada data set dinas
kesehatan DKI Jakarta, yang mencatat tentang wabah demam berdarah pada tahun
2004-2005. Diharapkan dapat di temukan adanya pola – pola dan relasi antar data
tersebut, hubungannya dengan suhu dan iklim di Jakarta pada saat pencatatan,
sehingga dapat di buat model prediksinya menggunakan sistem pakar. Untuk
mengetahui tingkat keakuratan hasil yang diperoleh dari model prediksi tersebut,
maka dibuatkan program aplikasi sebagai implementasi dari model tersebut,
dengan menggunakan program aplikasi tersebut maka dapat dilakukan pengujian
32
untuk melihat hasil keakuratan hasil yang diperoleh dari model tersebut. Secara
garis besar blok diagram sistem peringatan dini prediksi meledak DBD dan cara
penanggulangannya, dapat disajikan pada gambar 10
Gambar 10. Sistem Peringatan Dini Prediksi Meledak DBD
Dan Cara Penanggulangannya
Untuk menjabarkan kerangka pemikiran tersebut, dijabarkan dalam
tahapan penelitian yang disajikan pada gambar 11. Tahapan tersebut utamanya
terdiri dari : Studi pustaka, identifikasi masalah, pengumpulan data, pengolahan
dengan datamining, pembangunan aplikasi, dan prediksi menggunakan metode
Winter’s.
33
Gambar 11. Tahapan Penelitian
Sehingga
berdasarkan
pola
pemikiran
diatas,
setelah
dilakukan
pengumpulan data – data cuaca yang meliputi suhu, curah hujan, kelembaban, dan
penyinaran matahari serta data survailance DBD, data yang telah dikumpulkan ini
dilakukan proses seleksi, pembersihan dan transformasi data jika diperlukan. Data
yang telah di olah akan digunakan oleh datamining dengan metode CPAR, dimana
setelah di olah oleh datamining, akan dihasilkan basis aturan yang akan digunakan
34
dalam mendesign prototype pola penyebaran DBD yang akan dibangun dengan
software Matlab 7.0. Setelah melalui proses testing, apabila hasil yang diharapkan
belum sesuai dengan yang diharapkan maka proses membangun sistem tersebut
harus diulang kembali, akan tetapi jika hasilnya sudah sesuai dengan yang
diharapkan, maka selanjutnya adalah melakukan proses prediksi akan terjadinya
DBD melalui metode Winter’s, dan dari apa yang dihasilkan oleh prediksi
tersebut, tahap selanjutnya adalah Merumuskan suatu sistem peringatan dini
prediksi meledaknya DBD dan cara penanggulangannya.
3.2.
Tata Laksana
Dalam Penelitian ini akan dilaksanakan dalam 3 (tiga) tahap utama , yaitu
tahap pengumpulan data, tahap kedua penentuan jenis data yang akan digunakan,
dan selanjutnya adalah tahap pengolahan data.
3.2.1
Pengumpulan Data
Dalam melakukan pengumpulan data, yang didasarkan pada hasil dari
studi pustaka dan identifikasi masalah, maka dilakukan 2 (dua) tahap kegiatan,
yaitu penentuan jenis dan sumber data, serta teknik pengambilan data
3.2.1.1 Jenis dan Sumber Data
Berdasarkan jenis data dan informasi yang diperlukan, dalam membuat
thesis ini, maka jenis dan sumber data dapat dikelompokkan kedalam data primer
dan data sekunder. Data primer adalah data yang diperoleh langsung dari pakar
maupun observasi langsung dilapangan. Sedangkan data sekunder adalah data
yang didapat dari studi literatur, buku refrensi, jurnal, laporan penelitian, serta
sumber lain yangdianggap akurat.
3.2.1.2 Teknik Pengambilan Data
Data dan informasi dalam penelitian ini, dilakukan dengan 2 (dua) cara,
yaitu metode akuisisi yang dilakukan dengan wawancara, diskusi masalah, dan
deskripsi masalah tentang DBD dan cara penanggulangannya, Wawancara ini
dilakukan di Dinas Kesehatan DKI Jakarta. Selain itu metode lain yang digunakan
adalah melalui buku – buku refrensi dan sumber – sumber terpercaya lainnya.
3.2.2. Data Yang Digunakan
Data dalam penelitian ini dibagi menjadi 2 (dua), yaitu data yang mencatat
kejadian kasus DBD per kecamatan di wilayah DKI tahun 2004 – 2005 yang
35
dikeluarkan oleh Dinkes DKI Jakarta dan data cuaca dari BMG daerah Jakarta
pada tahun 2004 – 2005 yang meliputi suhu udara, curah hujan, kelembaban udara
dan penyinaran matahari. Semua data yang digunakan dalam penelitian dibatasi
hanya pada wilayah Jakarta Selatan dan Jakarta Pusat.
Untuk data survailens DBD diambil 2 tahun (2004 – 2005) karena data
pada tahun 2003 merupakan masa peralihan antara sistem manual dengan sistem
survailans, penerapan metode pengambilan data dengan sistem survailens
melibatkan seluruh puskesmas di DKI Jakarta baru efektif pada tahun 2004.
Daerah pemilihan sampel dilakukan didaerah Jakarta Selatan dan Jakarta Pusat
dengan alasan sebagai berikut :
a. Daerah Jakarta Selatan (mempunyai 10 kecamatan), secara ekonomi
mempunyai penyebaran yang cukup beragam dari strata ekonomi
lemah – strata ekonomi tinggi, dengan demikian di daerah Jakarta
selatan penyebaran tingkat pemahaman tentang pemberantasan DBD
pun diasumsikan beragam, dari yang perduli sampai yang tidak perduli
b. Daerah Jakarta Pusat (mempunyai 8 kecamatan), secara ekonomi juga
mempunyai penyebaran yang cukup beragam, selain itu di daerah
Jakarta Pusat merupakan pusat pemerintahan dan perekonomian DKI
Jakarta, dengan asumsi tersebut pola pemberantasan jentik DBD akan
lebih intensif dari daerah lainnya.
Data yang digunakan dalam membuat rule adalah sebanyak 97 data untuk
Jakarta Selatan
dengan rincian 36 untuk kemungkinan DBD dengan kondisi
kuning, 61 untuk DBD kondisi Merah, sedangkan untuk Jakarta Pusat, digunakan
data sebanyak 105 data, dengan rincian 32 untuk kemungkinan DBD kuning dan
73 untuk kemungkinan DBD Merah. Sedangkan untuk kondisi Hijau data tersebut
tidak terjadi pada tahun 2004-2005, karena dilapangan kondisi daerah yang Hijau
pun tidak terjadi, hal ini disebabkan karena klasifikasi dari Dinkes DKI Jakarta
yang memungkin daerah tersebut dimasukkan klasifikasi Hijau, yaitu tidak terjadi
DBD (0{ nol} Kejadian DBD) pada daerah tersebut selama 3 minggu berturut –
turut.
Sedangkan data cuaca dari dinas BMG digunakan data cuaca untuk daerah
Jakarta Selatan dan Jakarta Pusat dengan parameter yang digunakan
36
a. Suhu rata – rata dalam 1 minggu
b. Curah hujan rata – rata dalam 1 minggu
c. Penyinaran matahari rata – rata dalam 1 minggu
d. Kelembaban rata – rata dalam 1 minggu
Semua data cuaca di ambil rata – rata per minggu dengan tujuan untuk
menyamakan dengan data pencatatan survailens disusun dalam rekap per minggu
3.2.3. Pengolahan Data
Langkah awal dari proses pembuatan model adalah identifikasi data yang
ada. Data yang akan digunakan dalam pembuatan model penyebaran DBD adalah
data kasus DBD yang dicatat per kecamatan di Jakarta per minggu pada tahun
2004-2005. Selain itu digunakan pula data cuaca di Jakarta pada tahun yang sama.
Tahap selanjutnya adalah pemilihan data, jika data yang di perlukan tidak ada
maka proses identifikasi data harus dilakukan kembali. Setelah data yang terpilih
tersedia, maka diadakan validasi, eksplorasi dan pembersihan data dari data – data
sampah yang mungkin tidak akan digunakan dan membuat data yang digunakan
semakin membesar. Data terpilih yang akan digunakan juga harus di
transformasikan atau disamakan satu dan lainnya, contoh, adanya ketidak
seragaman dalam pencatatan data DBD dengan data cuaca, dimana data DBD di
catat berdasarkan mingguan sedangkan data cuaca dicatat harian, sehingga
diambil suatu keputusan untuk melakukan konversi data menjadi data perminggu.
Jika dianggap data-data yang telah kita kumpulkan tersebut masih belum lengkap
maka kita bisa menambahkan variabel yang bisa membantu dalam pembuatan
model. Secara umum sampai pada tahap ini, arsitektur system pola penyebaran
DBD dapat disajikan pada gambar 12.
37
Prediksi DBD & Penanggulanganya
Data masukan dari pengguna
Antar Muka Sistem Aplikasi DBD
Sistem Inferensi Fuzzy
( Matlab 7.0 )
Aturan –aturan
Hasil Datamining
Antarmuka Sistem Datamining
(pemilihan , pembersihan ,transformasi)
database
Gambar 12. Arsitektur system Aplikasi DBD
(adapatasi dari Maeda ,1995)
Berdasarkan gambar diatas, pada arsitektur sistem aplikasi DBD, dapat
dibagi menjadi 2 bagian besar, yaitu pembentukan aturan melalui datamining, dan
pembentukan Aplikasi DBD itu sendiri. Setelah dilakukan proses menggunakan
datamining dengan menggunakan metode CPAR, akan didapatkan aturan – aturan
hasil dari keterkaitan antara data – data yang ada, aturan – aturan tersebut akan di
implementasikan dengan sistem inferensi fuzzy dengan menggunakan software
Matlab 7.0 R 14. Hasil dari model yang didapat ini nantinya akan di tampilkan
dengan suatu sistem antar muka Aplikasi DBD, pengguna dapat memasukkan data
tentang suhu, curah hujan, kelembaban dan penyinaran matahari dari lokasi yang
akan diprediksi. Data tersebut akan memicu proses inferensi sehingga pada
akhirnya sistem tersebut akan memberikan keluaran berupa prediksi tentang
meledaknya DBD, dalam kondisi Hijau, Kuning atau Merah serta tata laksana
38
cara penanggulannya dan untuk melakukan validasi akan digunakan prediksi
metode Winters
3.3. Pembuatan Program Aplikasi
3.3.1. Data mining
Metodologi data mining didasarkan pada tiga tahapan yang dilakukan
untuk mendeteksi DBD di suatu wilayah. Ketiga tahapan tersebut adalah :
a) menangani data yang tidak lengkap melalui ekstraksi,transformasi dan loading
(ETL), b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit
serta, c) Pencarian aturan (rule mining) dan klasifikasi. Pada tahap pertama,
pemrosesan awal data survailens DBD dilakukan untuk menghapus data yang
tidak
lengkap
dan
mengekstrak
data
yang
akan
digunakan
untuk
mengelompokkan antara DBD kondisi kuning atau merah. Pada tahap kedua
setiap data yang bernilai kontinyu didiskritkan (dirubah kedalam bentuk katagori).
Hasil dari tahap pertama dan kedua diatas disimpan dalam working database.
Pada tahap ketiga, algoritma CPAR digunakan untuk menghasilkan aturan-aturan,
yang berguna dalam memprediksi kondisi DBD disuatu lokasi berdasrkan kondisi
alam pada saat itu.
3.3.1.1. Menangani Data Yang Tidak Lengkap Melalui ETL
Data yang terkumpul dan akan digunakan adalah data tentang DBD dan
data cuaca yang terdiri dari suhu, kelembaban, penyinaran matahari dan curah
hujan. Data DBD yang dikumpulkan adalah data yang tercatat per minggu untuk
tiap kecamatan di suatu wilayah, sedangkan data cuaca adalah data yang dicatat
per hari disuatu wilayah. Sehingga terdapat ketidaksamaan dalam memperlakukan
data tersebut, agar dapat digunakan maka data cuaca di rubah menjadi data per
minggu, dimana data yang ada diambil nilai rata – ratanya dalam 1 minggu. Data
yang telah sama tersebut selanjutnya akan dirubah menjadi data diskrit.
3.3.1.2. Merubah Data Kontinyu Menjadi Data Diskrit
Data sampel yang digunakan pada penelitian ini mempunyai atribut yang
nilainya numerik, sedangkan algoritma data mining CPAR bekerja dengan atributatribut yang nilainya nominal. Untuk menggunakan algoritma tersebut atribute
yang bernilai numerik tersebut diganti dengan atribute yang bernilai nominal yang
menunjukkan interval nilai dengan nilai-nilai diskrit. Proses ini dikenal sebagai
39
diskritisasi dan berisi transformasi dari variabel quantitatif kedalam variable
kualitatif.
3.3.2. Pembentukan Basis Aturan
Data yang diolah oleh metode CPAR, akan menghasilkan suatu basis
aturan yang mempunyai aturan IF – THEN rules. Sistem berbasis aturan adalah
suatu sistem penalaran yang membangun aturan – aturan yang merepresentasikan
pengetahuan dan menggunakan aturan tersebut sebagai pengambil keputusan
(Ignizio, 1991). Aturan – aturan ini selanjutnya mengolah fakta menjadi
kesimpulan. Aturan – aturan yang didefinisikan dengan rule dinyatakan dalam IFTHEN atau IF – THEN – ELSE yang mempunyai struktur umum :
IF (kondisi / premis )
THEN (aksi / konklusi )
Dimana :
-
IF merupakan suatu kondisi atau aturan yang berisi fakta – fakta
yang dapat dinyatakan sebagai kalimat atau ekspresi matematika.
Kondisi ini dapat berupa pernyataan benar atau salah
-
THEN merupakan aksi yang dilaksanakan jika kondisi IF bernilai
benar (true) sedangkan aturan ELSE dilaksanakan jika kondisi IF
bernilai salah (false)
Dua atau lebih premis dapat dihubungkan dalam bentuk AND. Aturan –
aturan IF-THEN dapat dibuat dari beberapa kondisi dan beberapa akibat menjadi
bentuk IF F1 is A1 and F2 is A2 THEN Z is Y dan seterusnya. Efisiensi dapat
dilakukan apabila saat penyusunan basis aturan ini pendapat pakar dapat langsung
di implementasikan.
3.3.3. Aplikasi DBD
Pada tahapan ini, aturan yang telah didapat dari hasil pengolahan dengan
menggunakan datamining, selanjutnya diaplikasikan kedalam suatu program
aplikasi sistem pakar yang dibangun dengan menggunakan program Matlab 7.0
R14.
40
Penyusunan sistem dimulai dengan memilih atribut – atribut yang akan
digunakan. Atribut tersebut meliputi atribut cuaca dan kondisi DBD, atribut –
atribut ini ini kemudian di dekomposisi menjadi himpunan – himpunan fuzzy.
Evaluasi aturan fuzzy kemudian diubah menjadi suatu harga numerik untuk
menentukan aksi dari hasil, proses ini desebut dengan defuzzifikasi. Metode
defuzzifikasi yang akan digunakan dalam pembuatan sistem ini adalah metode
centroid. Dengan menggunakan himpunan fuzzy, aturan atau rules dan metode
defuzzifikasi, maka dapat disusun sebuah Fuzzy Inferensi Sistim (FIS) dengan
menggunakan toolbox fuzzy pada software Matlab 7.0 R14. Sedangkan untuk
antarmuka digunakan fasilitas GUI (Graphical User Interface) pada software yang
sama. Sebagai hasil dari sistem ini adalah unit analisis DBD per kecamatan dari
wilayah Jakarta Pusat atau Jakarta Selatan, sehingga pengguna dapat mengeetahui
kemungkinan terjadinya DBD di kecamatan yang di prediksi.
3.3.4. Prediksi Cuaca Menggunakan Metode Winter’s
Aplikasi DBD adalah aplikasi yang dibangun berdasarkan dari basis aturan
yang dibangun dari atribut cuaca yang dikaitkan dengan kejadian DBD, sehingga
dalam memprediksi kemungkinan wabah DBD, data yang diperlukan adalah data
cuaca pada tahun yang akan di prediksi. Sebagai tindakan dalam melakukan cegah
dini, maka dicoba untuk melakukan prediksi cuaca pada tahun yang akan
dilakukan prediksi dengan menggunakan data cuaca minimal 2 tahun
sebelumnya.Misalnya cuaca pada tahun 2007, maka diperlukan data tahun 2005
dan tahun 2006 sebagai dasar dalam melakukan prediksi kondisi cuaca. Data
cuaca hasil prediksi inilah yang akan digunakan sebagai data masukkan kedalam
aplikasi DBD, dan dapat digunakan sebagai dasar tindakan pencegahan dini dalam
penanggulangan wabah DBD.
.
41
BAB IV
PERANCANGAN SISTEM
4.1.
Gambaran Umum Sistem
Sistem aplikasi yang dibangun pada penelitian ini dapat dibangkitkan
prediksinya melalui pemasukkan data cuaca yang meliputi suhu, curah hujan,
intensitas matahari dan kelembaban udara rata – rata per minggu. Setelah data
tersebut diolah oleh aplikasi DBD, sistem ini akan memberikan status DBD pada
daerah yang bersangkutan dan tata laksana penganggulangannya. Aplikasi ini
dikembangkan dengan menggunakan metode pemprograman prosedural, dapat
dijalankan oleh server pada lingkungan sistem operasi Microsoft Windows
95/98/NT/2000/XP dan dibangun dengan menggunakan software Matlab 7.0 R
14.
Pengguna sistem adalah mereka yang langsung berhubungan dengan
penatalaksanaan DBD misalnya Puskesmas, Sudin Kesehatan DKI Jakarta
ataupun masyarakat umum dalam hal ini adalah dokter umum yang ingin
mengetahui prediksi DBD di daerahnya. Dari hasil analisis kebutuhan maka
dikembangkan model seperti ditunjukkan dalam Gambar 13.
Gambar 13. Model Aplikasi DBD
42
4.2.
Analisa Kebutuhan Sistem
Pada penelitian ini, pengembangan sistem untuk menarik suatu
kesimpulan yang merupakan cirri khas suatu sistem pakar, dilakukan dengan
menerapkan metode logika fuzzy (fuzzy logic) sebagai dasar pendekatan
pemecahan masalah. Penggunaan metode ini adalah upaya untuk mendekati
mekanisme penalaran dalam melakukan penarikan kesimpulan kondisi DBD
disuatu wilayah. Metode logika fuzzy adalah suatu metode pemecahan masalah
yang hampir mendekati dengan cara nalar manusia dalam mengambil suatu
kesimpulan
4.3.
Desain Sistem
Pada penelitian ini sistem dibangun menjadi melalui 2 tahap, yaitu :
-
Tahap pencarian pola melalui data mining dengan menggunakan
metode CPAR, dimana aturan – aturan yang dihasilkan oleh data
mining tersebut akan dioleh oleh sistem aplikasi DBD
-
Tahap implementasi dalam suatu system yang disebut aplikasi DBD,
system ini dikembangkan melalui mekanisme penarikan kesimpulan
dengan menggunakan metode logika fuzzy sebagai dasar pendekatan
pemecahan masalah. Metode logika fuzzy ini adalah sebuah metode
pemecahan masalah yang sangat dekat dengan cara berpikir manusia
dalam melakukan penarikan kesimpulan.
4.3.1. Tahapan Data Mining
Tahap pencarian pola melalui data mining didasarkan pada tiga tahapan
yang dilakukan untuk mendeteksi DBD di suatu wilayah. Ketiga tahapan tersebut
adalah a) menangani data yang tidak lengkap melalui ekstraksi, transformasi dan
loading, b) merubah data yang bernilai kontinyu menjadi data yang bernilai
diskrit, c) memetakan basis aturan hasil mining dan klasifikasi.
Pada tahap pertama, pemprosesan awal data survailens DBD dilakukan untuk
menghapus data yang tidak lengkap dan mengekstrak data yang akan digunakan
untuk mengelompokkan antara DBD kondisi kuning dan merah. Pada tahap kedua
setiap data yang bernilai kontinyu didiskritkan, data sampel yang digunakan pada
penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritma
data mining CPAR bekerja dengan atribut-atribut yang nilainya nominal. Untuk
menggunakan algoritma tersebut, attribute yang bernilai numerik tersebut diganti
43
dengan atribut bernilai nominal yang menunjukkan interval nilai dengan nilainilai diskrit. Proses ini dikenal sebagai diskritisasi dan berisi transformasi dari
variabel quantitatif kedalam variable kualitatif. Hasil dari tahap pertama dan
kedua diatas disimpan dalam working database
Tabel 5. Atribut yang digunakan dalam algoritma CPAR
Atribut
Suhu
Suhu
Suhu
Curah Hujan
Curah Hujan
Curah Hujan
Curah Hujan
Curah Hujan
Matahari
Matahari
Matahari
Kelembaban
Kelembaban
Kelembaban
Keterangan
Temperatur rendah
Temperatur Normal
temperatur tinggi
Curah hujan sangat rendah
Curah hujan rendah
Curah hujan Normal
Curah hujan lebat
Curah hujan sangat lebat
Penyinaran matahari rendah
Penyinaran matahari Normal
Penyinaran matahari penuh
Kelembaban udara rendah / kering
Kelembaban udara Normal
Kelembaban udara tinggi / basah
Nilai Kontinyu
20o – 24oC
24oC – 27oC
> 27oC
<5mm
5-20mm
20 – 50mm
50 - 100mm
>100mm
0 - 35%
35 - 70%
> 70%
< 40%
40 - 75%
>75%
Nilai
Diskrit
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Dasar pembagian atribut cuaca yang akan digunakan dalam menentukan
nilai kontinyu adalah berdasarkan referensi dari dinas BMG DKI Jakarta untuk
cuaca di wilayah DKI Jakarta dan sekitarnya.
Atribut Suhu dibagi menjadi 3 klas, yaitu Temperatur rendah, normal, dan tinggi
dengan kisaran suhu 20oC - lebih besar dari 27oC.
Atribut untuk intensitas hujan dibagi menjadi 5 klas, yaitu curah hujan dengan
intensitas sangat rendah, rendah, normal, lebat dan sangat lebat. Curah hujan
yang diukur adalah curah hujan per hari pada jam 07.00 pagi dan diklasifikasikan
berdasarkan mingguan atau per 7 hari.
Atribut intensitas penyinaran matahari dibagi menjadi 3 klas, yaitu intensitas
rendah, intensitas normal dan intensitas tinggi / penuh. Pengukuran ini dilakukan
per hari dalam 1 bulan, kemudian dilakukan klasifikasi berdasarkan mingguan.
Atribut kelembaban udara dibagi menjadi 3 klas, yaitu kelembaban rendah /
kering, kelembaban normal, kelembaban tinggi / basah.
Atribut kejadian DBD di suatu wilayah, dibagi menjadi 2, yaitu , Kuning dan
Merah. Kondisi Hijau adalah kondisi dimana dalam 3 minggu berturut – turut
tidak terjadi kasus DBD; Kondisi Kuning adalah kondisi dimana terjadi 1 sampai
44
5 kasus dalam suatu daerah pada 1 minggu; Kondisi Merah adalah kondisi dimana
terjadi lebih dari 5 kasus dalam suatu daerah pada 1 minggu.
Pada tahap ketiga, algoritma CPAR digunakan untuk menghasilkan aturanaturan, yang berguna untuk mendeteksi apakah kondisi alam saat itu akan
memungkinkan terjadinya kondisi DBD
kuning atau merah. Data cuaca dari
BMG dimasukkan ke dalam atribut dan nilai diskrit yang akan digunakan dalam
algoritma CPAR Dalam penelitian ini digunakan datamining dengan algoritma
CPAR, dimana data yang telah dilakukan diskritisasi digunakan dalam algoritma
tersebut, CPAR hanya memilih literal yang terbaik dan mengabaikan seluruh
literal lainnya. CPAR membuat rule dari parameter cuaca yang dikaitkan dengan
kondisi kuning atau merah, Setelah CPAR menemukan literal terbaik, literal
lainnya yang Gain-nya mirip dengan literal sebelumnya (misalnya hanya berbeda
1%) akan terus dicari. Dari hasil literal tersebut didapat beberapa rule untuk tiap –
tiap daerah Jakarta Pusat dan Jakarta Selatan.
4.3.1.1.Basis Aturan (Rule Base)
Setelah CPAR memilih literal yang terbaik dari suatu gain similarity ratio
yang ditetapkan, maka akan didapatkan beberapa aturan yang dapat digunakan
sebagai dasar dalam merancang suatu sistem untuk memprediksi meletusnya DBD
disuatu daerah. Prediksi yang berkaitan dengan DBD dibuat berdasarkan hasil
proses data mining dan diperkuat oleh pendapat pakar, sedangkan tatalaksana
penanggulangan DBD disusun berdasarkan SOP tatalaksana di Dinkes DKI
Jakarta .
Basis pengetahuan yang dikembangkan pada penelitian ini menggunakan kaidah
aturan IF - THEN. Pada penelitian ini ada 2 klasifikasi prediksi yang digunakan
yaitu kondisi Kuning dan Kondisi Merah.
4.3.2. Tahapan Aplikasi DBD
Ada 3 (tiga) proses yangdilakukan oleh sistem ini yaitu proses masukkan
(input), proses evaluasi, dan proses keluaran (output)
4.3.2.1.Proses Masukkan (Input)
Pada proses input ini nilai masukkan yang diberikan divalidasi oleh
sistem. Hal ini perlu dilakukan agar tidak terjadi kesalahan pada sistem saat
prediksi dan penilaian dilakukan. Pada proses pemasukkan data, pengguna akan
memasukkan nilai untuk semua atribut cuaca. Kemudian atribut tersebut akan
45
difuzzifikasi dan dibagi menjadi beberapa himpunan fuzzy dan diberi selang nilai.
Selanjutnya sistem akan memproses data masukkan yang telah dimasukkan oleh
pengguna dan dibuat menjadi dinamic link library (dll).
Pada proses masukkan data, pengguna memasukkan nilai pada atribut
cuaca yangdiberikan oleh sistem, dimana atribut tersebut akan difuzzifikasi oleh
sistem yang kemudian akan dibagi menjadi beberapa himpunan fuzzy dan diberi
selang nilai, seperti yang terlihat pada tabel 8
Tabel 6. Atribut Cuaca dan Himpunan Fuzzy
Atribut
Himpunan Fuzzy
Domain /
Representasi Fuzzy
Selang Nilai
Suhu
Curah Hujan
Matahari
Kelembaban
Rendah
0 < N < 24
Tr (0,0, 23, 24)
Sedang
23 < N < 28
Tr (23, 24, 27, 28)
Tinggi
27 < N < 50
Tr (27,28, 50,50)
Sangat rendah
0 <N<5
Tr ( 0,0, 4, 5)
Rendah
4
Tr ( 4, 5, 20, 21)
Normal
19 < N < 50
Tr (19, 20, 49, 50)
Lebat
49 < N < 101
Tr(49,50,100,101)
Sangay Lebat
100 < N < 105
Tr(100,101,105)
Rendah
0 < N < 35
Tr ( 0, 0, 34, 35)
Sedang
34 < N < 71
Tr (34, 35, 70,71)
Penuh
70 < N < 100
Tr (70,71,100,100)
Kering
0 < N < 40
Tr(0, 0, 39,40)
Normal
39 < N < 76
Tr (39,40,75,76)
Basah
75 < N < 100
Tr (75,76,100,100)
< N < 21
4.3.2.1.1. Fuzzifikasi Atribut Suhu
Fungsi keanggotaan atau membershio function adalah suatu kurva yang
menunjukkan pemetaan titik – titik input data ke dalam nilai keanggotaannya
(sering juga disebut dengan derajat keanggotaan) yang memiliki interval antara 0
– 1. Dalam pembuatan aplikasi DBD untuk menentukan kondisi DBD disuatu
wilayah, terdapat 4 atribut yang cuaca yang akan digunakan, yaitu suhu, curah
hujan, matahari dan kelembaban sebagai fariabel fuzzy. Atribut cuaca ini
46
kemudian dibuatkan fuzzifikasinya, dan dibagi menjadi beberapa himpunan fuzzy
dan diberi selang nilai dan untuk mempresentasikan himpunan fuzzy digunakan
fungsi keanggotaan trapesium (Trapmf). Nilai x dari Trapmf ditentukan dari 5
parameter a,b,c dan d
0; x ≤ a

( x − a ) /(b − a); a ≤ x ≤ b
F(x;a,b,c,d) = 1; b ≤ x ≤ c
(d − x) /(d − c ); c ≤ x ≤ d

0; x ≥ d
Dalam aplikasi DBD, jumlah output dari kondisi DBD yanag dapat
ditentukan ada 2 kemungkinan, yaitu kondisi DBD kuning dan kondisi DBD
merah.
1.
Fuzzifikasi suhu
Fuzzifikasi suhu dibuat menjadi 3 himpunan fuzzy, yaitu rendah, sedang
dan tinggi. Untuk merepresentasikan himpunan fuzzy digunakan kurva trapesium
(Trapmf) seperti terlihat pada gambar 14
Gambar 14. Fuzzifikasi Suhu
2.
Fuzzifikasi Curah Hujan
Fuzzifikasi curah hujan terdiri dari 4 himpunan fuzzy yaitu sangat rendah,
rendah, normal, lebat, sangat lebat. Untuk mempresintasikannya digunakan kurva
trapesium (Trapmf), seperti terlihat pada gambar 15.
47
Gambar 15. Fuzzifikasi Curah Hujan
3.
Fuzzifikasi Matahari
Fuzzifikasi Matahari terdiri dari 3 himpunan fuzzy, yaitu penyinaran
rendah, sedang, penuh. Untuk merepresentasikannya digunakan kurva trapesium
(Trapmf) seperti terlihat pada gambar 16.
Gambar 16. Fuzzifikasi Penyinaran Matahari
4.
Fuzzifikasi Kelembabab Udara
Fuzzifikasi kelembaban udara terdiri dari 3 himpunan fuzzy, yaitu kering,
normal dan basah. Untuk merepresentasikannya digunakan kurva trapesium
(Trapmf) seperti terlihat pada gambar 17.
48
Gambar 17. Fuzzifikasi Kelembaban Udara
4.3.2.2. Proses Evaluasi
Di dalam proses evaluasi Aplikasi DBD terdapat 4 atribut cuaca dan 2
kondisi DBD yang akan dinilai. Proses inferensi adalah bagian terpenting dari
pengembangan suatu sistem. Berikut ini adalah proses inferensi pada model
fuzzy Mamdani menurut Marimin (2005) yang digunakan dalam proses evaluasi
sistem Aplikasi DBD :
1. Fuzzikasi
Input fuzzy diterima dan ditentukan derajat keanggotaannya. Apabila
kondisi mempunyai aturan lebih dari satu maka diterapkan operator
fuzzy
2. Operator fuzzy
Operator fuzzy diperlukan apabila anteseden untuk suatu aturan lebih
dari satu, dan digunakan untuk menentukan fungsi keanggotaan hasil
inferensi setiap aturan tersebut.
3. Inferensi
Nilai kebenaran untuk premise dari setiap aturan dihitung dan
diterapkan pada bagian konklusi dari setiap aturan
4. Agregasi
Penggabungan seluruh output gugus fuzzy menjadi sebuah output
gugus fuzzy
5. Defuzzifikasi
Proses pengubahan hasil fuzzy menjadi hasil yang mempunyai nilai
tunggal (crips)
49
Pada Aplikasi DBD, identifikasi kondisi DBD diawali dengan proses
pemasukkan data – data cuaca yang dibutuhkan dalam suatu mekanisme inferensi
yang bekerja berdasarkan kaidah kepakaran untuk mengambil suatu kesimpulan.
Untuk mendekati proses penalaran pakar dalam melakukan pengambilan
keputusan, maka pada penelitian ini proses tersebut disimulasikan dengan
menggunakan pendekatan logika fuzzy.
4.3.2.3.Proses Output
Data yang dimasukkan dalam proses defuzzifikasi adalah suatu himpunan
fuzzy yang diperoleh dari komposisi aturan – aturan fuzzy, sedangkan output
merupakan suatu bilangan pada domain himpunan fuzzy tersebut (Kusumadewi,
2002).
Setelah proses inferensi Mamdani yang terdiri dari fuzzifikasi , operasi
fuzzi, metode implikasi, metode agregasi dan defuzifikasi dijalankan, maka akan
diperoleh hasil defuzzifikasinya. Dalam penelitian ini metode defuzzifikasi yang
digunakan adalah metode centroid. Keuntungan dalam menggunakan metode
centroid adalah selain mudah dihitung, nilai defuzzifikasinya akan bergerak
secara halus sehingga perubahan dari suatu topologi himpunan fuzzy ke topologi
berikutnya akan bergerak dengan halus (Kusumadewi, 2002).
Derajat keanggotaan pada kondisi DBD didapatkan berdasarkan hasil pemetaan
nilai defuzzifikasi pada rentang nilai output seperti yang tertera pada tabel 7.
Tabel 7. Selang Nilai Untuk Hasil Output Pada Himpunan Fuzzy
Kondisi DBD
Rentang Nilai
Representasi Fuzzy
Hijau
0 <N<1
Tr (0, 0, 0, 1 )
Kuning
1 <N<5
Tr (1, 1, 4, 5 )
Merah
4 < N < 100
Tr (4, 5, 100, 100 )
Data masukkan dan hasil proses (Input dan Output) pada Aplikasi DBD dapat
dilihat pada tabel 8.
51
BAB V
IMPLEMENTASI SISTEM
Implementasi merupakan tahap peletakan sistem sehingga sistem siap
dioperasikan. Tahap ini meliputi implementasi datamining untuk mencari aturan –
aturan
sebagai
dasar
inferensi,
implementasi
proses
inferensi
dengan
menggunakan logika fuzzy, antarmuka untuk memasukkan data, dan terakhir
adalah implementasi keluaran berupa prediksi DBD dan tatalaksananya.
5.1.
Implentasi Sistem
Proses pencarian aturan – aturan yang akan digunakan dalam membangun
sistem ini dibangun dengan menggunakan datamining pada DBMS Oracle 9i.
Selanjutnya aturan hasil datamining akan digunakan dalam proses inferensi fuzzy
yang dibangun dengan perangkat lunak Matlab versi 7.0 R 14. Untuk
mendapatkan hasil prediksi dari tahun selanjutnya akan digunakan perangkat
lunak Minitab R 11 dengan sub sistem Metode Winter’s.
Pengembangan aplikasi DBD memerlukan perangkat keras yang
mendukung perangkat lunak yang digunakan, sehingga sistem ini dapat berjalan
sesuai dengan fungsinya.
•
Spesifikasi perangkat keras yang digunakan :
- Prosesor Intel Pentium IV atau yang setara
- RAM 128 Mb atau lebih
- Hard disk 20Gb atau lebih
- CD-Rom 8x atau lebih
- VGA Card 16 Mb atau lebih
- Monitor resolusi minimal 800 x 600 pixel
- Keyboard dan Mouse
•
Spesifikasi perangkat lunak yang digunakan :
- OS Windows 98/ 2000 / XP
- Matlab versi 7.0
- Minitab R 11
52
5.2.
Pembangunan Sistem Data mining
Pembangunan sistem data mining dengan algoritma CPAR menggunakan
PL/SQL. Pada penelitian ini digunakan DBMS Oracle 9i. Pada tahap awal data
yang berasal dari data BMG berupa data suhu, curah hujan, penyinaran matahari
dan kelembaban udara rata – rata per minggu dan data DBD, diubah ke dalam
bentuk kategori dengan ketentuan seperti pada tabel berikut dan selanjutnya
dirubah menjadi data dalam bentuk diskrit. Data wilayah yang sudah dalam
bentuk diskrit selanjutnya ditransformasi ke dalam bentuk array dua dimensi dan
dilakukan proses cleaning dengan menghapus baris-baris yang tidak lengkap.
Pada proses pembuatan sistem data mining sebagai contoh dipilih 20 baris sebagai
data training. (secara lengkap ditampilkan pada lampiran 4). Berikut adalah
contoh sampel data yang telah dirubah kedalam bentuk diskrit :
Tabel 9 : Tabel Diskrit Untuk Wilayah Jakarta Selatan
Minggu
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Temperatur
(oC)
3
3
3
3
3
3
2
3
3
3
3
3
3
3
3
3
3
Curah
hujan
(mm)
4
5
4
4
5
5
6
4
4
6
4
5
4
4
5
6
4
Sinar
matahari
(%)
Kelembaban(%)
10
14
9
14
9
14
9
14
9
14
9
14
9
14
9
14
10
13
9
14
9
14
10
14
11
13
10
14
10
13
11
13
10
14
DBD
15
15
15
16
16
16
16
16
16
16
16
16
16
16
16
16
15
5.2.1. Pembentukan Sampel Positif dan Sampel Negatif
Kolom terakhir pada sampel data menunjukkan kelas. Angka 15
menunjukkan kelas DBD pada kondisi kuning dan 16 menunjukkan kelas DBD
pada kondisi merah. Data training kemudian dipisahkan menjadi sampel positif
(data kejadian DBD pada kondisi merah) dan sampel negatif (data kejadian DBD
53
pada kondisi kuning). Sampel data positif diberikan dalam Tabel 10, sedangkan
sampel negatif diberikan dalam Tabel 11.
Tabel 10 : Sampel Data Positif
Minggu
4
5
6
7
8
9
10
11
12
13
14
15
16
Suhu
(oC)
3
3
3
2
3
3
3
3
3
3
3
3
3
Curah
hujanmm)
4
5
5
6
4
4
6
4
5
4
4
5
6
Sinar
matahari(%)
9
9
9
9
9
10
9
9
10
11
10
10
11
Kelembaban
(%)
14
14
14
14
14
13
14
14
14
13
14
13
13
DBD
16
16
16
16
16
16
16
16
16
16
16
16
16
Tabel 11 : Tabel Ssampel Negatif
Minggu
1
2
3
17
Suhu
(oC)
3
3
3
3
Curah
hujan(mm)
4
5
4
4
Sinar
matahari
(%)
10
9
9
10
Kelembaban
(%)
14
14
14
14
DBD
15
15
15
15
5.2.2. Pembentukan Basis Aturan / Rule Base
Setelah di kelompokkan kedalam sampel positif dan negatif, dan dibentuk
dalam array 2 (dua) dimensi, selanjutnya pada data tersebut ditentukan aturan
yang akan di cari, jika aturan yang ingin dicari adalah pada DBD kondisi kuning
maka sesuai dengan aturan yang telah ditetapkan, maka kita masukkan data:
Kondisi DBD = (jumlah data negatif, jumlah data posif, bobot).
- Jumlah data negatif / positif sesuai dengan wilayah yang akan di prediksi
- Bobot yang dimasukkan 0.1 s/d 1
Dari hasil pemasukkan data (61,36,0.99) dan (61,36, 0.8) untuk wilayah Jakarta
Selatan, dapat dilihat pada tabel berikut ini. (data selengkapnya dapat dilihat pada
lampiran 5 )
54
Tabel 12. Hasil Pemasukkan Data Untuk Wilayah Jakarta Selatan
61,36,0.99
1
2
3
61,36,0.8
1
1
13
11
4
Kuning
Kuning
Kuning
0.64
0.61
0.45
13
11
Kuning
Kuning
0.64
0.61
Dari data tersebut dapat diterjemahkan sebagai berikut :
Kolom 1 menunjukkan keterkaitan antar data, jika angka pada kolom 1
menunjukkan nilai yang berkelanjutan, contoh 1, 2, 3 artinya antar data tersebut
tidak berkaitan sehingga kaidah aturan yang digunakan adalah IF 1 Then.
Sedangkan jika angka pada kolom 1 menunjukkan perulangan, contoh 1, 1, 2, 3,3
berarti 1 dan 1 ada keterkaitan data, dimana kaidah aturannya IF 1 and 1 Then ,
untuk 2 mempunyai kaidah aturan hanya IF 2 Then, sedangkan untuk 3 dan 3
mempunyai kaidah aturan IF 3 and 3 Then.
Kolom 2 menunjukkan nilai diskrit dari atribut data yang digunakan, agar dapat
diaplikasikan, nilai ini selanjutnya akan dikembalikan kedalam nilai kontinyu.
Kolom 3 menunjukkan kondisi DBD .
Kolom 4 menunjukkan tingkat keakurasian dari aturan tersebut.
Sehingga dari data pada tabel 12 dapat dibaca sebagai berikut :
Untuk data (61, 36, 0.99)
If 13 then kuning (dengan tingkat keakurasian / Laplace akurasi : 0.64 %);
If 11 then kuning (dengan tingkat keakurasian : 0.61 %);
If 4 then kuning (dengan tingkat keakurasian : 0.45 %).
Untuk data (61, 36, 0.8)
Hasil yang diperoleh dapat dibaca sebagai berikut :
If 13 and 11 then kuning (dengan tingkat keakurasian : 0.63 %)
Hasil yang didapat dari pemasukkan beberapa data tersebut, dicari hasil
dengan tingkat akurasian yang paling tinggi, sehingga dari data tersebut dapat
digunakan sebagai dasar pembuatan basis aturan / rule base dari pola keterkaitan
antara data suhu, curah hujan, penyinaran matahari, kelembaban dan data DBD.
55
5.3.
Program Aplikasi
5.3.1. Input Sistem
Untuk memudahkan penggunaan aplikasi oleh pemakai maka dibuat
program antarmuka yang dibangun dengan menggunakan modus grafik.
Dua
proses yang digunakan yaitu proses prediksi diagnosa dan proses terapi. Aturan
untuk kedua proses tersebut dibangun berdasarkan hasil proses data mining dan
diperkuat oleh pendapat pakar
Adapun fungsi-fungsi yang dimiliki oleh aplikasi ini adalah:
A. Aplikasi Prediksi data tahunan
1.
Memasukkan data melalui papan ketik yang meliputi: suhu, curah
hujan, penyinaran matahari dan kelembaban . Data yang dimasukkan
adalah data rata – rata mingguan selama 1 tahun / 52 minggu.
Gambar 19. Tabel data selama 1 tahun
2.
Menampilkan hasil dari prediksi dengan mode grafik. Grafik yang
akan ditampilkan sebanyak 2 gambar, sehingga dapat dilakukan
prediksi oleh pengguna
56
Gambar 20. Grafik selama 2 tahun
B. Aplikasi Prediksi Penyebaran DBD
1.
Memilih lokasi / wilayah yang akan dilakukan prediksi, untuk saat
ini hanya terdapat 2 (dua) pilihan, yaitu Jakarta Selatan dan Jakarta
Pusat. Jika tidak dilakukan pilihan oleh pengguna, maka default yang
akan digunakan oleh aplikasi ini adalah Jakarta Selatan.
2.
Memilih status pengguna, yang terdiri dari : Dokter umum,
Puskesmas, Sudinkesmas, Dinkes
3.
Memasukkan data melakui papan ketik yang meliputi: suhu, curah
hujan, penyinaran matahari dan kelembaban. Salah satu hal yang
harus dicatat adalah data yang akan dimasukkan kedalam aplikasi ini
adalah data rata – rata mingguan.
4.
Melakukan prediksi penyebaran DBD. Hasil prediksi ini berupa
kemungkinan antara merah dan kuning. Aturan yang digunakan
untuk melakukan prediksi penyebaran DBDini diambil dari hasil
proses data mining menggunakan algoritma CPAR.
57
Gambar 21. Antar muka Aplikasi DBD
5.
Memberikan langkah – langkah tindakan preventif / tatalaksana
DBD. Dari hasil prediksi penyebaran DBD akan diberikan langkah –
langkah tindakan preventif yang disesuaikan dengan status dari
pengguna aplikasi iniAplikasi Prediksi Penyebaran DBD
Gambar 22. Tatalaksana Berdasarkan SOP Dinkes DKI Jakarta
58
Proses Evaluasi Sistem
Dalam proses evaluasi, sistem Aplikasi DBD menggunakan 4 (empat)
atribut data cuaca yang akan dipakai sebagai data masukkan, dan 2 (dua) klas
kondisi DBD yang akan menentukan kondisi DBD berdasarkan kondisi cuaca
yang dimasukkan kedalam sistem ini. Pengembangan aplikasi ini menggunakan
proses inferensi. Proses inferensi yangdigunakan dalam proses evaluasi sistem
pakar Aplikasi DBD adalah model fuzzy Mamdani, yang terdiri dari fuzzifikasi,
operasi fuzzy, metode implikasi, metode agregasi dan defuzzifikasi.
Prose evaluasi sistem Aplikasi DBD dilakukan dengan menggunakan
perangkat lunak Matlab 7.0 R 14. Evaluasi aturan fuzzy yang terbentuk dari
aturan – aturan berdasarkan atribut data cuaca, akan diubah menjadi satu harga
numerik untuk menentukan tindakan dari hasil keluaran (output), proses ini
dikenal dengan proses defuzzifikasi. Metode deffuzikasi yang digunakan adalah
metode centroid. Sistem inferensi fuzzy dibangun dengan menggunakan FIS
editor pada fuzzy logic toolbox Matlab 7.0.
FIS editor untuk data atribut cuaca dan klas kondisi DBD ditampilkan
pada gambar 23
Gambar 23. FIS Editor Untuk Data Atribut Cuaca dan Kondisi DBD, Wilayah
Jakarta Selatan
59
Terdapat 3 (tiga ) proses yang dilakukan oleh sistem pada proses evaluasi
sistem, yaitu proses masukkan (input), proses evaluasi, proses keluaran (output).
5.3.2.1. Proses Input
Pada proses input, system akan memproses data yang dimasukkan oleh
pengguna dan dibuat menjadi dinamic link library (dll), sehingga dapat digunakan
oleh system lainnya.
Berikut adalah gambar membership function editor untuk data cuaca yang
digunakan pada perangkat lunak Matlab 7.0
Gambar 24. Membership Function Untuk Atribut Suhu.
60
Gambar 25. Membership Function Untuk Atribut Curah Hujan.
Gambar 26. Membership Function Untuk Atribut Matahari.
61
Gambar 27. Membership Function Atribut Kelembaban.
5.3.2.2. Proses Evaluasi
Representasi pengetahuan secara sistematis untuk menentukan kondisi
DBD dibuat menggunakan kaidah yang didefinisikan dengan aturan yang
dinyatakan dalam bentuk IF – THEN. Secara umum dengan menggunakan prinsip
– prinsip penyusunan komposisi aturan, dari atribut cuaca yang terdiri dari suhu (
terdiri dari 3 atribut), Curah hujan (5 atribut), Penyinaran matahari (3 atribut) dan
Kelembaban udara (3 atribut), dan Kondisi DBD (3 atribut) maka didapatkan
aturan sebanyak 405 aturan / kecamatan, sehingga untuk 18 kecamatan akan
menghasilkan 7290 aturan.
Berikut adalah sebagian dari aturan – aturan yang disusun secara konvensional
dalam menentukan kondisi DBD berdasarkan atribut cuaca :
1. If (suhu is rendah) and (curah hujan is sangat rendah) and (matahari is
rendah) and (kelembaban is kering ) then (kondisi DBD is kuning).
2.
If (suhu is rendah) and (curah hujan is sangat lebat) and (matahari is
rendah) and (kelembaban is kering) then (kondisi DBD is merah).
62
3. If (suhu is tinggi) and (curah hujan is sangat rendah) and (matahari is
penuh) and (kelembaban is normal) then (kondisi DBD is hijau).
Aturan – aturan tersebut digunakan dalam proses evaluasi, akan tetapi dari
405 aturan tersebut, tidak semua dapat dipergunakan dalam menentukan kondisi
DBD. Dengan adanya aturan yang dihasilkan oleh datamining, maka dari 405
aturan tersebut, dapat di pilih aturan mana yang mempunyai keakurasian tertinggi
dalam menentukan kemungkinan kondisi DBD disuatu wilayah. Dari 405 aturan
tersebut dapat di reduksi menjadi 22 aturan untuk wilayah Jakarta Selatan dan 29
aturan untuk wilayah Jakarta Pusat.
Berikut adalah gambar rule editor atau tampilan aturan yang digunakan dalam
membangun prediksi kondisi DBD pada perangkat lunak Matlab 7.0, yang
didasarkan pada komposisi aturan hasil datamining.
Gambar 28. Rule Editor Jakarta Selatan
63
Gambar 29. Rule Editor Jakarta Pusat
Berikut adalah gambar rule viewer untuk kondisi DBD, yang digunakan
dalam aplikasi DBD pada perangkat lunak Matlab 7.0
64
Gambar 30. Rule Viewer untuk Jakarta Selatan.
Gambar 31. Rule Viewer untuk Jakarta Pusat.
65
5.3.2.3. Proses Output
Setelah pengguna memasukkan data cuaca yang terdiri dari suhu, curah
hujan, kelembaban, dan penyinaran matahari, maka pengguna menekan tombol
”Periksa”, dimana sebagai aksinya, sistem akan memproses data yang telah
dimasukkan oleh pengguna. Pengguna akan dapat langsung melihat prediksi
kondisi DBD di wilayah tersebut, kuning atau merah. Untuk melihat tindakan
yang harus dilakukan sesuai dengan tatalaksana SOP yang telah ditetapkan oleh
Dinkes DKI Jakarta, maka pengguna harus menekan tombol ”Lihat Tindakan”.
Pengguna dapat mengulang proses pemasukkan data dengan menekan tombol
”Ulangi Lagi”, dan melakukan proses kembali.
Gambar 32. Tombol Mendapatkan Output dari Input Data.
Output Sistem
Pembuatan antarmuka pada sistem Aplikasi DBD menggunakan fasilitas
GUI pada Matlab 7.0, Output yang dihasilkan oleh sistem adalah kondisi DBD
berdasarkan data cuaca yang dimasukkan oleh pengguna dan hasil proses
defuzzifikasi.
66
Prediksi DBD Tahun Selanjutnya
Prediksi DBD yang dibangun menggunakan basis aturan, dalam
membangun hasil prediksinya adalah berdasarkan data cuaca yang meliputi suhu,
kelembaban, penyinaran matahari dan curah hujan. Sehingga untuk memprediksi
DBD ditahun selanjutnya agar dapat digunakan sebagai dasar dari tindakan
pencegahan dini DBD di wilayah DKI Jakarta diperlukan data cuaca di wilayah
yang bersangkutan. Data cuaca yang digunakan dalam membangun basis aturan
adalah data cuaca yang telah dicatat oleh dinas BMG. Untuk memprediksi DBD
tahun selanjutnya, maka harus digunakan data cuaca hasil dari prediksi data cuaca
tahun – tahun sebelumnya, misalnya untuk memprediksi data cuaca tahun 2007,
maka digunakan data cuaca tahun 2005 dan 2006. Untuk memprediksi data cuaca
ini maka digunakan software Minitab dengan menggunakan metode Winter’s.
Metode ini melakukan prediksi data cuaca pada tahun 2007 didasarkan pada data
cuaca minimal 2 tahun sebelumnya.
Data cuaca akan dimasukkan sebagai data dalam bentuk cell, data tersebut
akan digunakan sebagai variabel yang akan diprediksi. Selanjutnya pengguna
menentukan panjang periode dari variabel sebelumnya. Pengguna juga
menentukan level, trend dan season dan jumlah yang akan diprediksi.
Gambar 33. Interface Metode Winter’s
67
Kompleksitas Sistem
Kompleksitas merupakan ukuran konerja sebuah algoritma. Kinerja
sebuah algoritma tergantung pada faktor internal dan eksternal.
Faktor internal yaitu tingkat efisiensi dalam :
-
Waktu yang digunakan untuk melaksanakan algoritma.
-
Memori yang diperlukan dalam menjalankan algoritma.
Faktor eksternal terdiri dari :
-
Ukuran input yang digunakan sebuah algoritma.
-
Kecepatan komputer yang digunakan untuk melaksanakan algoritma.
Potongan
koding
program
berikut
ini
terdapat
dalam
fungsi
banyak_data.m yang digunakan dalam mengolah data masukkan yang diberikan
oleh pengguna.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
tahun=get(handles.edit1,'String');
conn = database('hendra', '', '');
curs = exec(conn, ['select * from hendra where tahun = ''', tahun, ''''])
curs=fetch(curs);
A=curs.Data
uA=size(A);
if uA(1)>1
for i=1:uA(1)
Di eksekusi sebanyak n kali
k=1;
for j=3:uA(2)
Di eksekusi sebanyak m kali
B(i,k)=str2num(mat2str(cell2mat(A(i,j))));
k=k+1;
End
End
Secara garis besar potongan koding program diatas terdiri dari 2 iterasi, yaitu
pada baris 8 dan 10. Baris 10 iterasi dilakukan sebanyak m kali, dengan
kompleksitasnya O(m), akan tetapi karena pada iterasi ini di eksekusi sebanyak n
kali, maka kompleksitasnya menjadi O(mn). Secara keseluruhan komplesitas dari
program ini adalah O(mn).
68
BAB VI
PENGUJIAN DAN PEMBAHASAN
6.1.
Mekanisme Pengujian
Pengujian dilakukan terhadap model data mining yang dibangun. Tujuan
pengujian adalah untuk menemukan model yang ideal. Sebelum dilakukan
pengujian terlebih dahulu dilakukan pembentukan model. Pembentukan model
menggunakan data training adapun pengujian model menggunakan data testing.
Data training dan data testing memuat informasi tentang data input berupa suhu
udara, curah hujan, penyinaran matahari, kelembaban udara dan data output
berupa kondisi DBD (pada kondisi hijau, kuning, atau kondisi merah). Model
yang sudah terbentuk dibandingkan dengan hasil pengujian pada data testing.
Semakin sama hasil perbandingan output kedua model berarti model semakin
akurat.
Pengujian dilakukan terhadap data training dengan mengambil data
sampel berdasarkan prosentase. Pada kedua kelompok data tersebut algoritme
data mining digunakan untuk mencari pola-pola dari nilai yang diprediksi.
Selanjutnya model diperbaiki dengan menggunakan sampel data lain agar tidak
hanya bisa bekerja dengan data training.
6.2. Pembentukan Model Dengan Data Training
Proses pembentukan model data mining menggunakan algoritme CPAR.
Pembentukan dilakukan dengan mengambil sebanyak 202 sampel (tahun 2004 –
2005), dari sampel tersebut 105adalah berasal dari data DBD untuk wilayah
Jakarta Pusat dan 97 berasal dari data wilayah Jakarta Selatan. Data tersebut
adalah kejadian DBD di suatu kecamatan di wilayah tersebut, dalam hal ini untuk
wilayah Jakarta pusat terdapat 8 (delapan) kecamatan, sedangkan Jakarta selatan
10 (sepuluh) kecamatan. Dari data rata – rata ini diklasifikasikan kedalam
pembagian kondisi DBD (hijau, kuning dan merah) yang telah disepakati
bersama. Karakteristik sampel data bisa dilihat pada Tabel 13 dan 14, sedangkan
pada Tabel 15 dan 16 adalah Nilai rata-rata kasus DBD per kecamatan per
wilayah
69
Tabel 13 . Data Survalaince DBD Tahun 2005 Minggu 1 - 14
Minggu
Jakarta Pusat
Jakarta Selatan
1
25
29
2
30
49
3
42
78
4
50
74
5
54
102
6
71
140
7
98
192
8
87
149
9
67
124
10
44
110
11
35
71
12
37
69
13
44
68
12
182
231
13
127
154
14
39
58
Tabel 14. Data Survailance DBD Tahun 2004 Minggu 1 – 14
Minggu
Jakarta Pusat
Jakarta Selatan
1
41
40
2
36
78
3
35
103
4
55
112
5
57
138
6
90
173
7
102
170
8
260
421
9
438
652
10
417
636
11
272
318
Tabel 15. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2005
Minggu
Jakarta Pusat
Jakarta Selatan
1
3
3
2
4
5
3
5
8
4
6
7
5
7
10
6
9
14
7
12
19
8
11
15
9
8
12
10
6
11
11
4
7
12
5
7
13
6
7
14
5
6
Tabel 16. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2004
Minggu
Jakarta Pusat
Jakarta Selatan
1
5
4
2
5
8
3
4
10
4
7
11
5
7
14
6
11
17
7
13
17
8
33
42
9
55
65
10
52
64
11
34
32
12
23
23
13
16
15
14
10
16
Hasil proses data mining dari 97 sampel pada wilayah Jakarta Selatan
Kecamatan Kebayoran Baru, dengan berbagai variasi gain similarity ratio (GSR)
dapat dilihat pada Tabel 17 sampai dengan Tabel 21
Tabel 17. Aturan Data Training Dengan GSR 99%
No.
1
2
3
4
5
6
Aturan
IF Kelembaban udara tinggi / basah (>75%) Then
Merah
IF Penyinaran matahari sedang (35% - 70%) Then
Merah
IF Curah hujan rendah 5-20mm Then Merah
IF Kelembaban udara Normal (60% - 75%) Then
Kuning
IF Penyinaran matahari penuh (> 70%) Then
Kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
Akurasi
Laplace
0.71
0.71
0.7
0.64
0.61
0.45
Data pada Tabel 17. pada Gain similarity 99% didapatkan sebanyak 6 baris
aturan, data tersebut menunjukkan bahwa aturan IF Kelembaban udara tinggi /
basah (>75%) Then Merah serta IF Penyinaran matahari sedang (35% - 70%)
Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah ,
14
83
161
70
sebesar 71%, ini berarti pada kelembaban udara tinggi / basah dan pada
penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi
merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang,
Aturan IF Kelembaban udara Normal (60% - 75%) Then Kuning mempunyai
Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 64%. Ini
berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin
terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per
kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh
nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya
kelembaban udara berkisar pada 60% - 75%, situasi ini masih memungkinkan
nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara >75%.
Tabel 18. Aturan Data Training Dengan GSR 80%
No.
1
2
3
4
5
Aturan
IF Kelembaban udara tinggi / basah ( >75%)
and Penyinaran matahari sedang (35 - 70%)
Then Merah
IF Curah hujan rendah (5-20mm) Then Merah
IF Kelembaban udara Normal (60% - 75%)
Then Kuning
IF Penyinaran matahari penuh (> 70%) Then
Kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
Akurasi
Laplace
0.71
0.7
0.64
0.61
0.45
Pada tabel 18, dengan gain similarity 80% didapatkan 5 baris aturan, dari data
tersebut, aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran
matahari sedang (35% – 70 %) Then Merah, mempunyai tingkat keakurasian
71%, ini berarti pada kondisi kelembaban udara tinggi yang disertai dengan
penyinaran matahari sedang sangat memungkinkan terjadi DBD pada kondisi
merah. Sedangkan pada aturan yang menhasilkan kondisi DBD kuning terdapat 3
aturan yang sama dengan gain similarity 99 %
71
Tabel 19. Aturan Data Training Dengan GSR 60%
No.
Aturan
Akurasi
Laplace
1
2
IF Kelembaban udara tinggi / basah ( >75%)
and Penyinaran matahari sedang ( 35% - 70%)
Then Merah
IF Curah hujan rendah 5-20mm Then Merah
IF Kelembaban udara Normal (60% - 75%) and
Penyinaran matahari penuh ( > 70%) Then kuning
0.71
0.70
3
0.63
Pada tabel 19, dengan gain similarity rasio 60%, didapatkan aturan untuk
DBD pada kondisi merah sama dengan pada gain similarity 80%, akan tetapi
untuk kondisi kuning, didapatkan suatu aturan IF Kelembaban udara Normal
(60% - 75%) and Penyinaran matahari penuh (> 70%) Then kuning, sehingga
jika pada saat kondisi kelembaban udara normal dan penyinaran matahari penuh,
maka dapat terjadi DBD dengan jumlah pasien 1-5 orang per kecamatan.
Tabel 20. Aturan Data Training Dengan GSR 20%
No.
1
2
3
Aturan
IF Kelembaban udara tinggi / basah ( >75%)
and Penyinaran matahari sedang (35% - 70%) and
Curah hujan rendah (5-20mm) Then Merah
IF Kelembaban udara Normal (60% - 75%) and
Penyinaran matahari penuh (> 70%) Then kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
Akurasi
Laplace
0.71
0.63
0.45
Pada Gain similarity 20 %, didapatkan 3 aturan, 1 aturan untuk kondisi merah,
yaitu aturan IF
Kelembaban udara tinggi / basah (>75%) and Penyinaran
matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah,
dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi
kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah
sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah
penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku
pada gain similarity ini adalah aturan IF Curah hujan sangat rendah (<5mm)
Then Kuning, akan tetapi tingkat keakurasiannya hanya 45%.
72
Tabel 21. Aturan Data Training Dengan GSR 10%
No.
Aturan
Akurasi
Laplace
1
IF Kelembaban udara tinggi / basah ( >75%) and
Penyinaran matahari sedang ( 35 - 70%) and Curah
hujan rendah (5-20mm) Then Merah
IF Temperatur sedang (24oC – 27oC ) then Merah
0.71
2
3
4
5
0.65
IF Kelembaban udara Normal (60%- 75%) and
Penyinaran matahari penuh ( > 70%) Then Kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
IF temperatur tinggi (> 27oC ) Then Kuning
0.63
0.45
0.40
Pada gain similarity 10% didapatkan 5 baris aturan, dimana terdapat 2
aturan untuk kondisi merah dan 3 aturan untuk kondisi kuning. Untuk merah
terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak
didapatkan, yaitu pada temperature sedang (24oC – 27oC) juga memungkinkan
untuk terjadi DBD pada kondisi merah, akan tetapi hal ini hanya akan terjadi jika
kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari
sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 %.
Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan
terjadi jika kondisi Temperatur Tinggi (>27oC), kemungkinan hal ini terjadi dan
mempengaruhi adalah sebesar 40%.
6.3.
Pelatihan Dengan Data Testing
Pelatihan dengan data testing dilakukan dengan mengambil data cuaca
sebanyak 52 minggu untuk wilayah Jakarta Selatan dan 52 minggu untuk wilayah
Jakarta Pusat. Karakteristik sampel data bisa dilihat pada Tabel 22. Karakteristik
umum data testing wilayah Jakarta Selatan, dan Tabel 23. Data DBD untuk
wilayah Jakarta Selatan.
73
Tabel 22. Data Testing Untuk Wilayah Jakarta Selatan
Minggu
Suhu
(oC)
Kelembaban(%)
Radiasi
(%)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
27.1
26.8
25.9
26.0
26.9
27.2
27.9
27.0
26.8
28.0
26.8
27.5
27.7
26.8
83.3
85.1
88.9
78.0
85.8
83.4
84.1
84.9
86.9
76.0
82.7
84.9
85.1
88.0
41.0
73.9
31.0
15.7
36.8
42.4
26.7
25.9
26.9
76.6
22.0
49.0
55.9
50.0
Curah
Hujan
(mm)
7.0
11.2
13.8
19.1
9.5
7.7
15.3
10.2
1.3
0.4
4.1
15.5
1.2
7.6
Tabel 23. Data DBD Untuk Wilayah Jakarta Selatan
Minggu
DBD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
179
227
171
132
126
148
161
186
149
142
165
182
119
174
Rata-rata
DBD
17.9
22.7
17.1
13.2
12.6
14.8
16.1
18.6
14.9
14.2
16.5
18.2
11.9
17.4
Dari data yang akan digunakan pada tahun 2004 – 2005, untuk wilayah Jakarta
Selatan 65% berada dalam kondisi kuning, 35% berada dalam kondisi merah.
Untuk wilayah Jakarta Pusat, 85% kondisi kuning dan 15% kondisi merah.
6.4.
Pembahasan
Berdasarkan dari data yang digali menggunakan datamining, didapatkan
beberapa aturan antara lain (untuk wilayah Jakarta Selatan) :
Untuk kondisi merah
1. Kelembaban udara tinggi (> 75%) maka kondisi DBD merah
2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah
3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah
74
4. Temperatur sedang (24oC – 27oC) maka kondisi merah
Jika dikaitkan dengan nyamuk Aedes aegypti sebagai vektor / pembawa virus
DBD, maka hal ini dapat diterangkan sebagai berikut :
Nyamuk Aedes aegypti adalah nyamuk khas daerah tropis, nyamuk ini
menyenangi kondisi udara yang kelembabannya sedang – tinggi, sinar matahari
tidak terlalu panas, suhu udara berkisar antara 24oC – 27oC
dan untuk
berkembang biak nyamuk ini membutuhkan media air yang bersih, biasanya
nyamuk ini akan bertelur dia kolam, tempat – tempat yang dapat menampung air
hujan, dll asalkan air tersebut cukup bersih. Berdasarkan dari aturan yang didapat
dari penggalian datamining, maka kondisi tersebut semua terpenuhi, dengan kata
lain pada kondisi tersebut, nyamuk akan berkembang biak sehingga akan timbul
jentik – jentik nyamuk, dan nyamuk akan bergerak secara aktif. Pada saat
bergerak inilah nyamuk akan menyebarkan virus DBD ke manusia. Berdasarkan
pada prediksi ini maka, bagi pihak – pihak yang berwenang seharusnya segera
mengambil langkah tindakan / tatalaksana sesuai SOP yang ada guna
menghilangkan kemungkinan menyebarnya nyamuk Aedes Aegypti.
Untuk kondisi kuning,
1. Kelembaban udara normal (60% - 75%) then kuning
2. Penyinaran matahari penuh(>70%) then kuning
3. Curah hujan sangat rendah (< 5mm) then kuning
4. Temperatur tinggi (> 27oC) then kuning
Dari aturan yang didapat, jika dikaitkan dengan berkembang biak dan
bergeraknya nyamuk Aedes Aegypti, maka sesuai dengan syarat / kondisi cuaca
yang digemari oleh nyamuk tersebut, maka pada kondisi yang ada pada aturan ini
pun nyamuk Aedes Aegypti pun masih cukup menyenangi untuk bergerak dan
untuk berkembang biak, akan tetapi karena ada salah satu kondisi cuaca dimana
suhu cukup tinggi (> 27oC), dimana nyamuk pada suhu ini tidak terlalu
menyenangi, biasanya pada suhu ini mereka berkumpul ditempat yang cukup
teduh, misalnya di pepohonan, sehingga walaupun nyamuk masih memungkinkan
untuk bergerak tetapi tidak seaktif pada kondisi sebelumnya.
6.5.
Penerapan Aplikasi DBD Per Kecamatan
Aplikasi DBD yang telah dibahas sebelumnya adalah aplikasi DBD yang
dibangun untuk wilayah kabupaten, dalam hal ini adalah Jakarta Pusat dan Jakarta
75
Selatan. Dari hasil prediksi tersebut dapat diketahui kemungkinan terjadinya
wabah DBD diwilayah tersebut, akan tetapi terdapat kekurangan dari aplikasi
penerapan per kabupaten tersebut, yaitu tenaga pelaksana di lapangan tidak
mengetahui titik / lokasi awal dari penyebaran wabah DBD tersebut. Untuk
meminimalisasi kekurangan tersebut, dicoba untuk menerapkan aplikasi tersebut
sampai pada tingkat kecamatan. Kecamatan di wilayah Jakarta Pusat terdiri dari 8
kecamatan, yaitu: Cempaka putih, Gambir, Johar baru, Kemayoran, Menteng,
Sawah besar, Senen, Tanah abang. Sedangkan di wilayah Jakarta Selatan terdiri
dari 10 kecamatan, yaitu : Cilandak, Jagakarsa, Kebayoran baru, Kebayoran
Lama, Mampang prapatan, Pancoran, Psr.Minggu, Pesanggrahan, Setia budi,
Tebet. Data kejadian DBD di tiap – tiap kecamatan inilah yang akan dikaitkan
dengan variable dari cuaca, untuk mendapatkan aturan – aturan yang nantinya
dapat digunakan dalam memprediksi DBD di tiap – tiap kecamatan tersebut.
Dalam pembahasan ini akan dibahas 2 kecamatan dari wilayah Jakarta Selatan
yaitu Kecamatan Kebayoran Baru dan Tebet. Dasar pemilihan pembahasan 2
wilayah ini adalah karena berdasarkan data survailance, untuk wilayah Kebayoran
Baru, prevelensi terjadinya kondisi Hijau selama tahun 2004 – 2005 paling
banyak yaitu 17 minggu, sedangkan di kecamatan Tebet, kondisi hijau tidak
pernah terjadi, artinya wabah DBD selalu terjadi di wilayah ini.
6.5.1. Pembentukan Model Dengan Data Training
Seperti dalam langkah sebelumnya, pembentukan model data mining
dilakukan dengan menggunakan algoritma CPAR. Data cuaca yang digunakan
adalah data cuaca pada tahun 2004 – 2005 pada wilayah Jakarta Pusat dan Jakarta
Selatan. Data yang digunakan sebanyak 16.285 sampel (data kejadian tahun 2004
– 2005 ), yang terdiri dari 5.932 sampel untuk Jakarta Pusat, 10.353 sampel untuk
Jakarta Selatan. Dari sample data tersebut diklasifikasikan kedalam pembagian
kondisi DBD (hijau, kuning, merah). Karakteristik sampel data dapat dilihat pada
tabel 24 dan 25 untuk masing – masing wilayah.
76
Tabel 24. Data Survailance DBD Tahun 200 Untuk Kecamatan Wil. Jak-Pus
Minggu
KECAMATAN
Cempaka Putih
Gambir
Johar baru
Kemayoran
Menteng
Sawah Besar
Senen
Tanah Abang
1
1
3
0
7
4
3
1
6
2
6
2
2
3
5
7
1
4
3
6
5
3
4
5
5
2
12
4
4
3
8
8
8
11
2
6
5
7
8
4
8
3
5
10
9
6
10
9
9
10
12
2
5
14
7
12
12
11
16
16
14
9
8
Tabel 25. Data Survailance Tahun 2005 Untuk Kecamatan Wil. Jak-Sel
Minggu
KECAMATAN
Cilandak
Jagakarsa
Kebayoran baru
Kebayoran lama
Mampang
Pancoran
Psr. Minggu
Pesanggrahan
Setia budi
Tebet
1
3
2
2
8
1
5
2
0
0
6
2
4
3
5
7
3
5
8
3
4
7
3
7
5
9
10
8
5
7
6
2
19
4
9
9
16
14
4
5
3
2
5
7
5
11
10
6
17
4
10
16
4
7
17
6
21
14
15
17
5
12
28
2
7
19
7
10
24
16
27
13
20
23
13
13
33
Hasil proses data mining dari 10.353 sampel pada wilayah kecamatan di
Jakarta Selatan, dengan berbagai variasi gain similarity rasio (GSR),pada
kecamatan Kebayoran baru dapat dilihat pada tabel 26 – 28. Sedangkan untuk
kecamatan Tebet dapat dilihat pada tabel 29 -32.
Tabel 26. Aturan Data Training Dengan GSR 99 %
No.
1
2
3
4
5
6
7
8
9
Aturan
IF Kelembaban udara tinggi / basah ( >75%) Then
Merah
IF Penyinaran matahari sedang (35% - 70%) Then
Merah
IF Curah hujan rendah 5-20mm Then Merah
IF Kelembaban udara Normal (60% - 75%) Then
Kuning
IF Penyinaran matahari penuh ( > 70%) Then
Kuning
IF Curah hujan rendah (5-20mm) Then Kuning
IF Penyinaran matahari penuh (>70%) Then Hijau
IF Temperatur tinggi ( > 27o C) Then Hijau
IF Curah Hujan Sangat Rendah (< 5 mm) Then
Hijau
Akurasi
Laplace
0.71
0.71
0.7
0.71
0.64
0.64
0.71
0.71
0.71
77
pada Gain similarity 99% didapatkan sebanyak 9 baris aturan, dari aturan
tersebut dapat dilihat bahwa aturan IF Kelembaban udara tinggi / basah (>75%)
Then Merah serta IF Penyinaran matahari sedang (35% - 70%) Then Merah
mempunyai Akurasi Laplace yang sama tinggi pada klas merah , sebesar 71%, ini
berarti pada kelembaban udara tinggi / basah dan pada penyinaran matahari
sedang mempunyai peluang terjadi DBD dengan kondisi merah, atau suatu situasi
dimana jumlah pasian perkecamatan lebih dari 5 orang. Aturan IF Kelembaban
udara Normal (60% - 75%) Then Kuning mempunyai Akurasi Laplace paling
tinggi pada kelas kondisi DBD kuning,
yaitu 71%. Ini berarti pada kondisi
kelembaban udara normal, kondisi DBD kuning mungkin terjadi, atau suatu
kondisi dimana jumlah pasien berkisar antara 1- 5 orang per kecamatan. Pada
kondisi ini kelembaban udara masih cukup disenangi oleh nyamuk Aedes
Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya kelembaban udara
berkisar pada 60% - 75%, situasi ini masih memungkinkan nyamuk bergerak,
walau tidak seaktif pada kondisi kelembaban udara >75%. Selain itu pada kondisi
DBD hijau, aturan yang memungkin terjadinya kondisi ini adalah IF Temperatur
tinggi ( > 27o C) Then Hijau dan IF Curah Hujan Sangat Rendah (< 5 mm) Then
Hijau mempunyai Akurasi Laplace sama kuatnya yaitu 71%, hal ini berarti pada
kondisi tersebut kemungkinan nyamuk untuk berkembang biak sangat kecil.
Tabel 27. Aturan Data Training Dengan GSR 20 %
No.
1
2
3
4
Aturan
IF Kelembaban udara tinggi / basah ( >75%)
and Penyinaran matahari sedang (35% - 70%) and
Curah hujan rendah (5-20mm) Then Merah
IF Kelembaban udara Normal (60% - 75%) and
Penyinaran matahari penuh (> 70%) Then kuning
IF Curah hujan rendah (5-20mm) Then Kuning
IF Penyinaran matahari penuh (>70%) and
Temperatur tinggi (> 27o C) and Curah hujan sangat
rendah ( < 5mm) Then Hijau
Akurasi
Laplace
0.71
0.64
0.64
0.71
Pada Gain similarity 20 %, didapatkan 4 aturan, 1 aturan untuk kondisi
merah, yaitu aturan IF Kelembaban udara tinggi / basah (>75%) and Penyinaran
matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah,
dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi
kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah
78
sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah
penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku
pada gain similarity ini adalah aturan IF Kelembaban udara Normal (60% 75%) and Penyinaran matahari penuh (> 70%) Then kuning, dengan tingkat
keakurasian 63%, maka pada kondisi dimana kelembaban udara normal dan
penyinaran matahari penuh, nyamuk Aedes aegypti, tidak terlalu aktif untuk
bergerak, karena kondisi cuaca yang tidak disenangi oleh nyamuk ini, sehingga
penyebaran vektor dari DBD pun agak berkurang, untuk aturan IF Curah hujan
sangat rendah (<5mm) Then Kuning, juga turut mempengaruhi dengan tingkat
keakurasiannya hanya 64%, Pada aturan ke 4 didapat aturan untuk kondisi hijau,
IF Penyinaran matahari penuh (>70%) and Temperatur tinggi (> 27o C) and
Curah hujan sangat rendah (< 5mm) Then Hijau dengan tingkat keakurasian
71%, berdasarkan aturan ini, jika semua terpenuhi maka nyamuk Aedes Aegypti
benar – benar dalam keadaan pasif atau tidak bergerak. Hal ini lebih disebabkan
karena kondisi cuaca yang panas dimana pada kondisi ini nyamuk ini tidak
menyenanginya.
Tabel 28. Aturan Data Training Dengan GSR 10 %
No.
Aturan
Akurasi
Laplace
1
IF Kelembaban udara tinggi / basah ( >75%) and
Penyinaran matahari sedang ( 35 - 70%) and Curah
hujan rendah (5-20mm) Then Merah
IF Temperatur sedang ( 24oC – 27oC ) then Merah
0.71
2
3
4
5
6
7
0.65
IF Kelembaban udara Normal (60%- 75%) and
Penyinaran matahari penuh ( > 70%) Then Kuning
IF Curah hujan rendah (5-20mm) Then Kuning
IF temperatur tinggi ( > 27oC ) Then Kuning
IF Penyinaran matahari penuh (>70%) and
Temperatur tinggi ( > 27o C) and Curah hujan
sangat rendah ( < 5mm) Then Hijau
IF Kelembaban normal ( 60%-75%) Then Hijau
0.64
0.64
0.40
0.71
0.45
Pada gain similarity 10% didapatkan 7 baris aturan, dimana terdapat 2
aturan untuk kondisi merah, 3 aturan untuk kondisi kuning dan 2 aturan untuk
kondisi hijau. Untuk merah terdapat tambahan yang pada gain similarity rasio
sebelumnya aturan ini tidak didapatkan, yaitu pada temperature sedang (24oC –
27oC) juga memungkinkan untuk terjadi DBD pada kondisi merah, akan tetapi hal
79
ini hanya akan terjadi jika kondisi sebelumnya yaitu Kelembaban udara tinggi dan
penyinaran matahari sedang dan curah hujan rendah terjadi. Kemungkinan hal ini
terjadi sebesar 65 %. Sedangkan pada aturan untuk kondisi kuning, terdapat
tambahan aturan akan terjadi jika kondisi Temperatur Tinggi (>27oC), akan tetapi
karena kemungkinan hal ini terjadi dan mempengaruhi adalah sebesar 40%, maka
hal ini dapat di abaikan. Sedangkan pada kondisi hijau terdapat tambahan aturan
kondisi kelembaban normal, dengan keakurasian 45%. Kondisi kelembaban
normal yang mempengaruhi kondisi DBD hijau sebelumnya juga muncul pada
kondisi DBD kuning dengan keakurasian 63%, lebih dominan pengaruhnya pada
kondisi DBD hijau, sehingga untuk kondisi Kelembaban normal pada kondisi
DBD hijau dapat diabaikan.
Tabel 29. Aturan Data Training Dengan GSR 99%
No.
1
2
3
4
5
6
Aturan
IF Kelembaban udara tinggi / basah (>75%) Then
Merah
IF Penyinaran matahari sedang (35% - 70%) Then
Merah
IF Curah hujan rendah 5-20mm Then Merah
IF Kelembaban udara Normal (60% - 75%) Then
Kuning
IF Penyinaran matahari penuh ( > 70%) Then
Kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
Akurasi
Laplace
0.71
0.71
0.7
0.64
0.61
0.45
Data pada Tabel 29. pada Gain similarity 99% didapatkan sebanyak 6 baris
aturan, data tersebut menunjukkan bahwa aturan IF Kelembaban udara tinggi /
basah ( >75%) Then Merah serta IF Penyinaran matahari sedang (35% - 70%)
Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah ,
sebesar 71%, ini berarti pada kelembaban udara tinggi / basah dan pada
penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi
merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang,
Aturan IF Kelembaban udara Normal (60% - 75%) Then Kuning mempunyai
Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 64%. Ini
berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin
terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per
kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh
80
nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya
kelembaban udara berkisar pada 60% - 75%, situasi ini masih memungkinkan
nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara >75%.
Tabel 30. Aturan Data Training Dengan GSR 60%
No.
Aturan
Akurasi
Laplace
1
2
IF Kelembaban udara tinggi / basah (>75%)
and Penyinaran matahari sedang (35% - 70%)
Then Merah
IF Curah hujan rendah 5-20mm Then Merah
IF Kelembaban udara Normal (60% - 75%) and
Penyinaran matahari penuh ( > 70%) Then kuning
0.71
0.70
3
0.63
Pada tabel 30, dengan gain similarity rasio 60%, didapatkan aturan untuk
DBD pada kondisi merah sama dengan pada gain similarity 80%, akan tetapi
untuk kondisi kuning, didapatkan suatu aturan IF Kelembaban udara Normal
(60% - 75%) and Penyinaran matahari penuh ( > 70%) Then kuning, sehingga
jika pada saat kondisi kelembaban udara normal dan penyinaran matahari penuh,
maka dapat terjadi DBD dengan jumlah pasien 1-5 orang per kecamatan.
Tabel 31. Aturan data training dengan Gain similarity ratio 20%
No.
1
2
3
Aturan
IF Kelembaban udara tinggi / basah (>75%)
and Penyinaran matahari sedang (35% - 70%) and
Curah hujan rendah (5-20mm) Then Merah
IF Kelembaban udara Normal (60% - 75%) and
Penyinaran matahari penuh (> 70%) Then kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
Akurasi
Laplace
0.71
0.63
0.45
Pada Gain similarity 20 %, didapatkan 3 aturan, 1 aturan untuk kondisi merah,
yaitu aturan IF
Kelembaban udara tinggi / basah (>75%) and Penyinaran
matahari sedang (35% - 70%) and Curah hujan rendah (5-20mm) Then Merah,
dengan tingkat akurasian 71%, sehingga menurut aturan ini pada kondisi
kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah
sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah
penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku
pada gain similarity ini adalah aturan IF Curah hujan sangat rendah (<5mm)
81
Then Kuning, akan tetapi tingkat keakurasiannya hanya 45%, sehingga dapat
diabaikan.
Tabel 32. Aturan Data Training Dengan GSR 10%
No.
1
Aturan
Akurasi
Laplace
IF Kelembaban udara tinggi / basah (>75%) and
Penyinaran matahari sedang (35 - 70%) and Curah
hujan rendah (5-20mm) Then Merah
IF Temperatur sedang (24oC – 27oC ) then Merah
2
3
4
5
0.71
0.65
IF Kelembaban udara Normal (60%- 75%) and
Penyinaran matahari penuh (> 70%) Then Kuning
IF Curah hujan sangat rendah (<5mm) Then
Kuning
o
IF temperatur tinggi ( > 27 C ) Then Kuning
0.63
0.45
0.40
Pada gain similarity 10% didapatkan 5 baris aturan, dimana terdapat 2
aturan untuk kondisi merah dan 3 aturan untuk kondisi kuning. Untuk merah
terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak
didapatkan, yaitu pada temperature sedang (24oC – 27oC) juga memungkinkan
untuk terjadi DBD pada kondisi merah, akan tetapi hal ini hanya akan terjadi jika
kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari
sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 %.
Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan
terjadi jika kondisi Temperatur Tinggi (>27oC), kemungkinan hal ini terjadi dan
mempengaruhi adalah sebesar 40%.
6.5.2. Pembahasan
Berdasarkan dari data yang digali menggunakan datamining, didapatkan
beberapa aturan untuk kecamatan Kebayoran baru dan kecamatan Tebet, dimana
kecamatan – kecamatan ini masuk dalam wilayah Jakarta Selatan :
6.5.2.1.Kecamatan Kebayoran Baru
Aturan – aturan yang dapat digali menggunakan data mining untuk
wilayah Kebayoran baru, dengan jumlah data sebanyak 755 data, didapatkan
aturan – aturan sebagai berikut :
Untuk kondisi DBD merah
1. Kelembaban udara tinggi ( > 75%) maka kondisi DBD merah.
2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah.
82
3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah.
4. Temperatur sedang (24oC – 27oC) maka kondisi merah.
Untuk Kondisi DBD kuning
1. Kelembaban udara normal (60% - 75%) then kuning.
2. Penyinaran matahari penuh(>70%) then kuning.
3. Curah hujan rendah ( 5 – 20 mm) then kuning.
Jika dikaitkan dengan nyamuk Aedes Aegypti sebagai vektor / pembawa
virus DBD, maka hal ini dapat diterangkan sebagai berikut :
Seperti telah diterangkan di bab 6.4, dimana nyamuk ini adalah nyamuk
khas tropis yang menyukai kondisi udara yang lembab – hangat, yaitu suhu udara
berkisar 24oC – 27oC, penyinaran matahari yang normal (35% - 70%),
kelembaban udara tinggi (> 75%). Pada kondisi ini nyamuk ini akan aktif
bergerak dan berkembang biak, pada saat bergerak inilah untuk membantu proses
reproduksinya nyamuk – nyamuk ini me mbutuhkan darah manusia. Pada saat itu
pula mereka menyebarkan virus DBD kedalam tubuh manusia yang telah mereka
ambil darahnya. Untuk berkembang biak, mereka membutuhkan media air yang
bersih dan ruangan yang agak gelap, curah hujan pada kondisi 5 – 20 mm/minggu
cukup untuk memberikan media bagi nyamuk ini untuk berkembang biak, apalagi
ditambah kondisi lingkungan yang mempunyai banyak ruang untuk air – air
tersebut mengenang. Sehingga pada kondisi dimana air mengenang dan kondisi
cuaca dimana proses penguapan dari air tersebut tidak cukup memadai, maka
nyamuk Aedes Aegypti akan leluasa berkembang biak dan kemungkinan
terjadinya wabah DBD pada kondisi kuning (1 – 5 org/kecamatan) atau kondisi
merah (> 5 org/ kecamatan) sangat mungkin terjadi.
Untuk Kondisi DBD hijau
1. Penyinaran matahari penuh (> 70%)
2. Temperatur tinggi (> 27oC)
3. Curah hujan sangat rendah (< 5mm)
Berdasarkan aturan yang didapat untuk kondisi hijau, dapat diterangkan
sebagai berikut :
Pada kondisi cuaca dimana penyinaran matahari tinggi (> 70%),
temperatur yang tinggi (> 27oC) dan curah hujan yang sangat rendah (< 5mm),
maka pada kondisi ini nyamuk Aedes Aegypti tidak akan bergerak / pasif, karena
83
sifat dari nyamuk tersebut yang lebih menyenangi kondisi cuaca yang lembab –
hangat. Untuk wilayah kecamatan Kebayoran baru, kondisi DBD hijau (3 minggu
tidak terjadi DBD), hal ini karena keadaan lingkungan yang sebagian besar sudah
berupa perumahan – perumahan elite, pertokoan dan perkantoran, dimana
kesadaran akan kebersihan lingkungan mutlak diperlukan, disamping itu lahan
yang memungkinkan air untuk menggenang juga semakin sedikit karena kegiatan
ekonomi dan lalu lintas yang cukup tinggi di daerah ini.
6.5.2.2. Kecamatan Tebet
Aturan – aturan yang berhasil digali dari data yang digunakan (1.308
data), adalah sebagai berikut :
Untuk kondisi merah
1. Kelembaban udara tinggi (> 75%) maka kondisi DBD merah .
2. Penyinaran matahari sedang (35% - 70%) maka kondisi DBD merah.
3. Curah hujan rendah (5 – 20 mm) maka kondisi DBD merah .
4. Temperatur sedang (24oC – 27oC) maka kondisi merah.
Untuk kondisi kuning,
1. Kelembaban udara normal (60% - 75%) then kuning.
2. Penyinaran matahari penuh(>70%) then kuning.
3. Curah hujan sangat rendah (< 5mm) then kuning.
4. Temperatur tinggi (> 27oC) then kuning.
Di kecamatan Tebet sepanjang tahun 2004 – 2005 kondisi DBD yang
terjadi selalu dalam kondisi merah dan kuning (kondisi hijau tidak terjadi pada
kecamatan ini), hal ini selain dari karena faktor – faktor cuaca yang mendukung
dari perkembangan dan pergerakan nyamuk Aedes Aegypti, faktor lainnya adalah
faktor lingkungan di kecamatan Tebet yang cenderung rapat antar rumah.
Sehingga ketika turun hujan dapat mengakibatkan air yang menggenang dimana –
mana disekitar rumah – rumah tersebut dan karena faktor teknis kerapatan antar
rumah mengakibatkan sinar matahari yang membantu proses penguapan secara
alamipun tidak dapat menembus, sehingga lingkungan ini sangat disukai oleh
nyamuk untuk berkembang biak.
6.6.
Prediksi DBD Tahun 2007
Berdasarkan data cuaca pada tahun 2005 dan 2006 maka dapat
diprediksikan data cuaca untuk tahun 2007, yang meliputi data suhu, kelembaban,
84
curah hujan dan penyinaran matahari. Data cuaca tahun 2005 dan 2006 dapat
dilihat pada tabel 24 dan tabel 25.
Tabel 33. Data Cuaca Jakarta Selatan Tahun 2005
Minggu
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Suhu
(oC)
26
26
26
25
25
26
26
27
28
28
27
28
28
27
Curah
hujan
(mm)
4
24
5
21
10
16
9
7
6
0
22
9
6
3
Sinar
matahari(%)
50
20
46
26
29
26
40
52
61
46
37
62
60
48
Kelembaban(%)
88
89
87
89
91
87
87
83
81
81
87
80
79
83
Tabel 34. Data Cuaca Jakarta Selatan tahun 2006
Minggu
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Suhu
(oC)
26
26
27
27
27
27
28
28
27
28
28
28
28
28
Curah
hujan
(mm)
12
14
4
8
11
15
4
3
4
1
6
10
2
8
Sinar
matahari(%)
21
16
33
32
29
31
47
36
31
32
35
34
37
34
Kelembaban(%)
89
92
85
85
86
89
80
81
84
80
82
86
80
83
Berdasarkan data cuaca tersebut, dicoba untuk melakukan prediksi cuaca
pada tahun 2007, dengan memasukkan data tersebut sebagai data masukkan pada
metode Winter’s. Hasil prediksi dengan menggunakan metode Winters
ditampilkan dalam gambar 34 sampai dengan 37, sedangkan hasil prediksi cuaca
secara lengkap ditampilkan pada tabel 26 ( hasil lengkap pada lampiran 11).
85
Gambar 34. Prediksi Suhu tahun 2007 dengan metode Winter’s
Gambar 35. Prediksi Curah Hujan tahun 2007 dengan metode Winter’s
Gambar 36. Prediksi Penyinaran Matahari tahun 2007 dengan metode Winters
86
Gambar 37. Prediksi Kelembaban Udara tahun 2007 dengan metode Winters
Tabel 35. Hasil Prediksi Cuaca tahun 2007
Minggu Suhu (oC)
1
26.05
2
25.56
3
27.03
4
25.85
5
26.35
6
26.11
7
27.35
8
27.61
9
27.37
10
27.39
11
27.89
12
27.65
13
27.41
Curah
Hujan(mm)
6.93
8.13
2.07
4.93
7.16
6.27
2.89
2.23
1.13
5.35
3.47
3.75
1.22
Penyinaran
Matahari
( %)
27.02
19.88
37.81
33.68
40.60
45.32
52.68
60.30
49.53
46.23
51.42
68.83
58.34
Kelembaban
(%)
90.22
92.83
86.08
90.03
88.20
89.48
82.92
82.38
83.92
84.80
82.30
83.59
82.70
Berdasarkan data prediksi cuaca tahun 2007, dapat dilakukan prediksi
DBD dengan menggunakan aplikasi DBD untuk di wilayah kecamatan
Kebayoran baru dan di kecamatan Tebet, sehingga untuk melakukan tindakan
pencegahan dini dapat segera dilakukan oleh pihak yang terkait, dalam hal ini
dinas Kesehatan DKI Jakarta bekerjasama dengan seluruh komponen masyarakat.
Hasil dari prediksi dengan menggunakan aplikasi DBD untuk tahun 2006 – 2008
untuk masing – masing kecamatan tersebut disajikan pada gambar 38 dan 39 .
87
Gambar 38. Hasil Prediksi DBD tahun 2006 – 2008 Kecamatan Kebayoran baru
Dari gambar diatas dapat terlihat bahwa pada tahun 2007 kemungkinan terjadinya
wabah DBD pada kondisi merah sangat mungkin terjadi (94%) karena selama
tahun 2007 diprediksi cuaca di wilayah Jakarta Selatan mempunyai kelembaban
udara tinggi, penyinaran matahari sedang, curah hujan rendah dan suhu udara
rendah. Hal ini dapat memicu perkembangan dari populasi jentik / nyamuk Aedes
Aegeypti. Sebagai tindakan cegah dini, maka seharusnya sejak awal tahun 2007,
pihak dinas kesehatan telah melakukan sosialisasi pemberantasan jentik dari
nyamuk Aedes Aegypti, sehingga diharapkan dapat menekan angka populasi dari
nyamuk tersebut yang diharapkan juga dapat menurunkan secara signifikan dari
kemungkinan terjadinya wabah DBD. Akan tetapi pada minggu 31 dan 35 karena
faktor cuaca suhu tinggi, curah hujan yang sangat rendah sehingga kemungkinan
tidak terjadi DBD. Hal ini disebabkan karena kondisi cuaca yang tidak terlalu
memungkinkan tumbuhnya secara pesat jentik nyamuk Aedes Aegypti sebagai
vektor virus DBD. Pada tahun 2008, berdasarkan data prediksi cuaca, hasil
prediksi DBD dengan menggunakan aplikasi DBD, didapatkan hasil pada minggu
22, 27, 34 – 37 dan 51 tidak terjadi DBD (kondisi hijau), hal ini disebabkan
karena kondisi cuaca yang tidak memungkinkan tumbuhnya jentik – jentik DBD,
88
sehingga kemungkinan tidak terjadi wabah DBD sangat besar. Akan tetapi selain
minggu tersebut, kemungkinan terjadinya wabah DBD sangat besar (86%),
sehingga tetap perlu diwaspadai dengan melakukan pencegahan dini di wilayah
kecamatan ini.
Gambar 39. Hasil Prediksi DBD tahun 2006 – 2008 Kecamatan Tebet
Dari hasil prediksi aplikasi DBD, walaupun data cuaca yang digunakan sama
dengan yang digunakan dalam memprediksi DBD di wilayah kecamatan
Kebayoran baru, akan tetapi untuk wilayah Tebet, tidak terjadi dimana kondisi
DBD pada kondisi hijau, kondisi yang terjadi adalah DBD pada kondisi kuning.
Hal ini disebabkan karena pada daerah Tebet, faktor geografis dan lingkungannya
sangat berpengaruh, dimana karena faktor lingkungan, air hujan walaupun sedikit
tetap bisa menggenang karena walaupun matahari bersinar penuh, tetapi tidak bisa
menjangkau langsung ke tanah, sehingga genangan ini tidak bisa menguap dan
akhirnya menjadi tempat untuk nyamuk berkembang biak.
89
6.7.
Implikasi Manajerial
Penerapan datamining pada database DBD yang dimiliki oleh Dinkes DKI
Jakarta, diharapkan dapat memberikan suatu gambaran tentang DBD jika
dikaitkan dengan kondisi cuaca di suatu wilayah (khususnya dalam penelitian ini
adalah wilayah Jakarta Selatan dan Jakarta Pusat). Adanya perbedaan faktor –
faktor cuaca untuk setiap wilayah yang mempengaruhi terjadi wabah DBD juga
harus mendapatkan perhatian dari pihak – pihak yang berkompeten dalam
penanganan DBD, sehingga tidak salah dalam mengambil suatu keputusan dan
pelasanaan tatalaksana DBD.
Jika di lihat dari sisi pengguna, maka hasil aplikasi DBD ini dapat dibagi
menjadi 2, yaitu : masyarakat umum dan Pemerintah.
1. Masyarakat Umum :
Hasil prediksi demam berdarah yang didasarkan pada faktor cuaca di
wilayah, maka masyarakat dapat mengetahui kemungkinan wabah DBD di
wilayahnya, sehingga masyarakat dapat melakukan program cegah dini
DBD dengan melakukan program – program yang telah dicanangkan oleh
pemerintah, misalnya 3M, yaitu menutup, menguras, dan menimbun
tempat – tempat yang memungkinkan tumbuhnya jentik nyamuk Aedes
Aegypti. Selain tempat – tempat yang berada di luar rumah, maka
masyarakat juga dapat membersihkan tempat di dalam rumah yang
menjadi tempat favorit bagi nyamuk seperti korden, baju – baju yang
bergelantungan dan tempat – tempat yang gelap dan lembab. Kegiatan
pemberantasan ini minimal 1 x dalam seminggu, dan harus dilakukan
secara serentak di wilayah yang diprediksi akan terjadi wabah DBD,
mengingat radius terbang dari nyamuk Aedes aegypti cukup luas, yaitu 50
– 100 meter.
2. Pemerintah :
Pemerintah dalam hal ini adalah Dinas Kesehatan DKI Jakarta secara
khusus dan semua aparat pemerintah pada umumnya. Dari hasil prediksi
DBD, maka Dinas Kesehatan dapat melakukan tata laksana sesuai dengan
SOP yang telah diberlakukan dalam pemberantasan DBD, mengaktifkan
kembali para Jumantik (Juru Uji Jentik) ke setiap pelosok – pelosok
90
daerah yang diperkirakan berpotensi terjadi wabah DBD, melakukan
koordinasi dengan aparat pemerintahan dalam melakukan proses
Penyemprotan / Fogging, dan melakukan koordinasi untuk melakukan
kegiatan 3M secara massal disuatu wilayah.
3. Migrasi Sistem
3.1. Penerapan Aplikasi Secara Langsung
Sistem pakar Aplikasi DBD dapat diterapkan oleh suatu instansi
yang memerlukan informasi mengenai kemungkinan terjadinya wabah
DBD diwilayahnya, berikut tatalaksana yang harus dilaksanakan dalam
menanggulangi wanah DBD tersebut. Dalam mengaplikasikan sistem
pakar Aplikasi DBD ini maka diperlukan beberapa hal, antara lain:
-
Sistem operasi PC , Windows XP.
-
Perangkat lunak Matlab 7.0 R 14 (1.40 GB).
-
Perangkat lunak Minitab R11 for Windows (1.53 MB)
-
Aplikasi DBD (18.4 MB)
Langkah Migrasi :
-
Aplikasi DBD diletakkan kedalam folder Work yang terdapat
dalam perangkat lunak Matlab (misal : D:\MATLAB7\work).
-
Selanjutnya aplikasi tersebut dapat diakses melalui perangkat
lunak Matlab.
-
Untuk memprediksi data cuaca di tahun yang akan datang,
maka diperlukan perangkat lunak Minitab dengan metode
Winter’s. Data yang didapat hasil prediksi menggunakan
metode Winter’s selanjutnya dapat digunakan dalam Aplikasi
DBD.
3.2.
Migrasi Sistem Dengan Membangun Aturan Baru
Dalam menerapkan system ini pada lokasi yang baru, maka kita
harus membangun ulang aturan – aturan yang akan dijadikan dasar dalam
membangun prediksi DBD di wilayah tersebut. Adapun yang harus
dipersiapkan dalam membangun aturan tersebut adalah sebagai berikut :
91
-
Data cuaca dan data kejadian DBD di wilayah tersebut, pada
tahun yang sama.
-
Program datamining yang mempunyai metode Assosiation rule
(dapat
digunakan
metode
CPAR,
ataupun
software
Clementine).
-
Aplikasi DBD yang telah dibangun dengan Matlab 7.0 R14.
Langkah – langkah yang harus dilakukan :
-
Mempersiapkan data cuaca dan data DBD.
-
Diolah dengan program datamining yang telah dipilih.
-
Aturan yang telah didapat, selanjutnya dimasukkan kedalam
Aplikasi DBD yang telah ada.
-
Aturan yang terdapat di Aplikasi DBD, di edit dengan aturan –
aturan yang baru.
-
Aplikasi di coba dengan data yang telah ada dan digunakan
sebelumnya untuk membangun aturan – aturan.
-
Jika masih terdapat kesalahan, maka dapat diulang dalam
mencari aturan – aturannya.
-
Jika tingkat kesalahan sudah masuk dalam batas toleransi,
maka aplikasi DBD tersebut, dapat digunakan pada lokasi baru.
92
BABVII
KESIMPULAN DAN SARAN
7.1. Kesimpulan
Berdasarkan penelitian ini dapat disimpulkan beberapa hal, sebagai berikut :
1. Penerapan datamining dengan metode CPAR pada database DINKES DKI
Jakarta dikaitkan dengan data cuaca, menemukan adanya keterkaitan, yaitu :
Kelembaban udara , Penyinaran matahari dan Curah hujan menjadi penentu
utama apakah terjadi wabah DBD pada suatu wilayah.
2. Pola prediksi DBD berbeda untuk wilayah Jakarta Pusat dan Jakarta Selatan.
Wilayah Jakarta Selatan,
Faktor cuaca yang memicu DBD kondisi merah adalah : Kelembaban udara
tinggi, penyinaran matahari rendah - sedang, curah hujan normal dan suhu
udara normal
Faktor cuaca yang memicu DBD kondisi kuning adalah : Kelembaban udara
normal, penyinaran matahari normal, curah hujan rendah, dan suhu udara
normal - tinggi
Faktor cuaca yang memicu DBD kondisi hijau adalah : Penyinaran matahari
penuh, curah hujan sangat rendah, dan suhu udara tinggi
Wilayah Jakarta Pusat,
Faktor cuaca yang memicu DBD kondisi merah adalah : Penyinaran matahari
rendah, curah hujan sedang - normal, kelembaban udara tinggi, suhu udara
sedang.
Faktor cuaca yang me micu DBD kondisi kuning adalah : Curah hujan sangat
rendah, kelembaban udara normal, penyinaran matahari penuh, suhu udara
tinggi.
Faktor cuaca yang memicu DBD kondisi hijau adalah : Penyinaran matahari
penuh, curah hujan sangat rendah, dan suhu udara tinggi.
3. Kemungkinan DBD per minggu per wilayah berdasarkan data kejadian ;
Jakarta Selatan : Kondisi DBD Merah : Minggu ke 1-7, 13-20 dan 42-52;
selebihnya kondisi DBD kuning dan sebagian hijau atau tidak terjadi DBD.
Jakarta Pusat : Kondisi DBD Merah : Minggu ke 2-7, dan 10 – 12; Selebihnya
kondisi DBD kuning dan sebagian hijau tidak terjadi DBD.
93
4. Sebagai tindakan cegah dini wabah DBD, maka diprediksikan kemungkinan
wabah DBD untuk tahun 2007 di wilayah Jakarta Selatan adalah : Sepanjang
tahun 2007 kemungkianan terjadi wabah DBD dengan kondisi merah, kecuali
pada minggu ke 31, 34 dan 35 kondisi wabah DBD menurun sesuai dengan
factor cuaca ke kondisi kuning dan hijau, sedangkan pada tahun 2008,
walaupun pada minggu 22, 27, 34-37 dan 51 tidak terjadi DBD, akan tetapi
tetap harus diwaspadai karena selain minggu – minggu tersebut kemungkinan
DBD tetap terjadi.
5. Menurunkan nilai Gain Similarity Ratio dapat menggali aturan – aturan lain
yang sebelumnya tersembunyi.
7.2.Saran
Berdasarkan hasil penelitian ini, maka dapat disarankan :
1. Perlu ditambahkan atribut – atribut selain atribut cuaca, misalnya data atribut
kepadatan penduduk, data bebas jentik suatu wilayah dan data geografis dll
yang mempunyai potensi untuk mempengaruhi terjadinya wabah DBD disuatu
wilayah.
2. Pengelompokkan atribut lebih dipersempit rentangnya sehingga diharapkan
dapat dihasilkan aturan yang lebih detil dan lebih baik.
3. Dalam menggunakan Aplikasi DBD ini maka perlu dipersiapkan antara lain :
•
Perangkat lunak Matlab 7.0 R 14 dan Perangkat lunak Minitab R 11
for Windows.
•
Data cuaca rata – rata per minggu wilayah Jakarta Selatan dan Jakarta
Pusat.
94
DAFTAR PUSTAKA
1. Adriaans P, Zantinge D, Data Mining, Addison-Wesley Longman, London,
England, 1996.
2. Berry M.J.A, Linoff, G.S, mastering Data Mining “The Art Science of CRM”,
Willey , 2000.
3. Brookshear,J.G, Computer Science, Suatu Pengantar, Edisi 7, Erlangga, 2003 .
4. Breault J.L, Data Mining Diabetic Database:”Are Rough sets a Useful Addition”,
Depart. Of health system management, Tulane university, 2000.
5. Brosette S.E, A Data Mining System for Infection Control Surveillance,
www.medmined.com/image/pdf/MIMPaper.pdf, 2000.
6. Box E.P.G, Jenkins, M Gwilym, Time Series Analysis : Forecasting and Control,
1970.
7. Coenen F, The LUCS-KDD Implementations of CPAR ( Classification Based on
Predictive Association Rules), Department of Computer Science The
University of Liverfool, 2004.
8. Corey M, Abbey M, Abramson I, Taub B, Oracle 8i: Data Warehousing, Osborne
/ McGraw-Hill. 2001.
9. Dinas Kesehatan Propinsi DKI Jakarta, “Data Surveilans Penyakit Tahun 2003”.
2004.
10. Dinas Kesehatan DKI Jakarta, Demam Berdarah Aedes Aegypti,
www. Dinkesdkijakarta.gov. 2003.
11. Fayyad U, Piatetsky-Shapiro G, Smyth P, From Data Mining to Knowledge
Discovery in Database, AAAI, 1996.
12. Ferren G, Merwe M, Fleaming G, Murphy K, Fuzzy Expert System and GIS for
Cholera Health Risk Prediction in Southern Africa, The South African
Council for Scientific and Industrial research (CSIR), 2004.
13. Grosman Robert, Data Mining Research : Opportunities and Challenges “ A
Report of three NSF workshops on mining large, massive, and distributed
data”, January 1999.
95
14. Herwanto, Pembangunan Sistem Data mining untuk Mendiagnosa Penyakit
Diabetes Menggunakan Algoritma CPAR (Classification Based on
Predictive Association Rules), Thesis Pascasarjana, IPB, 2006.
15. Hirota K and Pedrycz W, Linguistic Data Mining and Fuzzy Modeling,
Procceding of IEEE fifth International Fuzzy System, New Orleans, LA,
1996.
16. Ishwar K Seti, Data mining : An Introduction, Intelligent Information Engineering
Laboratory, Departement of Computer Science and Engineering, Oakland
University, 2002
17. Jeffrey W, Data Mining : An Overview, CRS report for Congress, 2004.
18. Kantardzic M, Data Mining : Concepts, Models, Methods, and Algorithms, A
john wiley & sons, inc., Publication, 2003.
19. Marimin, Teori dan Aplikasi Sistem Pakar dalam teknologi Manajerial, IPB Press,
Bogor, 2002.
20. Ramachandran R, Application of fuzzy logic in data mining, computer science
department university of Alabama, 1998.
21. Scales R, Embrechts M, Computational Intelligence Technique for Medical
Diagnostics, Walter Lincoln Hawkins, 2002.
22. Sucahyo, Data Mining : Menggali Informasi yang Terpendam, www. Ilmu
Komputer.com , 2003.
23. Yin X, Han J, CPAR : Classification based on Predictive Association Rules,
University of Illinois at Urbana – Champaign, 2003.
24. Zimmermann HJ, Fuzzy Sets, Decission Making and Expert System, Kluwer
Academic Publisher, Boston, 1987.
Download