Pruning Pada Fuzzy Decision Tree Dalam Klasifikasi Data Iklim dan

advertisement
1
PENDAHULUAN
Latar Belakang
Kasus kebakaran hutan di Indonesia
merupakan salah satu bencana alam yang sering
terjadi.
Beberapa
faktor
cuaca
yang
mempengaruhinya ialah temperatur, curah
hujan, radiasi matahari, kelembaban, stabilitas
udara, kecepatan angin dan arah angin secara
langsung (Thoha 2001 dalam Dedek 2011).
Indikator kebakaran hutan yang bisa
dijadikan acuan adalah jumlah titik api
(hotspot). Hotspot merupakan titik-titik di
permukaan bumi yang menjadi indikator adanya
kebakaran hutan dan lahan. Salah satu cara
pencegahan kebakaran hutan yang dapat
dilakukan adalah dengan mengetahui hubungan
antara faktor cuaca yang ada di suatu wilayah
dengan jumlah hotspot yang muncul. Metode
klasifikasi dengan menggunakan decision tree
dapat digunakan untuk membuat sebuah
classifier yang berguna untuk melihat pola /
hubungan tersebut.
Data iklim dan hotspot sering kali tidak bisa
didekati melalui pendekatan crisp (tegas). Hal
ini dikarenakan nilai atribut yang sangat
berdekatan mampu memberi pengaruh yang
berbeda di dalam pembentukan hotspot. Untuk
mengatasi hal tersebut, diperlukan pendekatan
dengan kaidah fuzzy. Penerapan kaidah fuzzy di
dalam suatu decision tree
sering dikenal
sebagai fuzzy decision tree.
Hasil dari klasifikasi dapat dilihat dari
tingkat akurasi yang dihasilkan. Namun, sering
kali model decision tree yang dihasilkan
mengalami masalah overfitting. Overfitting di
dalam decision tree menghasilkan suatu keadaan yang lebih kompleks daripada yang
diperlukan. Hal ini juga membuat tingkat
akurasi yang dihasilkan tidak cukup baik untuk
mengklasifikasikan data baru. Oleh karena itu,
diperlukan cara untuk meningkatkan akurasi
dari model tree yang dihasilkan.
Salah satu metode yang bisa digunakan
untuk meningkatkan akurasi dari tree adalah
pruning. Pruning bekerja dengan prinsip
memangkas atau menyederhanakan struktur
tree. Pruning diharapkan mampu meningkatkan
akurasi yang dihasilkan dalam proses klasifikasi
secara signifikan.
Penelitian ini mencoba menemukan
hubungan antara faktor-faktor cuaca dengan
jumlah hotspot yang dibentuknya menggunakan
teknik klasifikasi menggunakan konsep fuzzy
dengan metode decision tree. Untuk
meningkatkan akurasi dalam proses klasifikasi,
diterapkan juga metode pruning. Model tree
dengan nilai akurasi tertinggi diharapkan
mampu memberikan suatu model atau aturan
yang bisa mengklasifikasikan jumlah hotspot
berdasarkan pola pada iklim di daerah tersebut.
Tujuan
Tujuan dari penelitian ini adalah:
1 Menerapkan teknik data mining berupa
klasifikasi dengan metode fuzzy decision
tree.
2 Menerapkan teknik pruning pada tree.
3 Menemukan aturan klasifikasi pada data
titik api (hotspot) sehingga dapat diketahui
kelas jumlah hotspot berdasarkan pada pola
data iklim di daerah tersebut.
Ruang Lingkup
Ruang lingkup penelitian ini dibatasi pada:
1 Penerapan algoritme ID3 dalam Fuzzy
Decision Tree pada data titik api (hotspot) di
daerah
Tjilik
Riwut,
Palangkaraya,
Kalimantan Selatan.
2 Membangun suatu model klasifikasi untuk
mengetahui tingkat potensi kebakaran hutan
di daerah terkait. Hal ini meliputi informasi
dari atribut temperatur, curah hujan,
penyinaran matahari, dan kelembaban
3 Penelitian ini menggunakan teknik data
mining yaitu klasifikasi dengan metode
decision tree. Namun, untuk mengatasi
adanya ketidaktepatan, pendekatan fuzzy
digunakan sebagai bantuan.
4 Penerapan pruning (pemangkasan) tree
untuk menyederhanakan aturan klasifikasi
yang ada.
Manfaat Penelitian
Penelitian
ini
diharapkan
dapat
menunjukkan
potensi
kebakaran
hutan
berdasarkan jumlah hotspot yang ada sehingga
dapat menjadi alat bantu oleh pihak yang
berwenang dalam mengantisipasi dan deteksi
dini kebakaran hutan.
TINJAUAN PUSTAKA
Knowledge Data Discovery (KDD)
Knowledge Data Discovery merupakan
sebuah proses iteratif yang terurut dan data
mining merupakan salah satu langkah dalam
KDD (Han & Kamber 2001). Tahapan proses
KDD menurut Han & Kamber (2001), yaitu:
Download