32 BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain

advertisement
BAB III
METODE PENELITIAN
3.1 Desain Penelitian
Desain penelitian yang dikembangkan dalam pengembangan sistem
keputusan jantung ini adalah sebagai berikut.
Data Pelatihan
Studi
Literatur
Data
Data
testing
Proses Fuzzy Decision Tree
Menentukan
Table atribut
Menentukan
Table MF
Pembentuk nilai MF
Menentukan nilai Mf
Mencari nilai fuzzy
entropy
Mencari dan menentukan
nilai information gain
FDT
Tahapan testing
Data sample
Data testing
Menentukan
Grafik
Array pembentuk
grafik
Tahap Kesimpulan
Rule
inferensi
Simulasi
program
Menentukan
kembali Tabel MF
Keputusan
Gambar 3.1 Desain Penelitian
32
33
Penjelasan gambar:
1. Tahap data penelitian
a. Studi literatur dilakukan dengan mempelajari dan memahami teoriteori yang digunakan, yaitu mencari gejala-gejala atau faktor-faktor
yang menjadi gejala penyakit jantung, teori Fuzzy Decision Tree,
algoritma FID3 dan perhitungan mencari Fuzzy Entrophy dan
Information Gain.
b. Pengumpulan data-data mengenai gejala yang diderita oleh pasien.
Data yang digunakan diperoleh dari http://archive.ics.uci.edu
2. Tahap pemrosesan Fuzzy Decision Tree
a. Menentukan nilai Fuzzy Membership Function.
b.
Setelah didapat nilai fuzzy decision tree maka langkah selanjutnya
yaitu mencari dan menentukan nilai Fuzzy Entrophy yang nantinya
akan dijadikan dalam pencarian nilai information gain
c. Setelah menentukan nilai Fuzzy Entrophy maka dicarilah nilai
Information Gain dari setiap atribut. Nilai information gain inilah yang
akan digunakan untuk merepresentasikan masalah, pencarian nilai
yang terbesar yang akan dijadikan sebagai node. Penjelasan algoritma
terdapat pada sub bab 3.3
d. Setelah mendapatkan nilai information gain, maka pemrosesan dalam
pengembangan sistem untuk keputusan jantung mulai bisa terlihat
karena mulai membentuk suatu grafik keputusan
34
e. Algoritma FID3 dimodifikasi atau disesuaikan dengan kebutuhan
pencarian resiko terhadap penderita penyakit jantung. Penjelasan
algoritma terdapat pada sub bab 2.5
3. Tahap kesimpulan
Pada tahap kesimpulan dapat dilihat dan diambil sebagai keputusan untuk
data testing dari grafik yang telah didapat.
4. Tahap testing
a. Sistem Pendukung Keputusan Penyakit Jantung merupakan nama
perangkat lunak yang dikembangkan.
b. Metode pendekatan perangkat lunak yang digunakan dalam penelitian
ini adalah pendekatan terstruktur dengan model proses sekuensial
linier. Pendekatan terstruktur lebih menekankan pada aliran data.
Model
sekuensial
linier
mengusulkan
sebuah
pendekatan
pengembangan perangkat lunak yang sistematik dan sekuensial mulai
dari system level dan terus maju ke analisis, desain, implementasi,
pengujian, dan pemeliharaan (Pressman, 2001: 28).
Gambar 3.2 Model Perangkat Lunak
Model sekuensial linier memiliki beberapa aktivitas, yaitu sebagai berikut.
a. Analisis
Pada tahap ini dilakukan analisis terhadap kebutuhan sistem (fungsional
dan non fungsional), kebutuhan pengguna, kebutuhan informasi, dan
35
kebutuhan antarmuka eksternal. Untuk memodelkan sistem, pada tahap
analisis ini digunakan Context Diagram, Data Flow Diagram (DFD),
kamus
data
(data
dictionary),
dan
spesifikasi
proses
(process
specification).
b. Desain
Tahap desain berfungsi untuk mengtranslasikan spesifikasi kebutuhan
perangkat lunak dari tahap analisis, menjelaskan bagaimana perangkat
lunak dapat berfungsi, dan menjelaskan bagaimana spesifikasi perangkat
lunak diimplementasikan. Tahap desain meliputi perancangan data,
perancangan
arsitektur,
perancangan
antarmuka,
dan
perancangan
prosedur. Tool yang digunakan adalah structure chart untuk memodelkan
perancangan arsitektur dan dialog chart untuk memodelkan perancangan
antarmuka.
c. Coding
Coding atau implementasi merupakan penerjemahan hasil desain ke dalam
bahasa yang dimengerti oleh komputer. Dalam penelitian ini digunakan
PHP untuk bahasa pemrograman dan my SQL sebagai database dalam
pembuatan sistemnya.
3.2 Representasi Masalah
Untuk merepresentasikan masalah menentukan resiko terhadap penyakit
jantung digunakan pencarian fungsi keanggotaan fuzzy, pencarian Fuzzy Entrophy
dan pencarian Information Gain dan treshold dalam FDT.
36
3.2.1
Sampel data dengan representasi Fuzzy membership function
Secara umum terdapat dua macam atribut: diskrit dan kontinu. Banyak
algoritma
memerlukan data dengan nilai diskrit. Hal ini tidak mudah untuk
mengganti kontinu domain dengan yang diskrit. Ini membutuhkan beberapa
partisi dan clustering. Hal ini juga sangat sulit untuk menentukan batas dari terus
menerus atribut. Sebagai contoh, bagaimana kita mendefinisikan apakah sakit
dada selalu penyakit jantung atau tidak? Dapatkah kita mengatakan bahwa normal
sakit dada hanya dalam waktu 5 menit atau paling lama 15 menit? Bisakah kita
mengatakan itu adalah saat tidak beraktifitas 2 menit, dan 30 menit ketika
beraktifitas? Oleh karena itu, beberapa peneliti mengutip konsep Fuzzy dalam
metode ID3, pengganti data sampel dengan ekspresi dan bentuk metode Fuzzy
ID3. Berikut ini adalah contoh dari representasi Fuzzy untuk data sampel.
(G.Liang, 2005)
Sesuai dengan parameter yang sudah ditentukan dalam pendeteksian resiko
penyakit jantung pada data yang didapat ada 9 parameter diantaranya yaitu chest
pain, tresbps, chol, fbs, restecg, thalach, exang, slope, dan thal. Sedangkan
parameter yang digunakan pada penelitian ini hanya diambil 6 parameter
dikarenakan atribut yang lain telah mencakup dalam 1 parameter yaitu restecg,
berikut penjelasan mengenai atribut tersebut.
1. Chest pain
Chest pain yaitu jenis sakit dada. Jenis sakit dada ini peneliti
menyimpulkan dinilai dalam hitungan menit dan memiliki 4 atribut antara
lain.
37
a. Typ angina, jenis sakit dada yang lama dirasa kisaran 5 – 10 menit
b. Atyp angina, jenis sakit dada yang lama dirasa kisaran 10 – 30 menit
c. Asympt, jenis sakit dada yang lama dirasa kisaran 30 – 60 menit
d. Non angina, jenis sakit dada yang lama dirasa kisaran lebih dari 60
menit
2. Tresbps
Tresbps atau biasa dikenal tekanan darah tinggi (Hipertensi) adalah suatu
peningkatan tekanan darah didalam arteri. Berikut klasifikasi berdasarkan
tekanan darah tinggi (Hipertensi).
Tabel 3.1 Klasifikasi Berdasarkan tresbps
Batas tekanan
Keterangan
<130/85
Normal
130 – 139/85 – 89
Normal tinggi
140 – 159 /90 – 99
Stadium 1 (hipertensi ringan)
160 – 179/100 – 109 Stadium 2 (hipertensi sedang)
180 – 209/110 – 119 Stadium 3 (hipertensi berat)
>210/210
Stadium 4 (hipertensi maligna)
3. Chol
Chol biasa dikenal dengan cholesterol atau kolesterol, klasifikasi pada chol
yaitu desirable apabila kadar kolesterol < 200, borderline 200 – 239, dan
tinggi apabila kadar kolesterolnya >240.
4. Fasting Blood Sugar (FBS)
Fasting Blood Sugar (FBS) atau kadar gula. Klasifikasi pada fbs terhadap
keputusan jantung yaitu apabila kadar gula < 120 mg/dl maka F, dan
38
apabila kadar gula >120 mg/dl maka dinyatakan T terhadap kadar gula
atau fbs tersebut.
5. Restecg
Restecg
yaitu
Resting
Electrocardiographic
Results.
Restecg
ini
kesimpulan dari hasil tes Elektrokardiografi (EKG). Elektrokardiografi
(EKG) adalah pencatatan potensial bioelektrik yang dipancarkan jantung
melalui elektroda-elektroda yang diletakkan pada posisi dipermukaan
tubuh. Dalam pengklasifikasian terhadap restecg, peneliti menyimpulkan
apabila pada data sample terdapat normal maka nilai tersebut <50 % dari
hasil tes EKG, tetapi apabila dalam data terdapat Left Vent Hyper maka
nilai tersebut >50% dari hasil tes EKG.
6. Thalach
Thalach yaitu denyut jantung. Thalach ini diklasifkasikan berdasarkan
denyut jantung dalam hitungan /menit. Maka didapat klasifikasi untuk
thalach yaitu
3.2.2
a. Bradikarbi
: < 80 kali/menit
b. Normal
: 80 – 100 kali/menit
c. Takikarbi
: >100 kali/menit
Implementasi algoritma FID3
Seperti yang telah dijelaskan pada sub-bab 2.6, algoritma yang dipakai
untuk pembangunan ADPJ ini menggunakan algoritma FID3. Implementasi
algoritma FID3 pada ADPJ ini adalah sebagai berikut.
39
1. Membuat root node dari semua data training yang ada dengan member nilai derajat
keanggotaan untuk semua record sama dengan 1.
2. Menghitung fuzzy entrophy dari training set yang ada. Dari hasil perhitungan
diperoleh nilai fuzzy entrophy. Nilai ini akan digunakan untuk menghitung nilai
information gain dari masing-masing atribut.
3. Menghitung information gain dari atribut dalam kelas, sehingga dari hasil tersebut
dipilih atibut dengan nilai information gain terbesar. Atribut yang nilainya terbesar
selanjutnya digunakan untuk mengekspansi tree atau menjadi root-node, tapi pada
sub-node selanjutnya atribut tersebut tidak dapat digunakan untuk mengekspansi
tree.
4. Data training diekspansi berdasarkan atribut nilai information gain terbesar
sehingga diperoleh hasil ekspansi tree.
3.3 Alat dan Bahan Penelitian
3.3.1
Alat Penelitian
1. Penelitian ini dilakukan dengan menggunakan komputer dengan
spesifikasi.
•
Prosesor Intel Pentium Core 2 duo T5250 2,4GHz
•
RAM 1Gb
•
VGA 512 MB 32 Bit
•
Layar dengan resolusi 1280 X 800 pixel, 32 bit color.
•
Mouse
40
2. Sistem operasi Microsoft Windows XP atau Linux atau sistem operasi
Microsoft Windows versi yang lebih tinggi dan mendukung aplikasi
XAMPP 1.7.3.
3. Perangkat lunak untuk perancangan sistem informasi:
•
XAMPP tools versi 1.7.3 (PhpMyAdmin, MySql, Apache).
•
Text editor. (Macromedia Dreamweaver 8, Notepad ++, Geany)
•
Web browser.
4. Perangkat keras penyimpan data berupa flashdisk, cd dan dvd.
3.3.2.
Bahan Penelitian
1) Database pasien dan database gejala
2) Parameter dari penyakit jantung
3) Nilai Membership Function
4) Nilai Fuzzy entrophy dan nilai information gain
Download