BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain penelitian yang dikembangkan dalam pengembangan sistem keputusan jantung ini adalah sebagai berikut. Data Pelatihan Studi Literatur Data Data testing Proses Fuzzy Decision Tree Menentukan Table atribut Menentukan Table MF Pembentuk nilai MF Menentukan nilai Mf Mencari nilai fuzzy entropy Mencari dan menentukan nilai information gain FDT Tahapan testing Data sample Data testing Menentukan Grafik Array pembentuk grafik Tahap Kesimpulan Rule inferensi Simulasi program Menentukan kembali Tabel MF Keputusan Gambar 3.1 Desain Penelitian 32 33 Penjelasan gambar: 1. Tahap data penelitian a. Studi literatur dilakukan dengan mempelajari dan memahami teoriteori yang digunakan, yaitu mencari gejala-gejala atau faktor-faktor yang menjadi gejala penyakit jantung, teori Fuzzy Decision Tree, algoritma FID3 dan perhitungan mencari Fuzzy Entrophy dan Information Gain. b. Pengumpulan data-data mengenai gejala yang diderita oleh pasien. Data yang digunakan diperoleh dari http://archive.ics.uci.edu 2. Tahap pemrosesan Fuzzy Decision Tree a. Menentukan nilai Fuzzy Membership Function. b. Setelah didapat nilai fuzzy decision tree maka langkah selanjutnya yaitu mencari dan menentukan nilai Fuzzy Entrophy yang nantinya akan dijadikan dalam pencarian nilai information gain c. Setelah menentukan nilai Fuzzy Entrophy maka dicarilah nilai Information Gain dari setiap atribut. Nilai information gain inilah yang akan digunakan untuk merepresentasikan masalah, pencarian nilai yang terbesar yang akan dijadikan sebagai node. Penjelasan algoritma terdapat pada sub bab 3.3 d. Setelah mendapatkan nilai information gain, maka pemrosesan dalam pengembangan sistem untuk keputusan jantung mulai bisa terlihat karena mulai membentuk suatu grafik keputusan 34 e. Algoritma FID3 dimodifikasi atau disesuaikan dengan kebutuhan pencarian resiko terhadap penderita penyakit jantung. Penjelasan algoritma terdapat pada sub bab 2.5 3. Tahap kesimpulan Pada tahap kesimpulan dapat dilihat dan diambil sebagai keputusan untuk data testing dari grafik yang telah didapat. 4. Tahap testing a. Sistem Pendukung Keputusan Penyakit Jantung merupakan nama perangkat lunak yang dikembangkan. b. Metode pendekatan perangkat lunak yang digunakan dalam penelitian ini adalah pendekatan terstruktur dengan model proses sekuensial linier. Pendekatan terstruktur lebih menekankan pada aliran data. Model sekuensial linier mengusulkan sebuah pendekatan pengembangan perangkat lunak yang sistematik dan sekuensial mulai dari system level dan terus maju ke analisis, desain, implementasi, pengujian, dan pemeliharaan (Pressman, 2001: 28). Gambar 3.2 Model Perangkat Lunak Model sekuensial linier memiliki beberapa aktivitas, yaitu sebagai berikut. a. Analisis Pada tahap ini dilakukan analisis terhadap kebutuhan sistem (fungsional dan non fungsional), kebutuhan pengguna, kebutuhan informasi, dan 35 kebutuhan antarmuka eksternal. Untuk memodelkan sistem, pada tahap analisis ini digunakan Context Diagram, Data Flow Diagram (DFD), kamus data (data dictionary), dan spesifikasi proses (process specification). b. Desain Tahap desain berfungsi untuk mengtranslasikan spesifikasi kebutuhan perangkat lunak dari tahap analisis, menjelaskan bagaimana perangkat lunak dapat berfungsi, dan menjelaskan bagaimana spesifikasi perangkat lunak diimplementasikan. Tahap desain meliputi perancangan data, perancangan arsitektur, perancangan antarmuka, dan perancangan prosedur. Tool yang digunakan adalah structure chart untuk memodelkan perancangan arsitektur dan dialog chart untuk memodelkan perancangan antarmuka. c. Coding Coding atau implementasi merupakan penerjemahan hasil desain ke dalam bahasa yang dimengerti oleh komputer. Dalam penelitian ini digunakan PHP untuk bahasa pemrograman dan my SQL sebagai database dalam pembuatan sistemnya. 3.2 Representasi Masalah Untuk merepresentasikan masalah menentukan resiko terhadap penyakit jantung digunakan pencarian fungsi keanggotaan fuzzy, pencarian Fuzzy Entrophy dan pencarian Information Gain dan treshold dalam FDT. 36 3.2.1 Sampel data dengan representasi Fuzzy membership function Secara umum terdapat dua macam atribut: diskrit dan kontinu. Banyak algoritma memerlukan data dengan nilai diskrit. Hal ini tidak mudah untuk mengganti kontinu domain dengan yang diskrit. Ini membutuhkan beberapa partisi dan clustering. Hal ini juga sangat sulit untuk menentukan batas dari terus menerus atribut. Sebagai contoh, bagaimana kita mendefinisikan apakah sakit dada selalu penyakit jantung atau tidak? Dapatkah kita mengatakan bahwa normal sakit dada hanya dalam waktu 5 menit atau paling lama 15 menit? Bisakah kita mengatakan itu adalah saat tidak beraktifitas 2 menit, dan 30 menit ketika beraktifitas? Oleh karena itu, beberapa peneliti mengutip konsep Fuzzy dalam metode ID3, pengganti data sampel dengan ekspresi dan bentuk metode Fuzzy ID3. Berikut ini adalah contoh dari representasi Fuzzy untuk data sampel. (G.Liang, 2005) Sesuai dengan parameter yang sudah ditentukan dalam pendeteksian resiko penyakit jantung pada data yang didapat ada 9 parameter diantaranya yaitu chest pain, tresbps, chol, fbs, restecg, thalach, exang, slope, dan thal. Sedangkan parameter yang digunakan pada penelitian ini hanya diambil 6 parameter dikarenakan atribut yang lain telah mencakup dalam 1 parameter yaitu restecg, berikut penjelasan mengenai atribut tersebut. 1. Chest pain Chest pain yaitu jenis sakit dada. Jenis sakit dada ini peneliti menyimpulkan dinilai dalam hitungan menit dan memiliki 4 atribut antara lain. 37 a. Typ angina, jenis sakit dada yang lama dirasa kisaran 5 – 10 menit b. Atyp angina, jenis sakit dada yang lama dirasa kisaran 10 – 30 menit c. Asympt, jenis sakit dada yang lama dirasa kisaran 30 – 60 menit d. Non angina, jenis sakit dada yang lama dirasa kisaran lebih dari 60 menit 2. Tresbps Tresbps atau biasa dikenal tekanan darah tinggi (Hipertensi) adalah suatu peningkatan tekanan darah didalam arteri. Berikut klasifikasi berdasarkan tekanan darah tinggi (Hipertensi). Tabel 3.1 Klasifikasi Berdasarkan tresbps Batas tekanan Keterangan <130/85 Normal 130 – 139/85 – 89 Normal tinggi 140 – 159 /90 – 99 Stadium 1 (hipertensi ringan) 160 – 179/100 – 109 Stadium 2 (hipertensi sedang) 180 – 209/110 – 119 Stadium 3 (hipertensi berat) >210/210 Stadium 4 (hipertensi maligna) 3. Chol Chol biasa dikenal dengan cholesterol atau kolesterol, klasifikasi pada chol yaitu desirable apabila kadar kolesterol < 200, borderline 200 – 239, dan tinggi apabila kadar kolesterolnya >240. 4. Fasting Blood Sugar (FBS) Fasting Blood Sugar (FBS) atau kadar gula. Klasifikasi pada fbs terhadap keputusan jantung yaitu apabila kadar gula < 120 mg/dl maka F, dan 38 apabila kadar gula >120 mg/dl maka dinyatakan T terhadap kadar gula atau fbs tersebut. 5. Restecg Restecg yaitu Resting Electrocardiographic Results. Restecg ini kesimpulan dari hasil tes Elektrokardiografi (EKG). Elektrokardiografi (EKG) adalah pencatatan potensial bioelektrik yang dipancarkan jantung melalui elektroda-elektroda yang diletakkan pada posisi dipermukaan tubuh. Dalam pengklasifikasian terhadap restecg, peneliti menyimpulkan apabila pada data sample terdapat normal maka nilai tersebut <50 % dari hasil tes EKG, tetapi apabila dalam data terdapat Left Vent Hyper maka nilai tersebut >50% dari hasil tes EKG. 6. Thalach Thalach yaitu denyut jantung. Thalach ini diklasifkasikan berdasarkan denyut jantung dalam hitungan /menit. Maka didapat klasifikasi untuk thalach yaitu 3.2.2 a. Bradikarbi : < 80 kali/menit b. Normal : 80 – 100 kali/menit c. Takikarbi : >100 kali/menit Implementasi algoritma FID3 Seperti yang telah dijelaskan pada sub-bab 2.6, algoritma yang dipakai untuk pembangunan ADPJ ini menggunakan algoritma FID3. Implementasi algoritma FID3 pada ADPJ ini adalah sebagai berikut. 39 1. Membuat root node dari semua data training yang ada dengan member nilai derajat keanggotaan untuk semua record sama dengan 1. 2. Menghitung fuzzy entrophy dari training set yang ada. Dari hasil perhitungan diperoleh nilai fuzzy entrophy. Nilai ini akan digunakan untuk menghitung nilai information gain dari masing-masing atribut. 3. Menghitung information gain dari atribut dalam kelas, sehingga dari hasil tersebut dipilih atibut dengan nilai information gain terbesar. Atribut yang nilainya terbesar selanjutnya digunakan untuk mengekspansi tree atau menjadi root-node, tapi pada sub-node selanjutnya atribut tersebut tidak dapat digunakan untuk mengekspansi tree. 4. Data training diekspansi berdasarkan atribut nilai information gain terbesar sehingga diperoleh hasil ekspansi tree. 3.3 Alat dan Bahan Penelitian 3.3.1 Alat Penelitian 1. Penelitian ini dilakukan dengan menggunakan komputer dengan spesifikasi. • Prosesor Intel Pentium Core 2 duo T5250 2,4GHz • RAM 1Gb • VGA 512 MB 32 Bit • Layar dengan resolusi 1280 X 800 pixel, 32 bit color. • Mouse 40 2. Sistem operasi Microsoft Windows XP atau Linux atau sistem operasi Microsoft Windows versi yang lebih tinggi dan mendukung aplikasi XAMPP 1.7.3. 3. Perangkat lunak untuk perancangan sistem informasi: • XAMPP tools versi 1.7.3 (PhpMyAdmin, MySql, Apache). • Text editor. (Macromedia Dreamweaver 8, Notepad ++, Geany) • Web browser. 4. Perangkat keras penyimpan data berupa flashdisk, cd dan dvd. 3.3.2. Bahan Penelitian 1) Database pasien dan database gejala 2) Parameter dari penyakit jantung 3) Nilai Membership Function 4) Nilai Fuzzy entrophy dan nilai information gain