BAB II TINJAUAN PUSTAKA 2.1 Penyakit Kulit Penyakit kulit adalah penyakit infeksi yang paling umum, terjadi pada orang-orang dari segala usia. Gangguan pada kulit sering terjadi karena ada faktor peyebabnya, antara lain yaitu iklim, lingkungan, tempat tinggal, kebiasaan hidup kurang sehat, alergi dan lain lain. Sebagian besar pengobatan infeksi kulit membutuhkan waktu lama untuk menunjukkan efek. Masalahnya menjadi lebih mencemaskan jika penyakit tidak merespon terhadap pengobatan. Tidak banyak statistik yang membuktikan bahwa frekuensi yang tepat dari penyakit kulit, namun kesan umum sekitar 10-20 persen pasien mencari nasehat medis jika menderita penyakit pada kulit. Matahari adalah salah satu sumber yang paling menonjol dari kanker kulit dan trauma terkait. Penyakit kulit untuk sebagian orang terutama wanita akan menghasilkan kesengsaraan, penderitaan, ketidakmampuan sampai kerugian ekonomi. Selain itu, mereka menganggap cacat besar dalam masyarakat. Namun akibat kemajuan teknologi dan perkembangan ilmu kedokteran bekas luka kulit dapat berhasil dilepas dengan perencanaan plastik, terapi laser, pencangkokan kulit dan lain sebagainya. Gejala-gejala penyakit pada kulit dapat menjadi parah jika tidak diobati, kadang-kadang bahkan menyakitkan. Beberapa penyakit radang kulit dapat menyebabkan jaringan parut dan pengrusakan. Gejala-gejala penyakit kulit pun perlu dirawat untuk mengontrol tingkat keparahan dan perkembangannya. 2.2 Sistem Pakar Secara umum, sistem pakar (expert system) adalah sistem yang berusaha mengadopsi pengetahuan manusia ke komputer, agar komputer dapat menyelesaikan masalah seperti yang biasa dilakukan oleh para ahli. Sistem pakar yang baik dirancang agar dapat menyelelasikan suatu permasalahan tertentu dengan meniru kerja dari para ahli. Dengan sistem pakar ini, orang awampun dapat menyelesaikan masalah yang cukup rumit yang sebenarnya hanya dapat 11 12 diselesaikan dengan bantuan para ahli. Bagi para ahli, sistem pakar ini juga akan membantu aktivitasnya sebagai asisten yang sangat berpengalaman. Ada beberapa definisi tentang sistem pakar, antara lain : a. Menurut Durkin : Sistem pakar adalah suatu program komputer yang dirancang untuk memodelkan kemampuan penyelesaian masalah yang dilakukan seorang pakar. b. Menurut Ignizio : Sistem pakar adalah suatu model dan prosedur yang berkaitan, dalam suatu domain tertentu, yang mana tingkat keahliannya dapat dibandingkan dengan keahlian seorang pakar. c. Menurut Giarratano dan Riley : Sistem pakar adalah suatu sistem komputer yang bisa menyamai atau meniru kemampuan seorang pakar. Gambar 2. 1 Struktur Sistem Pakar 2.3 Case-Based Reasoning Secara singkat Case-Based Reasoning (CBR) didefinisikan sebagai sebuah metodologi untuk penyelesaian masalah dengan memanfaatkan pengalaman sebelumnya [Main dkk, 2001]. Case-Based Reasoning (CBR) merupakan sebuah paradigma utama dalam penalaran otomatis (automated reasoning) dan mesin pembelajaran (machine learning). Di dalam CBR, seseorang yang melakukan penalaran dapat menyelesaikan masalah baru dengan memperhatikan kesamaannya dengan satu atau beberapa penyelesaian dari permasalahan sebelumnya. 13 Secara singkat, tahap-tahap penyelesaian masalah berbasis CBR adalah sebagai berikut : [Mantaras dkk, 2006] a. Pengambilan kembali kasus-kasus yang sesuai dari memori (hal ini membutuhkan pemberian indeks terhadap kasus-kasus dengan menyesuaikan fitur-fiturnya). b. Pemilihan sekelompok kasus-kasus yang terbaik. c. Memilih atau menentukan penyelesaian. d. Evaluasi terhadap penyelesaian (hal ini dimaksudkan untuk meyakinkan agar tidak mengulang penyelesaian yang salah) e. Penyimpanan penyelesaian kasus terbaru dalam penyimpan kasus/memori. f. Sesuai dengan tahap-tahap tersebut, Aamodt dan Plaza [Aamodt dan Plaza, 1994] menjelaskan sebuah CBR sebagai sebuah siklus yang disingkat 4R yaitu, Retrieve, Reuse, Revise dan Retain. 2.4 Jenis Data Data merupakan kumpulan angka atau huruf hasil dari penelitian terhadap sifat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi sehingga muncul istilah variabel. Jadi variabel merupakan karakteristik yang nilai datanya bervariasi dari satu pengukuran ke pengukuran berikutnya. Menurut skala pengukurannya, variabel dibagi 4 yaitu data nominal, ordinal interval, dan rasio. Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua kelompok, yaitu : data katagorik dan data numerik. 2.4.1 Katagorik (Kualitatif) Data katagorik merupakan data hasil pengklasifikasian/ penggolongan suatu data. Contoh: sex, jenis pekerjaan, pendidikan. Variabel kategorik pada umumnya berisi variabel yang berskala nominal dan ordinal. a. Nominal Variabel yang hanya dapat membedakan nilai datanya dan tidak tahu nilai data mana yang lebih tinggi atau rendah. Contoh : jenis kelamin, suku. 14 b. Ordinal Variabel yang dapat membedakan nilai datanya dan juga sudah diketahui tingkatan lebih tinggi atau lebih rendah, tapi belum diketahui besar beda antar nilai datanya. Contoh : pendidikan, pangkat, stadium penyakit. 2.4.2 Numerik (Kuantitatif) Data numerik merupakan variabel hasil dari penghitungan dan pengukuran. Variabel numerik dibagi dua macam : diskrit dan kontinyu. Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak, jumlah pasien tiap ruang. Kontinyu merupakan variabel hasil dari pengukuran, misalnya tekanan darah, kadar Hb. variabel numerik berisi variabel yang berskala interval dan rasio. Dalam analisis statistik seringkali data numerik dirubah ke dalam data kategorik dengan cara dilakukan pengelompokan/pengklasifikasian. a. Interval Variabel yang dapat dibedakan, diketahui tingkatannya dan diketahui juga besar beda antar nilainya. Namun pada variabel interval belum diketahui kelipatan suatu nilai terhadap nilai yang lain dan pada skala interval tidak mempunyai titik nol mutlak. Contoh : suhu. b. Rasio Variabel yang bisa dibedakan, ada tingkatan, ada besar beda, dan ada kelipatannya serta ada nol mutlak. Contoh : berat badan. Penelitian Analisis penskalaan multidimensional merupakan analisis eksplorasi data multivariat bersifat kualitatif yang menggunakan data non-metrik. Dengan begitu suatu format fungsional sangat berkaitan erat dengan menghitung jarak. Prosedur penskalaan multidimensional non-metrik secara langsung menghubungkan dekatnya dan jarak itu diukur dalam bentuk linear. Data kualitatif yang digunakan adalah data ordinal. (Yuliana, 2015). 2.5 K-Nearest Neighbor Algoritma K-Nearest Neighbor merupakan pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. Algoritma ini sering digunakan untuk klasifikasi. Ada beberapa pendekatan yang dapat 15 digunakan untuk mencari kesamaan fitur dalam proses klasifikasi menggunakan algoritma K-Nearest Nighbor yaitu Distance-Based Similarity Measure yang merupakan sebuah teknik untuk mengukur tingkat kesamaan dua buah objek dari segi jarak geometris dari variable-variabel yang tercakup di dalam kedua objek tersebut. Pendekatan menggunakan jarak yang dapat digunakan adalah Euclidean Distance dan Manhattan Distance, serta sebuah Adaptive Distance Measure yang merupakan sebuah teknik pengukuran jarak baru yang di adaptasi dari Euclidean Distance dengan menggunakan radius. Berikut adalah rumus dari masing-masing Distance-Based Similarity Measure: a. Euclidean Distance ( , )= ∑ − ........................................ (1) b. Manhattan Distance ( , )=∑ − ..............................................(2) c. Adaptive Distance Measure ( , = min Keterangan : : Kasus Baru : Kasus Lama : Indeks Kasus : Indeks Atribut Gejala : Dengan Jumlah Atribut = 34 : Indeks Radius : Indeks Kasus Lama : Epsilon = 0,001 )= ( , ) .........................................(3) ( , ) − .......................................(4)