BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan

advertisement
BAB 2
TINJAUAN PUSTAKA
DAN
LANDASAN TEORI
2.1
Tinjauan Pustaka
Data mining atau
au penambangan
penamba
bang
ngan data adalah proses
prediksi informasi yang
ya
ang
n tersembunyi dari
ekstraksi dari prediksi
sebuah
kum
mpulan
kumpulan
data
ta.
data.
pengetahuan
berupa pengetahuan
penamb
mbangan
penambangan
Hasil
bar
aru
u
baru
da
ata
a
data
penambanga
gan
penambangan
yang didapatkan
did
i apatkan
yang
tersebut.
Dal
ala
am
Dalam
data
d ri
da
dari
dapat
proses
pener
erapannya,
penerapannya,
pen
nambanga
gan
n data ini
ini memiliki
memilik
ki dua
d a hasil
du
hasi
il utama
a yaitu
penambangan
sebuah
h
sebuah
pre
r diks
ksi
prediksi
dan
sebuah
deskrip
psi
si(inf
nfor
orm
masi
deskripsi(informasi
atau
peng
nget
etah
ahua
an baru). Prediksi ini adalah sebuah
sebua
uah
h proses
pros
ses
pengetahuan
pe
eng
ngo
olah
han
pengolahan
data
yang
ada
pada
dataset
ya
ang
yang
aka
an
akan
meng
me
n ha
asilkan sebuah prediksi nilai di masa yang
yan
ng akan
n
menghasilkan
datang
da
ng.
datang.
Sedangkan
deskripsi
lebih
s
fokus
kepa
ke
p da
kepada
penca
arian pola - pola dan informasi yang menggambarkan
mengg
gambarkan
an
pencarian
penggu
una data
da a
keadaan data agar dapat disajikan kepada pengguna
se
elanj
n utnya (Geetha, et al., 2008).
selanjutnya
Salah satu proses
prose
es yang
y ng dapat
ya
dapat dilakukan pada data
data
mi
mining
adalah
Netw
Ne
wor
ork
k
Network
mela
me
laku
kuka
kan
n
melakukan
klasifikasi
si.
klasifikasi.
(ANN)
merupakan
klas
kl
asif
ifik
ikas
asi.
i.
klasifikasi.
Metode
salah
Dal
ala
am
Dalam
Artificial
satu
Neu
euro
ron
Neuron
meto
tode
de
metode
pen
enel
elit
itia
ian
n
penelitian
unt
ntuk
untuk
tent
te
ntang
tentang
Ja
ari
ring
ngan
an Syaraf
Sya
yara
af Tiruan
an Dengan Algoritma
Algori
itm
tma Backpropagation
Back
Ba
ckpr
prop
opag
agation
Jaringan
Kelulu
usan Sidang
Si
untuk Penentuan Kelulusan
Skripsi
(Matondang,
a algoritma pada metode ANN yang
2013) diketahui bahwa
adala
ah algoritma
algor
ritma Backpropagation. Pada
sering digunakan adalah
metode dengan
algoritm
ma
algoritma
in
ni
ini
menggunakan
metode ini,
ha
kunci keberhasilan dari hasil
dari ANN terdapat pada
pelatihan
masih
data
data.
Pada
penelitian
dilakukan
pada
iterasi
ini
pelatihan
pertama
saja
data
sehingga
belum dapat mencapai nilai eror sesuai dengan target
peneliti.
Pada
penelitian
7
tentang
Analisis
Metode
Jaringan Syaraf Tiruan Backpropagation untuk Pengenalan
Sel Kanker Otak
(Handayani, 2013), dalam menggunakan
metode ANN, selain pelatihan data, hal penting yang
perlu diperhatikan adalah arsitektur ANN yang dibuat
dan juga bobot yang
g akan
ak
dig
igun
unak
a an untuk membandingkan
digunakan
hasil
yang
maksimal
kel
eluar.
keluar.
Hasil
kar
arena bobot
bobo
ot
karena
dan
dari
penelitian
arsitektur
kurang
yang digunakan
kurang sesuai.
sesuai. Permasalahan
Permasa
ala
laha
han
n mengenail
meng
me
ngen
enail bobot
t pada metode
ANN
dapat
dapat
diat
atas
asi
i
diatasi
pada
penel
elit
itia
ian
n
penelitian
tentang
P ramalan
Pe
Peramalan
Penj
njualan Mobil
Mo
Meng
nggu
gunakan Jaringan
Jari
Ja
ringan Syaraf
Sya
ara
raf Tiruan
Tiru
uan
a dan
Penjualan
Menggunakan
C
ertain
inty
ty
Certainty
Fac
act
tor
Factor
(Pakaja,
et
al.
l ,
al.,
2012
20
1 ).
2012).
Pada
pene
eli
liti
tian ini digunakan metode Certainty
Certain
nty
t Factor
Fac
acto
tor yang
ya
penelitian
diko
kom
mbin
nasikan pada ANN. Fungsi Certainty Factor
Fac
a to
tor
r adalah
adala
ah
dikombinasikan
me
memb
mberi
ikan nilai pembanding yang terbaik yang
g digunakan
digu
gun
nakan
n
memberikan
un
untuk
melakukan
koreksi
dikel
luarkan ANN.
dikeluarkan
Dengan
bobot
metode
dari
ini,
has
sil
hasil
yang
yang
akuras
si
tingkat akurasi
hasil data akan bertambah. Salah satu kegunaan
keguna
aan lain
lain
n
da
dari
penggunaan
peramalan
tentang
dat
da
ta
data
metode
yang
yang
Penerapan
ANN
akan
Algo
ori
ritm
tma
Algoritma
yaitu
datang.
g
datang.
n
digunakan
Pad
ada
Pada
Jaringan
untuk
uk
untuk
peneliti
ian
penelitian
Saraf
Tir
rua
uan
n
Tiruan
Ba
Back
c propagation dalam Memprediksi Tingkat Suku
u Bunga
Bun
ung
ga
Backpropagation
Bank
Bank
(Anwar
(A
a ,
(Anwar,
pe
pela
latihan
pelatihan
data
data
2011
20
11),
)
2011),
unt
ntuk
untuk
dik
iket
etah
ahui
ui
diketahui
mem
empr
predik
ksi
memprediksi
bahwa
h
bahwa
ses
esua
u tu
sesuatu
par
aram
amet
eter
parameter
al
hal
dapat
dapat
berp
pen
enga
g ruh
h pada hasil
l prediksi.
predi
diksi. Pada
Pad
da penelitian
p neliti
pe
itian ini
berpengaruh
keakuratan prediksi mencapai
me
encapai 94% yang menandakan bahwa
akurasi sudah sangat baik.
baik.
Dari
terhadap
penelitian
data
EEG
g
yang
deng
de
ngan
dengan
yang
pernah
melakukan
dilakukan
klasifikasi
berdasarkan penyakit – penyakit yang dapat dideteksi
melalui data EEG diketahui bahwa penyakit – penyakit
yang dapat diklasifikasikan adalah penyakit epilepsi,
Mood
Disorder,
Dementia,
Schizophrenia
8
dan Attention
Deficit
Hyperactivity
tersebut
klasifikasi
memanfaatkan
akurasi
orang
tes
yang
Disorder.
data
algoritma
EEG
J48
Dari
penelitian
menggunakan
yang
Weka
memberikan
untuk
mengidentifikasi
tidak
memilik
ki
memiliki
negatif
p nyakit
pe
penyakit
dan
hasil
orang
–
(spesifisitas)
berada diantara
a 94% hingga 100% sedangkan
se
eda
d ngkan akurasi tes
untuk mengidentifikasi
mengid
identifikasi
s positif orang – orang memiliki
penyakit
t (sensitifitas)
(sensitifitas
as) berada
b ra
be
rada
da diantara
dia
iantara 70%
% hingga 100%
(Pande
dey
(Pandey
&
Ku
und
ndra
ra,
Kundra,
20
2014
1 ).
2014).
Ang
ngka
ka
Angka
pas
a ti
pasti
akura
rasi
akurasi
dari
spe
esifisit
tas dan sensitifitas
sen
ensi
siti
tifitas deteksi
dete
de
t ksi penyakit
peny
nyak
a it epilepsy
epi
pilepsy
spesifisitas
m
elalu
ui data
da
EEG ini dapat diketahui
ui pada
pad
da penelitian
peneli
itian
melalui
EEG
Epil
lep
epti
tic EEG
EE Detection Using Neural Networks
Net
tworks
s and
and PostPost
s Epileptic
Clas
ass
sific
cation dimana hasil akurasi spesifisitas
spesifi
isi
s ta
as berada
b rad
be
da
Classification
pada angka
pada
an
ngka 99.99% dan untuk akurasi sensitifitas
sensitifi
itas berada
berada
a
pa
pada
angka
91.29%
(Patnaik
&
Manyam,
)
2008)
.
Pada
Pada
penel
litian tersebut digunakan metode Wavelet Transfor
Transfo
or
penelitian
untuk melakukan ekstraksi fitur dan proses klasifikasi
klasifika
kasi
i
me
menggu
g nakan ANN dengan algoritma backpropagatio
on.
. Pada
da
menggunakan
backpropagation.
penel
litian tentang
tentang
g Th
The
e Use Of Wavelet
Wavel
let Power Spectrum
Spectru
rum
m
penelitian
For Detection And Identification
Iden
ntifi
fication Of Thinking-Induced
Thinking-Ind
duc
uced
ed
Eeg Signals, data EEG yang diambil dari hasil perekaman
Eeg
per
rek
ekam
ama
an
alat dengan
alat
denga
g n 20 kanal
kan
anal
al sinyal
sinyal dapat
dapa
da
pat
t diklasifikasikan
dikl
di
klasif
ifik
kas
asik
ikan
an ke
da
dala
lam dua kelas
kela
ke
las
s yaitu
yait
ya
itu kondisi
kond
ko
ndis
isi rileks
rile
ri
leks dan
dan
a tidak rileks.
ril
ileks.
dalam
Pros
ses analisis
ana
ali
lisis dan klasifikasi
klasifik
kl
ikasi menggunakan
menggu
gunakan spektral
spektral
Proses
daya yang sebelumnya menggunakan
menggun
nakan transformasi wavelet
sebagai pra pengolahan
n data EEG
EE
EG dimana dalam proses ini
dapat memberikan keberhasilan
keber
rhasila
an klasifikasi sebesar 85%
untuk kondisis rileks dan
da
an 83%
83
3% untuk kondisi non rileks.
Pada penelitian ini dilakukan
dila
akukan juga klasifikasi tanpa
melewati
proses
klasifikasi
tanpa
pra
pengolahan
proses
pra
data,
dimana
pengolahan
data
hasil
dapat
menurunkan keberhasilan klasifikasi menjadi 58% untuk
kondisi rileks dan 60% untuk kondisi tidak rileks. Dari
9
penelitian
ini
pengolahan
data
memberikan
dapat
disimpulkan
sebelum
peningkatan
proses
bahwa
proses
klasifikasi
keberhasilan
pra
dapat
klasifikasi.
Hal
ini dikarenakan pada metode transformasi wavelet dapat
mengatasi sinyal yang
yan
ng non stasioner
stas
st
asioner (Djamal, et al.,
2005). Pada penelitian
pene
nelitian sebelumnya ini
i i tidak dilakukan
in
eksperimen lebih
lebih jauh
h mengenai keterkaitan
keterkait
itan unsur waktu
pada
data
data
EEG
yang
yang
dim
imil
ilik
iki
dimiliki
m
dalam
melakukan
klasif
ifikasi.
klasifikasi.
Pr
ros
oses
es penambangan
pen
nam
amb
bangan data sangat
sang
gat
a
ber
erpe
pen
ngaruh
h pada
Proses
berpengaruh
jeni
is datanya.
dat
da
tany
ya. Pada data EEG, data yang
g dihasilkan
diha
hasi
silk
lkan oleh
oleh
jenis
EEG bersifat
bersif
be
ifat data temporal sehingga proses
es penambangan
pen
enam
ambang
gan
a
da
ata dilakukan
dil
ilakukan menggunakan teknik temporal data
data
a mining.
mini
mi
ning
g.
data
Pa
d
Pada
teknik
berda
be
asarkan
berdasarkan
ini,
pemrosesan
kurun
waktu
data
akan
tertentu.
dila
laku
kukan
n
dilakukan
Pada
pro
rose
es
proses
klasi
ifikasi epilepsi berdasarkan data EEG, sebuah
seb
bua
u h data
da
ata
a
klasifikasi
t rtentu
te
tertentu
belum
memi
mili
l ki
memiliki
a penyakit
peny
pe
nyakit epilepsi
epile
eps
psi
i atau
gejala
beberapa
data
data
me
menentukan
dapat
menunjukan
dala
lam
m
dalam
apakah
wakt
ktu
u
waktu
data
apakah
tertentu
tersebut
tere
rebut
t
data terebut
belum
m.
belum.
Butu
tuh
h
Butuh
untuk
dap
apat
at
dapat
adalah
data
yan
ya
ng
yang
memi
me
ili
liki gejala epilepsi atau tidak. Maka dari
dari itu,
itu,
memiliki
eksp
ek
s er
erim
imen
en
eksperimen
unt
ntuk
uk
untuk
kl
las
asif
ifik
ikas
asi
i
klasifikasi
menemuk
kan
menemukan
men
enen
entu
tuka
kan
n
menentukan
pe
it
penyakit
batas waktu
wakt
wa
ktu
u
waktu
epile
epsi
epilepsi
terb
bai
a k.
terbaik.
dala
da
lam
m
dalam
mela
laku
kukan
melakukan
d bu
di
butu
tuhk
hkan
an
dibutuhkan
Pada
untuk
peneli
litian yang
penelitian
pernah dilakukan menggunakan
mengg
gunakan Time Domain dan Frequency
Domain
Features
a
pada
data
EEG.
Sebelum
dilakukan
pemrosesan data, terlebih
terleb
bih dahulu
da
ahulu data EEG dimasukan ke
dalam pra proses. Pada bagian
bagian ini, data
durasi
23 6
23.6
detik
dilaku
k kan
dilakukan
pemotongan
EEG dengan
dimana
tiap
segmen pemotongan memiliki durasi 1 detik. Pemotongan
ini
digunakan
untuk
melakukan
pengenalan
dan
pembelajaran pada ANN untuk mengenali pola dari data-
10
data yang dipotong (Srinivasan, et al., 2005). Hasil
dari klasifikasi menggunakan memberikan akurasi sebesar
99,6%.
Pada penelitian ini, data yang digunakan adalah
data EEG dari dari penderita
pen
end
derita
a epilepsi
epi
p lepsi yang disediakan
oleh
as
Universitas
yang
h
telah
Bonn.
Terdapat
menggunak
a an
menggunakan
data
be
beberapa
ini
penelitian
un
untuk
melakukan
peneliti
ian terhadap data
data EEG.
EEG
EG. Salah
Sala
Sa
l h satu penelitian
pen
e elitian di
penelitian
Indone
nesia dengan
deng
gan menggunakan
menggunakan data
dat
ata
a ini
ini adalah penelitian
pen
e elitian
Indonesia
yan
ng
yang
ber
rju
judul
berjudul
Kl
las
asif
ifi
ikasi
i
Klasifikasi
eg
Eeg
Mengg
gunakan
Menggunakan
da
Least
Leas
Le
ast Squares
Squa
uares
FǦScore, dan
K
oefis
sie
ien
n Autoregresif,
Auto
toregresif,
Koefisien
Supp
ppor
ort
t Vector
Ve
ector Machine
Support
Siny
Si
yal
Sinyal
al.
l., 2011).
2011
20
11).
) Pada
Pad
a a
(Karyawan et al.,
pe
ene
nel
liti
ian ini
penelitian
men
ngg
ggu
unaka
an
data EEG diklasifikasikan menggunakan
LS
LS-S
-SVM
M
LS-SVM
kombinasi
dengan
autoregresif
seba
agai
sebagai
fitur
r
fitur
ek
ekstra
raksi dan F-score sebagai fitur seleksinya.
seleksin
nya.
. Pada
P da
Pa
ekstraksi
penel
litian ini menitik beratkan pada klasifikasi
klasifika
asi orang
ng
penelitian
sehat dengan mata terbuka dan orang dengan penderita
penderi
rita
a
ep
pile
epsi
epilepsi
pada
didapatkan
n
kondisi
a ku
kura
rasi
si
akurasi
pe
p
nelitian
penelitian
ini,
5
di
dise
sedi
diak
akan.
disediakan.
Pada
Pada
Dari
kla
lasifika
kasi
klasifikasi
hanya
ke
kese
seluruhan
keseluruhan
me
mela
laku
k kan
melakukan
kejang.
penelit
tian
n
penelitian
seb
ebes
esar
ar
sebesar
99,64%.
digunakan
digunakan
2
yang
ada
pada
a
data
pen
enelitia
ian
n
penelitian
ini
ini
da
data
EEG
EEG
dataset
eksp
ek
sper
rim
imen
en pada
pad
ada
a
eksperimen
unsu
sur
r
unsur
in
ni
ini
Pad
ada
a
Pada
dataset
wakt
ktu
u yang
waktu
dari
dari
yan
ang
yang
tid
idak
tidak
ter
erd
dapat
terdapat
pada
a data
data EEG.
EEG
EE
G.
Penelitian
dilakukan
denga
an
dengan
data
dengan
yang
sama
mengg
gunakan
menggunakan
juga
ANN
pernah
sebagai
pengklasifikasi. Pada penelitian
p nel
pe
litian ini, kelima dataset
digunakan
d
t
t
dataset
untuk
klasif
fik
kasi.
klasifikasi.
kili
mewakili
Dimana
i
i
masing-masing
masing-masing
k l
kelas
yang
d
ada.
Klasifikasi dilakukan pada kombinasi dataset S dan Z,
kemudian
adalah
dataset
dataset
S,
S,
F,
F,
dan
Z,
N,
11
Z,
serta
dan
O.
yang
terakhir
Penelitian
ini
menggunakan
proses
metode
klasifikasi
Time-Frequency
yang
Analysis
menggunakan
ANN
dimana
memberikan
akurasi terbaik dengan memberikan akurasi sebesar 100%
untuk kombinasi pertama, 100% untuk kombinasi kedua,
dan 89% untuk kombinasi
kombinas
asi
i ke 3
2.2
(T
(Tzallas
et al., 2009).
Te
eori
Dasar Teori
2.2.1. Data Mining
g
Data
analis
sis
analisis
min
inin
ing
g
mining
adalah
sebu
se
buah
ah
sebuah
m lakukan
me
melakukan
dari sudut pandang
pand
pa
ndang yang
ya
ang berbeda
berbe
eda
d dan
data dari
mena
nari
rik
k
menarik
ke
kesimpulan
be
berb
rbagai
i
berbagai
informasi
di
dip
paka
kai
dipakai
untuk
dari
baru
hasil
yang
membentuk
a alis
an
isis
is
analisis
yan
ang
g
yang
dap
pat
dapat
pengetahuan
ru
baru
gun
na
guna
Lu
ubi
b s,
, 2012)
2012)
(Mabrur & Lubis,
sed
dangkan pengertian lain dari
sedangkan
menemukan
pola
men
nja
j di
menjadi
ng
penting
me
m
mp
peroleh sebuah keuntungan
memperoleh
pr
roses
proses
proses
yang
data mining
minin
ng ad
adal
a ah
adalah
memiliki
ar
rti
arti
dan
dan
pe
engetahuan yang ada dari data yang berjumlah
berjumla
ah besar
be
esar
r
pengetahuan
(H
Han,
(Han,
Kamber,
&
Pei,
2012).
Analisis
da
ata
a
data
ng
yang
dilakuka
kan
n pada
p da data
pa
ta mining
minin
ng merup
pak
kan analisis
anali
isis pada
pa
ada
dilakukan
merupakan
data dengan jumlah yang
yan
ang
g sangat besar dan memiliki
memil
ilik
iki
i
be
b
rbagai
berbagai
jenis
dan
bentuk.
Data
g
mining
dig
igun
unak
aka
an
digunakan
un
untu
tuk
k mencari
menc
me
ncar
ari
i dan
dan menemukan
mene
me
n muka
kan
n hubungan
hubu
hu
bung
ngan
an antar
ant
ntar
ar data
dat
ata
a dan
dan
untuk
jug
juga
men
engi
gid
dent
ntif
ifik
i asi
i
mengidentifikasi
mu
unc
ncul
muncul
dari
dari
ditemukan
menjadi
dan
dan
hubung
gan
a
hubungan
ini
an
akan
informasi
memp
me
mpel
elaj
ajar
a i
mempelajari
ant
ntar
antar
data
diam
mbil
diambil
dan
yang
baru
po
ola
pola
yang
terseb
te
but
ut.
tersebut.
Pola
diproses
dan
berharga
untuk
dari
kumpulan data tersebut.
tersebut
u .
Dari pengertian di
i atas mengenai
yang
telah
dijabarkan
oleh
para
data mining
ahli
ahli,
dapat
diketahui bahwa data mining adalah suatu pemrosesan
data yang melibatkan proses pencarian dan analisis
pada
suatu
kumpulan
data
12
yang
besar
yang
akan
menghasilkan
suatu
pola
atau
karakter
data
yang
dapat berarti dan dapat digunakan untuk membentuk
sebuah
informasi
atau
pengetahuan
yang
berguna.
Data mining ini merupakan salah satu tahapan dari
proses
yang
Database
ada
(KD
KDD
D)
(KDD)
pada
yang
Kn
Knowledege
digunaka
an
digunakan
Discovery
untuk
in
mengambil
intisari dari
dari model
mode
el atau pola tertentu
terten
entu yang muncul
dari analisis
analisis data.
.
Seca
c ra
Secara
menjad
adi
i
menjadi
2
umum,
umum,
data
kat
ka
tegori
kategori
mining
utama,
d pat
da
t
dapat
yait
ya
i u
yaitu
dike
elo
l mpokan
dikelompokan
pred
pr
edic
i tive
ve
predictive
dan
desc
de
scri
riptiv
ve (Han, Kamber, & Pei, 2012)
2012
12)
) :
descriptive
a.
. Predictive
mining
adalah
proses
pencarian
pola
la-pola
a
pola-pola
dari kumpulan data menggunakan variabel
l tertentu
te
ert
rten
e tu
yang
mungkin
datang.
akan terjadi
Proses
ini
di waktu
dilakukan
ya
ang
yang
denga
an
dengan
an
akan
ca a
cara
melakukan analisis kepada kumpulan data
a secara
se ra
urut dan
dan membentuk
membent
ntuk satu
sat
atu atau beberapa
beb
eberapa kumpulan
kumpul
lan
model
yang
t
dapat
karakteristik
da
ri
i
dari
dari
pen
e er
erap
apan
an
penerapan
proses
es
digunakan
digunakan
kumpulan
predict
ctiv
ive
e
predictive
kla
lasi
sifika
kasi
si,
,
klasifikasi,
untuk
data
data
data
anal
an
alis
sis
analisis
mempred
dik
iksi
si
memprediksi
baru.
Con
onto
toh
Contoh
mi
inin
ng
mining
adal
ad
alah
adalah
si
regresi
dan
analis
isi
is trend.
analisis
b. Descriptive
Descriptive
g
mining
adalah
proses
pencarian
karakter atau ciri-ciri
ciri
ri-ci
iri serta informasi tertentu
yang
penting
m
dalam
descriptive
suatu kumpulan data.
mining
adalah
Tugas
melakukan
penyelidikan atas informasi yang bisa didapatkan
dari
kumpulan
didapatkan,
data
atau
tertentu.
cirri
13
yang
Informasi
yang
didaptkan
dari
proses ini perlu dilakukan proses validasi dan
pemberian penjelasan terhadap temuan baru yang
ada
pada
data.
Proses
ini
disebut
post-
processing.
Data mining
g memiliki 3 tujuan
tuj
ujuan utama dari proses
dilak
kuk
ukan yaitu explanatory, confirmatory,
c nfirmatory, dan
co
yang dilakukan
explorat
atory (Hoffer,
(Hoffer
er, Ramesh & Topi, 2012).
2012). Tujuan
exploratory
a
data
minin
ng
mining
ad
dalah
adalah
d lam
da
m
dalam
uk
untuk
kait
ka
itan
anny
nya
a
kaitannya
memberikan
dengan
e xplanatory
explanatory
penjel
elasan
n
penjelasan
a
pada
suatu
kondis
isi
i tertentu
terten
ent
tu atau pada suatu
sua
atu proses
pro
ose
ses
s observasi.
obser
rvasi.
kondisi
Seda
Se
dang
ngkan
Sedangkan
tujuan
mela
me
lakuka
kan
melakukan
d buat
di
at.
dibuat.
confirmatory
konfirmasi
Terakir
atau
adalah
dig
i un
nak
akan
an
digunakan
menjawab
unt
n uk
untuk
hip
ipotes
esis
is
hipotesis
exploratory
ng
yang
yan
ang
yang
ber
ertu
tugas
s
bertugas
untu
uk menganalisis kumpulan data yang akan diproses.
dip
pro
rose
s s.
untuk
Seb
bagai
Sebagai
salah
satu
proses
analisis,
a
data
min
inin
ng
mining
me
emiliki kelebihan dalam melakukan proses analisis.
analisi
is.
memiliki
Ya
ang pertama jelas bahwa data mining dapat menangani
menang
ngani
i
Yang
pe
pemrosesan
seperti
ter
erha
hada
d p
terhadap
ki
memiliki
data
yan
ang
g
yang
ber
erbaga
gai
i
berbagai
b sar
be
besar
macam
dan
tipe
komple
ko
eks
kompleks
data
dan
dan
pad
pa
da
atribut yang dimiliki. Kelebihan yang penting pada
data mining
data
p ng
pe
ngal
alam
aman
an
pengalaman
mem
empe
pela
laja
jari
adalah kemampuannya untuk mempelajari
ata
tau
u
atau
pros
pr
oses
es
proses
pem
mbe
bela
laja
jara
ran
n
pembelajaran
terd
te
rdah
ahu
ulu.
terdahulu.
Deng
De
ngan
an kemampuan
kemam
amp
puan ini,
ini, hasil
hasi
il dan
n kualitas
ku
ual
alit
itas
as analisis
ana
nalisis
Dengan
dilakuka
kan pada
pa
ada
d
selanj
jutnya akan
proses yang dilakukan
waktu selanjutnya
meningkat.
minin
ng terdapat
terda
dapat beberapa tahapan yang
Pada data mining
dilakukan
pertama
untuk
yang
mem
mprose
es
memproses
dilalui
adalah
adalah
kumpulan
data
data.
Proses
selection.
Pada
pemilihan data ini adalah proses memilih kumpulan
data yang akan dianalisis. Lalu yang kedua adalah
preprocessing
yaitu
proses
pembuangan
data
yang
ganda, data yang inkonsisten , serta penggabungan
14
data
dengan
guna
data
lain
keperluan
untuk
analisis.
memperkaya
Proses
informasi
ketiga
adalah
transformasi yaitu proses pengkodean sesuai dengan
kriteria
analisis
pada
data
yang
telah
dipilih.
Kemudian proses pencarian
penc
pe
ncarian pola
po
atau informasi yang
baru
dengan
terakhir
metode
adalah
pengka
kaj
jian
pengkajian
atau
ik
teknik
proses
hasil
tertentu.
evaluasi
pen
enem
mua
uan
n
penemuan
yaitu
in
informasi
Proses
proses
b ru
ba
baru
dengan
fakt
kta atau hipotesis
hip
ipotesi
is yang sebelumnya
sebe
se
belu
lum
mnya telah
ah dibuat
fakta
l
alu dipresentasikan
dip
ipre
r sentas
sik
ikan
an dalam bentuk
ben
entuk yang
g sesuai
sesuai dengan
lalu
kein
ingi
gina
nan.
keinginan.
2.2.2.
2. Artificial Neuron Network (ANN)
Artificial Neuron Network (ANN) atau
u Jaringan
Jari
Ja
ring
n an
n
Sar
raf
Saraf
Tiruan
pe
engetahuan
pengetahuan
adalah
yang
sebuah
mengadopsi
konsep
sistem
reka
kaya
y sa
a
rekayasa
a
kerja
sar
raf
saraf
ma
anusia. Metode ini dapat digunakan untuk pengenalan
pengena
alan
n
manusia.
po
pola,
klasifikasi
ANN memiliki
memi
mili
liki
ki 3
pemrosesan
dan
dan
peramalan.
Dalam
bag
agia
ian yaitu
yait
ya
itu
u bagian
bagi
ba
gian
an
bagian
bagia
an
bagian
output
de
esai
ainnya
ya,
desainnya,
input, bagian
bagi
gian
an
input,
(Prasetyo,
20
012
12).
2012).
Inpu
In
p tan pada ANN ini dapat berupa vector sehingga
seh
ehin
ingg
gga
Inputan
perh
pe
rhit
itun
unga
gan
n dalam
dala
da
lam
m ANN
ANN dapat
da
apa
pat
t dilakukan
dil
di
laku
kuka
kan
n untuk
untu
un
tuk
k masalah
masa
ma
sal
lah
perhitungan
ya
ng kompleks
kom
ompl
plek
eks dengan
deng
de
ngan
a mudah.
mud
uda
ah.
yang
Dalam prosesnya,
a, metode
metod
ode ANN ini digunakan untuk
melakukan peramalan
n dan pengenalan
pe
engenalan pola dalam data
mining.
Untuk
melak
kukanny
ya,
melakukannya,
ANN
memerlukan
proses
pelatihan agar dapat
t melakukan
mel
lakukan prediksi kelas dari
suatu data uji coba. Dalam
Dal
alam proses penambangan data,
k
f
i aktivasi
k i
i yang digunakan
di
k
k
ANN menggunakan
fungsi
untuk
membatasi
keluaran
dari
bagian
pemrosesan
atau
neuron agar sesuai dengan batasan yang diinginkan.
Terdapat
berbagai
algoritma
15
yang
dapat
digunakan
untuk menggunakan metode ini. Salah satunya adalah
algoritma Backpropagation.
Algoritma
Backpropagation
adalah
salah
satu
g
y g digunakan
g
p
algoritma
yang
untuk melakukan pelatihan
AN
NN. Algoritma ini
ini
n
pada metode ANN.
bersifat nonlinear
t mengatasi berbagai masalah
masa
salah yang rumit.
yang dapat
Algoritm
tma ini
Algoritma
dan
mem
mil
i iki dasar matematis
matemati
is yang tinggi
memiliki
dilati
ih
dilatih
di
dimana
menggu
guna
naka
kan
n
menggunakan
has
sil
hasil
sebelu
lumn
mnya
y .
sebelumnya.
atau
Pa
Pada
meod
me
ode
e
meode
belajar
tebimbing
suda
d h
sudah
di
diketahui
a
tujuannya
algoritma
ini
n ,
ini,
jari
ja
ringan
jaringan
akan
dibe
di
beri
rikan
n sepasang pola yang merupakan
merupak
akan masukan
mas
asuk
u an dan
diberikan
pola yang
yang diinginkan. Ketika pola dimasukan
dimasu
sukan ke dalam
dal
lam
a
pola
j rin
ja
ngan
jaringan
maka
bobot-bobot
akan
diu
ubah
h
diubah
un k
untuk
memp
mperkecil perbedaan pola keluaran dengan pola
pol
la yang
y ng
ya
g
memperkecil
dii
inginkan. Pelatihan ini dilakukan berulang-ulang
berula
ang-u
-ula
l ng
diinginkan.
se
ehingga memenuhi pola yang diinginkan,
sehingga
ber
rsifa
at
Algoritma ini mendukung jenis ANN yang bersifat
la
aye
yer
r atau biasa
bias
bi
a a disebut
dise
seb
but Multi
Mult
lti
i Layer Precepton
P ecepto
Pr
ton
n
multi layer
in
ni terdiri dari 3 layer yaitu
yai
aitu
tu
(MLP). Pada algoritma ini
t.
layer input, layer tersembunyi dan layer output.
Gambar 2.1. Arsitektur Multi Layer Precepton
(Haselstainer & Pfurtscheller, 2000).
16
Pada gambar di atas dapat dilihat arsitektur
dari algoritma ini. Dicontohkan dengan gambar diatas
diketahui
terdapat
p
tersembunyi
dan
da
an
layer
y
satu
output
p
layer
r
lalu
input.
satu
Pada
layer
y
layer
tersembunyi
tersembuny
yi ini dapat dibuat lebih
h dari satu layer.
Proses yang
yang berjalan
a pada
pada algoritma
algo
g ritma ini
i adalah nilai
diki
irim
dikirim
mela
lalu
lui
i
melalui
sa
am
mpai
sampai
ke
tersem
embu
buny
n i
tersembunyi
Pelatihan
Pe
Pela
lati
tihan
la
aye
yer
r
layer
layer
layer
inpu
in
put
t
input
output.
memiliki
memiliki
pada
k
ke
Pad
ada
Pada
fungsi
algoritma
layer
tersembunyi
tersembunyi
n
bagian
akti
iva
vasi
si
aktivasi
Backpropagation
Backpropag
agatio
ion
n
layer
sig
gmoid.
sigmoid.
memiliki
m mi
me
ili
l ki
pr
pros
oses seperti berikut. Yang pertama adalah
adala
lah
h proses
pros
ses
e
proses
Inisi
ialisasi yang digunakan untuk memberikan
member
rikan
an nilai
nil
i ai
i
Inisialisasi
a
wal
l terhadap nilai yang diperlukan seperti
seper
rti bobot.
bobo
bo
b t.
awal
Lal
lu yang kedua adalah Aktivasi yang akan melakukan
mela
aku
kuka
an
Lalu
pe
erhitungan aktual output pada layer tersembunyi
tersemb
bunyi dan
dan
n
perhitungan
la
ayer
layer
output.
Selanjutnya
ya
yaitu
menghitu
tung
ng
menghitung
eror
adalah
pada
Pelatihan
lay
ayer
e
layer
Bobot
t
Bobot
tersembun
uny
yi
tersembunyi
dan
dan
layer output dan mengganti
men
engg
g an
nti bobot
bobot dengan bobot yang
yang
baru dan terakhir adalah
ah Iterasi yang akan mengulang
mengu
gula
lan
ng
pr
ros
oses ini hingga mendapat eror yang minimal.
minim
imal
al.
. Pada
Pa
proses
al
lgo
gori
ritm
tma
a ini,
ini, proses
pro
rose
ses
s pelatihan
pela
pe
lati
tiha
han
n memiliki
memi
me
mili
liki
ki dua
dua
a fase
fase
algoritma
ut
utam
ama
a. Fase
Fase
e yang pertama,
pertama, inputan
inputa
tan
n
utama.
ini
di
diberikan
a
pada
lay
yer
layer
pad
ada
a algoritma
algo
al
goritma
pada
input
pad
da
pada
jaringan.
Kemudian inputan akan
ak
kan diteruskan
dite
eruskan ke dalam layer –
layer tersembunyi hingga
hingga menghasilkan nilai output
di
layer
output.
Fa
ase
Fase
kedua
kedua
yaitu
akan
dihitung
nilai eror dari hasil output
ou
utput jaringan dengan output
yang
sebenarnya
sebenarnya.
Kemudian
hasil
tersebut
dikembalikan ke layer tersembunyi hingga kembali ke
layer
input
dimana
saat
17
proses
pengembalian
ini,
bobot nilai akan diubah untuk agar mendapatkan hasil
output yang lebih akurat (Prasetyo, 2012).
Backpropagation
Klasifikasi
memiliki
metode
y
g digunakan
g
p
j
p
yang
untuk melakukan pembelajaran
terhadap
kumpulan data dan
da kemudian memetakan
mem
emetakan masing-masing
data yang terpilih
te
sa
ke dalam salah satu
dari kelompok
kelas yang
ya
ditetapkan sebelumya.
a. Tujuan dari
telah ditetapkan
klas
sifikasi
i yaitu
yait
ya
i u memperkirakan
memp
me
mper
erki
kira
raka
kan
n kelas
ke
elas yang
ng dimiliki
klasifikasi
da
dari
sua
u tu
suatu
ob
bjek
objek
dimana
ob
bje
ek
objek
te
t
tersebut
belum
diketa
tahu
hui
i labelnya.
labe
beln
lnya. Proses klasifikasi
klasi
sifi
f kasi
i ini
ini melakukan
melak
a ukan
diketahui
pr
pros
oses
es
proses
pencarian
pencarian
model
atau
fung
gsi
fungsi
yan
ang
g
yang
da
dapat
me
menj
njela
askan atau membedakan kelas dari data
data tertentu
terten
te
ntu
t
menjelaskan
(Han,
, et al., 2012). Untuk mengukur kualitas
kua
alita
tas
s dari
d ri
da
k
las
sifikasi dapat digunakan perhitungan berikut
ber
riku
ut ini:
in
klasifikasi
2.
.2.3. Temporal Data Mining
2.2.3.
Temporal Data mining
pe
ena
n mbangan
n
penambangan
data
ta
data
yang
adalah
sebuah
dila
di
lak
kuka
kan
n
dilakukan
pada
te
eknik
k
teknik
databas
ase
e
database
temporal. Database temporal
tem
empo
ora
ral merupakan database yang
yan
ang
g
memiliki
data
me
m
mili
mi
liki
ki
memiliki
fak
akto
tor
r
faktor
da
d
tab
base
database
ber
ersi
sifat
bersifat
pa
da
pada
data
a
data
tertentu.
berarti
bersif
fat
bersifat
w ktu.
wa
waktu.
time
time
terseb
but
u
tersebut
Dengan
melakukan
temporal
art
rtin
iny
ya
artinya
temp
te
mpor
oral
temporal
Seb
bua
uah
h
Sebuah
data
data
pad
ada
a
pada
series
series
yan
ang
yang
artinya
i a
artinya
ter
rsusun
tersusun
ka
ata
kata
yang
la
ain,
lain,
analisis
berd
be
rdas
asar
arka
kan
berdasarkan
temporal
data
penambangan
data
ni
nilai
waktu
mining
yang
mempertimbangkan pengaruh
pen
ngaruh waktu (Mitsa, 2010). Pada
penambangan data ini, unsur
uns
sur kompleksitas akan muncul
dikarenakan
n
penggalian
data
dan
pemrosesan
data
dil
k k
b d
k
k
l
dilakukan
berdasarkan
runtun waktu
tertentu. Dalam
penerapannya,
penambangan
data
temporal
ini
dapat
digunakan untuk melakukan klasifikasi serta prediksi
suatu
data
yang
akan
datang.
18
Klasifikasi
pada
temporal data mining dilakukan berdasarkan analisis
trend
dan
pola
tertentu
berdasarkan
waktu
(Shahnawaz, et al., 2011). Klasifikasi dan prediksi
dalam
penambangan
data
temporal
ini
berdasarkan
pergerakan nilai data
dat
ata pada
da suatu
sua
u tu interval waktu yang
diketahui bahwa
bahw
hwa pola-pola data yang
yan
ang muncul pada masa
lalu dapat
at terulang.
g
Perbed
daa
aan
n utama
utam
ma antara
anta
an
tara
ra klasifikasi
kla
lasi
sifikasi statis
sta
t tis yang
Perbedaan
bi
iasanya
ya
biasanya
dil
ilak
akukan
dilakukan
dengan
kl
las
sif
i ikas
asi
klasifikasi
d
pada
data
tempor
oral
al sangat
sanga
gat
t jelas terlihat
t pada
pada dimensi
dime
di
mensi waktu.
waktu.
temporal
Pa
da klasifikasi
klasi
sifikasi statis, tidak ada hubungan
hub
bun
unga
gan
n antara
anta
t ra
Pada
sa
tu data
da
ata dengan data yang lain, sehingga
sehingg
gga data
data dapat
dap
pat
a
satu
d por
di
rses
diporses
secara
satu
per
satu
atau
ind
div
ivid
idua
u l.
.
individual.
B
erb
beda degan klasifikasi yang dilakukan pada
pad
da data
d ta
da
a
Berbeda
tem
mporal, proses dilakukan pada sebuah set data
data
a yang
y ng
ya
temporal,
be
erurutan
berurutan
dari
kl
lasifikasi
klasifikasi
pe
pendekatan
temporal
kumpulan
temporal
unt
ntuk
uk
untuk
data,
data,
data.
data
ini,
melakukan
yai
aitu
tu
yaitu
Dalam
terdapat
pem
emro
r sesan
pemrosesan
Ex
xte
tern
rnal
l
External
Temporal
dan Internal Temporal Processing
pros
ses
s
proses
2
da
ata
data
je s
jenis
pad
ada
a
pada
Processi
sing
ng
Processing
(Haselstaine
ner
r &
(Haselstainer
Pfur
Pf
urtscheller, 2000).
Pfurtscheller,
a. Exte
tern
rnal Temporal
Tem
e pora
ral
l Processing
Proces
Pr
ssi
s ng
g
External
E
xternal
External
bahwa
Tempo
poral
Temporal
pengolaha
an
pengolahan
data
Processing
temporal
me
emi
mil
liki
memiliki
dimana
arti
dimensi
waktu dari kumpulan
kumpu
pulan data
da
ata tersebut ditangani di
luar proses klasifikasi.
klasif
i ika
asi. Gambar 1 di bawah ini
dapat menunjukan proses
pro
oses dari External Temporal
Processing.
19
Gambar
2.2.
Gamb
bar 2
.2. External Temporal
Tem
mpo
poral Processing
Processi
sing
(Haselstainer
(Ha
(H
aselst
tai
ainer & Pfurtscheller,
Pfurtsch
chel
eller, 2000).
200
000)
0).
Dari
Da
gambar
1
di
atas,
dapat
dilihat
dil
lih
hat
bahwa
bah
ahwa
pr
roses ini membentuk sebuah pola yang
yan
ang digunakan
digu
di
gunaka
an
proses
sebagain
sebagain
sebuah
inputan
subset
untuk
yang
klasifikasi
terdiri
dari
men
ngg
ggun
unak
a an
n
menggunakan
data
ta-d
-data
data-data
in
ndivi
idual
al
individual. Singkatnya, kumpulan data individual
akan
dibentuk
ulang
menjadi
sebuah
po
ola
pola
ya g
yang
ters
rsebut
t
lebih besar. Dari pola yang terbentuk tersebut
mer
ere
eprese
ent
ntasikan bentuk
bentuk
k baru
ba
kumpul
lan
akan merepresentasikan
dari kumpulan
data
temporal
ya
ang
yang
dari
kumpulan
data
dibe
di
bent
ntuk
uk
dibentuk
ada
ada
sebelumnya.
individual
den
enga
g n
dengan
Pola
tersebut
meng
me
nggu
guna
naka
kan
n
menggunakan
baru
baru
dap
apa
at
dapat
perh
hit
itun
ung
gan
perhitungan
statisti
tika
ka.
statistika.
Ke
Keuntungan
proses
uta
ama
utama
dari
dari
klasifi
ikasi
klasifikasi
menggunakan
mod
del
model
pendekat
atan
an
pendekatan
dapat
dapat
ini
ini
dilakukan
kla
asifikasi
klasifikasi
yang
yaitu
dengan
sederhana
i untuk
untu
uk pola yang statis. Proses
yaitu klasifikasi
yang
kompleks
pembentukan
pola
a an
ak
akan
baru
individual.
20
terdapat
pada
dari
kumpulan
proses
data
b. Internal Temporal Processing
Pada
pendekatan
dilakukan
bersamaan
ini,
dimensi
dengan
waktu
proses
akan
klasifikasi.
Sehingga
gg satu buah data individual dari kumpulan
p
data
temporal
tempora
ral
l
juga
akan
menjadi
m njadi
me
Gambar
untuk diklasifikasikan.
di
r
dapat
dapa
pat menunjukan
menunjuk
kan proses dari
satu
inputan
2 di bawah ini
Internal
Inte
ern
r al Temporal
P
rocessi
ing
ng.
.
Processing.
Gambar
Gamb
Ga
mbar
ar 2.3.
2.3
.3. Internal
In
al Temporal
Tem
empo
pora
ral
l Processing
Pr
Pf
(Haselstainer & Pfurtscheller,
2000).
Pad suatu
sua
atu waktu
wak
a tu tertentu hanya
ha
any
ya akan ada
ada satu
sat
atu
u
Pada
data
data
ta dari
dar
ari
i kumpulan
kumpul
ku
ulan
an data
dat
ata
a temporal
temp
por
oral
al yang
yan
ang
g digunakan
diguna
di
naka
kan
seba
se
bag
gai satu
satu inputan
inp
nputan dalam
dal
alam proses
prose
ses klasifikasi.
klas
kl
asif
ifik
ikas
asi.
sebagai
klasif
fik
i asi juga akan dilakukan
Di dalam proses klasifikasi
pengolaha
an data dengan metode-metode
proses pengolahan
dat
a a yang
yan
ng akan diproses.
tertentu untuk data
Electroencepha
alo
l gr
graphy (EEG)
2.2.4. Electroencephalography
Electroencephalogr
raphy
Electroencephalography
atau
EEG
merupakan
teknik untuk merekam aktifitas listrik yang ada di
otak
dimana
analog
hasil
perekaman
EEG
merupakan
sinyal
(Andrzejak et al., 2001). Teknik penempatan
electrode
pada
saat
perkaman
21
EEG
yang
biasa
digunakan adalah system international 10-20. Berikut
ini letak elktrode dengan system internasional 1020.
Gambar 2.4. Penempatan Elektrode dengan Sistem
m
Internasional 10-20.
Pe
ene
nemp
mpat
atan
an
Penempatan
elekt
k roda
a
elektroda
adalah
penempatan
Ha
Hasil
dari
(Song, 2011)
pad
ada
a
pada
elek
el
ektroda
elektroda
perekaman
gamb
ga
mbar
ar
gambar
2.4
dipermukaan
aktifitas
diata
tas
s
diatas
kepa
pala
la.
kepala.
k
listrik
dar
ari
dari
pe
pene
nemp
mpat
atan
an electrode
ele
lect
ctro
rode
de ini akan
aka
kan menggambarkan
meng
me
ngga
gamb
mbar
arka
kan
n kondisi
kond
ko
ndi
isi
penempatan
ge
gelo
l mban
ng yang
yang
ng ada
ada pada
pad
da otak.
otak
k.
gelombang
Terdapat 4 gelombang
gel
lombang
g yang akan terekam dalam
EEG.
Yang
pertama
h
adalah
gelombang
alfa,
beta,
theta, dan delta serta
ser
rta gamma(Nandish
gam
mma(Nandish et al., 2012).
Gelombang alfa adalah
h gelombah
gelo
lombah dengan frekuensi 8-13
Hz
yang
akan
muncul
l i
mengalami
k di i
kondisi
Gelombang
alfa
pada
pada
saat
il k
rileks
t
atau
dapat
digunakan
seseorang
t
mata
untuk
sedang
t t t
tertutup.
melihat
kenormalan suatu fungsi atau kerja otak. Gelombang
beta adalah gelombang yang memiliki frekuensi 13 Hz
22
hingga
30
Hz
yang
timbul
ketika
berpikir atau melakukan aktifitas.
orang
Gelombang theta
adalah gelombang dengan frekuensi 4
Gelombang
ringan
theta
atau
muncul
da
ala
lam
m
dalam
pada
saat
kead
adaa
a n
keadaan
sedang
sampai 8
seseorang
senang.
Hz.
tidur
Sedangkan
de
elt
lta adalah gelombang
ng yang berfrekuensi
gelombang delta
yai
aitu sekitar
sekit
tar 0 sampai 4 Hz yang
rendah yaitu
biasanya
ul pada saat seseorang
ses
eseo
ora
rang
ng tidur
t id
idur nyenyak.
nyenyak
ak. Gelombang
muncul
i dapat digunakan
digu
di
guna
n kan untuk
k mengidentifikasi
meng
me
ngid
iden
e tifikasi
si kondisi
ini
patholog
ogic
i
pathologic
seseo
ora
ran
ng
seseorang
seper
rti
seperti
terjadi
i ny
nya
terjadinya
ka
luka
atau
infe
feks
ksi,
i, serta
ser
erta penyakit seperti kanker,
kanker
ka
r, tumor,
t mor, dan
tu
infeksi,
epil
ep
ile
epsi
i. Terakhir adalah gelombang gamma.
ga
amm
m a.
. Gelombang
Gel
elomba
bang
epilepsi.
ini berfrekuensi
be
ini
deng
gan
dengan
yan
ng berkaitan
berk
be
rkaita
an
lebih dari 30 Hz yang
aktifitas
otak
untuk
mengin
ntegr
ras
asi
ikan
n
mengintegrasikan
ber
rmacam rangsangan.
bermacam
Data
hasil
me
enggunakan
menggunakan
ko
kondisi
perekaman
komputer
sese
eor
oran
ang.
g.
seseorang.
untuk
Hasil
EEG
akan
mengetahui
men
enta
tah
h
mentah
diol
lah
h
diolah
hasil
dari
G
EEG
atau
u
atau
adala
lah
h
adalah
sed
edan
angk
g an
n pada
pad
ada komputer hanya dapat
dap
apat
at
sinyal analog, sedangkan
membaca
data
pe
era
rangkat
perangkat
dapa
pat
t
dapat
digital.
Analog
meng
me
ngub
ubah
ah
mengubah
me
enj
njad
adi
i
menjadi
siny
nyal
sinyal
to
Maka
Digital
sin
inya
yal
l
sinyal
dari
Converter
anal
an
alog
og
analog
dig
i ital
l
digital
itu
dibutu
tuhk
hka
an
dibutuhkan
(ADC
(A
DC)
(ADC)
kon
onti
tiny
nyu
u
kontinyu
yang
yang
dapa
da
pat
t
dapat
dari
dari
diba
di
baca
ca
dibaca
ya
yang
EEG
oleh
komputer.
t
komputer.
Co
omponent Analysis dan Independent
2.2.5. Principle Component
Ana
alysis
Component Analysis
Metode
pengolahan
Analysis
c
statistic
sinyal
(PCA)
dan
yang
yang
ad
adalah
sering
digunakan
Principal
Independent
Component
untuk
Component
Analysis
(ICA). PCA sebuah metode yang dapat digunakan untuk
mengekstraksi informasi atau parameter dari kumpulan
data yang besar seperti data hasil perekaman sinyal
23
EEG. Parameter yang dapat digunakan pada PCA untuk
mengekstraksi data EEG adalah rata-rata, varian, dan
standar
devisasi.
Independent
Component
Analysis
(ICA) merupakan metode yang digunakan untuk mencari
informasi yang tersembunyi
ter
rse
sembunyi
i dari
dar
a i kumpulan data dimana
informasi
ya
yang
ditelusuri
adal
ad
a ah
adalah
faktor
yang
independen
en secara statistik
s atistik dan non gaussian.
st
ga
Metode
ini banyak
ba
digunak
kan
n untuk
unt
ntuk
uk pemrosesan
pem
e rosesan data
d ta sinyal
da
digunakan
sep
perti data
ta EEG.
E G. Parameter
EE
Paramete
t r yang
yang sering digunakan
d gunakan
di
seperti
u
ntuk mengekstrak
meng
me
n ekstra
ak data
data sinyal
sin
inya
yal
l EEG pada
pada metode
metod
ode ini
untuk
adal
alah
ah skew
wness dan kurtosis
adalah
skewness
para
pa
ram
mete
er
parameter
ini
stat
st
a is
stic.
statistic.
masuk
Dalam
hal
dalam
(C
Coh
ohen, 2014).
2014
20
1 ). Kedua
K dua
Ke
(Cohen,
golongan
pengolahan
high
gher
er
higher
l,
sinyal,
ord
rder
order
par
ara
amete
er
parameter
h
igh
her order statistic lebih merepresentasikan
merepresenta
asika
an data
data
a
higher
kar
rena informasi yang penting lebih terdapat
terda
apat
t pada
pada
karena
pa
arameter
parameter
ini.
Kedua
metode
ini
digunaka
an
digunakan
uk
untuk
me
enggambarkan dan merepresentasikan dua kondisi
kondis
i i data
da a
menggambarkan
ap
pabila
apabila
data
sinyal
terdistribusi
apabila
da
data
sin
nya
yal
sinyal
terdistribus
te
usi
i
terdistribusi
Berikut
ini
h
adalah
parameter
parameter
Gaussi
ian
n
Gaussian
an
dan
non-Gaussi
ian
non-Gaussian
statistik
yan
ang
g
yang
d gunakan untuk analisa sinyal EEG :
di
digunakan
a. Ra
ata
ta-r
rat
ata
a (Mean)
(Me
Mean
an)
)
Rata-rata
Mean
Mean
merupak
kan
a
merupakan
nilai
i
nilai
i
dari
ukur
uk
uran
an
ukuran
ten
endensi
tendensi
sentral
l yang didefinisikan
didefin
nisika
an sebagai nilai
nil
lai
i rata-rata
dari
kumpulan
data
a.
data.
i
Nilai
mean
didapatkan
dengan
menghitung jumlah semua
semua nilai
nilai dalam kumpulan data
kemudian
membagi
pen
njumla
ahan
penjumlahan
data
tersebut
dengan
banyaknya jumlah kumpu
ula
lan
n data tersebut.
kumpulan
b. Standar Deviasi (Standard Deviation)
Standar
Deviasi
merupakan
ukuran
sebaran
(dispersi) suatu distribusi. Jika suatu distribusi
24
rata maka nilai standar deviasinya kecil sedangkan
jika
suatu
standar
distribusi
deviasinya
berfluktuasi
besar.
Standard
maka
nilai
deviasi
adalah
sebuah nilai yang menunjukan seberapa banyak variasi
yang terdapat pada
a mean
mean atau
atau nilai yang diharapkan.
Standard deviasi
devia
iasi dari sebuah varibel
var
rib
i el acak, populasi
statistik
k,
statistik,
kumpul
u an
kumpulan
data
at
tau
atau
distribusi
probab
abi
ilitas adalah
h akar
ak r kuadrat
kua
uadr
drat dari varian.
va
arian. Nilai
probabilitas
sta
andard deviasi
dev
evia
iasi
s yang rendah
rend
dah menunjukan
men
enun
unjukan nilai
ni
standard
dari
d
ata-da
ata yang ada
ad
da itu
it dekat
d ka
de
kat
t dengan nilai
nil
ilai mean
a atau
data-data
nila
lai
i yang
y ng
ya
g diharapkan.
diharapkan. Nilai standard
stand
ndard deviasi
devi
de
v asi yang
nilai
ting
ti
nggi
g
menunjukkan bahwa nilai dari data-data
data
a -da
data
t
itu
tinggi
menunjukkan
itu
ja
u
jauh
dari nilai mean atau
dari
nilai
dih
ihar
ara
apkan
n.
yang diharapkan.
S
tan
ndard deviasi secara umum dapat digunakan
digun
nak
a an
n untuk
untuk
k
Standard
men
ngetahui seberapa dekat semua variasi data
t dengan
den
engan
mengetahui
ni
ilai mean dari data-data tersebut. Standard
d deviasi
si
nilai
pe
enting untuk menunjukkan seberapa besar perbedaan
perbeda
daan
n
penting
da
ari sekumpulan data yang ada dengan nilai m
ean
n atau
au
dari
mean
nilai yang
yang diharapkan.
diharapka
kan
n.
c. Skewness
Sk
Skew
e ness
Skewness
mer
erup
upak
akan
an
merupakan
me
mendefinis
isik
ikan
mendefinisikan
ke
kesi
s metris
isan
kesimetrisan
par
aram
amet
eter
parameter
pen
e yi
imp
mpan
ang
gan
penyimpangan
distrib
ibusi
distribusi
ata
au
atau
normal
normal
uk
kuran
n
ukuran
ya
yang
k miring
ke
gan
kemiringan
dari
u
atau
Gaussi
sia
an
Gaussian
pada
sekumpulan data. Nilai
Ni
ilai sk
kewness akan bernilai nol
skewness
jika distribusi data
t
simetris dengan
baseline dan
sebaliknya, nilai sk
skewness
ss bernilai tidak nol jika
tidak
simetris
ter
rha
h da
ap
terhadap
baseline.
Nilai
dari
parameter ini akan bernilai
ber
rni
nilai positif jika ekor lebih
condong ke kanan dan akan bernilai negatif jika ekor
lebih condong ke kiri.
25
2.5.
Gambar 2
.5
5. Parameter
P rame
Pa
eter Skewness
Skewne
ess
s
d. Ku
urtosis
Kurtosis
K
urtos
sis adalah parameter
pa
uk
kur
uran
a yang
g mendefinisikan
mendefin
me
nisikan
Kurtosis
ukuran
kepu
punc
ncak
akan
kepuncakan
atau
kedataran
suatu
dist
stri
rib
busi
distribusi
pada
pada
ku
kump
mpulan
n data. Terdapat 3 jenis distribusi
distri
ribusi
i yang
yang ada
ada
kumpulan
pad parameter ini. Yang pertama yaitu leptokurtic
pada
lept
ptok
okurti
ic
y ng
ya
g akan terjadi jika nilai kurtosis positif
posi
s ti
if atau
u
yang
leb
bih
lebih
besar
si
ingkat
singkat
di
ibanding
dibanding
dari
apabila
distribusi
nilai
distribusi
normal
kurtosis
normal.
ata
au
atau
lebih
Yang
sec
se
cara
a
secara
berpuncak
ak
berpuncak
kedua
adal
alah
h
adalah
di
istribusi mesokurtic
c apa bila nilai kurtosis adalah
adala
ah
distribusi
n jika
jika nilia
nil
ilia kurtosis
kurtos
osis b
erni
er
nila
lai
i negatif maka
ma
aka
nol dan
bernilai
distri
ibu
bus
si platykurtic.
disebut sebagai distribusi
Gambar 2.6. Parameter Kurtosis
26
2.2.6. Waikato Environment for Knowledge Analysis
(WEKA)
WEKA merupakan perangkat lunak yang menyediakan
y
p g
layanan
untuk melakukan pengolahan
data dalam data
Perangka
kat
t lunak ini berbasis
berb
be
r asis open source dan
mining. Perangkat
dibuat
menggunakan
menggunakan
dikemban
angkan
dikembangkan
Baru
u.
Baru.
A
WEKA
oleh
Java.
WEK
EKA
A
WEKA
Universitas
mer
erupak
kan
merupakan
dibuat
o
Waikato
per
eran
angk
gkat
at
perangkat
lunak
di
dan
Selandia
gra
r tis
gratis
yang
te
ersedia
a dibawah
dib
baw
awah General Public
ic License.
Licen
ense. Perangkat
Pe
tersedia
memi
me
mili
l ki fasilitas
fasilitas untuk melakukan
mel
elak
a ukan
an preprocessing
preproce
pr
essing
ini memiliki
data
da
ta,
,
data,
cl
classification,
regression
on,
regression,
clus
cl
usteri
ring,
clustering,
asso
as
sociat
ation rules, dan visualiszation.
association
s Java
Java yang
yang
g
Di dalam WEKA terdapat library kelas
leng
ngkap
lengkap
untuk
pem
mbelajaran
pembelajaran
melakukan
dan
implementasi
algoritma
data
met
tod
o e
metode
mining.
me n
mesin
K mu
Ke
muda
daha
an
Kemudahan
da
ari aplikasi WEKA ini adalah library kelas yang ada
ada
a
dari
da
apat
dapat
digunakan
secara
bebas
pada
aplikas
si
aplikasi
lain.
.
lain.
Ba
s yang
yang ada pada
a WEKA
WEK
dij
ija
alanka
kan
n
Bahkan,
kelas
dapat dijalankan
pada
apl
lik
ikasi
aplikasi
b rb
be
rbas
asis
berbasis
web
eb.
web.
Hal
ini
ini
memungkink
nkan
an
memungkinkan
kan berbagai teknik dan metode
meto
me
tod
de
pengguna untuk menerapka
menerapkan
data mining
g pada weka untuk data yang inigin
inigi
gin
n mereka
mere
me
reka
data
ol
lah sendiri
sen
endi
diri
ri tanpa
tan
anpa
pa memperhatikan
mem
e pe
perh
rhat
atik
ikan
an platform
plat
pl
atfo
form
rm
m komputer
kom
ompu
puter
olah
ya
ang digunakan.
dig
igun
unak
kan. (Witten,
(W
Wit
itten, Frank
Fra
ank & Hall,
Hal
a l,
l 2011)
201
011)
1)
yang
Gambar
2.7. Tampilan Awal WEKA
27
WEKA mulai dikembangkan sejak tahun 1994 dan
telah menjadi software data mining open source yang
paling
popular.
WEKA
mempunyai
kelebihan
seperti
mempunyai banyak algoritma data mining dan machine
learning, kemudahan
kemudaha
han
n dalam
dalam penggunaannya,
pe
selalu upto-date
deng
ngan
dengan
algoritma-alg
gor
oritma
algoritma-algoritma
yang
baru.
Software
e WEKA tidak hanya digunakan
n untuk akademik
saja
namun
cukup
ban
anya
yak
k
banyak
dipa
di
p kai
dipakai
h
oleh
perusahaan
un
ntuk meramalkan
mera
ama
malk
lkan
a bisnis
bisnis dari
d ri suatu
da
sua
uatu
t perusahaan.
perusah
ahaan. Ian
untuk
H.
Wit
itte
t n
Witten
kesu
suks
kse
esan
kesuksesan
me
eru
rupakan
merupakan
WEKA.
lata
la
tar
latar
Beliau
bela
aka
kang
belakang
merupa
aka
k n
merupakan
dibalik
dibalik
prof
pr
o esor
r
profesor
di
Un
Univ
iversi
sitas of Waikato, New Zealend, yang
ng menekuni
men
e ek
kuni
Universitas
Di
Digita
tal Library, Text Mining, Machine Learning
L ar
Le
rni
ning
n dan
da
an
Digital
In
I
formation
fo
Information
me
etode
metode
Retrieval.
pemilihan
Pada
variable
Weka
dari
a
ada
bebe
eberapa
a
beberapa
suatu
da
ata
tase
s t,
dataset,
di
iantaranya BestFirst, ExhautiveSearch, FCBFSearch,
FCB
BFSearch
h,
diantaranya
G
eneticSearch,
GeneticSearch,
GreedyStepwise,
Rac
ceSear
rch,
RaceSearch,
R
andomSearch, Rankerdan, RankerSearch. Metode
Meto
ode atau
ata
au
RandomSearch,
Teknik yang
yan
ang
g digunakan
diguna
akan Weka
We
eka adalah
h
Descriptive
data
Weka
Weka
preprocessing,
re
regr
g ession,
i ,
regression,
Se
S
mua
Semua
karena
te
ekn
knik
ik
teknik
Wek
e a
Weka
mendukung
clustering,
visu
vi
sual
aliz
i ation,
n,
visualization,
adal
ad
alah
adalah
Predictive dan
dan
dan
dan
teknik-tek
kni
nik
k
teknik-teknik
classifica
cati
tion
on,
classification,
f
eat
ture
feature
did
idasar
arka
kan
didasarkan
Red
educ
ucti
tio
on.
Reduction.
a
pada
asumsi
asumsi
ba
bahw
h a data
da
ata tersedia
a sebagai
sebaga
gai flat file
fil
ile
e tungggal
tungg
ggg
gal atau
bahwa
hubungan, dimana setiap
se
etiap titik
ti
itik data digambarkan oleh
sejumlah tetap atribut
atr
ribut (biasanya,
(b
biasanya, atribut numeric
atau
nominal, tetapi
p
juga
didukung).
beb
berapa jenis atribut lain
beberapa
WEK
KA
WEKA
memiliki
memiliki
empat
jenis
test
option yang dapat digunakan
digu
gunakan untuk melakukan proses
klasifikasi.
Proses
yang
ditangani
adalah
proses
pelatihan dan pengujian. Keempat jenis test option
tersebut yaitu:
28
a. Use training set
Klasifikasi
untuk
data
ini
melakukan
yang
akan
menggunakan
pelatihan.
dilatih
satu
Kemudian
sebelumnya
juga
data
seluruh
digunakan
untuk proses pengujian.
pengujian
n.
b. Supplied
d test set
Klas
sifikasi ini
in
ni dilakukan evaluasi
evalua
uasi dengan cara
Klasifikasi
m
emprediksi
memprediksi
sebe
se
bera
rapa
pa
seberapa
bai
aik
baik
satu
dat
a aset
dataset
yang
diambi
il dari
da
seb
buah data
data tertentu
ter
ertentu yang
n memang
diambil
sebuah
su
uda
dah
sudah
dise
ediakan
k
disediakan
pela
pe
l ti
iha
han
pelatihan
unt
ntuk
uk
untuk
akan
meng
nggunakan
menggunakan
pengu
guji
jian.
pengujian.
Proses
terle
lebi
bih
h
terlebih
da
ahulu
dahulu
kem
mud
u ia
an
kemudian
pros
ses
proses
dilakukan
data
latih
p
engujian akan dilakukan dengan data
da
ata
t uji
uji yang
yan
ng
pengujian
berbeda
dengan
data
yang
dila
atih
dilatih
a
pada
klasifikasi.
c. Cross-validation
Klasifikasi
ini
cross-validation
yang
ng
tertentu
tertentu
dilakukan
dan
yang
evaluasi
menggunakan
dapat
dapat
den
ngan
n
dengan
juml
lah
jumlah
dii
iinp
nputkan
diinputkan
fo
old
d
fold
manual
al.
.
manual.
Pada cross-valida
dati
ion akan ada pilihan berapa
ber
rap
apa
a
cross-validation
fold
d yang akan digunakan. Nilai fold
d awal
awa
al yang
yan
ya
ng
dib
di
berika
ikan
n
diberikan
adal
ad
alah
a
adalah
dila
aku
kuka
kan
dilakukan
sebany
se
yak
sebanyak
0.
10.
Pro
rose
ses
Proses
ai
nilai
p ng
pe
guj
ujia
ian
n
pengujian
fol
old
d
fold
y ng
ya
yang
ak
akan
dib
iber
erikan
diberikan
sert
rta
a akan dibentuk
diben
entuk subset
su
seban
anya
yak nilai
nila
lai
i fold.
serta
sebanyak
Kemudian
pros
ses
proses
menggunakan
sisany
se
ebuah
sebuah
akan
pe
engujian
pengujian
su
ubset
subset
akan
yang
dig
gunakan
digunakan
dilakukan
terbentuk
dan
untuk
proses
evaluasi
dengan
pelatihannya.
d. Percentage split
Klasifikasi
ini
dilakukan
melakukan pembagian data antara data uji dan
data latih pada satu dataset dengan menggunakan
prosentase.
Prosentase
29
yang
diinputkan
akan
digunakan
untuk
proses
pelatihan
dan
sisanya
akan digunakan untuk proses pengujian. Proses
ini biasanya dilakukan dengan perbandingan 2/3
data
untuk
pelatihan
dan
1/3
data
digunakan
untuk proses pengujian.
pengujian
n.
Klasifik
ikasi data pada Weka
ka dapat menggunakan
Klasifikasi
deng
ngan memanfaatkan
memanfa
f atkan algoritma Backpropagation.
B ckpropagation.
Ba
ANN dengan
a Weka, ANN diberi
dib
ber
eri
i nama
nama Multilayar
r Precepton.
Pada
Ja
yan
ng ada pada Weka
Wek
eka
a dapat
dap
da
pat dibuat
at dengan
Jaringan
yang
cara
mem
e berika
an
memberikan
di
ibu
butu
tuhk
h an
n
dibutuhkan
dapa
da
pat
dapat
oleh
pantau
pela
pe
atihan.
pelatihan.
nilaii
nila
ilai
i
nilai-nilai
jaringan.
dan
Berikut
pada
yang
Jaring
gan
a
ter
erse
s but juga
Jaringan
tersebut
dimodifikasi
ini
par
arameter
er
parameter
s lama
se
ma
selama
prose
s s
proses
parameter-par
ram
a et
eter
er
parameter-parameter
yan
ng
yang
dap
pat digunakan untuk membangun sebuah jaringan
jar
aringa
gan
n :
dapat
a
. momentum
a.
Parameter ini digunakan untuk menyesuaian
men
nyesuaia
an
bobot yang dimanfaatkan untuk menemukan
menemuka
an nilai
ni
ilai
global
eror
Para
rame
met
ter
Parameter
yang
i
ini
minimal
juga
dapat
dapat
selama
pe
elati
tihan
n.
pelatihan.
mem
empe
percepat
t
mempercepat
prose
ses
s
proses
pelatihan. Nilai
i momentum
mom
omentum dapat diberika dati
dat
ti 0
hingga 1.
b hiddenLayers
b.
hidd
hi
ddenLa
Laye
yers
rs
Para
ame
mete
ter
Parameter
in
ini
digu
di
gun
nakan
n
digunakan
u tu
un
tuk
k
untuk
i
memberi
ju
jumlah
laye
yer
r tersembunyi
tersembuny
nyi dari
dar
ri jaringan.
n. Parameter
Param
met
eter ini
layer
mendukung
pembuata
pe
an
pembuatan
multilayer
dengan
menggunakan tanda
ta
anda koma
a untuk memisahkan jumlah
node yang dibuat
at di tiap
ti
layer.
c. trainingTime
Parameter
ini
di
igunakan
digunakan
untuk
memberi
nilai
digunakan
untuk
memberi
nilai
epoch.
d. learningRate
Parameter
ini
pada laju belajar yang ada pada jaringan.
30
Download