Penerapan Metode Extreme Learning Machine untuk

advertisement
Penerapan Metode Extreme Learning Machine untuk Peramalan
Permintaan
Irwin Dwi Agustina, Wiwik Anggraeni, S.Si, M.Kom, Ahmad Mukhlason, S.Kom, M.Sc
Jurusan Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia
Abstrak
Permintaann konsumen yang selalu berubah-ubah menuntut pelaku industri untuk dapat melakukan perencanaan
produksi yang tepat. Kegiatan perencanaan produksi meliputi penentuan jumlah barang yang akan diproduksi, bahan baku
yang dibutuhkan, dan harga barang jadi. Dengan perencanaan produksi yang tepat, diharapkan perusahaan dapat memiliki
tingkat inventory rendah dan mampu merespon permintaann konsumen lebih cepat.
Perencanaan yang efektif dan efisien harus didukung oleh sistem peramalan yang akurat. Oleh karena itu, pada tugas
akhir ini penulis akan membuat sistem peramalan permintaann dengan menerapkan metode extreme learning machine
(ELM). Metode ini merupakan salah satu metode pembelajaran baru dari jaringan syaraf tiruan.
Hasil uji coba dalam tugas akhir ini menunjukkan bahwa metode ELM memiliki tingkat akurasi yang lebih baik
dibandingkan dengan metode konvensional seperti Moving Average dan Exponential Smoothing. Dengan implementasi
metode ELM untuk peramalan permintaan ini diharapkan mampu membantu para pelaku industri dalam menentukan
jumlah permintaann secara lebih akurat dan efektif .
Kata Kunci : Permintaan konsumen, Peramalan, Jaringan Syaraf Tiruan, Extreme Learning Machine
demand forecasting diharapkan mampu menghasilkan
ramalan yang lebih efektif.
1. PENDAHULUAN
ermintaan konsumen terhadap barang maupun jasa
selalu berubah dari waktu ke waktu. Perubahan ini
dipengaruhi oleh banyak faktor baik internal maupun
eksternal, sehingga memperkirakan
permintaan
konsumen di masa datang selalu menjadi tantangan bagi
pelaku usaha dan industri. Terutama untuk perusahaanperusahaan make to stock, peramalan memiliki peranan
penting.
Peramalan yang akurat dan efektif dapat membantu
pengambil keputusan dalam perusahaan menentukan
jumlah barang yang akan diproduksi, bahan baku yang
dibutuhkan serta menentukan harga terhadap barang jadi
sehingga perusahaan memiliki tingkat inventory rendah,
serta mampu merespon permintaan konsumen lebih
cepat. Peramalan permintaan yang akurat juga akan
membawa dampak positif bagi pihak-pihak lain dalam
satu rantai pasok.
Banyak metode telah dikemukakan untuk
mendapatkan hasil ramalan yang akurat. Salah satunya
adalah metode jaringan syaraf tiruan (JST) yang
mengadopsi sistem pembelajaran pada otak manusia. JST
banyak diaplikasikan secara intensif pada peramalan
khususnya sales forecasting, karena kelebihannya pada
kontrol area, prediksi dan pengenalan pola. Banyak
penelitian menyimpulkan bahwa metode JST lebih baik
daripada metode-metode peramalan konvensional (Sun et
al, 2008).
Pada tugas akhir ini akan diaplikasikan suatu
metode baru dari JST yaitu Extreme Learning Machine
(ELM). ELM merupakan jaringan syaraf tiruan
feedforward dengan satu hidden layer atau lebih dikenal
dengan istilah single hidden layer feedforward neural
network (SLFNs). Metode ELM mempunyai kelebihan
dalam learning speed, serta mempunyai tingkat akurasi
yang lebih baik dibandingkan dengan metode
konvensional seperti Moving Average dan Exponential
Smoothing sehingga dengan menerapkan ELM pada
P
2. METODE EXTREME LEARNING MACHINE
Extreme Learning Machine merupakan metode
pembelajaran baru dari jaringan syaraf tiruan. Metode ini
pertama kali diperkenalkan oleh Huang (2004). ELM
merupakan jaringan syaraf tiruan feedforward dengan
single hidden layer atau biasa disebut dengan Single
Hiddel Layer Feedforward neural Networks (SLFNs)
(Sun et al, 2008).
Metode pembelajaran ELM dibuat untuk mengatasi
kelemahan-kelemahan dari jaringan syaraf tiruan
feedforward terutama dalam hal learning speed. Huang et
al mengemukaan dua alasan mengapa JST feedforward
mempunya leraning speed rendah, yaitu :
1. menggunakan slow gradient based learning
algorithm untuk melakukan training.
2. semua parameter pada jaringan ditentukan secara
iterative
dengan
menggunakan
metode
pembelajaran tersebut.
Pada pembelajaran dengan menggunakan
Conventional gradient based learning algorithm seperti
backpropagration (BP) dan variaanya Lavenberg
Marquadt (LM) semua parameter pada
JST feedforward harus ditentukan secara manual
(Zhu,2005).
Parameter yang dimaksud adalah input weight dan
hidden bias. Parameter-parameter tersebut juga saling
berhubungan antara layer yang satu dengan yang lain,
sehingga membutuhkan learning speed yang lama dan
sering terjebak pada local minima (Huang et al, 2005).
Sedangkan pada ELM parameter-parameter seperti
input weight dan hidden bias dipilih secara random,
sehingga ELM memiliki learning speed yang cepat dan
mampu
menghasilkan
good
generalization
performance. Gambar 1 merupakan struktur dari ELM.
1
H = ( w i ,..., w N , b i ,..., b N , x i ,...., x N )
(2.13)
=
g ( w 1• x 1 + b 1 )
K
g (w N • x1+ b N )
M
g ( w 1• x N + b 1 )
M
K
M
g ( w N • x N + b N ) (6)
β 1T
β = M
β NT
Gambar 1 Struktur ELM
Metode ELM mempunyai model matematis yang
berbeda dari jaringan syaraf tiruan feedforward. Model
matematis dari ELM lebih sederhana dan efektif. Berikut
model matrematis dari ELM. Untuk N jumlah sample
yang berbeda ( Xi , ti )
Xi = [ Xi 1 , Xi
2,
...., Xi
Xt = [ Xt 1 , Xt
2,
...., Xt n ] T ∈ R m
n
]T ∈ R
t 1T
T = M
t
n
(1)
(2)
N
β igi ( xj ) =
i =1
N
∑
i =1
β ig (W i. • X j+ b i ) = o
matrix dari target atau output .
Pada ELM input weight dan hidden bias ditentukan
secara acak, maka output weight yang berhubungan
dengan hidden layer dapat ditentukan dari persamaan [5].
(9)
β = H ΤT
j
(3)
Dimana :
J = 1, 2 ,..., N
w i = ( w i 1 , w i 2 ,..., w in ) T = merupakan vektor dari
weight
3. METODOLOGI
Pada bab ini dibahas mengenai penjelasan dari setiap
tahapan penyelesaian dari permasalahan yang diangkat
pada Tugas Akhir ini.
yang
i th
menghubungkan
hidden nodes dan input
nodes.
β i = ( β i 1, β i 2 ,..., β
im
) T merupakan weight vector
1. Pengumpulan Data
yang menghubungkan i
th hidden dan output
nodes.
bi
threshold dari
wix
j
i
Data yang digunakan adalah data penjualan harian
selama dua tahun yaitu tahun 2008-2009 dari bulan
Januari-Desember milik “ Cak Cuk Shop” Surabaya.
Peramalan dibatasi pada dua produk yaitu kaos dan pin.
Antara kedua produk tidak ada hubungan saling
mempengaruhi sehingga setiap produk dianggap sebagai
produk dipenden dimana jumlah permintaan untuk setiap
produk tidak dipengaruhi oleh jumlah permintaan dari
produk lainnya. Gambar 2 dan 3 berikut merupakan plot
data penjualan kaos dan pin selama periode Januari 2008Desember 2009.
th hidden nodes.
merupakan inner produk dari
wi
dan x
j
SLFNs dengan N hidden nodes dan activation function
g ( x ) diasumsikan dapat meng-approximate dengan
tingkat error 0 atau dapat dinotasikan sebagai berikut :
N
∑
j =1
N
∑
i =1
o
j−
t
j
= o sehingga o j = t
β ig (W i. • X j+ b i ) = t
j
j
(8)
T
N
H pada persamaan [6] di atas adalah hidden layer
output matrix. g (w1• x1+b1 ) menunjukkan output dari
hidden neuron yang berhubungan dengan input
x i . β merupakan matrix dari output weight dan T
Standart SLFNs dengan jumlah hidden nodes
sebanyak N
dan activation function
g ( x ) dapat
digambarkan secara matematis sebagai berikut :
∑
(7)
(3)
2. Peramalan dengan Metode ELM
Ada beberapa tahap yang harus dilalui pada
peramalan dengan metode ELM. Secara garis besar
langkah ELM dibagi menjadi tiga tahap yaitu
preprocessing data, training, kemudian testing. Langkahlangkah peramalan metode ELM secara rinci ditunjukkan
pada gambar 4.
(4)
Persamaan [4] dapat dituliskan secara sederhana sebagai
(5)
Hβ = T
2
rendah. Langkah- langkah
ditunjukkan pada gambar 5..
pada
training
ELM
Gambar 2 Plot data penjualan kaos
Gambar 4 Flowchart peramalan dengan metode
ELM
rendah. Langkah-langkah dari proses training ELM
ditunjukkan pada gambar 5.
Gambar 3 Plot data penjualan pin
Dari gambar 3.3 langkah-langkah ELM dapat
dirinci sebagai berikut :
1. Pembagian data training dan testing.
2. Training ELM.
3. Testing ELM.
4. Analisa hasil peramalan.
Berikut penjelasan dari masing-masing langkah
peramalan dengan metode ELM.
3. Pembagian data menjadi data training dan testing
Proses training dan testing mutlak diperlukan pada
proses peramalan dengan ELM. Proses training untuk
mengembangkan model dari ELM, sedangkan testing
digunakan untuk mengevaluasi kemampuan ELM sebagai
forecasting tool. Oleh karena itu data dibagi menjadi dua
yaitu data training dan testing.
Menurut Zhang (1997) beberapa peneliti membagi
data training dan testing dengan komposisi sebagai
berikut :
- Data training sebanyak 80% dari total data.
- Data testing 20% dari total data.
Gambar 5 Flowchart pelatihan ELM
5. Normalisasi Data Training
Data yang akan diinputkan pada ELM sebaiknya
dinormalisasi sehingga mempunyai nilai dengan range
tertentu. Hal ini diperlukan karena fungsi aktivasi yang
digunakan akan menghasilkan output dengan range data
[0,1] atau [-1,1]. Pada tugas akhir ini data training
dinormalisasi sehingga mempunyai range nilai [-1,1].
Berikut Rumus yang digunakan pada proses normalisasi.
4. Pelatihan ELM
Sebelum digunakan sebagai tool peramalan, ELM
harus melalui proses pelatihan terlebih dahulu. Tujuan
dari proses ini adalah untuk mendapatkan input weight ,
bias dan output weight dengan tingkat kesalahan yang
3
X = 2× (X
p−
min{ X p }) /(max{ X p } − min{ X p }) − 1
Dimana :
(1)
X
Dimana :
= nilai data setelah denormalisasi.
= data output sebelum denormalisasi.
X
= nilai hasil normalisasi yang berkisar antara [-1,1].
X
Xp
= nilai data asli yang belum dinormalisasi.
min( X p ) = data minimum pada data set sebelum
normalisasi.
min( X p ) = nilai minimum pada data set.
max( X p ) = data maksimun pada data set sebelum
max( X p ) = nilai maksimum pada data set.
normalisasi.
6. Menentukan fungsi aktivasi dan jumlah hidden neuron
Pada proses training jumlah hidden neuron dan
fungsi aktivasi dari ELM harus ditentukan terlebih
dahulu. Pada tugas akhir ini dilakukan uji coba dengan
menggunakan fungsi aktivasi log sigmoid dan tan
sigmoid karena kedua fungsi tersebut yang paling sering
digunakan pada permasalahan forecasting, serta fungsi
transfer purelin karena data yang diramalkan bersifat
stasioner. Hal ini mengacu pada tulisan Zhang (1997)
bahwa fungsi transfer linier memiliki kelemahan pada
pola data yang memiliki trend.
Untuk jumlah hidden neuron menurut Sun et
al(2008) ELM menghasilkan output peramalan yang
stabil dengan jumlah hidden neuron 0-30. Namun jika
output yang didapatkan dari ELM kurang optimal, maka
akan digunakan alternative fungsi transfer yang lain atau
merubah jumlah hidden neuron.
9. Testing ELM
Berdasarkan input weight dan output weight yang
didapatkan dari proses training, maka tahap selanjutnya
adalah melakukan peramalan dengan ELM. Data yang
digunakan adalah data testing sebanyak 20% dari data.
Pada tahap ini data input dinormalisasi terlebih dahulu
dengan range dan rumus normalisasi yang sama dengan
data training. Secara otomatis output dari proses ini juga
harus didenormalisasi.
10. Analisa Hasil Peramalan
Setelah melalui berbagai tahap seperti yang telah
dijabarkan di atas, maka didapatkan nilai peramalan
penjualan y i . Hasil yang didapatkan tersebut kemudian
dianalisa apakah memiliki tingkat kesalahan (MSE dan
MAPE)
yang kecil. Jika tingkat kesalahan yang
dihasilkan masih relatif besar, maka dievaluasi kembali
langkah-langkah yang telah dilakukan. Mulai dari proses
training,testing maupun predicting hingga hasil yang
didapatkan optimal. Berikut rumus matematis dari Mean
Square Error (MSE) dan Mean Absolut Precentage Error
(MAPE).
7. Menghitung input weight, bias of hidden neuron dan
output weight
Output dari proses pelatihan ELM adalah input
dan output weight serta bias dari hidden neuron dengan
tingkat kesalahan rendah yang diukur dengan MSE dan
MAPE. Input weight ditentukan secara random,
sedangkan output weight merupakan invers dari matrix
hidden layer dan output. Secara matematis dapat ditulis
sebagai berikut :
β = H ΤT
N
, b i ,..., b
g ( w 1• x 1 + b 1 )
=
M
g ( w 1• x N + b 1 )
β 1T
β = M
β NT
mse =
K
M
K
N
, x i ,...., x
(3)
(5)
T
N
N
⎛ yi − t i
⎝ yi
∑ ⎜⎜
i =1
data penjualan actual
⎞
⎟⎟(100 )
⎠
(8)
N = jumlah data
y i = data ouput (predicted sales)
t i = data penjualan actual
11. Membandingkan Hasil Peramalan ELM dengan hasil
peramalan MA dan ES.
Setelah analisis terhadap hasil ramalan metode ELM
dilakukan, maka akan diketahui nilai MSE danMAPE.
Langkah selanjutnya adalah membandingkan nilai MSE
dan MAPE tersebut dengan dua metode peramalan
konvensional yaitu Moving Average dan Exponential
Smoothing. Metode MA yang digunakan adalah Single
8. Denormalisasi Output
Output yang dihasilkan dari proses pelatihan
didenormalisasi, sehingga didapatkan predicted sales dari
data training. Berikut rumus denormaliasi yang
digunakan
X = 0.5× ( X p +1) × (max{X p } − min{X p }) + min{X p }
1
N
Dimana :
T
1
T = M
t
mape =
(7)
N = jumlah data
yi = data ouput (predicted sales)
ti =
)
g (w N • x1+b N )
M
g (w N • x N +b N )
t
(4)
N
1 N
∑ ( yi − ti )2
N i =1
Dimana :
(2)
H = ( w i ,..., w
p
(6)
4
Moving Average dua periode. Sedangkan untuk metode
ES menggunakan metode Single Exponential Smoothing.
Selain nilai MSE dan MAPE, plot data hasil ramalan
dari masing-masing metode juga diperbandingkan. Hal
ini dilakukan untuk mengetahui perbandingan tingkat
akurasi metode ELM dengan metode konvensional serta
performa dari ELM.
Bobot dan bias yang didapatkan pada proses
training akan digunakan sebagai parameter pada proses
testing. Hasil dari proses testing pada produk kaos
ditunjukkan pada gambar 6 pada produk kaos dan 7 pada
produk pin.
4. IMPLEMENTASI DAN HASIL
Pada tahap implementasi dilakukan uji coba dengan
menggunakan fungsi aktivasi sigmoid, tansig dan purelin
dengan jumlah hidden (1,3,5 dan 7). Fungsi sigmoid dan
tansig digunakan karena kedua fungsi aktivasi tersebut
merupakan fungsi aktivasi yangs sering digunakan
terutama untuk masalah peramalan. Sedangkan fungsi
aktivasi purelin digunakan karena data yang ada bersifat
stasioner.
Metode
ELM
pada
tugas
akhir
ini
diimplementasikan pada dua produk yaitu kaos dan pin.
Pada produk kaos hasil uji coba dengan fungsi aktivasi
dan jumlah hidden neuron yang berbeda kedua produk
menghasilkan bobot dan bias yang paling optimal pada
jumlah hidden neuron 5 pada aktivasi purelin. Sedangkan
pada produk pin hasil palng optimal pada fungsi aktivasi
purelin dengan jumlah hidden neuron 3.
Gambar 8 Grafik perbandingan data histori, hasil
peramalan MA, ES dan ELM untuk data kaos.
Gambar 9 Grafik perbandingan data histori, hasil
peramalan MA, ES dan ELM untuk data pin.
Gambar 6 Grafik perbandingan data histori dan
testing ELM pada data kaos
Tabel 1 Perbandingan nilai MSE dan MAPE antara
metode MA, ES dan ELM untuk data kaos
MA
ES
ELM
MSE
116.74
502.19
0.0481
MAPE
19.19
32.93
0.0042
Tabel 2 Perbandingan nilai MSE dan MAPE antara
metode MA, ES dan ELM untuk data pin
MA
ES
ELM
MSE
13.78
55.45
0.0023
MAPE
55.43
111.39
0.0095
Gambar 7 Grafik perbandingan data histori dan data
testing ELM
5
Hasil perbandingan testing ELM pada data kaos
dan data pin dengan hasil peramalan dengan metode
Moving Average dan Exponential Smoothing ditunjukkan
pada gambar 8 dan 9. Dari gambar tersebut dapat
diketahui bahwa ELM menghasilkan ramalan yang jauh
lebih baik dari metode konvensional yaitu Moving
Average dan Exponential Smoothing. Hal ini juga
diperkuat dengan perbandingan MSE dan MAPE dari
metode ELM, ES dan MA yang ditunjukkan pada tabel 1
dan 2.
5. KESIMPULAN
[6]
Huang, G.B., Zhu, Q.Y., dan Siew, C.K. 2005.
Extreme Learning Machine : Theory and
applications. Elsevier science : Neurocomputing
70 (2006) 489-501.
[7]
Makridakis, S., Wheelwright,S.C., dan McGee,
V.E. 1999. Metode dan Aplikasi Peramalan.
Jakarta : Erlangga.
[8]
Mitchel, T.M. 1997.
Singapura: McGraw-Hill.
[9]
Sun, Z.L., Choi, T.M., Au, K.F., dan Yu, Y. 2008.
Sales Forecasting using Extreme Learning
Machine with Application in Fashion Retailing.
Elsevier Decision Support Systems 46 (2008)
411-419.
[10]
Zhang, G., Pattuwo, B.E., dan Hu, M.Y. 1997.
Forecasting with Artificial Neural Networks : The
State of the Art. Elsevier International Journal
of Forecasting 14 (1998) 35-62.
Kesimpulan yang dapat diambil dari tugas akhir ini
adalah sebagai berikut :
y Berdasarkan hasil uji coba terhadap ELM dengan
fungsi aktivasi dan jumlah hidden neuron yang
berbeda, maka pada tugas akhir ini
ELM
menghasilkan output optimal pada fungsi aktivasi
purelin dengan jumlah hidden neuron lima untuk
data kaos, dan jumlah hidden neuron tiga untuk
data pin.
y ELM menghasilkan output peramalan dengan
tingkat kesalahan yang rendah yaitu MAPE
0.0042 % pada produk kaos dan 0.0095% pada
produk pin. Metode peramalan Moving Average
mempunyai tingkat kesalahan
19.19% pada
produk kaos dan 55.43% pada produk pin.
Sedangkan pada
Exponential Smoothing
mempunyai tingkat kesalahan 32.93% pada
produk kaos dan 111.39% pada produk pin.
y Training time atau learning speed yang
dibutuhkan oleh ELM sangat singkat, yaitu ratarata 0.0059 detik.
y Output dari ELM ditentukan oleh penentuan
parameter seperti fungsi aktivasi atau fungsi
transfer dan jumlah hidden neuron.
6. DAFTAR PUSTAKA
[1]
Abraham, A. 2004. Meta-Learning Evolutionary
Artificial Neural Networks. Elsevier science :
Neurocomputing Journal 56 c (2004). 1-38.
[2]
Barron, A.R. 1994. A comment on”Neural
network: A review form statistical perspective”.
Statistical Science 9 (1), 33-35.
[3]
Brockwell, P.J., dan Davis, R.A. 2002.
Introduction to Time Series and Forecasting.
Springer : New York.
[4]
Demuth, H.,dan Beale, M. 2000. Neural Network
Toolbox For Use with MATLAB. Massachusetts:
The MathWork Inc.
[5]
Huang, G.B., Zhu, Q.Y., dan Siew, C.K. 2004.
Extreme Learning Machine : A New Learning
Scheme of Feddforward neural Networks.
Proceeding of International Joint Conference
on Neural Networks. Hungary, 25-29 Juli.
6
Machine
learning.
Download