11_fel pendulum - Teknik Elektro – UM

advertisement
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
Sistem Kendali pada Pendulum Terbalik Menggunakan
Feedback Error Learning
Saida Ulfa
Jurusan Teknologi Pendidikan, Universitas Negeri Malang
Jl. Surabaya 6 Malang 65145 Indonesia
Email: [email protected]
Abstrak Pendulum terbalik merupakan salah satu contoh kasus sistem nonlinear yang sering
digunakan untuk menguji kehandalan sebuah sistem kendali. Posisi kesetimbangan pendulum ini
berada pada posisi tegak berlawanan arah grafitasi. Untuk menjaga pendulum berada pada posisi
kesetimbangannya, diperlukan sebuah sinyal kendali. Dalam makalah ini penulis menggunakan
teknik kendali feedback error learning (FEL). Konsep FEL ini mengadopsi sistem kendali pada otak
manusia. Teknik ini menggabungkan conventional feedback controller atau kendali umpan balik
konfensional dan feedforward controller atau kendali umpan maju. Umpan maju yang digunakan
disini, menggunakan model artificial neural network atau jaringan syaraf tiruan yang digunakan
untuk menghitung inverse model atau model balikan dari pendulum terbalik.
Kata Kunci: Feedback error learning, neural network, system nonlinear, pendulum terbalik
1. Pendahuluan
Pendulum terbalik adalah pendulum yang yang titik
beratnya berada diatas titik tumpunya sehingga
mempunyai kesetimbangan yang labil. Untuk
menjaga pendulum tetap berada pada posisi
kesetimbangannya, pada makalah ini digunakan
sebuah teknik kendali yang disebut Feedback Error
Learning (FEL).
Teknik FEL yang dikemukakan oleh
Kawato [1,2] adalah penggabungan pembelajaran
dan efesiensi kendali. Sistem kendali ini adalah
two degree of freedom (TDOF) control atau kendali
adaptif dua derajat kebebasan neural network
feedforward controller (NNFC) atau pengendali
umpan maju jaringan syaraf dan sebuah
conventional feedback controller (CFC) atau
kendali umpan balik konfensional.
NNFC
digunakan untuk memperoleh inverse model atau
nilai balikan
dari plant
atau objek yang
dikendalikan sedangkan CFC
digunakan untuk
menjamin kestabilan global asymptotic dan sebagai
sinyal error untuk NNFC [3,4]. Jika inverse model
diperoleh secara tepat, keluaran dari plant akan
menghitung sinyal referensi dengan menggunakan
umpan maju.
Sebuah sistem kendali dikatakan bagus
jika
telah dicoba dan dievaluasi oleh beberapa
teknik kendali yang berbeda, pada tulisan ini,
penulis membandingkan hasil kendali FEL dengan
CFC.
Pengujian dilakukan dengan menggunakan
graphical user interface (GUI) pada komputer yang
didisain menggunakan software Borland C++
Builder.
Garis besar dari makalah ini adalah: Pada
bab 2 dibahas pemodelan pendulum terbalik secara
fisik dan matematika. Inti dari system kendali FEL
yang digunakan akan dijelaskan pada bab 3. Hasil
pengujian dengan menggunakan FEL ditampilkan
pada bab 4 dan bab 5 merupakan kesimpulan dari
makalah ini.
2. Pemodelan Pendulum Terbalik
Sebuah sistem dikatakan nonlinear ketika
karakteristik dari sistem tersebut menggunakan
pemodelan
matematika
secara
nonlinear.
Pemodelan secara nonlinear digunakan untuk
menjelaskan sifat dan pola dari sistem yang di
modelkan.
2.1. Pemodelan Fisik
Sistem kendali terdiri atas sebuah plant atau objek
yang dikendali, controller atau pengendali dan
trainer atau pelatih yang saling berhubungan
sehingga membentuk sebuah loop umpan balik.
pengendali mempunyai parameter yang adaptif
seperti pembobotan yang terdapat pada NNFC.
NNFC akan memantau performa plant yang
nilainya ditentukan oleh nilai umpan balik system
sehingga mampu mengoptimasi pengendali yang
bertindak sebagai pengendali adaptif.
Seperti yang terlihat pada Gambar 1, servo
motor AC akan menjalankan kereta, sinyal kendali
pada servo motor AC ini harus diberikan secara
tepat karena akan mempengaruhi pergerakan
kereta yang turut mempengaruhi posisi sudut θ
pendulum.
Untuk mempertahankan pendulum pada
posisi tegak diperlukan sebuah control force f atau
gaya yang diberikan ke kereta untuk membawa
pendulum tersebut. Pendulum dikatakan berhasil
distabilkan ketika sudut θ pendulum kecil atau
bahkan mendekati nol, sin θ≈0 dan cos θ≈1.
A2-55
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
θ
r
komput
r
θ
V
2l, m
Servo
amplifi
f
I
M
AC servo motor
A2-56
fungsinya sebagai sebuah aproksimasi linear
untuk
inverse model dari plant. Fungsi dari
Feedfarward controller membuat nilai balikan dari
plant dengan mengurangi feedback error. Pada
teori FEL ini, feedback error sebagai sebuah
teaching signal pada proses pembelajaran untuk
model balikan plant.
Tujuan dari pengendalian sistem secara
umum adalah mengurangi nilai error e antara sinyal
masukan r dan sinyal keluaran y.
3.1 Pembelajaran on-line pada FEL
Pendulum dapat di kendalikan pada posisi tersebut
dan membuat kereta berada pada posisi acuan (r =
0) dengan menggunakan kendali umpan balik untuk
sistem linear. Akan tetapi, masalah akan timbul
ketika muncul viscous friction force yang tidak
diketahui antara rel dan kereta. Apalagi parameter
uncertain friction berubah bergantung pada arah
pergerakan kereta.
2.1 Pemodelan Matematika
Ketika parameter uncertain friction antara rel dan
kereta diperhitungkan, diperoleh persamaan linear
untuk pendulum terbalik sebagai berikut:
(M + m)
+
+ ml
Gambar 3: Skema sistem kendali FEL
= f – friction term , (1)
= gθ
(2)
dimana, r adalah kereta dari pusat rel, M dan m
adalah massa kereta dan pendulum, 2l adalah
panjang pendulum dan f adalah gaya yang
diberikan kepada kereta yang berasal dari servo
motor AC.
3. Disain Sistem Kendali FEL
Gambar 2 merupakan konsep dasar FEL yang
terdiri atas: linear feedback controller K atas CFC,
plant P atau objek, adaptive nonlinear feedfarwad
controller Q atau kendali umpan balik maju
nonlinear yang merupakan model balikan dari plant.
Gambar 3 merupakan skema FEL yang
menggunakan jaringan syaraf sebagai feedfarward
controller. Plant dikendalikan oleh CFC dan NNFC.
Pole placement regulator yang di adopsi dari CFC,
adalah
,
(3)
Dimana, nilai K = [ K1 K2 K3 K4] dan
x = [θ r
]. Feedback gain K berasal dari
persamaan (1) dengan mengabaikan istilah
nonlinear dan persamaan (2). Parameter K
diperoleh dengan menggunakan Matlab [6]:
K = [-5.6082 -5.3963 -0.8433 -2.4315]
(4)
Untuk memperbaiki kinerja CFC, NNFC
bertindak sebagai adaptive controller.
Neural
Network di update setiap satu kali putaran yang
bergantung pada waktu cuplik dari komputer.
Setiap satu kali proses pembelajaran disebut
epoch.
Waktu cuplik berkisar 20 ms yang
merupakan nilai standar untuk pengendalian pada
pendulum terbalik.
Learning law berasal dari metode gradient
descent dengan fungsi error [5] sebagai berikut:
Gambar 2: Konsep dasar FEL
Feedback controller tidak hanya menjamin
kestabilan sistem tetapi yang terpenting adalah
Dimana,
=
untuk
plant.
menghasilkan:
(5)
y
merupakan nilai masukan
Metode
gradient
descent
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
(6)
Hasil untuk tuning rule:
A2-57
h
1 L m
n

E = ∑∑ t kj − f 2  ∑wjs f1  ∑wsi xik 
2L k =1 j=1 
 i=1

 s=1
(9)
Perhitungan bobot
tersembunyi :
atau
(8)
merupakan keluaran dari neural network
yang akan dijelaskan lebih detail pada bagian
selanjutnya.
merupakan keluaran dari CFC
yang digunakan untuk sinyal error untuk neural
network. w(t) adalah bobot neural network yang
berisi parameter yang tidak diketahui yang akan di
update secara on-line pada setiap epoch.
Scaling factor (s.f) yang diberikan pada
masukan neural network, hal ini dikarenakan nilai
masukan sangat kecil sehingga nilai masukan di
. Nilai ini
tambah sampai mendekati
berhubungan dengan nilai maksimum fungsi bipolar
sigmoid sehingga membantu dalam proses
pembelajaran
untuk
lapisan
∂E
1 L
= − ∑ δ 2kq z rk
∂Wqr
L k =1
(10)
δ 2kq = (t qk − y qk ) f 2' (netqk )
(11)
Perhitungan
lapisan
tersembunyi :
masukan
ke
lapisan
8
6
4
Angle[deg]
(7)
keluaran
2
2
0
-2
-4
-6
4
6
8
10
12
14
16
18
20
Time[s]
3.1 Jaringan syaraf Tiruan
Pada makalah ini, penulis menggunakan model
jaringan syaraf tiruan berlapis banyak dengan
empat lapisan seperti pada Gambar 4. Pemilihan
jumlah neuron pada lapisan tersembunyi sangat
menentukan kemampuan dari sebuah jaringan
sayaraf tiruan.
Akan tetapi dalam sebuah
eksperimen, penulis tidak menemukan perbedaan
hasil yang mendasar antara 20 neuron dan 10
neuron pada lapisan tersebunyi. Oleh karena itu,
untuk lapisan masukan digunakan 4 neuron, 2
lapisan
tersembunyi
yang
masing-masing
menggunakan 10 neuron dan 2 lapisan keluaran
menggunakan masing-masing 1 neuron.
Gambar 5: Fungsi aktifasi
1 L
∂E
= − ∑ δ 1kq x rk
∂W qr
L k =1
(12)
dimana :
δ 1kq = f1' (net qk )∑ w jqδ 2k j
'
m
(13)
j =1
Untuk menghitung nilai bobot pada layar
tersembunyi, error pada lapisan keluaran
di
propagasi
balik
menggunakan
metode
backpropagation. Hasil dari propagasi balik akan
dibandingkan
dengan
sinyal
target
untuk
memperoleh nilai mean square error. Proses ini di
ulang untuk setiap sampel pada training set.
Gambar 6: Data pelatihan
Gambar 4: Jaringan syaraf tiruan dengan
banyak lapisan
Fungsi aktifasi yang digunakan adalah fungsi
sigmoid untuk lapisan tersembunyi dan fungsi
linear untuk lapisan keluaran seperti pada Gambar
5.
Untuk proses pembelajaran secara on-line,
jaringan syaraf di latih sebagai persiapan awal
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
A2-58
sehingga mempunyai fungsi yang sama dengan
CFC. Data yang digunakan adalah seperti yang
tampak pada Gambar 6 dibawah ini.
4. Hasil Pengujian
Hasil pengujian dengan menggunakan CFC seperti
pada Gambar 7 dan 8, nilai sudut θ mempunyai
nilai antara -5 sampai 5 derajat dan posisi kereta
berada pada jarak -0.06 sampai -0.06 m.
Berdasarkan
kedua data
yang diperoleh,
pendulum akan berada pada posisi tegak akan
tetapi mengalami vibrasi pada nilai tersebut.
Untuk memperbaiki performa dari sistem
kendali dengan menggunakan CFC,
P e n d u l u m 's P o s it i o n
0.2
0.15
Position[m]
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
Gambar 10: Keluaran FEL berupa sudut pendulum
0
1000
2000
3000
4000
5000
6000
7000
8000
FEL diterapkan untuk mencapai hasil yang
maksimal seperti yang tampak pada Gambar Pada
Gambar 9 dan 10 , tampak pada iterasi 8500 nilai
sudut θ dan jarak kereta terhadap posisi acuan
mencapai stabil. Berdasarkan data ini, pendulum
akan stabil pada posisi tegak tanpa mengalami
vibrasi. Akan tetapi pada iterasi diatas 8500, kereta
dan pendulum akan mengalami vibrasi lagi
kemudian akan stabil pada iterasi diatas 10.500.
Hal ini diakibatkan adanya gaya gesek antara rel
dan kereta.
It e r at i o n s
Gambar 7: Keluaran CFC berupa posisi kereta
8
6
Angle[deg]
4
2
0
-2
-4
-6
1000
2000
3000
4000
5000
6000
7000
8000
9000
Iterations
Gambar 8: Keluaran CFC berupa sudut pendulum
Gambar 9: Keluaran FEL berupa posisi kereta
5. Kesimpulan
Konsep
feedback
error
learning
(FEL)
mengadaptasi cara kerja motorik pada otak
manusia. Pada sistem kendali, teknik FEL
diaplikasikan pada sistem nonlinear. Dengan hanya
menggunakan CFC, pendulum dapat berada pada
posisi tegak namun tidak stabil pada posisi
tersebut. Pendulum mengalami vibrasi:
kereta
akan bergerak pada jarak -0.06 sampai 0.06 meter
dan sudut θ pendulum bergerak pada kisaran -5
sampai 5 derajat.
Nilai vibrasi kereta terhadap jarak acuan (r
= 0) dan sudut θ pendulum dapat diperkecil hingga
mendekati nol dengan cara menggunakan konsep
FEL, teknik ini menggabungkan
feedback
controller atau
kendali umpan balik dan
feedforward controller atau kendali umpan maju.
Pada umpan maju digunakan jaringan syaraf tiruan
untuk menghitung nilai model balikan dari objek
yang dikendalikan.
Daftar Pustaka
[1] Kawato M., Furakawa K., Suzuki R., :“A
Hierarchial Neural Network Models and
Learning Voluntary Movements”, Biol.,
Cybernet. 57, pp. 169-185, 1987.
[2] Kawato M.,: “Feedback Error Learning
Neural Network for Supervised Motor
Learning”, Advanced Neural Computers/ R.
Eckmiller (Ed), Neural Network for Sensory
and Motor Systems, North-Holland, pp.
365-372, 1990
[3] Gomi H., Kawato M.,: “Neural Network
Control for a Clossed-Loop System Using
Feedback Error Learning” Neural Networks
Vol. 6, pp. 933-946, 1993.
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
[4] Areolino et,al: “Feedback Error Learning for
Controlling a Flexible Link”, Proc. Of the
Sixth Brazilian Symposium on Neural
Networks, IEEE, 2000.
[5] Miyamura A., Kimura H.,:”Stability of
Feedback
Error
Learning
Scheme",
Systems & Control Letters, 45, pp.303316,2002.
[6] Jinnai K.,: “A study of Double Inverted
Pendulum System”, Master Thesis of Saga
University, Faculty of Culture and
Education,
Technology
Education
Department, 2002.
A2-59
Download