BAB II LANDASAN TEORI

advertisement
BAB II
LANDASAN TEORI
II.1 Data Time Series Finansial
Data time series financial adalah sequence/deret nilai harga dari aset finansial
pada suatu periode waktu tertentu[36]. Dalam tesis ini berfokus pada data time
series yang merepresentasikan deret nilai harga saham. Saham merupakan
sertifikat yang menunjukkan bukti kepemilikan suatu perusahaan, dan pemegang
saham memiliki hak klaim atas penghasilan dan aktiva perusahaan[28]. Lebih dari
puluhan tahun, penelitian untuk menyelesaikan permasalahan dalam bidang pasar
saham telah dilakukan. Penelitian tersebut memiliki satu tujuan yaitu
mengembangkan suatu tool agar mendapatkan keuntungan sebesar-besarnya pada
perdagangan saham. Keuntungan ini kemungkinan dapat diperoleh jika memiliki
analisa atau prediksi yang tepat terhadap pergerakan harga saham.
Data time series dapat dinotasikan sebagai sebuah vektor
x = {xt, t=1,...,n}, dengan
x merupakan data observasi yang terurut berdasarkan waktu, t adalah indeks
waktu, dan n adalah jumlah observasi/pengamatan. Pada data harga saham,
observasi dapat dilakukan berdasarkan harga sesi pembukaan (open) atau
penutupan (close), harga tertinggi atau terendah, volume perdagangan dan return
dari harga saham. Pada satu periode, return Rt dari data time series financial
dihitung dengan formula sebagai berikut :
Rt =
Pt − Pt −1
*100%
Pt −1
(2.1)
dengan Pt merupakan harga dari satu jenis saham pada indek waktu t .
Prediksi pada domain time series financial khususnya harga saham memiliki
tingkat kesulitan yang tinggi, karena beberapa alasan berikut ini
6
1. data time series financial sering berperilaku mendekati random,
2. data time series financial banyak mengandung noisy, unpredictable
dengan variasi tiap harinya,
3. banyak faktor yang mempengaruhi pergerakan harga saham.
Sifat noisy pada data time series financial membuat sulit untuk membedakan
algoritma prediksi yang baik dengan yang buruk, karena bahkan random predictor
dapat menghasilkan hasil prediksi yang bagus[18]. Walaupun demikian, layaknya
obor untuk penerangan sewaktu berjalan di tengah hutan belantara, walaupun
tidak dapat menunjukkan secara tepat kemana harus melangkah keluar hutan,
tetap saja obor tersebut sangat membantu dalam perjalanan. Gambar di bawah ini
merupakan beberapa contoh yang menggambarkan fluktuatifnya pergerakan harga
saham.
Gambar II.1 Pergerakan saham pada index Dow Jones dari tanggal 3 Desember
1962 sampai 31 Desember 1986 (diambil dari[11]) .
7
Gambar II.2 Pergerakan saham yang memperlihatkan peristiwa “black Monday”
(19 Oktober 1987) pada index Dow Jones (diambil dari[11]).
II.1.1 Faktor yang Mempengaruhi Pergerakan Harga Saham
Perubahan harga suatu saham ditentukan oleh hukum supply dan demand. Harga P
dari suatu produk ditentukan oleh keseimbangan antara penawaran (supply) dan
permintaan (demand), sebagaimana ilustrasi gambar di bawah. Dalam bidang
ekonomi, supply dan demand menggambarkan relasi pasar yaitu antara prospektif
penjual dan pembeli terhadap suatu barang. Model supply dan demand ini
menentukan harga dan kuantitas penjualan dalam pasar.
Gambar II.3 Grafik Keseimbangan antara supply dan demand.
8
Pada harga Pt, banyaknya jumlah barang yang ditawarkan oleh produsen sebesar
Qte, akan tetapi konsumen hanya sanggup membeli sebanyak Qt. Besarnya
penawaran ini menyebabkan harga cenderung turun sampai pada dimana produsen
tidak merasa rugi yaitu di Pe. Pada harga Pe jumlah yang tersedia dibeli oleh
konsumen sebanyak Qe dan jumlah sama dengan kesediaan produsen melepaskan
barangnya.
Bentuk keseimbangan lainnya dijelaskan bahwa ketika permintaan bertambah
pada harga tertentu atau disebut sebagai increase in demand (lihat Gambar II.4)
yaitu dari kurva D1 ke D2. Sebagaimana terlihat pada gambar tersebut, kenaikan
permintaan ini memberikan perubahan kenaikan pada equilibrium price dari P1 ke
P2 dan equilibrium quantity dari Q1 ke Q2.
Gambar II.4 Grafik kondisi increase in demand.
Pada kasus lain, ketika supply mengalami peningkatan atau disebut sebagai
increase in supply (lihat Gambar II.5) yaitu dari kurva S1 ke S2, maka akan
memberikan efek perubahan pada penurunan equilibrium pada harga dan kenaikan
equilibrium pada quantity sebagaimana terlihat pada Gambar di bawah ini.
9
Gambar II.5 Grafik kondisi increase in supply.
Setelah mengetahui faktor yang mempengaruhi perubahan harga saham,
pertanyaan selanjutnya yang muncul adalah faktor apakah yang mempengaruhi
keseimbangan supply dan demand pada harga saham. Supply dan demand pada
suatu harga barang dipengaruhi oleh psikologi pasar. Ketika banyak orang berfikir
bahwa perusahaan A memberikan keuntungan besar sehingga orang-orang
tersebut melakukan transaksi membeli saham A, maka sesuai dengan hukum
supply dan demand akan memberikan kenaikan equilibrium pada harga.
Pertanyaan selanjutnya adalah faktor apa saja yang menentukan psikologi pasar
pada perdagangan harga saham? Faktor-faktor inilah yang selama ini dikaji oleh
banyak peneliti. Menurut penelitian yang dilakukan oleh David M. Cutler, James
M. Poterba, dan Lawrence H. Summers[11], faktor yang mempengaruhi pergerakan
saham dibagi dalam 2 aspek yaitu aspek performa makroekonomi dan non
ekonomi. Faktor ekonomi karena aktifitas makroekonomi yang mempengaruhi
pergerakan saham antara lain: pembagian deviden, produksi/kapasitas industri,
pemasukan modal (real money supply), bunga bank, tingkat inflasi, dan tingkat
fluktuatif indeks harga suatu jenis saham. Sedangkan contoh faktor non ekonomi
10
antara lain: kebijakan politik, kondisi politik, kejadian internasional (pemilihan
presiden, perang, dan lain-lain), sifat industri yang berubah sesuai musim (industri
agrobisnis), dan berita-berita penting lainnya. Sedangkan menurut analisa Roll[27]
bahwa fluktuasi harga saham agrobisnis juga dipengaruhi oleh kondisi cuaca atau
musim. Faktor lain yang sangat mempengaruhi pergerakan harga saham adalah
harga minyak dunia[13]. Faktor harga minyak sangat mempengaruhi pergerakan
harga saham untuk beberapa sektor bisnis misalkan bisnis produk logam,
transportasi, mesin dan peralatan.
Penelitian yang dilakukan oleh David M. Cutler, James M. Poterba, dan Lawrence
H. Summers[11] ini juga mengemukakan pengaruh faktor non ekonomi/berita
peristiwa terhadap pergerakan harga saham, misalkan pada tanggal 22 Oktober
1987, terjadi penurunan 3.92% pada index S&P karena penyerangan Iran ke
stasiun minyak di Kuwait. Contoh-contoh lain pengaruh aktifitas nonekonomi
terhadap pergerakan harga saham yang diambil dari makalah David M. Cutler,
James M. Poterba, dan Lawrence H. Summers dapat dilihat pada tabel II.1.
Walaupun
dapat
diketahui
bahwa
berita/peristiwa
non
ekonomi
juga
mempengaruhi pergerakan harga saham, akan tetapi sangat sulit untuk
menentukan tingkat pengaruhnya terhadap harga saham.
Tabel II.1 Pengaruh aktifitas non ekonomi terhadap pergerakan index S&P, 19411987 (diambil dari[11]).
No.
Event (Aktifitas nonekonomi)
Tanggal
1.
2.
Bom Jepang di Pearl Harbor
Bom atom dijatuhkan di Jepang:
Bom Hiroshima
Bom Nagasaki
Kemenangan Truman terhadap
Dewey
Pembunuhan Kennedy
Pecahnya perang Korea
Eisenhower mengalami serangan
jantung
Serangan Iran terhadap terminal
minyak Kuwait
8 Des. 1941
Prosentase
Perubahan
-4.37%
6 Agustus 1945
9 Agustus 1945
3 Nov. 1948
0.27%
1.65%
-4.61%
22 Nov. 1963
26 Juni 1950
26 Sept. 1955
-2.81%
-5.38%
-6.62%
22 Okt. 1987
-3.92%
3.
4.
5.
6.
7.
11
Berikut ini dipaparkan beberapa terminologi makroekonomi dan alat ukur kondisi
perusahaan yang mempengaruhi pergerakan harga saham.
1. Inflasi merupakan proses kenaikan harga-harga umum secara terusmenerus[19]. Sedangkan kebalikan dari inflasi adalah deflasi, yaitu
penurunan harga secara terus menerus, akibatnya daya beli masyarakat
bertambah besar. Angka inflasi dihitung berdasarkan angka indeks yang
dikumpulkan dari beberapa macam barang yang diperjualbelikan di pasar
dengan
masing-masing
tingkat
harga.
Angka
indeks
yang
memperhitungkan semua barang yang dibeli oleh konsumen pada masingmasing harganya disebut sebagai Indeks Harga Konsumen ( IHK atau
Consumer Price Index = CPI). Adapun rumus untuk menghitung tingkat
inflasi adalah:
Inf =
IHK n − IHK n −1
*100%
IHK n −1
(2.2)
Dengan Inf adalah tingkat inflasi.
Untuk mendapatkan inflasi pada tiap bulannya, dapat dilihat dari hasil
penelitian Badan Pusat Statistik (BPS).
2. Suku bunga bank merupakan imbal jasa atas pinjaman uang. Imbal jasa ini
merupakan suatu kompensasi kepada pemberi pinjaman atas manfaat ke
depan dari uang pinjaman tersebut apabila diinvestasikan. Jumlah
pinjaman tersebut disebut "pokok utang" (principal). Prosentasi dari pokok
utang yang dibayarkan sebagai imbal jasa (bunga) dalam suatu periode
tertentu disebut "suku bunga". Di Indonesia, besaran suku bunga
ditentukan oleh Bank Indonesia.
3. Money supply merupakan total jumlah uang yang dipegang oleh suatu
perusahaan pada satu waktu tertentu.
4. Produksi/kapasitas industri merupakan total jumlah barang yang
diproduksi pada satu waktu tertentu.
5. Deviden yield ( DY ) yaitu untuk mengukur jumlah deviden per saham
relatif terhadap harga pasar yang dinyatakan dalam bentuk prosentasi:
12
DY =
DPS
Ps
(2.3)
Dengan:
DPS = Devidend per Share (Deviden per Saham)
Ps = Market Price (Harga Pasar)
6. Devidend Per Share ( DPS ) merupakan total deviden yang dibagikan pada
tahun buku sebelumnya, baik deviden interim, deviden final maupun
deviden saham.
DPS =
Dividend
Ss
(2.4)
Dengan:
Ss = Total outstanding share (Total saham yang diterbitkan).
7. Earning per Share ( EPS ) yaitu menggambarkan jumlah laba bersih
setelah pajak pada satu tahun buku yang dihasilkan untuk setiap lembar
saham. EPS dirumuskan sebagai berikut:
EPS =
Laba Bersih
Jumlah Saham yang beredar
(2.5)
8. Price Earning Ratio ( PER ) yaitu menunjukkan apresiasi pasar terhadap
kemampuan emitten, dalam menghasilkan laba, semakin kecil rasio,
semakin bagus. PER dirumuskan sebagai berikut:
PER =
h arg a Saham
EPS
(2.6)
II.1.2 Efficient Market Hypothesis
Konsep efficient market hypothesis dikembangkan pada tahun 1965 oleh Fama[15].
Efficient market hypothesis menyatakan bahwa harga pasar saat ini merefeksikan
asimilasi dari semua informasi yang ada. Berdasarkan dari tipe informasi yang
digunakan/dipertimbangkan, terdapat tiga bentuk dari EMH[18]
1. weak form yaitu hanya harga saham yang lampau yang menjadi bahan
pertimbangan dalam memprediksi,
13
2. semi
strong
form
yaitu
semua
informasi
publik
diperhitungkan/dipertimbangkan dalam melakukan prediksi,
3. strong form yaitu semua informasi baik publik maupun prifat
diperhitungkan/dipertimbangkan dalam melakukan prediksi.
Dari hipotesa ini dapat disimpulkan suatu pasar dikatakan efisien jika dalam pasar
tersebut, pergerakan harga saham tidak hanya dipengaruhi oleh para spekulan tapi
berdasarkan kondisi makroekonomi, kondisi perusahaan, dan lain - lain.
II.1.3 Jenis prediksi berdasarkan penggunaan datanya
Seperti yang telah dijelaskan sebelumnya, terdapat dua tipe data yang dapat
digunakan untuk memprediksi harga yaitu
1. data teknis. Data ini seperti data harga saham yang lampau, volume
perdagangan, fluktuatif saham, atau harga saham tertinggi. Istilah data
time series financial sendiri merupakan istilah untuk data teknis secara
time series,
2. data fundamental. Data ini meliputi data yang menggambarkan
makroekonomi
(inflasi,
suku
bunga,
dan
lain-lain),
kondisi
perusahaan/industri, dan alat ukur kondisi perusahaan (P/E, net profit
margin, dan lain-lain).
Banyak penelitian menggunakan data teknis dibandingkan data fundamental
karena lebih mudah untuk diperoleh dan menurut teori efficient market hypothesis
bahwa harga saham masa lampau telah merepresentasikan kondisi saat itu.
II.2 Data Mining - Pattern Matching and Classification
Data mining merupakan analisa data dengan tujuan menyingkap pola yang
tersembunyi[30,
sebelumnya
33]
. Analisa pada data mining ini melibatkan historis data-data
untuk
dilakukan
proses
seperti
pencarian
pola
tertentu,
pengelompokan, proses clustering, dan lain-lain.
Berikut ini langkah-langkah proses data mining (sebagaimana diilustrasikan pada
Gambar II.6).
14
1. Mengembangkan dan memahami domain aplikasi, pengetahuan yang
relevan, dan mengindentifikasi tujuan proses data mining.
2. Membuat data target.
3. Data cleaning dan preprocessing, yaitu menghilangkan noise dan
menangani data yang hilang.
4. Pengurangan data dan projection yaitu menemukan fitur yang berguna
yang merepresentasikan bahwa data bergantung pada tujuan proses.
5. Mencocokkan tujuan dengan metoda data mining. Tujuan data mining
dicapai melalui metoda sebagai berikut :
-
clustering,
melakukan
identifikasi
kategori
untuk
mendeskripsikan data,
-
classification, melakukan pengelompokan berdasarkan kategori
yang telah ditentukan sebelumnya.
Gambar II.6 Langkah – langkah proses data mining (diambil dari[1]).
Pada penelitian ini, proses data mining yang diimplementasikan difokuskan pada
pencocokkan/kesamaan pola dari data time series.
Menemukan kesamaan pola dari sebuah data time series (data terurut) terhadap
suatu contoh pola yang diberikan disebut juga sebagai similar sequence
matching[35]. Kajian untuk menyelesaikan masalah ini dapat dilihat pada makalah
15
yang ditulis oleh Agrawal dengan metode Discrete Fourier Transform (DFT)[25],
Faloutsos, dan kawan-kawan menyusulkan metoda subsequence matching yang
kemudian diperbaruhi dengan metoda Dual Match[10], Keogh, dan kawan-kawan
dengan pendekatan probabilistik[22], Yang-Sae Moon menemukan metoda general
match[37]. Metoda-metoda tersebut menggunakan model pengukuran kesamaan
berdasarkan jarak Euclidean[10, 22, 25, 37] yaitu misalkan terdapat vector/sequence X
= {X[1],…,X[n]} dan Y = {Y[1],…,Y[n]} dengan panjang sama, dikatakan
similar/sama jika jarak Euclidean D(X,Y) ( =
∑ ( x[i] − y[i])
2
) kurang dari atau
sama dengan ε (toleransi yang diberikan oleh user). Atau bisa kita definisikan
bahwa dua deret data X dan Y adalah ε-match jika D(X,Y) ≤ ε.
Similar sequence matching(SSM) dapat dikelompokkan dalam dua kategori[10]
yaitu
•
whole matching, diberikan N data sequence S1,…,SN, sebuah query
sequence Q, dan nilai toleran e, dan kemudian ditemukan bahwa data
sequence tersebut adalah e-match dengan Q dimana data dan query
sequence memiliki panjang yang sama,
•
subsequence matching, diberikan N data sequence S1,…SN dengan
berbagai variasi panjang, sebuah query sequence Q, dan toleran e, dan
kemudian ditemukan semua sequence S, satu atau lebih dari satu sequence
yang e-match dengan Q.
Dari pengelompokan ini terlihat bahwa subsequence matching merupakan
generalisasi dari whole matching.
Berikutnya akan dipaparkan secara sederhana dari konsep similar sequence
matching.
Metoda Similar Sequence Matching
J-Sliding Windows
Metoda ini membagi data sequence kedalam j-sliding window yang didefinisikan
sebagai berikut.
16
Definisi: Sebuah J-sliding window(1≤J≤ω) siJ dengan ukuran ω dari sequence S
didefinisikan sebagai subsequence panjang ω dimulai dari
S[(i - 1)*J + 1] (1 ≤ i ≤
Len( s ) − ω
+ 1).
J
Contoh : Pada gambar berikut ini menunjukkan contoh pembagian sequence S ke
dalam 4-sliding windows (J = 4) dengan panjang ω = 16.
Gambar II.7 Contoh pembagian sequence S.
Dari gambar diatas, terlihat bahwa dengan panjang subsequence 16 dan J = 4,
maka subsequence diawali pada S[1], S[5], S[9],…
Lemma : Jika sequence S dibagi kedalam J-Sliding window, J-sliding window
yang pertama termasuk dalam subsequence S[i :j] adalah J-sliding window ke
⎛ ⎡ i − 1⎤ ⎞
⎜ ⎢ J ⎥ + 1⎟ dari S.
⎥ ⎠
⎝⎢
Didefinsikan sebuah vektor Q (oleh Yang Sae Moon dinamakan sebagai query
sequence[35]) sebagai sampel pola dengan panjang sequence Len(Q) = ω.
Misalkan data sequence S dibagi dalam J-Sliding Window dengan ukuran ω, dan
sampel pola Q memiliki ukuran yang sama yaitu ω. Maka subsequence S[i:j]
dikatakan ε-match Q jika D(S[i : j], Q) ≤ ε.
II.3 Metoda Ant Colony
Artificial ant system terinspirasi oleh tingkah laku koloni semut dan merupakan
konsep baru dalam artificial intelligence, yang disebut sebagai swarm
intelligence[9]. Istilah “swarm intelligence” pertama kali digunakan oleh Beni,
17
Hackwood, dan Wang
[4, 5, 6, 7, 16, 17]
dalam konteks sistem robot selular, dimana
banyak agen sederhana yang berkerja pada lingkungan berdimensi satu atau dua
untuk mendapatkan pola melalui interaksi satu sama lain yang berdekatan.
Algoritma Ant Colony pertama kali dipaparkan pada tahun 1992 oleh Marco
Dorigo[24]. Ant colony system merupakan model perilaku semut yang diketahui
dapat menemukan jarak terpendek antara sarang dan sumber makanan mereka.
Meskipun setiap individu semut bergerak secara quasi random, melakukan
pekerjaan yang sederhana, akan tetapi dalam suatu koloni, semut dapat melakukan
pergerakan dengan pola tertentu. Setiap pergerakan, semut mengeluarkan zat
kimia yang disebut sebagai pheromone. Zat kimia inilah yang dideteksi dan
digunakan sebagai alat komunikasi tidak langsung oleh semut lain. Pada gambar
berikut ini mengilustrasikan bagaimana semut dapat menemukan jarak terpendek
antara sarang dan makanan[8].
Gambar II.8 Dua Percobaan a) Pada permulaan percobaan. b) pada waktu
selanjutnya.
Pada intinya, desain dari ant system menyatakan spesifikasi dari aspek berikut ini
-
suatu
lingkungan
yang
merepresentasikan
domain
permasalahan,
-
suatu permasalahan yang bergantung pada fungsi evaluasi
heuristic (η), yang merepresentasikan sebuah faktor kuantitas
untuk solusi yang berbeda,
-
suatu
rule
untuk
update
pheromone
(τ),
yang
merepresentasikan evaporation dan reinforcement dari trails,
18
-
suatu probabilistic transition rule berdasarkan nilai dari fungsi
heuristic dan penguatan pheromone trail (τ) yang digunakan
secara iteratif mengkonstruksi sebuah solusi,
spesifikasi yang jelas kapan algoritma menuju konvergen ke
-
suatu solusi.
Berikut ini dipaparkan algoritma umum dan flow chart dari Ant System untuk
implementasi pada Travel Salesman Problem (TSP)[8].
/* Inisialisasi*/
For every edge(I,j) do
τ ij (0) = τ o
End for
For k=1 to m do
Place ant k on a randomly chosen city
End For
+
+
Let T be the shortest tour found from beginning and L its length
/*main loop*/
For t = 1 to tmax do
For k = 1 to m do
Build tour Tk(t) by applying n – 1 times the following step:
Choose the next city j with probability
α
P (t ) =
k
ij
⎡⎣τ ij (t ) ⎤⎦ . ⎡⎣ηij ⎤⎦
∑
α
l∈J ik
β
⎡⎣τ ij (t ) ⎤⎦ . ⎡⎣ηij ⎤⎦
β
,
Where i is the current city
End For
For k = 1 to m do
Compute the length Lk(t) of the tour Tk(t) produced by ant k
End For
If an improved tour is found then
Update T+ and L+
End if
For every edge (i,j) do
Update pheromone trails by applying the rule:
τ ij (t ) ← (1 − ρ ).τ ij (t ) + Δτ ij (t ) + e.Δτ ije (t ) where
19
m
Δτ ij (t ) = ∑ Δτ ijk (t ),
k =1
⎧Q / Lk (t ) if (i, j ) ∈ T k (t );⎫
⎧Q / L+ (t ) if (i, j ) ∈ T + ;⎫
e
and
Δτ ijk (t ) = ⎨
Δ
=
(
t
)
τ
⎨
⎬
⎬
ij
0 otherwise
0 otherwise
⎩
⎭
⎩
⎭
End For
For every edge (i,j) do
τ ij (t + 1) = τ ij (t )
End For
End For
Print the shortest tour T+ and its length L+
Stop
Gambar II.9 Flow chart secara umum untuk Algoritma Ant System.
II.4 Pengukuran Akurasi Prediksi
II.4.1 Mean Absolute Deviation (MAD)
Mean absolute deviation (MAD) mengukur akurasi hasil prediksi dengan me-ratarata error prediksi pada setiap percobaan. Jika nilai sebenarnya pada waktu ke – t
dinotasikan sebagai x(t ) dan hasil prediksinya dinotasikan sebagai x '(t ) , error
atau selisih prediksi diperoleh sebagai e(t ) = x(t ) − x '(t ) . Maka formula MAD
adalah[14]
MAD =
∑ x(t ) − x '(t ) = ∑ e(t ) ,
N
N
(2.7)
20
Dengan N adalah banyaknya records atau pengujian.
II.4.2 Mean Square Error (MSE) dan Root Mean Square Error (RMSE)
Pengukuran akurasi prediksi dengan Mean Square Error (MSE) hampir sama
dengan MAD. Pada MSE tidak menggunakan harga mutlak (absolute) pada error
prediksi, tetapi menggunakan nilai pangkat dua (square). Keuntungan penggunaan
pangkat dua adalah nilai error prediksi yang diperoleh lebih besar dibandingkan
dengan nilai absolute. Formula MSE adalah sebagai berikut:
∑ ( x(t ) − x '(t ))
MSE =
N
2
∑ e(t )
=
2
(2.8)
N
Sedangkan formula Root Mean Square Error (RMSE) adalah sebagai berikut:
RMSE = MSE
(2.9)
II.4.3 Percent Error
Pengukuran akurasi dengan percent error bertujuan untuk mengetahui prosentase
galat antara nilai sebenarnya dengan nilai hasil simulasi. Formula percent error
adalah sebagai berikut:
e=
⎛ x(t ) − x '(t ) ⎞
⎟ *100%
x(t )
⎝
⎠
N
∑ abs ⎜
(2.10)
21
Download