BAB II LANDASAN TEORI II.1 Data Time Series Finansial Data time series financial adalah sequence/deret nilai harga dari aset finansial pada suatu periode waktu tertentu[36]. Dalam tesis ini berfokus pada data time series yang merepresentasikan deret nilai harga saham. Saham merupakan sertifikat yang menunjukkan bukti kepemilikan suatu perusahaan, dan pemegang saham memiliki hak klaim atas penghasilan dan aktiva perusahaan[28]. Lebih dari puluhan tahun, penelitian untuk menyelesaikan permasalahan dalam bidang pasar saham telah dilakukan. Penelitian tersebut memiliki satu tujuan yaitu mengembangkan suatu tool agar mendapatkan keuntungan sebesar-besarnya pada perdagangan saham. Keuntungan ini kemungkinan dapat diperoleh jika memiliki analisa atau prediksi yang tepat terhadap pergerakan harga saham. Data time series dapat dinotasikan sebagai sebuah vektor x = {xt, t=1,...,n}, dengan x merupakan data observasi yang terurut berdasarkan waktu, t adalah indeks waktu, dan n adalah jumlah observasi/pengamatan. Pada data harga saham, observasi dapat dilakukan berdasarkan harga sesi pembukaan (open) atau penutupan (close), harga tertinggi atau terendah, volume perdagangan dan return dari harga saham. Pada satu periode, return Rt dari data time series financial dihitung dengan formula sebagai berikut : Rt = Pt − Pt −1 *100% Pt −1 (2.1) dengan Pt merupakan harga dari satu jenis saham pada indek waktu t . Prediksi pada domain time series financial khususnya harga saham memiliki tingkat kesulitan yang tinggi, karena beberapa alasan berikut ini 6 1. data time series financial sering berperilaku mendekati random, 2. data time series financial banyak mengandung noisy, unpredictable dengan variasi tiap harinya, 3. banyak faktor yang mempengaruhi pergerakan harga saham. Sifat noisy pada data time series financial membuat sulit untuk membedakan algoritma prediksi yang baik dengan yang buruk, karena bahkan random predictor dapat menghasilkan hasil prediksi yang bagus[18]. Walaupun demikian, layaknya obor untuk penerangan sewaktu berjalan di tengah hutan belantara, walaupun tidak dapat menunjukkan secara tepat kemana harus melangkah keluar hutan, tetap saja obor tersebut sangat membantu dalam perjalanan. Gambar di bawah ini merupakan beberapa contoh yang menggambarkan fluktuatifnya pergerakan harga saham. Gambar II.1 Pergerakan saham pada index Dow Jones dari tanggal 3 Desember 1962 sampai 31 Desember 1986 (diambil dari[11]) . 7 Gambar II.2 Pergerakan saham yang memperlihatkan peristiwa “black Monday” (19 Oktober 1987) pada index Dow Jones (diambil dari[11]). II.1.1 Faktor yang Mempengaruhi Pergerakan Harga Saham Perubahan harga suatu saham ditentukan oleh hukum supply dan demand. Harga P dari suatu produk ditentukan oleh keseimbangan antara penawaran (supply) dan permintaan (demand), sebagaimana ilustrasi gambar di bawah. Dalam bidang ekonomi, supply dan demand menggambarkan relasi pasar yaitu antara prospektif penjual dan pembeli terhadap suatu barang. Model supply dan demand ini menentukan harga dan kuantitas penjualan dalam pasar. Gambar II.3 Grafik Keseimbangan antara supply dan demand. 8 Pada harga Pt, banyaknya jumlah barang yang ditawarkan oleh produsen sebesar Qte, akan tetapi konsumen hanya sanggup membeli sebanyak Qt. Besarnya penawaran ini menyebabkan harga cenderung turun sampai pada dimana produsen tidak merasa rugi yaitu di Pe. Pada harga Pe jumlah yang tersedia dibeli oleh konsumen sebanyak Qe dan jumlah sama dengan kesediaan produsen melepaskan barangnya. Bentuk keseimbangan lainnya dijelaskan bahwa ketika permintaan bertambah pada harga tertentu atau disebut sebagai increase in demand (lihat Gambar II.4) yaitu dari kurva D1 ke D2. Sebagaimana terlihat pada gambar tersebut, kenaikan permintaan ini memberikan perubahan kenaikan pada equilibrium price dari P1 ke P2 dan equilibrium quantity dari Q1 ke Q2. Gambar II.4 Grafik kondisi increase in demand. Pada kasus lain, ketika supply mengalami peningkatan atau disebut sebagai increase in supply (lihat Gambar II.5) yaitu dari kurva S1 ke S2, maka akan memberikan efek perubahan pada penurunan equilibrium pada harga dan kenaikan equilibrium pada quantity sebagaimana terlihat pada Gambar di bawah ini. 9 Gambar II.5 Grafik kondisi increase in supply. Setelah mengetahui faktor yang mempengaruhi perubahan harga saham, pertanyaan selanjutnya yang muncul adalah faktor apakah yang mempengaruhi keseimbangan supply dan demand pada harga saham. Supply dan demand pada suatu harga barang dipengaruhi oleh psikologi pasar. Ketika banyak orang berfikir bahwa perusahaan A memberikan keuntungan besar sehingga orang-orang tersebut melakukan transaksi membeli saham A, maka sesuai dengan hukum supply dan demand akan memberikan kenaikan equilibrium pada harga. Pertanyaan selanjutnya adalah faktor apa saja yang menentukan psikologi pasar pada perdagangan harga saham? Faktor-faktor inilah yang selama ini dikaji oleh banyak peneliti. Menurut penelitian yang dilakukan oleh David M. Cutler, James M. Poterba, dan Lawrence H. Summers[11], faktor yang mempengaruhi pergerakan saham dibagi dalam 2 aspek yaitu aspek performa makroekonomi dan non ekonomi. Faktor ekonomi karena aktifitas makroekonomi yang mempengaruhi pergerakan saham antara lain: pembagian deviden, produksi/kapasitas industri, pemasukan modal (real money supply), bunga bank, tingkat inflasi, dan tingkat fluktuatif indeks harga suatu jenis saham. Sedangkan contoh faktor non ekonomi 10 antara lain: kebijakan politik, kondisi politik, kejadian internasional (pemilihan presiden, perang, dan lain-lain), sifat industri yang berubah sesuai musim (industri agrobisnis), dan berita-berita penting lainnya. Sedangkan menurut analisa Roll[27] bahwa fluktuasi harga saham agrobisnis juga dipengaruhi oleh kondisi cuaca atau musim. Faktor lain yang sangat mempengaruhi pergerakan harga saham adalah harga minyak dunia[13]. Faktor harga minyak sangat mempengaruhi pergerakan harga saham untuk beberapa sektor bisnis misalkan bisnis produk logam, transportasi, mesin dan peralatan. Penelitian yang dilakukan oleh David M. Cutler, James M. Poterba, dan Lawrence H. Summers[11] ini juga mengemukakan pengaruh faktor non ekonomi/berita peristiwa terhadap pergerakan harga saham, misalkan pada tanggal 22 Oktober 1987, terjadi penurunan 3.92% pada index S&P karena penyerangan Iran ke stasiun minyak di Kuwait. Contoh-contoh lain pengaruh aktifitas nonekonomi terhadap pergerakan harga saham yang diambil dari makalah David M. Cutler, James M. Poterba, dan Lawrence H. Summers dapat dilihat pada tabel II.1. Walaupun dapat diketahui bahwa berita/peristiwa non ekonomi juga mempengaruhi pergerakan harga saham, akan tetapi sangat sulit untuk menentukan tingkat pengaruhnya terhadap harga saham. Tabel II.1 Pengaruh aktifitas non ekonomi terhadap pergerakan index S&P, 19411987 (diambil dari[11]). No. Event (Aktifitas nonekonomi) Tanggal 1. 2. Bom Jepang di Pearl Harbor Bom atom dijatuhkan di Jepang: Bom Hiroshima Bom Nagasaki Kemenangan Truman terhadap Dewey Pembunuhan Kennedy Pecahnya perang Korea Eisenhower mengalami serangan jantung Serangan Iran terhadap terminal minyak Kuwait 8 Des. 1941 Prosentase Perubahan -4.37% 6 Agustus 1945 9 Agustus 1945 3 Nov. 1948 0.27% 1.65% -4.61% 22 Nov. 1963 26 Juni 1950 26 Sept. 1955 -2.81% -5.38% -6.62% 22 Okt. 1987 -3.92% 3. 4. 5. 6. 7. 11 Berikut ini dipaparkan beberapa terminologi makroekonomi dan alat ukur kondisi perusahaan yang mempengaruhi pergerakan harga saham. 1. Inflasi merupakan proses kenaikan harga-harga umum secara terusmenerus[19]. Sedangkan kebalikan dari inflasi adalah deflasi, yaitu penurunan harga secara terus menerus, akibatnya daya beli masyarakat bertambah besar. Angka inflasi dihitung berdasarkan angka indeks yang dikumpulkan dari beberapa macam barang yang diperjualbelikan di pasar dengan masing-masing tingkat harga. Angka indeks yang memperhitungkan semua barang yang dibeli oleh konsumen pada masingmasing harganya disebut sebagai Indeks Harga Konsumen ( IHK atau Consumer Price Index = CPI). Adapun rumus untuk menghitung tingkat inflasi adalah: Inf = IHK n − IHK n −1 *100% IHK n −1 (2.2) Dengan Inf adalah tingkat inflasi. Untuk mendapatkan inflasi pada tiap bulannya, dapat dilihat dari hasil penelitian Badan Pusat Statistik (BPS). 2. Suku bunga bank merupakan imbal jasa atas pinjaman uang. Imbal jasa ini merupakan suatu kompensasi kepada pemberi pinjaman atas manfaat ke depan dari uang pinjaman tersebut apabila diinvestasikan. Jumlah pinjaman tersebut disebut "pokok utang" (principal). Prosentasi dari pokok utang yang dibayarkan sebagai imbal jasa (bunga) dalam suatu periode tertentu disebut "suku bunga". Di Indonesia, besaran suku bunga ditentukan oleh Bank Indonesia. 3. Money supply merupakan total jumlah uang yang dipegang oleh suatu perusahaan pada satu waktu tertentu. 4. Produksi/kapasitas industri merupakan total jumlah barang yang diproduksi pada satu waktu tertentu. 5. Deviden yield ( DY ) yaitu untuk mengukur jumlah deviden per saham relatif terhadap harga pasar yang dinyatakan dalam bentuk prosentasi: 12 DY = DPS Ps (2.3) Dengan: DPS = Devidend per Share (Deviden per Saham) Ps = Market Price (Harga Pasar) 6. Devidend Per Share ( DPS ) merupakan total deviden yang dibagikan pada tahun buku sebelumnya, baik deviden interim, deviden final maupun deviden saham. DPS = Dividend Ss (2.4) Dengan: Ss = Total outstanding share (Total saham yang diterbitkan). 7. Earning per Share ( EPS ) yaitu menggambarkan jumlah laba bersih setelah pajak pada satu tahun buku yang dihasilkan untuk setiap lembar saham. EPS dirumuskan sebagai berikut: EPS = Laba Bersih Jumlah Saham yang beredar (2.5) 8. Price Earning Ratio ( PER ) yaitu menunjukkan apresiasi pasar terhadap kemampuan emitten, dalam menghasilkan laba, semakin kecil rasio, semakin bagus. PER dirumuskan sebagai berikut: PER = h arg a Saham EPS (2.6) II.1.2 Efficient Market Hypothesis Konsep efficient market hypothesis dikembangkan pada tahun 1965 oleh Fama[15]. Efficient market hypothesis menyatakan bahwa harga pasar saat ini merefeksikan asimilasi dari semua informasi yang ada. Berdasarkan dari tipe informasi yang digunakan/dipertimbangkan, terdapat tiga bentuk dari EMH[18] 1. weak form yaitu hanya harga saham yang lampau yang menjadi bahan pertimbangan dalam memprediksi, 13 2. semi strong form yaitu semua informasi publik diperhitungkan/dipertimbangkan dalam melakukan prediksi, 3. strong form yaitu semua informasi baik publik maupun prifat diperhitungkan/dipertimbangkan dalam melakukan prediksi. Dari hipotesa ini dapat disimpulkan suatu pasar dikatakan efisien jika dalam pasar tersebut, pergerakan harga saham tidak hanya dipengaruhi oleh para spekulan tapi berdasarkan kondisi makroekonomi, kondisi perusahaan, dan lain - lain. II.1.3 Jenis prediksi berdasarkan penggunaan datanya Seperti yang telah dijelaskan sebelumnya, terdapat dua tipe data yang dapat digunakan untuk memprediksi harga yaitu 1. data teknis. Data ini seperti data harga saham yang lampau, volume perdagangan, fluktuatif saham, atau harga saham tertinggi. Istilah data time series financial sendiri merupakan istilah untuk data teknis secara time series, 2. data fundamental. Data ini meliputi data yang menggambarkan makroekonomi (inflasi, suku bunga, dan lain-lain), kondisi perusahaan/industri, dan alat ukur kondisi perusahaan (P/E, net profit margin, dan lain-lain). Banyak penelitian menggunakan data teknis dibandingkan data fundamental karena lebih mudah untuk diperoleh dan menurut teori efficient market hypothesis bahwa harga saham masa lampau telah merepresentasikan kondisi saat itu. II.2 Data Mining - Pattern Matching and Classification Data mining merupakan analisa data dengan tujuan menyingkap pola yang tersembunyi[30, sebelumnya 33] . Analisa pada data mining ini melibatkan historis data-data untuk dilakukan proses seperti pencarian pola tertentu, pengelompokan, proses clustering, dan lain-lain. Berikut ini langkah-langkah proses data mining (sebagaimana diilustrasikan pada Gambar II.6). 14 1. Mengembangkan dan memahami domain aplikasi, pengetahuan yang relevan, dan mengindentifikasi tujuan proses data mining. 2. Membuat data target. 3. Data cleaning dan preprocessing, yaitu menghilangkan noise dan menangani data yang hilang. 4. Pengurangan data dan projection yaitu menemukan fitur yang berguna yang merepresentasikan bahwa data bergantung pada tujuan proses. 5. Mencocokkan tujuan dengan metoda data mining. Tujuan data mining dicapai melalui metoda sebagai berikut : - clustering, melakukan identifikasi kategori untuk mendeskripsikan data, - classification, melakukan pengelompokan berdasarkan kategori yang telah ditentukan sebelumnya. Gambar II.6 Langkah – langkah proses data mining (diambil dari[1]). Pada penelitian ini, proses data mining yang diimplementasikan difokuskan pada pencocokkan/kesamaan pola dari data time series. Menemukan kesamaan pola dari sebuah data time series (data terurut) terhadap suatu contoh pola yang diberikan disebut juga sebagai similar sequence matching[35]. Kajian untuk menyelesaikan masalah ini dapat dilihat pada makalah 15 yang ditulis oleh Agrawal dengan metode Discrete Fourier Transform (DFT)[25], Faloutsos, dan kawan-kawan menyusulkan metoda subsequence matching yang kemudian diperbaruhi dengan metoda Dual Match[10], Keogh, dan kawan-kawan dengan pendekatan probabilistik[22], Yang-Sae Moon menemukan metoda general match[37]. Metoda-metoda tersebut menggunakan model pengukuran kesamaan berdasarkan jarak Euclidean[10, 22, 25, 37] yaitu misalkan terdapat vector/sequence X = {X[1],…,X[n]} dan Y = {Y[1],…,Y[n]} dengan panjang sama, dikatakan similar/sama jika jarak Euclidean D(X,Y) ( = ∑ ( x[i] − y[i]) 2 ) kurang dari atau sama dengan ε (toleransi yang diberikan oleh user). Atau bisa kita definisikan bahwa dua deret data X dan Y adalah ε-match jika D(X,Y) ≤ ε. Similar sequence matching(SSM) dapat dikelompokkan dalam dua kategori[10] yaitu • whole matching, diberikan N data sequence S1,…,SN, sebuah query sequence Q, dan nilai toleran e, dan kemudian ditemukan bahwa data sequence tersebut adalah e-match dengan Q dimana data dan query sequence memiliki panjang yang sama, • subsequence matching, diberikan N data sequence S1,…SN dengan berbagai variasi panjang, sebuah query sequence Q, dan toleran e, dan kemudian ditemukan semua sequence S, satu atau lebih dari satu sequence yang e-match dengan Q. Dari pengelompokan ini terlihat bahwa subsequence matching merupakan generalisasi dari whole matching. Berikutnya akan dipaparkan secara sederhana dari konsep similar sequence matching. Metoda Similar Sequence Matching J-Sliding Windows Metoda ini membagi data sequence kedalam j-sliding window yang didefinisikan sebagai berikut. 16 Definisi: Sebuah J-sliding window(1≤J≤ω) siJ dengan ukuran ω dari sequence S didefinisikan sebagai subsequence panjang ω dimulai dari S[(i - 1)*J + 1] (1 ≤ i ≤ Len( s ) − ω + 1). J Contoh : Pada gambar berikut ini menunjukkan contoh pembagian sequence S ke dalam 4-sliding windows (J = 4) dengan panjang ω = 16. Gambar II.7 Contoh pembagian sequence S. Dari gambar diatas, terlihat bahwa dengan panjang subsequence 16 dan J = 4, maka subsequence diawali pada S[1], S[5], S[9],… Lemma : Jika sequence S dibagi kedalam J-Sliding window, J-sliding window yang pertama termasuk dalam subsequence S[i :j] adalah J-sliding window ke ⎛ ⎡ i − 1⎤ ⎞ ⎜ ⎢ J ⎥ + 1⎟ dari S. ⎥ ⎠ ⎝⎢ Didefinsikan sebuah vektor Q (oleh Yang Sae Moon dinamakan sebagai query sequence[35]) sebagai sampel pola dengan panjang sequence Len(Q) = ω. Misalkan data sequence S dibagi dalam J-Sliding Window dengan ukuran ω, dan sampel pola Q memiliki ukuran yang sama yaitu ω. Maka subsequence S[i:j] dikatakan ε-match Q jika D(S[i : j], Q) ≤ ε. II.3 Metoda Ant Colony Artificial ant system terinspirasi oleh tingkah laku koloni semut dan merupakan konsep baru dalam artificial intelligence, yang disebut sebagai swarm intelligence[9]. Istilah “swarm intelligence” pertama kali digunakan oleh Beni, 17 Hackwood, dan Wang [4, 5, 6, 7, 16, 17] dalam konteks sistem robot selular, dimana banyak agen sederhana yang berkerja pada lingkungan berdimensi satu atau dua untuk mendapatkan pola melalui interaksi satu sama lain yang berdekatan. Algoritma Ant Colony pertama kali dipaparkan pada tahun 1992 oleh Marco Dorigo[24]. Ant colony system merupakan model perilaku semut yang diketahui dapat menemukan jarak terpendek antara sarang dan sumber makanan mereka. Meskipun setiap individu semut bergerak secara quasi random, melakukan pekerjaan yang sederhana, akan tetapi dalam suatu koloni, semut dapat melakukan pergerakan dengan pola tertentu. Setiap pergerakan, semut mengeluarkan zat kimia yang disebut sebagai pheromone. Zat kimia inilah yang dideteksi dan digunakan sebagai alat komunikasi tidak langsung oleh semut lain. Pada gambar berikut ini mengilustrasikan bagaimana semut dapat menemukan jarak terpendek antara sarang dan makanan[8]. Gambar II.8 Dua Percobaan a) Pada permulaan percobaan. b) pada waktu selanjutnya. Pada intinya, desain dari ant system menyatakan spesifikasi dari aspek berikut ini - suatu lingkungan yang merepresentasikan domain permasalahan, - suatu permasalahan yang bergantung pada fungsi evaluasi heuristic (η), yang merepresentasikan sebuah faktor kuantitas untuk solusi yang berbeda, - suatu rule untuk update pheromone (τ), yang merepresentasikan evaporation dan reinforcement dari trails, 18 - suatu probabilistic transition rule berdasarkan nilai dari fungsi heuristic dan penguatan pheromone trail (τ) yang digunakan secara iteratif mengkonstruksi sebuah solusi, spesifikasi yang jelas kapan algoritma menuju konvergen ke - suatu solusi. Berikut ini dipaparkan algoritma umum dan flow chart dari Ant System untuk implementasi pada Travel Salesman Problem (TSP)[8]. /* Inisialisasi*/ For every edge(I,j) do τ ij (0) = τ o End for For k=1 to m do Place ant k on a randomly chosen city End For + + Let T be the shortest tour found from beginning and L its length /*main loop*/ For t = 1 to tmax do For k = 1 to m do Build tour Tk(t) by applying n – 1 times the following step: Choose the next city j with probability α P (t ) = k ij ⎡⎣τ ij (t ) ⎤⎦ . ⎡⎣ηij ⎤⎦ ∑ α l∈J ik β ⎡⎣τ ij (t ) ⎤⎦ . ⎡⎣ηij ⎤⎦ β , Where i is the current city End For For k = 1 to m do Compute the length Lk(t) of the tour Tk(t) produced by ant k End For If an improved tour is found then Update T+ and L+ End if For every edge (i,j) do Update pheromone trails by applying the rule: τ ij (t ) ← (1 − ρ ).τ ij (t ) + Δτ ij (t ) + e.Δτ ije (t ) where 19 m Δτ ij (t ) = ∑ Δτ ijk (t ), k =1 ⎧Q / Lk (t ) if (i, j ) ∈ T k (t );⎫ ⎧Q / L+ (t ) if (i, j ) ∈ T + ;⎫ e and Δτ ijk (t ) = ⎨ Δ = ( t ) τ ⎨ ⎬ ⎬ ij 0 otherwise 0 otherwise ⎩ ⎭ ⎩ ⎭ End For For every edge (i,j) do τ ij (t + 1) = τ ij (t ) End For End For Print the shortest tour T+ and its length L+ Stop Gambar II.9 Flow chart secara umum untuk Algoritma Ant System. II.4 Pengukuran Akurasi Prediksi II.4.1 Mean Absolute Deviation (MAD) Mean absolute deviation (MAD) mengukur akurasi hasil prediksi dengan me-ratarata error prediksi pada setiap percobaan. Jika nilai sebenarnya pada waktu ke – t dinotasikan sebagai x(t ) dan hasil prediksinya dinotasikan sebagai x '(t ) , error atau selisih prediksi diperoleh sebagai e(t ) = x(t ) − x '(t ) . Maka formula MAD adalah[14] MAD = ∑ x(t ) − x '(t ) = ∑ e(t ) , N N (2.7) 20 Dengan N adalah banyaknya records atau pengujian. II.4.2 Mean Square Error (MSE) dan Root Mean Square Error (RMSE) Pengukuran akurasi prediksi dengan Mean Square Error (MSE) hampir sama dengan MAD. Pada MSE tidak menggunakan harga mutlak (absolute) pada error prediksi, tetapi menggunakan nilai pangkat dua (square). Keuntungan penggunaan pangkat dua adalah nilai error prediksi yang diperoleh lebih besar dibandingkan dengan nilai absolute. Formula MSE adalah sebagai berikut: ∑ ( x(t ) − x '(t )) MSE = N 2 ∑ e(t ) = 2 (2.8) N Sedangkan formula Root Mean Square Error (RMSE) adalah sebagai berikut: RMSE = MSE (2.9) II.4.3 Percent Error Pengukuran akurasi dengan percent error bertujuan untuk mengetahui prosentase galat antara nilai sebenarnya dengan nilai hasil simulasi. Formula percent error adalah sebagai berikut: e= ⎛ x(t ) − x '(t ) ⎞ ⎟ *100% x(t ) ⎝ ⎠ N ∑ abs ⎜ (2.10) 21