APLIKASI PREDIKSI HARGA SAHAM APPLE, IBM, DELL DAN HP MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS Naila Fitriah 52409455 Teknologi Industri Teknik Informatika AGENDA • Saham ? – Manfaat – Prediksi Saham • KNN ? – 2 Metode KNN – Contoh Kasus • Tujuan Penulisan • • • • Batasan Masalah Diagram Alur Aplikasi KNN Kesimpulan dan Saran Saham • Saham merupakan surat berharga sebagai tanda kepemilikan atas perusahaan penerbitnya (Ang, 1997). • Saham juga berarti sebagai tanda penyertaan atau pemilikan seseorang atau badan dalam suatu perusahaan terbuka (Darmadji dan Fakhruddin, 2001). Manfaat Saham 1. Untuk memperoleh dividen, yaitu bagian dari keuntungan perusahaan yang dibagikan kepada pemilik saham. 2. Untuk memperoleh capital gain, yaitu keuntungan yang diperoleh dari selisih jual dengan harga beli. 3. Manfaat non finansial, yaitu timbulnya kebanggaan dan kekuasaan memperoleh hak suara dalam menentukan jalannya perusahaan. (Darmadji dan Fakhruddin, Pasar Modal di Indonesia, Pendekatan Tanya Jawab, 2001) Prediksi Harga Saham • Prediksi harga saham adalah suatu proses menganalisis dan menentukan harga suatu saham dimasa yang akan datang. • Dibutuhkan analisa untuk mengukur nilai saham dengan menggunakan analisa teknikal sehingga dapat membantu dalam memprediksi harga saham. http://www.belajarinvestasi.net/saham/analisis-teknikal-saham-perubahan-harga, Tanggal Akses: 24 Juni 2012 K-Nearest Neighbors K-Nearest Neighbors (KNN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil dari sampel uji yang baru diklasifikasikan berdasarkan mayoritas dari kategori pada KNN. Tujuan dari algoritma ini adalah mengklasifikasi objek baru berdasarkan atribut dan sampel latih. Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, 2005 Metode KNN 1. Metode Simple Unweighted Voting • • • • Tentukan K (Jumlah tetangga terdekat). Hitung Jarak antara data yang diuji dengan data training. Urutkan berdasarkan jarak terdekat dan tentukan apakah termasuk dalam K (jumlah tetangga terdekat). Hitung Rata-rata dari data yang termasuk dalam K. Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, 2005 Metode KNN 2. Metode Weighted Voting • • • • Tentukan K (Jumlah tetangga terdekat). Hitung Jarak antara data yang diuji dengan data training. Urutkan berdasarkan jarak terdekat dan tentukan apakah termasuk dalam K (jumlah tetangga terdekat). Menghitung bobot dari data yang termasuk dalam K. Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, 2005 Pengukuran Jarak • Euclidean • Manhattan City Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, 2005 Contoh Kasus Data X (5.0) , berapa Y? K=3 1. Menghitung Jarak 2. Me-ranking Berdasarkan K K=3, Ambil 3 data terdekat 4. Menghitung Prediksi • Metode Simple Unweighted Voting Data X (5.0): • Metode Weighted Voting Tujuan Penulisan Menghasilkan aplikasi yang dapat membantu memprediksi besarnya harga penutupan saham menggunakan algoritma K-Nearest Neighbors (KNN) sehingga bisa dilakukan langkah-langkah strategis yang berkaitan dengan perubahan harga saham. Bab 1, Halaman 3 Batasan Masalah • Menggunakan bahasa pemrograman C#.NET • Empat perusahaan komputer yaitu APPLE, IBM, DELL, dan HP yang akan diprediksi dengan menggunakan Algoritma K-Nearest Neighbors (KNN) . • Data yang dipakai adalah daftar harga pembukaan dan penutupan saham perusahaan pada bulan Januari tahun 2000 hingga Juli tahun 2012 Bab 1, Halaman 3 Diagram Alur Program Mulai Inisialisasi Program memprediksi Pilih Prediksi Tentukan prediksi saham Pilih Data Menghitung prediksi dengan algoritma KNN Menampilkan data Harga Saham Edit data Keluar Menghitung kesalahan (error) Simpan data ke dalam database Output Update database Selesai Bab 3, Halaman 29 Aplikasi KNN Tab Data Lampiran, Halaman 69 Aplikasi KNN Tab Menghitung Jarak Lampiran, Halaman 69 Aplikasi KNN Tab Me-Ranking/Mengurutkan data Berdasarkan K Lampiran, Halaman 69 Aplikasi KNN Tab Menghitung Bobot dan Hasil Lampiran, Halaman 69 Hasil Prediksi Harga Saham APPLE Hasil Prediksi (Simple,Weighted) Fluktuasi (Simple, Weighted) 606.01, 607.59 Naik, Naik 604.44, 606.49 Naik, Naik 20 602.39, 605.03 Turun, Naik 5 585.30, 586.49 Turun, Turun 587.84, 587.68 Turun, Turun 586.88, 587.30 Turun, Turun .................... ................. Tanggal K 31 -07-2012 5 10 30 -07-2012 18 Juni – 31 Juli 2012 10 Open Price 603.23 590.92 Close Price 610.76 595.03 Fluktuasi Naik Naik 20 ..... ..... ...... ....... .............. Bab 4, Halaman 50 Analisa Prediksi Benar K Metode 5 10 % Prediksi Benar 5/10 x 100% = 50% Simple Unweighted Voting 6/10 x 100% = 60% 20 4/10 x 100% = 40% 5 6/10 x 100% = 60% 10 20 Weighted Voting 5/10 x 100% = 50% 6/10 x 100% = 60% Bab 4, Halaman 50 Analisa Rata-Rata Error Tanggal K Error (Simple) Error (Weighted) Tanggal K Error (Simple) Error (Weighted) 31 -07-2012 5 -4.75 -3.17 24 -07-2012 5 0.17 9.51 10 -6.32 -4.27 10 6.86 8.61 20 -8.37 -5.73 20 3.30 7.67 5 -9.73 -8.54 5 -6.95 -5.32 10 -7.19 -7.35 10 -5.04 -4.59 20 -8.15 -7.73 20 -9.25 -7.38 5 -10.47 -10.08 5 5.55 8.63 10 -10.79 -10.46 10 4.36 8.07 20 -10.08 -10.48 20 2.05 7.12 5 2.94 4.62 5 -6.45 -6.62 10 2.78 4.12 10 -6.24 -6.50 20 1.00 3.18 20 -10.61 -8.38 5 -2.47 -2.10 5 -1.83 -0.81 10 0.29 -0.93 10 -0.31 -0.48 20 -1.56 -1.54 20 -6.01 0.83 5 51.31% 59.4% 10 50.18% 55.38% 20 60.38% 60.04% 30 -07-2012 27-07-2012 26 -07-2012 25 -07-2012 RATA-RATA ERROR 23 -07-2012 20 -07-2012 19 -07-2012 18 -06-2012 Bab 4, Halaman 52 Kesimpulan Prediksi kenaikan atau penurunan harga saham • Metode Simple Unweighted Voting: K terbaik : K=10; Jumlah persentase prediksi benar: 60%. Rata-rata error terkecil: 51.31% dengan K=10. • Metode Weighted Voting: K terbaik: K=5 dan K=20; Jumlah persentase prediksi benar: 60%. Rata-rata error terkecil: 55.38% dengan K=10. Bab 5, Halaman 54 Saran Error rate (rata-rata error terkecil) yang dihasilkan Algoritma K-Nearest Neighbors > 50%. Melakukan prediksi menggunakan algoritma lain, misal: Neural Network dan Decision Tree untuk mendapatkan hasil prediksi (rata-rata error terkecil) yang lebih baik dari algoritma K-Nearest Neighbors. Bab 5, Halaman 55