BAB 2 LANDASAN TEORI Pada bab ini, akan dibahas dasar teori, penelitian terdahulu, kerangka pikir dan hipotesis yang mendasari penyelesaian permasalahan memprediksi inflasi dengan menggunakan algoritma K-Nearest Neighbor (KNN). 2.1 Inflasi Secara sederhana inflasi diartikan sebagai meningkatnya harga-harga secara umum dan terus menerus. Kenaikan harga dari satu atau dua barang saja tidak dapat disebut inflasi kecuali bila kenaikan itu meluas (atau mengakibatkan kenaikan harga) pada barang lainnya. Dengan kata lain, inflasi juga merupakan proses menurunnya nilai mata uang secara kontinu. Kebalikan dari inflasi disebut deflator. Indikator yang sering digunakan untuk mengukur tingkat inflasi adalah indeks harga konsumen (IHK). Perumusan inflasi berdasarkan inflasi dapat dilihat sebagai berikut : Inflasi = × 100% Banyak pengertian inflasi yang dapat kita jumpai pada beberapa sumber, diantaranya : Dornbusch dan Fischer (2001), menyebutkan bahwa inflasi merupakan kejadian ekonomi yang sering terjadi meskipun kita tidak pernah menghendaki. Inflasi ada dimana saja dan selalu merupakan fenomena moneter yang mencerminkan adanya pertumbuhan moneter yang berlebihan dan tidak stabil. Menurut Boediono (1985), mengemukakan bahwa Inflasi adalah kecenderungan dari harga–harga untuk menaik secara umum dan terus-menerus. Universitas Sumatera Utara 8 Kenaikan harga dari satu atau dua barang saja tidak disebut inflasi, kecuali bila kenaikan tersebut meluas kepada (atau mengakibatkan kenaikan) sebagian besar dari harga-harga barang lain. Syarat adanya kecenderungan menaik yang terus-menerus juga perlu diingat. Kenaikan harga-harga karena, misalnya musiman, menjelang hari-hari besar, atau yang terjadi sekali saja (dan tidak mempunyai pengaruh lanjutan) tidak disebut inflasi Sedangkan Murni Asfia (2006), menyatakan bahwa inflasi adalah suatu kejadian yang menunjukkan kenaikan tingkat harga secara umum dan berlangsung secara terus menerus. Dari defenisi tersebut ada 3 kriteria yang perlu diamati untuk melihat telah terjadi inflasi, yaitu kenaikan harga, bersifat umum , dan terjadi terus menerus dalam rentang waktu tertentu. Apabila terjadi kenaikan harga satu barang yang tidak mempengaruhi harga barang lain, sehingga harga tidak naik secara umum, kejadian seperti itu bukanlah inflasi. Kecuali bila yang naik itu seperti harga BBM, ini berpengaruh terhadap harga-harga lain sehingga secara umum semua produk hampir mengalami kenaikan harga. Bila kenaikan harga itu terjadi sesaat kemudian turun lagi, itu pun belum bisa dikatakan inflasi, karena kenaikan harga yang diperhitungkan dalam konteks inflasi mempunyai rentang waktu minimal satu bulan. Boediono, dalam bukunya “Pengantar Ilmu Ekonomi” (1985) , menjabarkan bahwa ada beberapa cara untuk penggolongan inflasi, yakni, penggolongan pertama didasarkan atas “parah” tidaknya inflasi tersebut. Disini dapat dibedakan beberapa macam inflasi, yaitu : 1. Inflasi ringan (dibawah 10% pertahun) 2. Inflasi sedang (diantara 10-30% pertahun) 3. Inflasi berat (antara 30-100% pertahun) 4. Hiper inflasi (diatas 100% pertahun) Penggolongan yang kedua adalah atas dasar sebab awal dari inflasi. Atas dasar ini dapat dibedakan dua macam inflasi, yaitu : Universitas Sumatera Utara 9 1. Inflasi yang timbul karena permintaan masyarakat akan berbagai barang terlalu kuat. Inflasi ini disebut demand full inflation 2. Inflasi yang muncul kerana kenaikan biaya produksi. Inflasi ini disebut cost full inflation Penggolongan yang ketiga adalah berdasarkan asal dari inflasi. Disini dapat dibedakan menjadi dua , yaitu : 1. Inflasi yang berasal dari dalam negeri (dometik inflation) 2. Inflasi yang berasal dari luar negeri (import inflation) 2.2 Peramalan (Forecasting) Peramalan adalah ilmu untuk memperkirakan kejadian di masa depan (Heizer & Render, 2005). Hal ini dilakukan dengan melibatkan pengambilan data masa lalu dan menempatkannya ke masa yang akan datang dengan suatu bentuk model matematis. Ishak (2010) berpendapat bahwa pada hakikatnya peramalan hanya merupakan perkiraan (guess), tetapi dengan menggunakan teknik-teknik tertentu, maka peramalan menjadi lebih dari sekedar perkiraan. Setiap pengambilan keputusan yang menyangkut keadaan di masa yang akan datang, pasti ada peramalan yang melandasi pengambilan keputusan tersebut. Peramalan ini bertujuan untuk meredam ketidak pastian sehingga diperoleh suatu perkiraan yang mendekati keadaan sebenarnya. Haizer dan Render 2009, mengatakan bahwa peramalan biasanya diklasifikasikan berdasarkan horizon waktu masa depan yang dilingkupinya. Horizon waktu terbagi menjadi beberapa kategori: 1. Peramaln Jangka Pendek (Short term) Peramalan ini meliputi jangka waktu harian atapun mingguan. Peramalan ini digunakan untuk merencanakan pembelian, penjadwalan kerja, jumlah tenaga kerja, penugasan kerja, dan tingkat produksi. 2. Peramalan Jangka Menengah (Medium term) Peramlan jangka menengah atau intermediate umumnya mencakup hitungan bulanan atau kuartal. Universitas Sumatera Utara 10 Peramalan ini bermanfaat untuk merencanakan penjualan, perencanaan dan anggaran produksi, anggaran kas, serta menganalisis bermacam-macam rencana operasi. 3. Peramalan Jangka Panjang (Long term) Peramalan ini bersifat tahunan. Peramalan jangka panjang digunakan untuk merencanakan produk baru, pembelanjaan modal, lokasi atau pengembangan fasilitas, serta penelitian dan pengembangan. Terdapat dua pendekatan umum dalam teknik peramalan (Heizer & Render, 2005), yaitu: 1. Peramalan Kualitatif Peramalan kualitatif menggabungkan faktor seperti intuisi, emosi, pengalaman pribadi, dan bersifat subjektif. Peramalan ini biasanya dilakukan melalui kuesioner, survey, dan riset pasar. 2. Peramalan Kuantitatif Peramalan kuantitatif merupakan peramalan yang didasarkan pada model matematis yang beragam dengan data masa lalu (time series) dan variable sebab-akibat (causal method). 2.2.1 Peramalan time series Metode time series adalah metode yang digunakan untuk menganalisis data yang merupakan fungsi dari waktu (Ishak, 2010). Peramalan dengan teknik ini berarti nilai masa depan diperkirakan hanya dari nilai masa lalu dan mengabaikan variabel yang lain (Heizer & Render, 2005). Dengan analisis ini dapat ditunjukkan bagaimana permintaan terhadap produk tertentu bervariasi terhadap waktu. Berikut ini merupakan beberapa pola yang terdapat dalam data time series (Hartanto, 2012), yaitu: 1. Pola Data Horizontal Pola ini terjadi apabila nilai data berfluktuasi di sekitar nilai rata-rata yang konstan. Deret itu seperti stationer terhadap nilai rata-ratanya. Grafik pola horizontal dapat dilihat pada Gambar 2.1 Universitas Sumatera Utara 11 Jumlah Data Waktu Gambar 2.1 Pola Data Horizontal 2. Pola Data Musiman Pola ini terjadi jika suatu deret dipengaruhi oleh musiman (misalnya kuartal tahun tertentu, bulanan, mingguan, atau pada hari-hari tertentu). Grafik pola data musiman dapat dilihat pada Gambar 2.2 Jumlah Data Waktu Gambar 2.2 Pola Data Musiman 3. Pola Data Siklus Pola ini terjadi bila datanya dipengaruhi oleh fluktasi ekonomi jangka panjang seperti yang berhubungan siklus bisnis. Penjualan produk seperti mobil, baja, dan peralatan lainnya menunjukkan jenis pola data ini. Grafik pola data siklus dapat dilihat pada gambar 2.3 Jumlah Data Waktu Gambar 2.3 Pola Data Siklus Universitas Sumatera Utara 12 4. Pola Data Tren Pola ini terjadi apabila terdapat kenaikan tau penurunan sekuler panjang dalam data. Data penjualan suatu perusahaan , produk bruto nasional (GNP), dan berbagai indikator bisnis tau ekonomi lainnya mengikuti suatu pola data tren selama perubahannya sepanjang waktu. Grafik pola data tren dapat dilihat pada gambar 2.4 Jumlah Data Waktu Gambar 2.4 Pola Data Tren 2.3 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam database (Luthfi, 2009). Data mining adalah proses yang menggunakan teknik statik, matematika, kecesdasan buatan dan machine learning untuk mengekstraksian dan mengindentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban, 2005). Selain defenisi di atas beberapa defenisi juga diberikan seperti, data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Data mining adalah menganalisis secara otomatis dari data yang berjumlah besar atau kompleks untuk menemukan suatu pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006). Dari berbagai definisi yang telah disampaikan, berikut merupakan beberapa hal penting yang terkait dengan data mining: 1. Data mining adalah suatu proses otomatis yang dilakukan terhadap data yang telah ada. Universitas Sumatera Utara 13 2. Data yang akan diproses merupakan data yang berjumlah sangat besar. 3. Tujuan dari data mining adalah untuk mendapatkan hubungan atau pola yang kemungkinan memberikan indikasi bermanfaat. Knowledge Discover in Database (KDD) adalah proses menentukan informasi yang berguna serta pola-pola yang ada dalam data. Informasi ini terkandung dalam basis data yang berukuran besar yang sebenarnya tidak diketahui dan potensi bermanfaat (Han & Kamber, 2006). Data Mining merupakan salah satu langkah dari serangkaian proses iterative KDD. Gambar 2.5 Tahapan dalam KDD (Han & Kamber , 2006) Tahapan proses KDD terdiri dari : 1. Data Selection Pada Proses ini dilakukan pemilihan himpunan data, menciptakan himpunan data target, atau memfokuskan pada subset variable, (sampel data) dimana penemuan (discovery) akan dilakukan. Hasil seleksi disimpan dalam suatu berkas yang terpisah dari basis data operasional. 2. Pre-Processing dan Cleaning Data Pre-Processsing dan Cleaning Data dilakukan membuang data yang tidak konsisten dan noise, duplikasi data, memperbaiki kesalahan data,dan bisa diperkaya dengan data eksternal yang revelan. Universitas Sumatera Utara 14 3. Transformation Proses ini mentransformasikan atau menggabungkan data ke dalam yang lebih tepat untuk melakukan proses mining dengan cara melakukan peringkasan (agregasi). 4. Data Mining Proses data mining yaitu proses mencari pola atau informasi menarik dalamdata terpilih dengan menggunakan teknik, metode atau algoritma tertentu sesuai dengan tujuan dari proses KDD secara keseluruhan. 5. Interpretation/ Evaluasi Proses untuk menerjemahkan pola-pola yang dihasilkan dari data mining, Mengevaluasi (menguji) apakah pola atau informasi yang ditemukan bersesuian atau bertentangan dengan faktaatau hipotesa sebelumnya. Pengetahuan yang diperoleh dari pola-pola yang terbentuk dipresentasikan dalam bentuk visualisasi. Fungsi-fungsi dalam data mining mengacu pada Larose (2005) yang membaginya ke dalam enam fungsi yaitu (Susanto & Suryadi, 2010) : 1. Fungsi Deskripsi (description) Fungsi deskripsi adalah cara yang digunakan untuk menggambarkan sekumpulan data secara ringkas. Banyak cara yang digunakan dalam memberikan gambaran secara ringkas bagi sekumpulan data yang besar jumlahnya dan banyak macamnya yaitu deskripsi grafis, deskripsi lokasi dan deskripsi keragaman. 2. Fungsi Estimasi (estimation) Fungsi estimasi adalah fungsi untuk memperkirakan suatu hal yang sudah ada datanya. Fungsi estimasi terdiri dari dua cara yaitu estimasi titik dan estimasi selang kepercayaan. 3. Fungsi Prediksi (prediction) Fungsi prediksi adalah memperkiraan hasil dari informasi yang belum diketahui untuk mendapatkan informasi baru yang akan muncul selanjutnya. 4. Fungsi Klasifikasi (clasification) Fungsi klasifikasi atau menggolongkan suatu data. Beberapa algoritma yang digunakan antara lain adalah algoritma Mean Vector, algoritma K-Nearest Universitas Sumatera Utara 15 Neighbor (KNN) , algoritma C.45 dan algoritma lainnya. Fungsi klasifikasi ini banyak juga digunakan untuk melakukan prediksi. 5. Fungsi Klastering (Clustering) Fungsi klastering merupakan fungsi untuk mengelompokkan data. Data yang dikelompokkan disebut objek yang memiliki kemiripan atribut kemudian dikelompokkan yang berbeda. Teknik atau metode klastering dapat dikelompokkan menjadi 2 kategori besar yaitu , Metode Hirarki (Hierarchical Clustering) dan Metode Partisi (Partitional Clustering). 6. Fungsi Asosiasi (Association) Fungsi asosiasi adalah untuk menemukan aturan hubungan (association rule) yang mampu mengindentifikasi item-item yang menjadi objek. 2.3 Klasifikasi Klasifikasi adalah proses penemuan model (atau fungsi) yang menggambarkan dan membedakan kelas data atau konsep yang bertujuan agar bisa digunakan untuk memprediksi kelas dari objek yang label kelasnya tidak diketahui (Han, 2006). Klasifikasi data terdiri dari 2 langkah proses. Pertama adalah learning (face training), dimana algoritma klasifikasi dibuat untuk menganalisa data training lalu dipresentasikan dalam bentuk rule klasifikasi, dimana data tes digunakan untuk memperkirakan akurasi dari rule klasifikasi (Han, 2006). Klasifikasi merupakan proses untuk menempatkan suatu objek ke dalam suatu kategori/kelas yang sudah didefenisikan sebelumnya berdasarkan model tertentu. Data Mining merupakan penjelasan tentang masa lalu dan prediksi masa depan berdasarkan ini data mining menggunakan beberapa model yaitu pemodelan prediktif dan deskriptif . (Emerensye, 2012) a. Pemodelan Prediktif diawali dengan pembentukan pemodelan unruk memprediksi hasil. Universitas Sumatera Utara 16 Variabel Input (plafon, total telat, status) x1, x2, x3 .. Model Data mining (k-NN) f(.) Output (macet, lancer, tersendat /nilai jaminan) Y = f()x1,x2,x3..) Gambar 2.6 Pomedalan Prediktif b. Pemodelan Deskriptif atau lebih dikenal dengan istilah clustering , merupakan proses pengamatan terhadap kelompok data kemudian diikuti dengan pengelompokan data/cluster terhadap data yang mempunyai kesamaan ciri. 2.4 Algoritma K-Nearest Neighbor (KNN) Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut (Widiarsana, O et al., 2011). Algoritma K-Nearest Neighbor (KNN) adalah metode yang digunakan untuk mengelompokkan objek berdasarkan contoh pelatihan terdekat di ruang fitur. K-Nearest Neighbor merupakan jenis yang paling dasar dari contoh based learning atau lazy learning juga termasuk kelompok instance-based learning. K-Nearest Neighbor dilakukan dengan mencari kelompok objek dalam data training yang paling dekat (mirip) dengan objek pada data baru atau data testing. (Krati,2014). Algoritma K-Nearest Neighbor bersifat sederhana, bekerja dengan berdasarkan pada jarak terpendek dari sampel uji (testing sample) ke sampel latih (training sample) untuk menentukan K- Nearest Neighbor nya. Setelah mengumpulkan K-Nearest Neighbor, kemudian diambil mayoritas dari K- Nearest Neighbor (KNN) untuk dijadikan prediksi dari sample uji. K-Nearest Neighbor memiliki beberapa kelebihan yaitu tangguh terhadap training data yang noise dan efektif apabila data latih nya besar. Pada fase training, algoritma ini hanya melakukan penyimpanan vektor-vektor fitur dan klasifikasi data training sample. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk testing data atau yang klasifikasinya tidak diketahui. Jarak dari vektor baru yang ini terhadap seluruh vektor training sample dihitung dan sejumlah k buah yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik-titik tersebut. Ketepatan algoritma K-Nearest Neighbor Universitas Sumatera Utara 17 sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan atau jika bobot fitur tersebut tidak setara dengan relevansinya terhadap klasifikasi. (Alfian,2014). Menurut Kusrini dan Emma (2009) algoritma K-Nearest Neighbor adalah pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama dengan berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada yang memiliki kesamaan (similiarity). Tujuan dari algoritma ini untuk mengklasifikasikan objek baru berdasarkan atribut dan training sample. Classifier tidak menggunakan model apapun untuk dicocokan dan hanya berdasarkan pada memori. Contoh kasus, misalkan diinginkan untuk mencari solusi terhadap pasien baru dengan menggunakan solusi dari data pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar yang akan diambil solusinya untuk digunakan pada kasus pasien baru. Gambar 2.7 Ilustrasi Solusi pada KNN (Sumber: Kursini & Emha Taufiq Luthfi, 2009) Seperti tampak pada Gambar 2.2 terdapat dua pasien lama A dan B. Ketika ada pasien baru, maka solusi yang akan diambil adalah solusi dari pasien terdekat dari pasien baru. Seandainya d1 adalah kedekatan antara pasien baru dan pasien A, sedangkan d2 adalah kedekatan antara pasien baru dengan pasien B. Karena d2 lebih dekat dari d1 maka solusi dari pasien B yang akan digunakan untuk memberikan solusi pasien baru. . Universitas Sumatera Utara 18 Ada banyak cara untuk mengukur jarak kedekatan antara data baru dengan data lama (data training), diantaranya Euclidean distance dan manhattan distance (city block distance) yang sering digunakan adalah euclidean distance, yaitu : , = − + − , . . . − ….2.1 Dimana a = , , …, dan b = , , … mewakili n nilai atribut dari dua record. Adapun langkah-langkah untuk menghitung algoritma K-Nearest Neighbor antara lain : 1. Menentukan Parameter K (jumlah tentangga terdekat). 2. Menghitung kuadrat jarak eucliden (queri instance) masing –masing objek terhadap data sampel yang diberikan. 3. Kemudian mengurutkan jarak tersebut ke dalam kelompok yang mempunyai Euclid terkecil (mengurutkan hasil no 2 secara ascending). 4. Mengumpulkan kategori Y (Klasifikasi Nearest Neighbor) berdasarkan nilai K atau ambil data tetangga terdekat. 5. Dengan menggunakan kategori Nearest Neighbor yang paling mayoritas maka akan menghasilkan kelas data baru (prediksi). Nilai k yang terbaik untuk algoritma ini tergantung pada data. Secara umum, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi semakin kabur. Nilai k yang bagus dapat dipilih dengan optimasi parameter, misalnya dengan menggunakan Simple Unweighted Voting. 2.5 Penelitian Terdahulu Adapun beberapa penelitian terdahulu yang berkaitan dengan topik ini dapat dilihat pada tabel 2.1Tabel Universitas Sumatera Utara 19 Tabel 2.1 Penelitian Terdahulu No 1. Judul Aplikasi Metode Ensembel untuk Peramalan Inflasi di Indonesia Peneliti (Tahun) Mega Silfiani dan Suhartono (2012) Hasil Metode single ANN menghasilkan RMSE yang kecil dibandingkan model lainnya pada pemodelan inflasi nasional dan tujuh kota di Jawa Timur. Sedangkan jika dilihat dari ensembel, metode ANN ensembel menghasilkan RMSE yang kecil dibandingkan model ensembel lainnya. 2. Aplikasi Model Neuro Fuzzy untuk Prediksi Tingkat Inflasi di Indonesia Aidatul Fitriah (2011) model ANFIS mempunyai nilai tersebut MSE sebesar 0.0420 dan MAPE sebesar 40.32 %. Dan pada proses testing model tersebut mempunyai nilai MSE sebesar 0.9087 dan MAPE sebesar 193.11 %. bahwa prediksi tingkat inflasi menggunakan model ANFIS tidak cocok untuk jangka panjang, namun cocok untuk jangka pendek misal tingkat inflasi 3 bulan kemudian (triwulan). Universitas Sumatera Utara 20 Tabel 2.2 Penelitian terdahulu (lanjutan) No 3. Judul Peneliti (tahun) Hasil Analisi Prediksi Ricky Imanuel Hasil penelitian dengan uji Tingkat Ndaumanu (2014) coba secara manual dan Pengunduran Diri menggunakan system Mahasiswa dengan didapatkan kesamaan hasil Moteode K- prediksi 79%. Nearest Neigbor 4 Aplikasi Prediksi Naila Fitriah (2012) Hasil penelitian ini Prediksi Harga Saham kenaikan atau penurunan Apple, IBM, harga saham Error rate (rata- DELL, Dan HP rata error terkecil) yang Menggunakan dihasilkan Algoritma K- Algoritma K- Nearest Neighbors < 50%. Nearest Neighbors Universitas Sumatera Utara