BAB 2 LANDASAN TEORI Pada bab ini, akan dibahas dasar teori

advertisement
BAB 2
LANDASAN TEORI
Pada bab ini, akan dibahas dasar teori, penelitian terdahulu, kerangka pikir dan
hipotesis yang mendasari penyelesaian permasalahan memprediksi inflasi dengan
menggunakan algoritma K-Nearest Neighbor (KNN).
2.1 Inflasi
Secara sederhana inflasi diartikan sebagai meningkatnya harga-harga secara umum
dan terus menerus. Kenaikan harga dari satu atau dua barang saja tidak dapat disebut
inflasi kecuali bila kenaikan itu meluas (atau mengakibatkan kenaikan harga) pada
barang lainnya. Dengan kata lain, inflasi juga merupakan proses menurunnya nilai
mata uang secara kontinu. Kebalikan dari inflasi disebut deflator. Indikator yang
sering digunakan untuk mengukur tingkat inflasi adalah indeks harga konsumen
(IHK). Perumusan inflasi berdasarkan inflasi dapat dilihat sebagai berikut :
Inflasi =
× 100%
Banyak pengertian inflasi yang dapat kita jumpai pada beberapa sumber,
diantaranya : Dornbusch dan Fischer (2001), menyebutkan bahwa inflasi merupakan
kejadian ekonomi yang sering terjadi meskipun kita tidak pernah menghendaki. Inflasi
ada dimana saja dan selalu merupakan fenomena moneter yang mencerminkan adanya
pertumbuhan moneter yang berlebihan dan tidak stabil.
Menurut
Boediono
(1985),
mengemukakan
bahwa
Inflasi
adalah
kecenderungan dari harga–harga untuk menaik secara umum dan terus-menerus.
Universitas Sumatera Utara
8
Kenaikan harga dari satu atau dua barang saja tidak disebut inflasi, kecuali bila
kenaikan tersebut meluas kepada (atau mengakibatkan kenaikan) sebagian besar dari
harga-harga barang lain.
Syarat adanya kecenderungan menaik yang terus-menerus juga perlu diingat.
Kenaikan harga-harga karena, misalnya musiman, menjelang hari-hari besar, atau
yang terjadi sekali saja (dan tidak mempunyai pengaruh lanjutan) tidak disebut inflasi
Sedangkan Murni Asfia (2006), menyatakan bahwa inflasi adalah suatu
kejadian yang menunjukkan kenaikan tingkat harga secara umum dan berlangsung
secara terus menerus.
Dari defenisi tersebut ada 3 kriteria yang perlu diamati untuk melihat telah
terjadi inflasi, yaitu kenaikan harga, bersifat umum , dan terjadi terus menerus dalam
rentang waktu tertentu. Apabila terjadi kenaikan harga satu barang yang tidak
mempengaruhi harga barang lain, sehingga harga tidak naik secara umum, kejadian
seperti itu bukanlah inflasi. Kecuali bila yang naik itu seperti harga BBM, ini
berpengaruh terhadap harga-harga lain sehingga secara umum semua produk hampir
mengalami kenaikan harga. Bila kenaikan harga itu terjadi sesaat kemudian turun lagi,
itu pun belum bisa dikatakan inflasi, karena kenaikan harga yang diperhitungkan
dalam konteks inflasi mempunyai rentang waktu minimal satu bulan.
Boediono, dalam bukunya “Pengantar Ilmu Ekonomi” (1985) , menjabarkan
bahwa ada beberapa cara untuk penggolongan inflasi, yakni, penggolongan pertama
didasarkan atas “parah” tidaknya inflasi tersebut.
Disini dapat dibedakan beberapa macam inflasi, yaitu :
1. Inflasi ringan (dibawah 10% pertahun)
2. Inflasi sedang (diantara 10-30% pertahun)
3. Inflasi berat (antara 30-100% pertahun)
4. Hiper inflasi (diatas 100% pertahun)
Penggolongan yang kedua adalah atas dasar sebab awal dari inflasi. Atas dasar
ini dapat dibedakan dua macam inflasi, yaitu :
Universitas Sumatera Utara
9
1. Inflasi yang timbul karena permintaan masyarakat akan berbagai barang terlalu
kuat. Inflasi ini disebut demand full inflation
2. Inflasi yang muncul kerana kenaikan biaya produksi. Inflasi ini disebut cost
full inflation
Penggolongan yang ketiga adalah berdasarkan asal dari inflasi. Disini dapat
dibedakan menjadi dua , yaitu :
1. Inflasi yang berasal dari dalam negeri (dometik inflation)
2. Inflasi yang berasal dari luar negeri (import inflation)
2.2 Peramalan (Forecasting)
Peramalan adalah ilmu untuk memperkirakan kejadian di masa depan (Heizer &
Render, 2005). Hal ini dilakukan dengan melibatkan pengambilan data masa lalu dan
menempatkannya ke masa yang akan datang dengan suatu bentuk model matematis.
Ishak (2010) berpendapat bahwa pada hakikatnya peramalan hanya merupakan
perkiraan (guess), tetapi dengan menggunakan teknik-teknik tertentu, maka peramalan
menjadi lebih dari sekedar perkiraan. Setiap pengambilan keputusan yang menyangkut
keadaan di masa yang akan datang, pasti ada peramalan yang melandasi pengambilan
keputusan tersebut. Peramalan ini bertujuan untuk meredam ketidak pastian sehingga
diperoleh suatu perkiraan yang mendekati keadaan sebenarnya.
Haizer
dan
Render
2009,
mengatakan
bahwa
peramalan
biasanya
diklasifikasikan berdasarkan horizon waktu masa depan yang dilingkupinya. Horizon
waktu terbagi menjadi beberapa kategori:
1. Peramaln Jangka Pendek (Short term)
Peramalan ini meliputi jangka waktu harian atapun mingguan. Peramalan ini
digunakan untuk merencanakan pembelian, penjadwalan kerja, jumlah tenaga
kerja, penugasan kerja, dan tingkat produksi.
2. Peramalan Jangka Menengah (Medium term)
Peramlan jangka menengah atau intermediate umumnya mencakup hitungan
bulanan atau kuartal.
Universitas Sumatera Utara
10
Peramalan ini bermanfaat untuk merencanakan penjualan, perencanaan dan
anggaran produksi, anggaran kas, serta menganalisis bermacam-macam
rencana operasi.
3. Peramalan Jangka Panjang (Long term)
Peramalan ini bersifat tahunan. Peramalan jangka panjang digunakan untuk
merencanakan produk baru, pembelanjaan modal, lokasi atau pengembangan
fasilitas, serta penelitian dan pengembangan.
Terdapat dua pendekatan umum dalam teknik peramalan (Heizer & Render, 2005),
yaitu:
1. Peramalan Kualitatif
Peramalan kualitatif menggabungkan faktor seperti intuisi, emosi,
pengalaman pribadi, dan bersifat subjektif. Peramalan ini biasanya
dilakukan melalui kuesioner, survey, dan riset pasar.
2. Peramalan Kuantitatif
Peramalan kuantitatif merupakan peramalan yang didasarkan pada model
matematis yang beragam dengan data masa lalu (time series) dan variable
sebab-akibat (causal method).
2.2.1 Peramalan time series
Metode time series adalah metode yang digunakan untuk menganalisis data yang
merupakan fungsi dari waktu (Ishak, 2010). Peramalan dengan teknik ini berarti nilai
masa depan diperkirakan hanya dari nilai masa lalu dan mengabaikan variabel yang
lain (Heizer & Render, 2005). Dengan analisis ini dapat ditunjukkan bagaimana
permintaan terhadap produk tertentu bervariasi terhadap waktu.
Berikut ini merupakan beberapa pola yang terdapat dalam data time series
(Hartanto, 2012), yaitu:
1. Pola Data Horizontal
Pola ini terjadi apabila nilai data berfluktuasi di sekitar nilai rata-rata yang
konstan. Deret itu seperti stationer terhadap nilai rata-ratanya. Grafik pola
horizontal dapat dilihat pada Gambar 2.1
Universitas Sumatera Utara
11
Jumlah Data
Waktu
Gambar 2.1 Pola Data Horizontal
2. Pola Data Musiman
Pola ini terjadi jika suatu deret dipengaruhi oleh musiman (misalnya kuartal
tahun tertentu, bulanan, mingguan, atau pada hari-hari tertentu). Grafik pola
data musiman dapat dilihat pada Gambar 2.2
Jumlah Data
Waktu
Gambar 2.2 Pola Data Musiman
3. Pola Data Siklus
Pola ini terjadi bila datanya dipengaruhi oleh fluktasi ekonomi jangka panjang
seperti yang berhubungan siklus bisnis. Penjualan produk seperti mobil, baja,
dan peralatan lainnya menunjukkan jenis pola data ini. Grafik pola data siklus
dapat dilihat pada gambar 2.3
Jumlah Data
Waktu
Gambar 2.3 Pola Data Siklus
Universitas Sumatera Utara
12
4. Pola Data Tren
Pola ini terjadi apabila terdapat kenaikan tau penurunan sekuler panjang dalam
data. Data penjualan suatu perusahaan , produk bruto nasional (GNP), dan
berbagai indikator bisnis tau ekonomi lainnya mengikuti suatu pola data tren
selama perubahannya sepanjang waktu. Grafik pola data tren dapat dilihat pada
gambar 2.4
Jumlah Data
Waktu
Gambar 2.4 Pola Data Tren
2.3 Data Mining
Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan
pengetahuan didalam database (Luthfi, 2009). Data mining adalah proses yang
menggunakan teknik statik, matematika, kecesdasan buatan dan machine learning
untuk mengekstraksian dan mengindentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar (Turban, 2005).
Selain defenisi di atas beberapa defenisi juga diberikan seperti, data mining
adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data
berupa pengetahuan yang selama ini tidak diketahui secara manual. Data mining
adalah menganalisis secara otomatis dari data yang berjumlah besar atau kompleks
untuk menemukan suatu pola atau kecenderungan yang penting yang biasanya tidak
disadari keberadaannya (Pramudiono, 2006).
Dari berbagai definisi yang telah disampaikan, berikut merupakan beberapa
hal penting yang terkait dengan data mining:
1. Data mining adalah suatu proses otomatis yang dilakukan terhadap data
yang telah ada.
Universitas Sumatera Utara
13
2. Data yang akan diproses merupakan data yang berjumlah sangat besar.
3. Tujuan dari data mining adalah untuk mendapatkan hubungan atau pola
yang kemungkinan memberikan indikasi bermanfaat.
Knowledge Discover in Database (KDD) adalah proses menentukan informasi yang
berguna serta pola-pola yang ada dalam data. Informasi ini terkandung dalam basis
data yang berukuran besar yang sebenarnya tidak diketahui dan potensi bermanfaat
(Han & Kamber, 2006). Data Mining merupakan salah satu langkah dari serangkaian
proses iterative KDD.
Gambar 2.5 Tahapan dalam KDD (Han & Kamber , 2006)
Tahapan proses KDD terdiri dari :
1. Data Selection
Pada Proses ini dilakukan pemilihan himpunan data, menciptakan himpunan
data target, atau memfokuskan pada subset variable, (sampel data) dimana
penemuan (discovery) akan dilakukan. Hasil seleksi disimpan dalam suatu
berkas yang terpisah dari basis data operasional.
2. Pre-Processing dan Cleaning Data
Pre-Processsing dan Cleaning Data dilakukan membuang data yang tidak
konsisten dan noise, duplikasi data, memperbaiki kesalahan data,dan bisa
diperkaya dengan data eksternal yang revelan.
Universitas Sumatera Utara
14
3. Transformation
Proses ini mentransformasikan atau menggabungkan data ke dalam yang lebih
tepat untuk melakukan proses mining dengan cara melakukan peringkasan
(agregasi).
4. Data Mining
Proses data mining yaitu proses mencari pola atau informasi menarik
dalamdata terpilih dengan menggunakan teknik, metode atau algoritma
tertentu sesuai dengan tujuan dari proses KDD secara keseluruhan.
5. Interpretation/ Evaluasi
Proses untuk menerjemahkan pola-pola yang dihasilkan dari data mining,
Mengevaluasi (menguji) apakah pola atau informasi yang ditemukan
bersesuian atau bertentangan dengan faktaatau hipotesa sebelumnya.
Pengetahuan yang diperoleh dari pola-pola yang terbentuk dipresentasikan
dalam bentuk visualisasi.
Fungsi-fungsi dalam data mining mengacu pada Larose (2005) yang
membaginya ke dalam enam fungsi yaitu (Susanto & Suryadi, 2010) :
1. Fungsi Deskripsi (description)
Fungsi deskripsi adalah cara yang digunakan untuk menggambarkan
sekumpulan data secara ringkas. Banyak cara yang digunakan dalam
memberikan gambaran secara ringkas bagi sekumpulan data yang besar
jumlahnya dan banyak macamnya yaitu deskripsi grafis, deskripsi lokasi dan
deskripsi keragaman.
2. Fungsi Estimasi (estimation)
Fungsi estimasi adalah fungsi untuk memperkirakan suatu hal yang sudah ada
datanya. Fungsi estimasi terdiri dari dua cara yaitu estimasi titik dan estimasi
selang kepercayaan.
3. Fungsi Prediksi (prediction)
Fungsi prediksi adalah memperkiraan hasil dari informasi yang belum
diketahui untuk mendapatkan informasi baru yang akan muncul selanjutnya.
4. Fungsi Klasifikasi (clasification)
Fungsi klasifikasi atau menggolongkan suatu data. Beberapa algoritma yang
digunakan antara lain adalah algoritma Mean Vector, algoritma K-Nearest
Universitas Sumatera Utara
15
Neighbor (KNN) , algoritma C.45 dan algoritma lainnya. Fungsi klasifikasi ini
banyak juga digunakan untuk melakukan prediksi.
5. Fungsi Klastering (Clustering)
Fungsi klastering merupakan fungsi untuk mengelompokkan data. Data yang
dikelompokkan disebut objek yang memiliki kemiripan atribut kemudian
dikelompokkan yang berbeda. Teknik atau metode klastering dapat
dikelompokkan menjadi 2 kategori besar yaitu , Metode Hirarki (Hierarchical
Clustering) dan Metode Partisi (Partitional Clustering).
6. Fungsi Asosiasi (Association)
Fungsi asosiasi adalah untuk menemukan aturan hubungan (association rule)
yang mampu mengindentifikasi item-item yang menjadi objek.
2.3 Klasifikasi
Klasifikasi adalah proses penemuan model (atau fungsi) yang menggambarkan dan
membedakan kelas data atau konsep yang bertujuan agar bisa digunakan untuk
memprediksi kelas dari objek yang label kelasnya tidak diketahui (Han, 2006).
Klasifikasi data terdiri dari 2 langkah proses. Pertama adalah learning (face training),
dimana algoritma klasifikasi dibuat untuk menganalisa data training lalu
dipresentasikan dalam bentuk rule klasifikasi, dimana data tes digunakan untuk
memperkirakan akurasi dari rule klasifikasi (Han, 2006).
Klasifikasi merupakan proses untuk menempatkan suatu objek ke dalam suatu
kategori/kelas yang sudah didefenisikan sebelumnya berdasarkan model tertentu. Data
Mining merupakan penjelasan tentang masa lalu dan prediksi masa depan berdasarkan
ini data mining menggunakan beberapa model yaitu pemodelan prediktif dan
deskriptif . (Emerensye, 2012)
a. Pemodelan Prediktif diawali dengan pembentukan pemodelan unruk
memprediksi hasil.
Universitas Sumatera Utara
16
Variabel Input (plafon,
total telat, status) x1,
x2, x3 ..
Model Data
mining (k-NN)
f(.)
Output (macet, lancer,
tersendat /nilai jaminan)
Y = f()x1,x2,x3..)
Gambar 2.6 Pomedalan Prediktif
b. Pemodelan Deskriptif atau lebih dikenal dengan istilah clustering , merupakan
proses pengamatan terhadap kelompok data kemudian diikuti dengan
pengelompokan data/cluster terhadap data yang mempunyai kesamaan ciri.
2.4 Algoritma K-Nearest Neighbor (KNN)
Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk
melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya
paling dekat dengan objek tersebut (Widiarsana, O et al., 2011). Algoritma K-Nearest
Neighbor (KNN) adalah metode yang digunakan untuk mengelompokkan objek
berdasarkan contoh pelatihan terdekat di ruang fitur. K-Nearest Neighbor merupakan
jenis yang paling dasar dari contoh based learning atau lazy learning juga termasuk
kelompok instance-based learning. K-Nearest Neighbor dilakukan dengan mencari
kelompok objek dalam data training yang paling dekat (mirip) dengan objek pada data
baru atau data testing. (Krati,2014).
Algoritma K-Nearest Neighbor bersifat sederhana, bekerja dengan berdasarkan
pada jarak terpendek dari sampel uji (testing sample) ke sampel latih (training sample)
untuk menentukan K- Nearest Neighbor nya. Setelah mengumpulkan K-Nearest
Neighbor, kemudian diambil mayoritas dari K- Nearest Neighbor (KNN) untuk
dijadikan prediksi dari sample uji. K-Nearest Neighbor memiliki beberapa kelebihan
yaitu tangguh terhadap training data yang noise dan efektif apabila data latih nya
besar. Pada fase training, algoritma ini hanya melakukan penyimpanan vektor-vektor
fitur dan klasifikasi data training sample. Pada fase klasifikasi, fitur-fitur yang sama
dihitung untuk testing data atau yang klasifikasinya tidak diketahui. Jarak dari vektor
baru yang ini terhadap seluruh vektor training sample dihitung dan sejumlah k buah
yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan termasuk pada
klasifikasi terbanyak dari titik-titik tersebut. Ketepatan algoritma K-Nearest Neighbor
Universitas Sumatera Utara
17
sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan atau jika bobot
fitur tersebut tidak setara dengan relevansinya terhadap klasifikasi. (Alfian,2014).
Menurut Kusrini dan Emma (2009) algoritma K-Nearest Neighbor adalah
pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru
dengan kasus lama dengan berdasarkan pada pencocokan bobot dari sejumlah fitur
yang ada yang memiliki kesamaan (similiarity). Tujuan dari algoritma ini untuk
mengklasifikasikan objek baru berdasarkan atribut dan training sample. Classifier
tidak menggunakan model apapun untuk dicocokan dan hanya berdasarkan pada
memori.
Contoh kasus, misalkan diinginkan untuk mencari solusi terhadap pasien baru
dengan menggunakan solusi dari data pasien terdahulu. Untuk mencari kasus pasien
mana yang akan digunakan maka dihitung kedekatan kasus pasien baru dengan semua
kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar yang akan diambil
solusinya untuk digunakan pada kasus pasien baru.
Gambar 2.7 Ilustrasi Solusi pada KNN
(Sumber: Kursini & Emha Taufiq Luthfi, 2009)
Seperti tampak pada Gambar 2.2 terdapat dua pasien lama A dan B. Ketika ada pasien
baru, maka solusi yang akan diambil adalah solusi dari pasien terdekat dari pasien
baru. Seandainya d1 adalah kedekatan antara pasien baru dan pasien A, sedangkan d2
adalah kedekatan antara pasien baru dengan pasien B. Karena d2 lebih dekat dari d1
maka solusi dari pasien B yang akan digunakan untuk memberikan solusi pasien baru.
.
Universitas Sumatera Utara
18
Ada banyak cara untuk mengukur jarak kedekatan antara data baru dengan
data lama (data training), diantaranya Euclidean distance dan manhattan distance
(city block distance) yang sering digunakan adalah euclidean distance, yaitu :
, = − + − , . . . − ….2.1
Dimana a = , , …, dan b = , , … mewakili n nilai atribut dari dua
record.
Adapun langkah-langkah untuk menghitung algoritma K-Nearest Neighbor
antara lain :
1. Menentukan Parameter K (jumlah tentangga terdekat).
2. Menghitung kuadrat jarak eucliden (queri instance) masing –masing objek
terhadap data sampel yang diberikan.
3. Kemudian mengurutkan jarak tersebut ke dalam kelompok yang mempunyai
Euclid terkecil (mengurutkan hasil no 2 secara ascending).
4. Mengumpulkan kategori Y (Klasifikasi Nearest Neighbor) berdasarkan nilai K
atau ambil data tetangga terdekat.
5. Dengan menggunakan kategori Nearest Neighbor yang paling mayoritas maka
akan menghasilkan kelas data baru (prediksi). Nilai k yang terbaik untuk
algoritma ini tergantung pada data. Secara umum, nilai k yang tinggi akan
mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap
klasifikasi menjadi semakin kabur. Nilai k yang bagus dapat dipilih dengan
optimasi parameter, misalnya dengan menggunakan Simple Unweighted
Voting.
2.5 Penelitian Terdahulu
Adapun beberapa penelitian terdahulu yang berkaitan dengan topik ini dapat dilihat
pada tabel 2.1Tabel
Universitas Sumatera Utara
19
Tabel 2.1 Penelitian Terdahulu
No
1.
Judul
Aplikasi Metode
Ensembel untuk
Peramalan
Inflasi di
Indonesia
Peneliti (Tahun)
Mega Silfiani dan
Suhartono (2012)
Hasil
Metode single ANN
menghasilkan RMSE yang
kecil dibandingkan model
lainnya pada pemodelan
inflasi nasional dan tujuh kota
di Jawa Timur. Sedangkan
jika dilihat dari ensembel,
metode ANN ensembel
menghasilkan RMSE yang
kecil dibandingkan model
ensembel lainnya.
2.
Aplikasi Model
Neuro Fuzzy
untuk Prediksi
Tingkat Inflasi di
Indonesia
Aidatul Fitriah (2011)
model
ANFIS
mempunyai
nilai
tersebut
MSE
sebesar 0.0420 dan MAPE
sebesar 40.32 %. Dan pada
proses testing model tersebut
mempunyai
nilai
MSE
sebesar 0.9087 dan MAPE
sebesar 193.11 %. bahwa
prediksi
tingkat
inflasi
menggunakan model ANFIS
tidak cocok untuk jangka
panjang, namun cocok untuk
jangka pendek misal tingkat
inflasi 3 bulan kemudian
(triwulan).
Universitas Sumatera Utara
20
Tabel 2.2 Penelitian terdahulu (lanjutan)
No
3.
Judul
Peneliti (tahun)
Hasil
Analisi Prediksi
Ricky Imanuel
Hasil penelitian dengan uji
Tingkat
Ndaumanu (2014)
coba secara manual dan
Pengunduran Diri
menggunakan system
Mahasiswa dengan
didapatkan kesamaan hasil
Moteode K-
prediksi 79%.
Nearest Neigbor
4
Aplikasi Prediksi
Naila Fitriah (2012)
Hasil penelitian ini Prediksi
Harga Saham
kenaikan atau penurunan
Apple, IBM,
harga saham Error rate (rata-
DELL, Dan HP
rata error terkecil) yang
Menggunakan
dihasilkan Algoritma K-
Algoritma K-
Nearest Neighbors < 50%.
Nearest Neighbors
Universitas Sumatera Utara
Download