BAB 2 LANDASAN TEORI Bab ini akan membahas tentang teori-teori pendukung dan penelitian sebelumnya yang berhubungan dengan prediksi produksi kelapa sawit dan penerapan jaringan saraf Radial Basis Function (RBF). 2.1. Produksi Kelapa Sawit Kelapa sawit terdiri daripada dua spesies Arecaceae atau famili palma yang digunakan untuk pertanian komersil dalam pengeluaran minyak kelapa sawit. Pohon Kelapa Sawit Afrika, Elaeis guineensis, berasal dari Afrika barat di antara Angola dan Gambia, manakala pohon kelapa sawit Amerika, Elaeis oleifera, berasal dari Amerika Tengah dan Amerika Selatan. Bagian yang paling utama pada industry kelapa sawit adalah buah dari kelapa sawit. Bagian daging buah menghasilkan minyak kelapa sawit mentah yang diolah menjadi bahan baku minyak goreng. Untuk memenuhi permintaan minyak kelapa sawit diperlukan produksi kelapa sawit pada industri kelapa sawit. Produksi minyak kelapa sawit merupakan hasil panen buah kelapa sawit dari suatu area perkebunan kelapa sawit. Produksi kelapa sawit merupakan sumber penghasilan utama dalam perusahaan. Perlu adanya penyusunan biaya produksi untuk mendapatkan produksi kelapa sawit yang tinggi. Hal ini dikarenakan jika produksi kelapa sawit tinggi maka keuntungan perusahaan dari penjualan hasil produksi akan meningkat. Penyusunan biaya produksi perusahaan memerlukan peramalan produksi kelapa sawit sebagai target produksi agar anggaran yang dikeluarkan oleh perusahaan menjadi optimal karena pengeluaran perusahaan disesuaikan berdasarkan kemungkinan produksi perusahaan dalam setahun. Universitas Sumatera Utara 8 Beberapa faktor yang mempengaruhi produksi kelapa sawit menurut Septianita (2009) yaitu luas produksi, tenaga kerja, bibit, pupuk urea dan herbisida. Dari penelitian tersebut diketahui bahwa luas produksi berpengaruh secara signifikan terhadap produksi terlihat bahwa tingkat penggunaan lahan pada usaha tani kelapa sawit menunjukkan adanya penambahan faktor tersebut terhadap peningkatan faktor produksi. Faktor lain seperti tenaga kerja juga berpengaruh terhadap produksi namun tidak signifikan karena faktor produksi sudah maksimal jika ditambah satu persen maka hanya akan menurunkan tingkat produksi. 2.2. Data Mining Data mining merupakan proses kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan pola atau hubungan dalam set data berukuran besar. Pengenalan pola merupakan bagian dari data mining. Pengenalan pola melakukan pengelompokkan objek ke berbagai kelas dan dari data tersebut dapat diketahui kecendrungan pola. Pengenalan pola mengacu kepada kasus klasifikasi dan regresi (Santosa, 2007). Tugas utama dari data mining dibagi menjadi dua yaitu descriptive dan predictive. Descriptive merupakan kemampuan untuk mengidentifikasi keunikan data, pola, trend, hubungan dan anomaly pada data. Descriptive dibagi menjadi asosiasi, segmentasi dan clustering. Predictive merupakan pengembangan model dari beberapa fenomena yang memungkinkan dilakukan estimasi nilai dan prediksi untuk masa depan. Predictive dibagi menjadi klasifikasi dan regresi. Regresi termasuk kepada estimasi dan peramalan atau prediksi (Myatt & Johnson, 2009). Atribut dibutuhkan untuk proses data mining. Atribut disebut sebagai variabel dan ada juga yang menyebutnya dengan fitur. Variabel-variabel yang akan digunakan, akan dikelompokkan menjadi input dan output. Format data akan dinyatakan dalam bentuk matrik dimana baris menyatakan objek atau observasi dan kolom dinyatakan variabel (Santosa, 2007). Metode dalam data mining untuk memproses data-data yang ada dibagi menjadi dua pendekatan yaitu supervised dan unsupervised. Supervised learning merupakan pembelajaran yang terawasi, sehingga membutuhkan data untuk pelatihan Universitas Sumatera Utara 9 dan pengujian. Unsupervised learning merupakan pembelajaran yang tidak terawasi sehingga metode yang diterapkan tanpa ada proses pelatihan. 2.2.1 Data Cleaning Menurut Myatt dan Johnson (2009) sebelum memproses data diperlukan cleaning data pada data tabel untuk mengidentifikasi data. Tujuannya adalah untuk menghindari data error, tidak ada entri data dan data yang hilang. Nilai pada data sering hilang pada tabel data, tetapi pendekatan data mining tidak dapat diproses sampai kasus ini diselesaikan. Ada lima pilihan untuk melakukan cleaning data yaitu menghapus data yang memiliki nilai kosong pada tabel data, menghapus variabel yang memiliki data kosong pada tabel data, mengganti nilai data dengan nilai komputasi, mengganti nilai data dengan nilai secara prediksi pada model yang umum menggunakan field yang lain pada data tabel. Situasi yang sama jika terjadi hilang data ketika variabel yang dimaksudkan diperlakukan sebagai variabel angka berisi nilai teks, atau angka spesifik yang memiliki arti khusus. Teks atau angka spesifik kemungkinan akan dijadikan nilai angka untuk menggantikan teks dan angka spesifik. Masalah lain muncul ketika nilai dengan data tabel salah. Nilai mungkin menjadi salah sebagai hasil dari data entri yang error. Keluaran pada data mungkin error dan dapat ditemukan menggunakan metode yang berbeda berdasarkan variabel, sebagai contohnya menghitung nilai score a-z untuk nilai masing-masing yang merepresentasikan nilai standar deviasi dari nilai mean. Ploting data menggunakan box plot atau frekuensi histogram dapat mengidentifikasi nilai data yang signifikan dari nilai mean. Variabel noise yang berisi sudut error digantikan variabel dengan versi biner yang lebih merepresentasikan secara akurat variasi data yang mungkin dibutuhkan, proses ini disebut data smoothing. Metode yang lainnya, seperti visualisasi data, clustering, dan model regresi dapat juga digunakan untuk mengidentifikasi anomali data yang terlihat tidak sama dengan data lainnya atau yang tidak cocok dengan data trend untuk data mayoritas. Universitas Sumatera Utara 10 2.2.2 Data Selecting Data selecting dilakukan untuk memilih variabel data yang akan digunakan dan membagi data menjadi data latih dan data uji. Menurut Kaastra dan Boyd (1996) ada dua tipe pemilihan variabel yaitu teknikal input dan fundamental input. Teknikal input adalah penetapan nilai variabel yang berpengaruh atau indikator perhitungan dari nilai yang lalu, sedangkan fundamental input adalah penetapan variabel ekonomis yang dipercaya mempengaruhi variabel output dan mungkin membantu peningkatan prediksi. Pembagian data dalam data mining menurut Kaastra dan Boyd (1996) dibagi menjadi tiga yaitu a. Training data (data latih) Data latih terdiri dari data set yang banyak. Biasanya digunakan oleh jaringan saraf untuk melakukan pengenalan pola. b. Testing data (data uji) Data uji berjumlah 10-30% data dari training set. Data Uji digunakan untuk mengevaluasi kemampuan jaringan saraf setelah dilatih. c. Validation data (data validasi) Data validasi digunakan untuk pengecekan akhir kemampuan jaringan saraf yang telah dilatih. 2.2.3 Tranformasi Data Transformasi data dibutuhkan untuk membuat variabel baru dari kolom data yang sudah ada untuk merefleksikan lebih dekat tujuan dari projek atau pendekatan kualitas prediksi. Sebuah data ditransformasi agar dapat digunakan untuk beberapa analisis teknik terutama pada bidang analisis data. Transformasi data digunakan untuk mengatur nilai yang diukur pada suatu skala menjadi nilai yang lebih kecil sehingga seluruh atribut data memiliki jangkauan yang lebih kecil dalam jangkauan nilai 0 sampai 1 (Siang, 2012). Ada beberapa rumusan transformasi data yang dapat digunakan menurut Siang (2012) seperti berikut ini. Universitas Sumatera Utara 11 1. Transformasi polinomial π₯ ′ = ln π₯ (2.1) Dengan, π₯ ′ = nilai data setelah transformasi polynomial π₯ = nilai data pada data aktual 2. Transformasi normal π₯′ = π₯0 − π₯πππ π₯πππ₯ − π₯πππ (2.2) Dengan, π₯ ′ = nilai data setelah transformasi normal π₯0 = nilai data pada data aktual π₯πππ = nilai minimum pada data aktual π₯πππ₯ = nilai maksimum pada data aktual 3. Transformasi linear Transformasi nilai data pada interval [0.1,0.9] π₯′ = 0.8 ( π₯−π) π−π + 0.1 (2.3) Dengan, π₯ ′ = nilai data setelah transformasi linear π₯ = nilai data pada data aktual π = nilai minimum data aktual π = nilai maksimum data aktual 2.2.4 Peramalan Peramalan adalah suatu kegiatan bisnis yang memperkirakan penjualan, penggunaan suatu produk sehingga produk tersebut dapat dibuat dalam kuantitas yang tepat (Gaspersz, 2010). Dugaan terhadap permintaan yang akan datang berdasarkan pada beberapa variabel peramalan berdasarkan data masa lalu. Universitas Sumatera Utara 12 Menurut Gaspersz (2010), langkah-langkah yang harus dilakukan dalam menjamin efisiensi untuk melakukan peramalan. Langkah-langkah tersebut adalah sebagai berikut. 1. Menentukan tujuan peramalan 2. Memilih item yang akan diramalkan 3. Menentukan rentang waktu peramalan 4. Memilih model peramalan 5. Mengumpulkan dan menganalisis data 6. Validasi model peramalan 7. Membuat peramalan 8. Implementasi hasil peramalan 9. Memantau keandalan hasil peramalan Peramalan dilakukan berdasarkan jangka waktu yang diperlukan. Peramalan ini dilakukan untuk mengambil keputusan sehingga peramalan ini menghasilkan suatu kemungkinan keadaan yang akan terjadi. Berdasarkan horison waktu, peramalan dapat dikelompokkan dalam tiga bagian (Herjanto, 2006), yaitu: 1. Peramalan jangka pendek, jangka waktu kurang dari tiga bulan. Misalnya, peramalan yang berhubungan dengan perencanaan pembelian material, penjadwalan kerja dan penugasan karyawan. 2. Peramalan jangka menengah, mencakup waktu antara 3 bulan sampai 18 bulan. Misalnya, peramalan perencanaan penjualan, perencanaan produksi dan perencanaan tenaga kerja tidak tetap. 3. Peramalan jangka panjang, mencakup waktu yang lebih besar dari 18 bulan. Misalnya peramalan yang diperlukan dalam kaitannya dengan penanaman modal, perencanaan fasilitas dan perencanaan kegiatan litbang. Pengumpulan data yang relevan berupa informasi yang dapat menghasilkan peramalan yang akurat. Pemilihan teknik peramalan yang tepat akan memanfaatkan informasi data yang diperoleh secara maksimal. Menurut Jumingan (2009) teknik peramalan berdasarkan sifatnya dapat dibedakan menjadi dua yaitu: Universitas Sumatera Utara 13 1. Teknik peramalan kualitatif Teknik kualitatif merupakan teknik peramalan yang bersifat subjektif berdasarkan pendapat dari suatu pihak atau berdasarkan hasil penelitian questioner yang telah dilakukan. Data pada teknik ini tidak dapat direpresentasikan secara tegas ke dalam suatu angka atau nilai. 2. Teknik peramalan kuantitatif Teknik kuantitatif merupakan teknik peramalan berdasarkan data masa lalu atau data historis dan dapat dibuat dalam bentuk angka. Dalam peramalan dikenal istilah prediksi. Prediksi merupakan suatu usaha untuk meramalkan keadaan di masa mendatang melalui pengujian keadaan di masa lalu (Rambe, 2002). Data historis diolah secara sistematik dan digabungkan dengan suatu metode tertentu akan memperoleh prediksi keadaan pada masa datang. Prediksi ini menggunakan data kuantitatif sebagai pelengkap informasi melakukan peramalan (Herjanto, 2006). Peramalan menurut Heizer (2005) dapat dikelompokkan berdasarkan sumber peramalannya sebagai berikut. 1. Model data time series atau runtun waktu Model data time series merupakan suatu jenis peramalan secara kuantitatif. Model ini sering disebut model kuantitatif intrinsik. Tujuannya adalah menemukan pola dalam deret data historis dan mengekstrapolasikan pola dalam deret data tersebut ke pola data masa depan. 2. Model data causal Model data causal merupakan suatu jenis peralaman yang menggunakan hubungan sebab-akibat sebagai asumsi dari apa yang terjadi di masa lalu akan terulang kembali. Model ini disebut dengan peramalan kuantitatif ekstrasik, sesuai digunakan untuk pengambilan keputusan dan kebijakan. 3. Model data judgemental Model data judgemental merupakan suatu jenis peramalan yang mencakup untuk memasukkan faktor-faktor kualitatif atau subjektif ke dalam metode peramalan. Universitas Sumatera Utara 14 Model data time series dan causal digunakan sebagai metode peramalan kuantitatif. Pada umumnya metode peramalan causal meliputi faktor-faktor yang berhubungan dengan variabel yang diprediksi seperti analisi regresi sedangkan metode peramalan time series menggunakan data masa lalu yang telah dikumpulkan untuk dianalisis secara teratur dengan menggunakan teknik yang tepat (Sani, 2013). Hasilnya dapat dijadikan acuan untuk peramalan nilai di masa yang akan datang. Peramalan harus mendasarkan analisisnya pada pola data yang ada. Empat pola data yang lazim ditemui dalam peramalannya adalah sebagai berikut (Aryanto, 2012). 1. Pola data horizontal Pola ini terjadi bila data berfluktuasi di sekitar rata-ratanya. Produk yang penjualannya tidak meningkat atau menurun selama waktu tertentu termasuk jenis ini. Struktur datanya dapat digambarkan sebagai berikut ini. Jumlah Data Waktu Gambar 2.1 Pola Data Horizontal 2. Pola data musiman Pola musiman terjadi bila nilai data dipengaruhi oleh faktor musiman (misalnya kuartal tahun tertentu, bulanan atau hari-hari pada minggu tertentu). Struktur datanya dapat digambarkan sebagai berikut ini. Jumlah Data Waktu Gambar 2.2 Pola Data Musiman Universitas Sumatera Utara 15 3. Pola data siklis Pola ini terjadi bila data dipengaruhi oleh fluktuasi ekonomi jangka panjang seperti yang berhubungan dengan siklus bisnis. Struktur datanya dapat digambarkan sebagai berikut. Jumlah Data Waktu Gambar 2.3 Pola Data Siklis 4. Pola data trend Pola trend terjadi bila ada kenaikan atau penurunan sekuler jangka panjang dalam data. Struktur datanya dapat digambarkan sebagai berikut. Jumlah Data Waktu Gambar 2.4 Pola Data Trend 2.3. Jaringan Saraf Tiruan Jaringan saraf tiruan (Artificial Neural Network) adalah pemrosesan suatu informasi yang terinspirasi oleh sistem jaringan saraf biologis (Smith, 2003). Jaringan saraf tiruan juga merupakan cabang ilmu kecerdasan buatan dan alat untuk memecahkan masalah terutama di bidang-bidang yang melibatkan pengelompokan data yang memiliki kecendrungan untuk menyimpan pengetahuan yang bersifat pengalaman dan membuatnya untuk siap digunakan (Sutojo et al, 2011). Universitas Sumatera Utara 16 Jaringan saraf tiruan disusun dengan asumsi yang sama dengan jaringan saraf biologis karena pengolahan informasi terjadi pada elemen-elemen pemrosesan (neuron-neuron), sinyal antara dua buah neuron diteruskan melalui link koneksi, setiap link koneksi memiliki weight yang terasosiasi, dan setiap neuron menerapkan sebuah fungsi aktifasi terhadap input jaringan dengan tujuan agar dapat menentukan sinyal output (Puspitaningrum, 2006). Output Signal Input Signal Input Layer Middle Layer Output Layer Gambar 2.5 Arsitektur Umum Jaringan Saraf Tiruan Multilayer Cara belajar jaringan saraf tiruan dilakukan seperti berikut ini. 1. Pada jaringan saraf tiruan, node atau unit-unit input di-input kan informasi yang sebelumnya telah diketahui hasil keluarannya. 2. Weights antar koneksi dalam suatu arsitektur diberi nilai awal dan kemudian jaringan tersebut dijalankan. Weights ini digunakan untuk belajar dan mengingat suatu informasi. 3. Pengaturan weights dilakukan secara terus-menerus dan menggunakan kriteria tertentu sampai diperoleh keluaran yang diharapkan. Tujuan jaringan saraf tiruan dilatih adalah untuk mencapai keseimbangan antara memorisasi dan generalisasi. Kemampuan memorisasi dilakukan untuk memanggil kembali secara sempurna pola yang telah dipelajari. Kemampuan generalisasi dilakukan untuk menghasilkan respons yang bisa diterima terhadap polapola input yang serupa dengan pola-pola sebelumnya yang telah dipelajari. Sehingga, jaringan saraf tiruan akan tetap memberikan tanggapan yaing baik berupa keluaran yang paling mendekati walaupun informasi yang di-input kan adalah informasi baru. Universitas Sumatera Utara 17 Pada pembelajaran jaringan saraf tiruan, terdapat dua kelompok pembelajaran yaitu sebagai berikut. 1. Jaringan saraf tiruan umpan maju (feed-forward networks), merupakan graf yang tidak mempunyai loop dan bergerak maju. Contoh jaringan umpan maju adalah single-layer perceptron, multilayer perceptron dan radial basis fuction. 2. Jaringan saraf tiruan umpan balik (recurrent-feedback networks), merupakan graf yang memiliki loop koneksi balik. Contoh jaringan ini adalah competitive networks, kohonen’s SOM, hopfield network, dan ART model. Pada feed-forward networks, diterapkan fungsi aktivasi kedalam weight dan input dilakukan perhitungan yang hasilnya dianggap sebagai sinyal berbobot yang diteruskan kelapisan di atasnya. Sinyal yang berbobot tersebut menjadi input bagi lapisan selanjutnya. Fungsi aktivasi diterapkan pada lapisan tersebut untuk menghitung output jaringan. Proses ini dilakukan terus menerus sampai kondisi berhenti terpenuhi. Kelebihan-kelebihan yang diberikan oleh jaringan saraf tiruan adalah sebagai berikut (Sutojo et al, 2011). 1. Belajar Adaptive yang merupakan kemampuan untuk mempelajari bagaimana melakukan pekerjaan berdasarkan data yang diberikan untuk pelatihan dan pengalaman awal. 2. Self-Organisation yang merupakan sebuah jaringan saraf tiruan dapat membuat representasi sendiri dari informasi yang diterimanya selama proses pembelajaran. 3. Real Time Operation yang merupakan perhitungan jaringan saraf tiruan dapat dilakukan secara parallel sehingga perangkat keras yang dirancang dan diproduksi secara khusus agar dapat mengambil keuntungan dan kemampuan ini. Kelemahan-kelemahan jaringan saraf tiruan adalah sebagai berikut (Kasabov, 2007). Universitas Sumatera Utara 18 1) Kesulitan memilih arsitektur dari system karena jaringan saraf tiruan memiliki arsitektur yang tetap dengan jumlah neuron serta koneksi yang tetap sehingga akan sulit untuk beradaptasi dengan informasi yang baru. 2) Dalam mempelajari data baru, jaringan akan cenderung melupakan pengetahuan yang lama. 3) Pelatihan pada jaringan akan memerlukan banyak iterasi serta propagasi data melalui struktur jaringan sehingga perlu waktu yang lama. 4) Kurangnya fasilitas representasi pengetahuan pada jaringan. 2.3.1 Radial Basis Function Radial basis function (RBF) merupakan sebuah fungsi yang dinyatakan dengan nilai yang bergantung pada jarak antar argumen atau jarak antara nilai center (Lukaszyk, 2004). Sama seperti multilayer perceptron (MLP) yang memiliki lapisan hidden dengan fungsi sigmoid yang dapat belajar dengan fungsi perkiraan, jaringan RBF menggunakan pendekatan yang sedikit berbeda. Menurut Bullinaria (2004) fitur utama RBF adalah sebagai berikut. 1. Terdapat dua layer yang bersifat feed-forward 2. Hidden node mengimplementasikan bagian RBF berupa fungsi Gaussian 3. Output node mengimplementasikan fungsi linear yang sama seperti MLP 4. Jaringan untuk pengujian dibagi menjadi dua bagian, yang pertama weight dari input ke hidden dan kemudian weight dari hidden ke output 5. Pengujian atau pembelajaran sangat cepat. 6. Interpolasi jaringan sangat baik Struktur jaringan RBF terdiri dari tiga layer yaitu input layer, hidden layer, dan output layer. Pada input layer terdiri dari source node (unit sensor) yang menghubungkan jaringan dengan lingkungannya. Pada layer kedua yang biasa disebut dengan hidden layer mengaplikasikan sebuah transformasi nonlinear dari input ke hidden, sehingga dibutuhkan sebuah metode unsupervised learning untuk mengaplikasikannya. Pada output layer berupa linear sehingga pada layer ini dibutuhkan metode supervised learning untuk prosesnya. Struktur jaringan RBF dapat dilihat pada Gambar 2.6. Universitas Sumatera Utara 19 φ1 H1 ||X1 – C1|| X1 φ2 w0 1 w1 X2 w2 φ3 Y w3 wj Xi φj Hj Output Layer Hidden Layer Input Layer Gambar 2.6 Arsitektur Jaringan Radial Basis Function (Haykin, 2009) Pada jaringan RBF, hidden layer menggunakan biasanya fungsi Gaussian sebagai radial basis function. Fungsi Gaussian dinyatakan dengan, ππ = exp { −||ππ −πΆπ||2 2π2 } (2.4) dimana φj adalah fungsi Gaussian dan σ adalah standar deviasi dari fungsi Gaussian ke j dengan nilai center (Cj). Fungsi σ dinyatakan dengan (Zhang & Li, 2012), σ= ππππ₯ √π π (2.5) dimana dmax merupakan nilai jarak atau distance terbesar pada hidden j dan Cj merupaka nilai center pada hidden j. Metode unsupervised learning yang digunakan untuk jaringan RBF biasanya adalah pendekatan K-Means. Pembelajaran dengan metode tersebut dilakukan untuk menentukan nilai center dan standar deviasi dari variabel input pada setiap node di hidden layer. Setelah mendapatkan nilai pada hidden node tahap selanjutnya hidden layer ke output layer yang menggunakan metode supervised learning dengan pembelajaran yang sama dengan MLP. Pada training set, elemen-elemennya terdiri dari unsur nilai variabel independen (input) dan variabel dependen (output). Sebagai contoh, hubungan variabel independen dengan fungsi aktivasi adalah sebagai berikut. π¦ = π(π₯) (2.6) Universitas Sumatera Utara 20 dengan nilai x merupakan nilai vektor dan nilai y merupakan nilai skalar, dan nilai y bergantung kepada fungsi f dengan komposisi nilai x adalah sebagai berikut(Orr, 1996). π₯1 π₯2 . π₯= . . [π₯π ] (2.7) 2.3.1.1 Tahap Data Pre-processing Menurut Kaastra dan Boyd (1996) data pre-processing merupakan proses menganalisis dan mentransformasikan variabel input dan output untuk membantu jaringan mempelajari pola data. Data pre-processing dilakukan untuk: a. Meminimalisasikan data noise b. Menyoroti hubungan yang penting c. Mendeteksi tren d. Meratakan distribusi variabel Pada tahap pelatihan, data dikumpulkan untuk melakukan proses pelatihan. Data-data tersebut dirakit sebagai pra-proses time series data. Pada penelitian Hussein et al (2011), data tersebut direpresentasikan seperti Gambar 2.7. Gambar 2.7 Data Time Series Prediksi Harga Emas Pada Tahap Pelatihanuntuk Merepresentasikan Form Baris Waktu (Timeline) Hussein et al (2011) melakukan prediksi harga emas hari esok dengan menggunakan harga emas hari kemarin dan hari ini. Sehingga harga emas hari esok adalah output dan harga emas hari kemarin dan hari ini merupakan input. Misalkan input yang digunakan adalah 2 node dan menghasilkan 1 output. Penjelasan pemakaian data input dan output dapat dilihat pada Tabel 2.1 Universitas Sumatera Utara 21 Tabel 2.1 Variabel Data yang digunakan Harga Penjelasan Variabel Harga kemarin Harga (n) dengan n = 1,2,3…. Harga hari ini Harga (n+1) dengan n = 1,2,3…. Harga esok hari Harga (n+2) dengan n = 1,2,3…. Dan tahapan prediksi harga emas dapat dilihat pada Gambar 2.8 Gambar 2.8 Langkah-langkah Proses Pelatihan untuk Input dan Target Vektor Matriks (Hussein et al, 2011) Universitas Sumatera Utara 22 Pada gambar 2.11, vector matriks input terdiri dari baris dan kolom. Pada baris input, data yang ditunjukkan merupakan data yang digunakan untuk mencari nilai prediksi sedangkan untuk kolom (sama seperti pada vector matriks output) merupakan data yang akan digunakan untuk proses jaringan selanjutnya. 2.3.1.2 Tahap I: Input Layer ke Hidden Layer Dalam mendesain jaringan RBF, dibutuhkan suatu metode untuk menghitung nilai parameter dari unit Gaussian yang diperlukan di hidden layer dengan data yang tidak berlabel. Oleh karena itu diperlukan sebuah metode unsupervised learning yang berupa metode K-Means. Metode K-Means merupakan salah satu bentuk metode pemetaan pada dirinya sendiri (Self Organizing Map) yang juga dikembangkan dalam permodelan NN. Tahapan algoritma K-means clustering dapat dilakukan seperti yang di Gambar 2.9. MULAI Menentukan Banyaknya Cluster(k) Menentukan Center Nilai Center Berubah ? Tidak SELESAI Ya Menghitung Jarak dari Center Mengelompokkan Data Berdasarkan Jarak Terdekat Gambar 2.9 Flowchart Algoritma K-Means Clustering Universitas Sumatera Utara 23 Pertama kali yang dilakukan dalam algoritma K-means clustering adalah menentukan kelompok atau cluster dengan syarat jumlah kelompok yang akan dibuat harus lebih kecil dengan jumlah data yang digunakan, kelompok pada jaringan radial basis function yang dimaksud adalah jumlah hidden yang akan digunakan. Kedua, menentukan nilai center secara acak. Ketiga, menghitung jarak data ke center digunakan Euclidean norm. Nilai Euclidean norm dapat dinyatakan dengan (Haykin,2009), d(Xi, Cj) = ||Xi – Cj||2 (2.8) dengan nilai Xi adalah nilai vector input dari data ke i dan nilai Cj adalah nilai vector dari center hidden ke j. Keempat, kelompokkan data sesuai dengan kelompoknya, yaitu data yang memiliki jarak terpendek pada masing-masing hidden (jumlah kelompok = jumlah hidden). Misalkan jumlah hidden adalah dua sehingga jumlah kelompok dua, ketika d(x1,c1) < d(x1,c2) maka nilai x1 masuk ke kelompok 1 dan lakukan hal yang sama dengan data selanjutnya Kelima, memperbaharui nilai center dengan cara merata-ratakan nilai anggota kelompok yang dapat dinyatakan sebagai berikut. ππ = 1 ππ × ∑ππ=1 π₯π (2.9) dengan ni merupakan jumlah anggota kelompok. Lakukan langkah pertama sampai kelima hingga nilai center tidak berubah lagi. Metode K-Means memiliki beberapa keuntungan penggunaan pada jaringan RBF ini, yaitu 1. Algoritma K-Means merupakan algoritma dengan komputasi yang efisien karena seluruh yang kompleks dijadikan linear pada angka cluster 2. Ketika cluster dengan lengkap didistribusikan datanya, maka akan dengan tepat di-recovery oleh algoritma tersebut. Universitas Sumatera Utara 24 2.3.1.2 Tahap II: Hidden Layer ke Output Layer Setelah K-Means digunakan pada input layer ke hidden layer maka proses selanjutnya hidden layer ke output layer yang merupakan pembelajaran terawasi yang sama seperti penggunaan pada MLP, output layer dilatih dengan menggunakan Least Means Square. Inisialisasi weight pada hidden layer sampai output layer dilakukan inisialisasi weight secara acak. Lalu dilakukan penghitungan seluruh output (Yk) pada jaringan yang dinyatakan dengan (Haykin,2009) , ππ = ∑πΏπ=1 ππ π€ππ (2.10) dimana, Yk = nilai node pada output k dari node hidden ke j L = nomor dari data pelatihan φj = fungsi Gaussian pada node j wkj = nilai weight output dari node ke j pada hidden layer ke output k Setelah itu dilakukan langkah selanjutnya untuk menghitung error atau selisih hasil pada output Yk yang dinyatakan dengan, πΏπ = (π‘π − ππ ) (2.11) dimana, δk = unit kesalahan yang akan dipakai dalam perubahan weight layar tk = hasil normalisasi data dari data input. Yk = output pada node k Setelah tingkat kesalahan didapat tidak sesuai dengan yang diinginkan maka dihitung suku perubahan weight wkj (yang akan dipakai nanti pada saat merubah weight wkj) dengan laju percepatan α yang dinyatakan dengan, βπ€ππ = πΌπΏπ ππ (2.12) Pada fase ini tidak dilakukan perhitungan kesalahan pada hidden layer. Hal ini dilakukan karena pada saat input layer ke hidden layer sudah dilakukan fungsi Universitas Sumatera Utara 25 objektif dari algoritma K-means sehingga nilai yang didapat sudah sesuai. Lalu tahap selanjutnya adalah tahap perubahan weight dengan menghitung semua perubahan weight wkj yang dinyatakan dengan, π€ππ (ππππ’) = π€ππ (ππππ) + βπ€ππ (2.13) Proses tersebut terus dilakukan sampai weight(wkj) tidak berubah lagi. 2.3.2. Menghitung Nilai Error Menghitung nilai error sangat penting untuk melihat hasil pelatihan pada jaringan sarat tiruan. Hal ini dikarenakan pada tahap pelatihan nilai error yang diharapkan adalah nilai yang paling kecil. Output error adalah perhitungan error yang merupakan hasil dari perbedaan nilai target dan nilai output yang didapat. Nilai ini akan digunakan untuk menghitung nilai error. The Means Absolute Percentage Error (MAPE) merupakan metode perhitungan error untuk mengevaluasi metode peramalan. Pendekatan ini menghitung kesalahan peramalan yang besar karena nilai output error yang didapat dari perbedaan antara target dan output dibagi nilai target. Perhitungan nilai MAPE dapat dinyatakan sebagai berikut. ππ΄ππΈ = 1 π ∑ππ‘=1 π¦π‘ −π¦Μπ‘ π¦π‘ × 100% (2.14) 2.4. Penelitian Terdahulu Berikut ini adalah penjelasan mengenai penelitian terdahulu dari kasus penelitian kelapa sawit dan jaringan saraf radial basis function. 2.4.1 Penelitian kasus prediksi produksi kelapa sawit Penelitian mengenai prediksi produksi kelapa sawit sudah pernah dilakukan. Metode prediksi yang dilakukan pada penelitian-penelitian tersebut menggunakan metode time-series dan juga menggunakan metode statistik. Hermanto dan Purnawan (2009) mengenai prediksi produksi menggunakan jaringan saraf tiruan dengan algoritma backpropagation. Penelitian tersebut menggunakan tujuh data sebagai variabel berdasarkan kualitas lahannya yaitu curah Universitas Sumatera Utara 26 hujan, ketinggian dari permukaan laut, kelerengan, umur tanaman, batuan, solium, dan keasaman tanah. Percobaan dengan beberapa layer untuk mendapatkan hasil terbaik yaitu 3 layer, 4 layer dan 5 layer. Hasil terbaik didapat pada percobaan 3 layer pada iterasi ke 30000, dengan laju pembelajaran sebesar 0.9, dan momentum sebesar 0.9. Hasil pelatihan yang didapat dengan R2=0.9998 dan RMSE = 0.0709 dan hasil pengujian dengan R2 = 0.8901 dan RMSE = 2.2196. Penelitian lain dilakukan Bando (2012) menggunakan metode ARIMA untuk memprediksi curah hujan dengan produksi kelapa sawit. Tahapan yang dilakukannya sebagai berikut. 1. Tahap identifikasi Pada tahap identifikasi dilakukan perumusan kelompok model-model yang umum. Kemudian melakukan penetapan model untuk sementara. 2. Penaksiran parameter dan pengujian Tahap ini dilakukan penaksiran parameter sementara. Kemudian diperiksa apakah model tersebut memadai. Jika ya, maka tahap lanjut ke penerapan. Namun, jika tidak maka tahapan mengulang ke penaksiran parameter. 3. Penerapan Pada tahap ini dilakukan model untuk peramalan. Data yang digunakan ada dua yaitu data curah hujan dan data produksi. Lalu data-data tersebut digunakan dengan metode ARIMA untuk mendapatkan hasil peramalan selanjutnya. Kacaribu (2013) menggunakan dua metode untuk membandingkan prediksi produksi kelapa sawit yaitu menggunakan metode causal berupa regresi ganda dan metode time-series berupa exponential smoothing. Adapun tahapan-tahapan yang dilakukannya sebagai berikut. 1. Identifikasi masalah 2. Mengumpulkan dan mempersiapkan data untuk dianalisis 3. Mengolah data (dengan menggunakan regresi ganda dan exponential smoothing) 4. Melakukan pengujian untuk metode regresi ganda 5. Menghitung nilai MAPE untuk masing-masing metode Universitas Sumatera Utara 27 6. Menentukan metode yang cocok untuk peramalan 7. Membuat program aplikasi 8. Kesimpulan Tabel 2.2 Penelitian Terdahulu No 1 2 Peneliti Teknik yang (Tahun) Digunakan Hermanto Backpropagation Kelemahan Error Melakukan percobaan sebanyak 3 RMSE = & kali dengan layer yang berbeda 2.2196 Purnawan dan banyak iterasi untuk (2009) mendapatkan hasil terbaik Bando ARIMA (2012) Hanya meneliti untuk memeriksa - keterhubungan curah hujan dengan hasil produksi 3 Kacaribu Regresi Ganda Kurangnya variabel yang MAPE regresi (2013) dan Exponential dibutuhkan untuk dianalisis = 21.068% Smoothing sehingga adanya kemungkinan MAPE ES variabel independen lain yang pertahun = lebih berpengaruh 12.78% 2.4.2 Penelitian kasus prediksi dengan menggunakan Radial Basis Function Prediksi menggunakan jaringan RBF ini telah digunakan di beberapa peramalan seperti peramalan saham, banjir, finansial, dan lainnya. Pada peramalan saham, Tan et al (2012) melakukan peramalan dengan model jaringan RBF dan mendapatkan hasil yang baik yang dapat dilihat dari hasil error nilai prediksinya. Model jaringan RBF ini malalui dua tahap yaitu klustering dan penentuan weight. Pada pelatihan, klustering akan berhenti jika nilai error yang dihasilkan program lebih kecil dari nilai toleransi yang ditetapkan. Sedangkan penentuan weight hanya dilakukan satu kali. Universitas Sumatera Utara 28 Pada penelitian Jayawerdana et al (1997), RBF digunakan untuk memprediksi level air saat terjadi musim hujan. Hasil prediksi dinyatakan jaringan RBF yang menggunakan metode K-Means lebih baik daripada MLP dengan algoritma backpropagation. Jaringan RBF berbasis linear dalam parameter dan menjamin nilainilai optimal. Pengembangan model jaringan RBF memerlukan sedikit trial and error sehingga peramalan yang dilakukan hanya memerlukan sedikit waktu dan usaha dari pada penggunaan jaringan MLP dengan pendekatan bacpropagation. Pada penelitian Husein et al (2011), peneliti menampilkan pemakaian data untuk jaringan saraf RBF dan juga membandingkan nilai yang didapat dengan menggunakan tiga metode yaitu Single Radial Basis Function Network, Multiple Radial Basis Function Network dan Auto Regressive Model. Dari ketiga metode tersebut performa terbaik dihasilkan pada metode Auto Regressive Model lalu Multiple Radial Basis Function Network. Berdasarkan ketiga penelitian tersebut dapat dijadikan acuan penggunaan jaringan RBF dalam melakukan peramalan. Universitas Sumatera Utara