Reduksi Data Luaran GCM Stasiun Amahai Dengan

advertisement
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan
Analisis Komponen Utama
Ferry Kondo Lembang
Jurusan Matematika FMIPA UNPATTI
[email protected]
Abstrak
Reduksi dimensi adalah bagian penting bagi prosedur menganalisis data berdimensi tinggi
(ukuran besar). Didalam pemodelan statistika, reduksi dimensi dikenal sebagai teknik preprocessing suatu model yang akan dikembangkan. Data luaran Global Circulation Model
(GCM) memiliki ukuran dimensi data yang tinggi (besar) disebabkan GCM adalah suatu
model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik
yang terpadu dan mengikuti kaidah-kaidah fisika dimana GCM mampu menduga perubahan
unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut
lintang dan bujur. Oleh karena itu, pada penelitian ini digunakan metode Analisis Komponen
Utama (AKU) sebagai salah satu metode reduksi dimensi yang populer dalam ilmu statistika.
Metode reduksi AKU diyakini mampu mempertahankan keragaman variabel asal sehingga
keaslian data asal masih tetap ada disebabkan total keragaman yang dipakai adalah 90%
untuk mendapatkan komponen utama yang optimal. Adapun domain grid data luaran GCM
yang dipakai sebagai sampel penelitian adalah domain grid 3x3, 8x8, dan 12x12. Hasil
penelitian menunjukkan bahwa total variabel prediktor yang dihasilkan dengan metode AKU
pada domain grid 3×3 adalah 17 variabel, domain 8×8 adalah 34 variabel, dan domain
12×12 adalah 48 variabel. Semakin luas domain maka semakin banyak komponen utama
yang dipakai untuk memperoleh keragaman lebih dari 90%.
Kata Kunci: GCM, Analisis Komponen Utama, Keragaman
1. Pendahuluan
Sampai saat ini, GCM (General Circulation Models) diakui banyak pihak sebagai alat
penting dalam upaya memahami sistem iklim. GCM mampu menduga perubahan unsur-unsur
cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur
(von Stroch et al. 1993 dalam Sutikno, 2008). Ukuran-ukuran grid yang besar ini tentu saja
seringkali menjadi masalah bagi beberapa peneliti yang berkecimpung dibidang klimatologi
dalam memprediksikan iklim maupun cuaca. Untuk daerah-daerah dengan topografi yang
kompleks, di sepanjang garis pantai, dan daerah-daerah dengan tutupan lahan yang sangat
heterogen, seperti Indonesia model GCM hasilnya kurang sensitif. Model GCM yang sesuai
diterapkan di Indonesia adalah model dengan resolusi horisontal yang tinggi dan skema
konveksi yang komprehensif. Untuk itu perlu diupayakan suatu teknik reduksi dimensi untuk
memperkecil ukuran grid-grid pada data luaran GCM sehingga memudahkan peneliti yang
ada untuk memprediksi iklim dan cuaca secara tepat.
Pada penelitian Manorang, et.al (2009) membandingkan metode AKU dan AKU Kernel
untuk mereduksi dimensi data luaran GCM Kabupaten Indramayu. Berdasarkan penelitian
yang dilakukan Manorang, et al, metode reduksi dimensi AKU memberikan hasil yang lebih
baik dari metode AKU Kernel. Tertarik dengan penelitian Manorang, maka dalam penelitian
ini digunakan metode reduksi dimensi AKU. Tujuan dari penelitian ini adalah mengkaji
prosedur dan hasil metode AKU untuk mereduksi dimensi data luaran GCM stasiun Kairatu.
Kriteria yang digunakan pada pereduksian adalah jumlah komponen utama optimal yang
33
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
digunakan mampu menjelaskan lebih besar sama dengan 90% keragaman dari keragaman
total. Penelitian ini diharapkan dapat digunakan BMKG untuk kajian dampak iklim dengan
basis data luaran GCM, khususnya dalam penggunaan reduksi dimensi AKU.
Tinjauan Pustaka
Analisis Komponen Utama (AKU)
Analisis Komponen Utama adalah struktur yang menjelaskan varian kovarian yang
terdiri atas sedikit kombinasi linier dari variabel asal (Johnson dan Wichern, 1998). Sharma
(1996) menyatakan AKU adalah teknik untuk membentuk linier komposit variabel baru dari
variabel asal. Sehingga variabel baru itu nantinya merupakan ringkasan/susutan dari variabel
asal dengan tetap mampu menjelaskan semaksimal mungkin variabel asalnya. Jadi secara
umum AKU adalah meringkas/menyusut variabel untuk lebih mempermudah interpretasi.
Variabel baru yang dihasilkan maksimal sebanyak variabel asalnya. Secara gometrik,
AKU untuk menentukan sekumpulan sumbu ortogonal yang baru. Penjelasannya sebagai
berikut :
1. Koordinat observasi pada sumbu akan menunjukkan nilai bagi variabel baru. Sumbu baru
ini (variabel baru yang terbentuk) disebut PCs dan nilai pada PCs ini disebut principal
components scores.
2. Setiap variabel baru adalah kombinasi linier dari variabel asal.
3. Variabel baru pertama (PC ke-1) memuat varian maksimum data.
4. Variabel baru kedua (PC ke-2) memuat varian maksimum yang tidak termuat oleh
variabel baru pertama (PC ke-1).
5. Variabel baru ke-p (PC ke-p) memuat varian maksimum yang tidak termuat dalam
variabel baru sebelumnya (PC ke-1 sampai PC ke- (p-1)).
6. Variabel baru yang terbentuk tidak berkorelasi.
Secara aljabar AKU adalah kombinasi linier dari p variabel random X1, X2,…, Xp. Kombinasi
linier ini adalah seleksi dari koordinat baru dari rotasi variabel asal (X1, X2,…, Xp) sebagai
sumbu koordinat (Johnson dan Wichern,1998). Sumbu baru ini mampu menjelaskan variasi
maksimum dan menghasilkan penjelasan yang lebih simpel dan hemat dari struktur kovarian.
Global Circulation Model (GCM)
GCM adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik
dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika. Model ini menduga
perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km
menurut lintang dan bujur (von Stroch et al. 1993 dalam Sutikno, 2008). GCM merupakan
suatu alat penting dalam studi keragaman iklim dan perubahan iklim (Zorita dan Storch,
1999). Namun informasi GCM masih berskala global dan tidak untuk fenomena skala lebih
kecil (lokal), sehingga sulit untuk memperoleh langsung informasi berskala lokal dari GCM.
Resolusi GCM terlalu rendah untuk memprediksi iklim lokal yang dipengaruhi oleh sirkulasi
atmosfir dan parameter lokal seperti topografi dan tataguna lahan, tetapi GCM masih
mungkin digunakan untuk memperoleh informasi skala lokal atau regional bila teknik
downscaling digunakan (Fernandez, 2005 dalam Wigena, 2006)
34
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
3. Metodologi
Data yang digunakan adalah data sekunder yang diperoleh dari data luaran GCM
model CSIRO-Mk3. Domain GCM yang digunakan adalah domain 3x3 , pada posisi
4.660 LS- 8.39 0 LS, 106.87 0 BT– 110.64 0 BT, domain 8x8 , pada posisi 0.93 0 -13.99 0 LS,
101.120 BT - 114.380 BT; dan domain 12x12 , pada posisi 2.79 0 LU-17.72 0 LS, 97.500
BT – 118.1250 BT. Lokasi domain yang diambil adalah pada stasiun Amahai. Variabel
prediktor meliputi: precipitable water (prw), tekanan permukaan laut (slp), komponen
angin meridional (va), komponen zonal (ua), ketinggian geopotensial (zg), dan
kelembaban spesifik (hus). Ketinggian (level) adalah 850 hPa, 500 hPa, dan 200 hPa.
Tabel 1 Variabel Prediktor yang diambil dari model luaran CSIRO-Mk3 dan pengkodingan.
Tahapan analisis data dalam penelitian ini yaitu :
1. Melakukan reduksi dimensi. Metode reduksi dimensi yaitu Analisis Komponen Utama.
Berikut akan diuraikan langkah-langkah analisisnya:
1. Anggap sekumpulan observasi xj, dimana j: 1,2,...,m pada input data Rn.
2. Untuk satuan variabel asal tidak sama, seringkali dilakukan pembakuan
n
(stadardization) dulu sebelum dibuat matriks varian-kovarian. Sehingga
x
j
 0.
j 1
3. Membuat matrik Varian Kovariansi Σ.
4. Menentukan nilai akar karakteristik (eigen value) dengan menghitung   I  0 .
5. Menentukan jumlah komponen utama yang dibangkitkan (dengan melihat nilai eigen
value). Keragaman yang lebih dari 90% menunjukkan banyaknya komponen utama
yang harus dibangkitkan.
6. Menghitung nilai komponen utama (scores) dari model komponen utama Yi  a 'i X ,
dimana ai adalah eigenvektor.
PEMBAHASAN
Pra-pemrosesan Pemodelan
Statistical Downscaling
Pra-pemrosesan pemodelan Statistical Downscaling (SD) adalah salah satu
tahapan yang mengkaji luasan dan lokasi grid domain GCM yang optimum untuk
penyusunan pemodelan SD. Pra-pemrosesan pemodelan SD berupa reduksi dimensi.
Reduksi dimensi pada penelitian ini menggunakan metode AKU. Reduksi dimensi
dilakukan pada variabel luaran GCM di setiap level, yaitu permukaan, 200 hPa, 500
hPa, dan 850 hPa serta dilakukan pada setiap domain. Pada setiap hasil reduksi (per
35
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
level) diambil satu atau lebih komponen utama dengan keragaman lebih dari 90%
sebagai variabel prediktor.
4.2 Hasil Reduksi Dimensi menggunakan Metode AKU
Reduksi dimensi dengan metode AKU pada variabel HUSS ditunjukkan pada
Tabel 2. Tabel 2 memberikan informasi kumulatif proporsi komponen utama variabel
HUSS pada masing-masing grid.
Tabel 2 Nilai Eigen dan Kumulatif Proporsi Metode AKU pada Variabel HUSS domain 3×3,
8×8, dan 12×12
Keterangan: Kum= Kumulatif proporsi keragaman
Tabel 2 memberikan informasi bahwa jumlah komponen utama yang mempunyai
keragaman ≥ 90% pada domain 3×3, 8×8 12×12, masing-masing adalah 1, 3, dan 5. Hal
ini menunjukkan semakin luas domain maka semakin banyak komponen utama (PC)
yang dipakai dan sebaliknya. Situasi ini mungkin tidak berlaku bagi variabel luaran
GCM yang lain. Variabel luaran GCM yang satu dengan yang lain memiliki
karakteristik yang berbeda-beda. Hal ini dimungkinkan karena setiap variabel luaran
GCM memiliki level/ketinggian yang berbeda-beda pula.
Plot scores komponen utama variabel HUSS ditunjukkan pada gambar 1.
Gambar 1 Plot scores variabel HUSS (a) Domain 3×3,(b) Domain 8×8, dan (c) Domain 12×12.
36
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
Gambar 1 memperlihatkan plot komponen utama masing-masing domain. Domain 3x3 dan
12x12 cenderung memiliki bentuk plot yang hampir menumpuk pada satu sisi. Sedangkan
domain 8x8 memiliki bentuk plot yang menyebar secara merata.
Reduksi dimensi dengan metode PCA pada berbagai variabel luaran GCM selain variabel
HUSS, dapat dilakukan dengan cara yang sama dengan reduksi dimensi PCA pada variabel
HUSS.
Tabel 3 memperlihatkan jumlah komponen utama dengan keragaman ≥ 90% untuk
setiap variabel luaran GCM pada domain 3×3, 8×8, dan 12×12.
Tabel 3 Jumlah PC dan Kumulatif Proporsi dengan Metode AKU pada Berbagai Variabel Luaran
GCM.
Keterangan: Kum= Kumulatif proporsi keragaman
Total variabel prediktor yang dihasilkan dengan metode AKU pada domain 3×3 adalah
17 variabel, domain 8×8 adalah 34 variabel, dan domain 12×12 adalah 48 variabel.
Dapat disimpulkan bahwa semakin luas domain maka semakin banyak komponen utama
yang dipakai untuk memperoleh keragaman lebih dari 90%. Semakin sedikit jumlah
komponen dan mempunyai persentase keragaman yang besar menunjukkan antar
variabel (grid) memiliki hubungan sangat erat dan sebaliknya.
Kesimpulan dan Saran
Kesimpulan
Berdasarkan hasil analisis dan pembahasan didapatkan beberapa kesimpulan :
Prosedur mendapatkan komponen utama (PC) pada metode AKU dengan total variabel
prediktor yang dibangkitkan dengan metode PCA pada domain 3×3 adalah 17 variabel, pada
domain 8×8 adalah 34 variabel, dan pada domain 12×12 adalah 48 variabel. Hal ini
menunjukkan bahwa semakin luas domain maka semakin banyak komponen utama yang
dipakai untuk memperoleh keragaman lebih dari 90%.
Saran
Beberapa saran yang dapat direkomendasikan dalam memperbaiki penelitian ini
diantaranya:
1. Untuk mendapatkan reduksi variabel yang lebih baik perlu diperhatikan karakteristik dari
data GCM.
2. Dapat dilanjutkan untuk memodelkan curah hujan di Amahai dengan menganalisis
hubungan antara curah hujan bulanan dengan data luaran GCM.
37
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
Daftar Pustaka
Johnson, R.A and Wichern, D.W. (1998). Applied Multivariate Statistical Analysis. 5th Ed.
New Jersey: Prentice Hall.
Jolliffe, I.T. (1986). Principal Component Analysis, Second Ed. New York: Springer-Verlag.
Khotimah, K, Sutikno, Otok, W.B (2009). “ Reduksi Dimensi Robust Dengan Estimator
MCD Untuk Pra- Pemrosesan Data Pemodelan Statistical Downscaling”. Prosiding
Seminar Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA .
Surabaya.
Manorang Y, Sutikno, Setiawan, Otok WB, (2009). “Analisis Komponen Utama Kernel
Untuk Pra Pemrosesan Pemodelan Statistical Downscaling”. Prosiding Seminar
Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA . Surabaya.
Sutikno. (2008). “Statistical Downscaling Luaran GCM dan Pemanfaatannya untuk
Peramalan Produksi Padi” Disertasi. Bogor: Program Pascasarjana, Institut Pertanian
Bogor.
Wigena, A.H. (2006). “Pemodelan Statistical Downscaling dengan Regresi Projection
Pursuit untuk Peramalan Curah Hujan Bulanan” Disertasi. Bogor: Program
Pascasarjana, Institut Pertanian Bogor.
Zorita, E. and von Storch, H., (1999): “The analog method as a simple statistical downscaling
technique: comparison with more complicated method”, Journal of Climate, 12, 24742489.
38
Jurnal Konvergensi
Vol. 3, No. 2, Oktober, 2013
Profil Penulis
Ferry Kondo Lembang
Pada Tanggal 16 Februari 1984, Penulis dilahirkan di Kota
Ambon sebagai anak ketiga dari empat bersaudara. Pendidikan formal
penulis berawal di TK Efata Hative Kecil Kota Ambon selama satu
tahun, dilanjutkan pada SDN 2 Hative Kecil Kota Ambon. SLTP
negeri 3 Ambon merupakan lanjutan pendidikan formal penulis setelah
menamatkan pendidilan di Sekolah Dasar. Pada Tahun 2001, setelah lulus dari SMA Negeri
5 Ambon, penulis melanjutkan pendidilan S1 di Jurusan Matematika UNPATTI. Setelah
lulus S!, pada tahun 2008 penulis melanjutkan pendidikan pada Strata 2 (S2) pada Jurusan
Statistika ITS Surabaya. Sampai sekarang penulis berstatus Dosen tetap pada jurusan
matematika FMIPA UNPATTI dengan mengampuh beberapa mata kuliah Statistika
diantaranya Metode Statistika, Statistika Matematika 1, dan Analisis Multivariat.
39
Download