ε β β

advertisement
BAB 2
LANDASAN TEORI
2.1
Analisis Regresi
Analisis regresi adalah salah satu metode yang dapat digunakan untuk
menentukan hubungan antara variabel independen (x) dengan variabel dependen (y).
Untuk n pengamatan dengan p variabel independen, maka model regresi tersebut dapat
ditulis sebagai berikut:
p
y i = β 0 + ∑ β k x ik + ε i ; i = 1, 2, 3, ... , n
( 2.1)
k =1
Keterangan :
yi
=
variabel dependen pada pengamatan ke-i (i = 1, 2, ... , n)
β0
=
konstanta
βk
=
koefisien regresi ke – k (k = 1,2, … , p)
xik
=
variabel independen ke-k pada pengamatan ke-i (i = 1, 2, ... , n)
εi
=
error yang diasumsikan identik, independen, dan berdistribusi normal
dengan mean nol dan varians σ 2
Persamaan 2.1 dapat ditransformasikan ke dalam matriks:
y = Xβ + ε
( 2 .2 )
7
Dimana,
1
1
X=
M

1
x11
x 21
x12
x 22
L
L
M
x n1
M
xn 2
O
L
x1k 
x 2 k 
M 

x nk 
 y1 
y 
y= 2
M 
 
 yn 
β 0 
β 
1
β= 
M 
 
 β p 
Penaksiran parameter model regresi dapat dilakukan dengan menggunakan
metode Ordinary Least Square (OLS). Metode ini dilakukan dengan meminimumkan
jumlah kuadrat errornya dan hasil penaksiran parameternya adalah sebagai berikut:
βˆ = (XT X)−1 XT y
(2.3)
Uji signifikansi parameter regresi dilakukan dengan 2 cara, yaitu uji serentak dan
uji parsial. Hipotesis yang digunakan untuk uji serentak adalah sebagai berikut:
H0 : β1 = β2 = ... = βk = ... = βp = 0
H1 : paling tidak ada satu βk ≠ 0, k = 1, 2, ... p
Statistik uji:
Fhitung =
MSR
=
MSE
n
2
∑ ( yˆ i − y )  /( p)
 i =1

n

2
∑ ( yi − yˆ i )  /(n − p − 1)
 i =1

Keterangan:
MSR = Mean Square Regression
MSE = Mean Square Error
(2.4)
8
Pengambilan keputusan adalah apabila Fhitung > Fα
(p, n-p-1)
dengan p adalah
parameter maka H0 ditolak pada tingkat signifikansi α. Artinya paling sedikit ada satu βk
yang tidak sama dengan nol. Pengambilan keputusan juga dapat melalui p-value dimana
H0 ditolak jika p-value < α.
Hipotesis yang digunakan untuk uji parsial adalah sebagai berikut:
H0 : βk = 0
H1 : βk ≠ 0, k = 1, 2, ... p
Statistik uji:
t hitung =
bk
S (bk )
(2.5)
Dengan S ( b k ) adalah akar diagonal matriks
S 2 (bk ) = (XT X) −1 MSE
Pengambilan keputusannya yaitu apabila |thitung| > t(1-α/2,
(2.6)
n-p-1)
dengan p adalah
parameter dan MSE adalah Mean Square Error maka H0 ditolak pada tingkat
signifikansi α, artinya ada pengaruh xi terhadap model. Pengambilan keputusan juga
dapat melalui p-value, dimana H0 ditolak jika P-value < α.
9
Uji Asumsi Residual
Residual memiliki asumsi identik, independen, dan berdistribusi normal (Hill,
Griffiths dan Lim, 2011, p172). Pengujian masing–masing asumsi tersebut adalah
sebagai berikut:
1.
Uji Asumsi Identik
Uji asumsi identik dapat dilakukan dengan uji Glejser. Uji Glejser dilakukan
dengan melakukan regresi antara nilai variabel independen dan absolute
residual sebagai dependen.
Hipotesis untuk uji Glejser adalah sebagai berikut:
H0 : residual identik
H1 : residual tidak identik
Statistik uji:
Fhitung =
−
 n ^

(
|
e
|
|
e
|) 2  /( p )
−
∑ i
MSR
i =1

= n 
^
MSE 
2
∑ (| ei | − | ei |)  /(n − p − 1)
 i =1

(2.7)
Pengambilan keputusan adalah apabila Fhitung > Fα (p, n-p-1) maka H0 ditolak
pada tingkat signifikansi α, artinya residual tidak identik atau terjadi
heterokedastisitas. Pengambilan keputusan juga dapat melalui p-value
dimana H0 ditolak jika p-value < α.
10
2.
Uji Asumsi Independen
Uji asumsi independen dengan menggunakan Durbin-Watson. Hipotesis
untuk uji Durbin-Watson adalah sebagai berikut:
H0 : ρ = 0
tidak ada korelasi residual
H1 : ρ > 0
ada korelasi residual
Statistik uji:
n
d hitung =
∑ (e
i =1
i
− ei −1 )
2
n
∑e
i =1
2
i
(2.8)
Daerah keputusan yang dapat diambil adalah jika dhitung ≤ dL,α maka H0
ditolak.
3.
Uji Asumsi Normal
Uji kenormalan data dapat dengan uji Kolmogorov–Smirnov. Hipotesis
untuk uji Kolmogorov–Smirnov adalah sebagai berikut:
H0 : Residual berdistribusi normal
H1 : Residual berdistribusi tidak normal
Statistik Uji:
D = maks F0 ( x ) − S N ( x )
(2.9)
11
F0(x) adalah fungsi distribusi kumulatif teoritis sedangkan SN(x)=i/n
merupakan fungsi peluang kumulatif pengamatan dari suatu sampel random
dengan i adalah pengamatan dan n adalah banyaknya pengamatan.
Pengambilan keputusan adalah H0 ditolak jika D >q(1-α) dimana q adalah
nilai berdasarkan Tabel Kolmogorov-Smirnov. Selain itu juga dapat melalui
Pvalue , dimana H0 ditolak jika Pvalue kurang dari α.
Coefficient of Determination (R2)
Nilai R2 menunjukkan hubungan linear, goodness of fit antara data sampel
dengan nilai prediksinya. Nilai R2 juga menunjukkan nilai proporsi varian variabel
dependen yang dapat dijelaskan oleh variabel independennya (Hill, Griffiths dan Lim,
2011, p137).
R2 = 1−
Keterangan
SSE
SST
(2.10)
:
SSE
= Sum Square Error
SST
= Sum Square Total
2.2
Geographically Weighted Regression (GWR)
Model GWR adalah suatu model regresi sederhana yang diubah menjadi model
regresi yang terboboti (Fotheringham, Brunsdon, Charlton, 2002). Setiap nilai parameter
akan dihitung pada setiap titik lokasi geografis sehingga setiap titik lokasi geografis
mempunyai nilai parameter regresi yang berbeda-beda. Hal ini akan memberikan variasi
pada nilai parameter regresi di suatu kumpulan wilayah geografis. Jika nilai parameter
12
regresi konstan pada tiap-tiap wilayah geografis, maka model GWR adalah model
global. Artinya tiap-tiap wilayah geografis mempunyai model yang sama.
Model umum untuk model GWR adalah
p
y i = β 0 (ui , vi ) + ∑ β k (ui , vi )xik + ε i
k =1
(2.11)
Keterangan:
yi
= variabel dependen pada lokasi ke-i (i = 1, 2, ... , n)
xik
= variabel independen ke-k pada lokasi ke-i (i = 1, 2, ... , n)
(ui,vi)
= koordinat longitude latitude dari titik ke-i pada suatu lokasi geografis.
βk (ui,vi)
= koefisien regresi ke-k pada masing-masing lokasi
εi
= error yang diasumsikan identik, independen, dan berdistribusi Normal
dengan mean nol dan varians konstan σ 2
Model GWR di persamaan 2.11 dapat ditransformasikan ke dalam bentuk
matriks seperti di bawah ini :
y = (β ⊗ X)1 + ε
( 2.12)
Pada model GWR diasumsikan bahwa data observasi yang dekat dengan titik ke-i
mempunyai pengaruh yang besar pada penaksiran dari β k (u i , vi ) daripada data yang
berada jauh dari titik ke-i. Menurut Fotheringham, Brunsdon dan Charlton (2002), lokal
parameter β k (u i , vi ) ditaksir menggunakan Weighted Least Squared (WLS). Pada GWR
sebuah observasi diboboti dengan nilai yang berhubungan dengan titik ke-i. Bobot wij,
untuk j = 1, 2, ... , n, pada tiap lokasi (ui , vi ) diperoleh sebagai fungsi yang kontinu dari
jarak antara titik ke-i dan titik data lainnya.
13
Penaksiran parameter
Penaksiran parameter pada masing-masing lokasi ke-I
melalui WLS adalah
sebagai berikut :
(
βˆ (i ) = X T W (i ) X
Keterangan :
X
= matrik data dari variabel bebas
y
= vektor variabel respon
W(i)
= matriks pembobot
W i1
 0
W (i ) = 
 M

 0
0
Wi2
M
0
...
0 
...
0 
M
M 

... W i n 
1
1
X=
M

1
x11
x 21
x12
x 22
L
L
M
x n1
M
O
L
xn2
x1k 
x 2 k 
M 

x nk 
 y1 
y 
y= 2
M 
 
 yn 
 β 0 (u1 , v1 ) β 1 (u1 , v1 ) ... β p (u1 , v1 ) 


.
.
.



.
.
.
β=


.
.
.


β 0 (u n , v n ) β 1 (u n , v n ) ... β p (u n , v n )


)
−1
X T W (i ) y
(2.13)
14
Uji signifikansi
Uji signifikansi dapat dilakukan dengan hipotesis sebagai berikut (Sugiyanto,
2008, p26):
H 0 : β k (u i , v i ) = 0
H 1 : β k (u i , v i ) ≠ 0 ; k = 1, 2, ... , p
Statistik uji:
T hit =
β̂ k ( u i , v i )
( 2 . 14 )
se (β̂ k ( u i , v i ))
Pengambilan keputusan adalah H0 ditolak jika nilai | Thit | > t


α / 2 ; δ 1 δ 
2

δ 1 = tr (( I − L ) T ( I − L ) )
δ 2 = tr (( I − L ) T ( I − L ) )
2
1
0
I=
...

0
0 ... 0 
1 ... 0 
... ... ...

0 ... 1 
 x1T [X T W (u1 , v1 )X] −1 X T W (u1 , v1 ) 
 T T

−1
T
 x 2 [X W (u 2 , v 2 )X] X W (u 2 , v 2 ) 
L=

M


 x T [X T W (u , v )X] −1 X T W (u , v )
n
n
n
n 
 n
2
dimana:
15
Fotheringham, Brunsdon dan Charlton (2002, p6) menyebutkan adanya beberapa
perbedaan antara model regresi global dengan model GWR. Perbedaan tersebut
disajikan pada Tabel 2.1.
Tabel 2.1 Perbandingan Model Regresi Global dengan GWR
Model Regresi Global
Model umum untuk semua lokasi
Single-valued statistic
Tidak dapat dipetakan
Tidak berhubungan dengan GIS
Tidak menggunakan pengaruh spasial
Menekankan kesamaan di seluruh ruang
Model GWR
Disagregrasi lokal pada statistik global
Multi-valued statistic
Dapat dipetakan
Berhubungan dengan GIS
Menggunakan pengaruh spasial
Menekankan perbedaan antar ruang
Contoh : Classic Regression
Contoh : Geographically Weighted
Regression
2.3
Bandwidth
Bandwidth adalah ukuran jarak fungsi pembobot dan sejauh mana pengaruh
lokasi terhadap lokasi lain. Secara teoritis bandwidth merupakan lingkaran dengan
radius b dari titik pusat lokasi, dimana digunakan sebagai dasar menentukan bobot setiap
pengamatan terhadap model regresi pada lokasi tersebut. Untuk pengamatanpengamatan yang terletak dekat dengan lokasi i maka akan lebih berpengaruh dalam
membentuk parameter model pada lokasi i. (Fotheringham, Brunsdon, dan Charlton,
2002, p45).
Untuk mendapatkan bandwidth optimum, dapat dilakukan dengan menghitung
cross validation (CV). Jika nilai CV semakin kecil, maka didapatkan bandwidth yang
16
optimum (Fotheringham, Brunsdon, dan Charlton, 2002, p60) dengan menggunakan
rumus sebagai berikut:
n
[
CV = ∑ yi − yˆ ≠i (b)
i =1
]
2
(2.15)
Keterangan:
i
= lokasi ke-i
b
= bandwidth
yˆ ≠ i (b ) = nilai prediksi dari model regresi tanpa pengamatan ke-i
2.4
Pembobot
Pembobot W(i) dihitung untuk tiap i dan wij mengindikasikan kedekatan atau
bobot tiap titik data dengan lokasi i. Hal ini yang membedakan GWR dengan WLS pada
umumnya yang mempunyai matrik bobot yang konstan. Peran pembobot sangat penting
karena nilai pembobot tersebut mewakili letak data observasi satu dengan lainnya
sehingga sangat dibutuhkan ketepatan cara pembobotan.
Beberapa
jenis
fungsi
pembobot
yang
dapat
dipergunakan
menurut
Fotheringham, Brunsdon, dan Charlton (2002, p56-57) antara lain:
1
Fungsi Inverse Jarak
Fungsi tersebut dapat dinotasikan sebagai berikut:
1

w j (u i , v i ) = 
0

, jika d ij < b
( 2.16)
, jika d ij ≥ b
17
Fungsi inverse jarak akan memberi bobot nol ketika lokasi j berada diluar
radius b dari lokasi i, sedangkan apabila lokasi j berada didalam radius b
maka akan mendapat bobot satu.
dij = (ui − u j ) 2 + (vi − v j ) 2
2
(2.17)
Fungsi Kernel Gauss
Bentuk fungsi kernel gauss adalah
w j (u i , v i ) = exp[ − 1 / 2 (d ij / b) 2 ]
(2.18)
Fungsi kernel gauss akan memberi bobot yang akan semakin menurun
mengikuti fungsi gaussian ketika dij semakin besar.
3
Fungsi Kernel Bi-square
Fungsi tersebut dapat dinotasikan sebagai berikut:
 [1 − (d ij /b) 2 ] 2 , jika d ij < b

w j (u i , v i ) = 
0
, jika d ij ≥ b

(2.19)
Fungsi kernel bi-square akan memberi bobot nol ketika lokasi j berada pada
atau diluar radius b dari lokasi i, sedangkan apabila lokasi j berada didalam
radius b maka akan mendapat bobot yang mengikuti fungsi kernel bi-square.
2.5
Teori Angka Buta Huruf
Angka buta huruf (ABH) adalah proporsi penduduk usia tertentu yang tidak
dapat membaca dan atau menulis huruf latin atau huruf lainnya terhadap penduduk usia
tertentu (BPS, 2012). Kondisi ABH di Jawa Timur sudah masuk ke dalam tahap yang
cukup memprihatinkan. Hal ini bisa dapat dilihat dari data BPS (2012) yang menyatakan
18
bahwa pada 2010, persentase penduduk yang buta huruf di provinsi Jawa Timur dengan
usia 15 tahun ke atas bisa mencapai 11,66% penduduk, 15–44 tahun mencapai 2,39%
dan di atas 45 tahun sebesar 26,22%. Angka ini merupakan ABH terbesar di pulau Jawa
pada tahun 2010.
Menurut Dirjen Pendidikan Non Formal dan Informal (Dirjen PNFI) Depdiknas
Hammid Muhammad ada beberapa faktor penyebab tingginya buta aksara antara lain
tingginya angka putus sekolah dasar, beratnya geografis Indonesia, munculnya buta
aksara baru, dan kembalinya seseorang menjadi buta aksara.
Menurut Firmansyah dan Sutikno (2011), faktor–faktor yang mempengaruhi
tingkat ABH antara lain kepadatan penduduk, rasio penduduk miskin per jumlah
penduduk, rasio anggaran pendidikan per APBD, rasio tenaga pendidik sekolah dasar
per jumlah siswa sekolah dasar, rasio tenaga pendidik sekolah menengah pertama per
jumlah siswa sekolah menengah pertama, rasio fasilitas fisik pendidikan sekolah dasar
per jumlah siswa sekolah dasar, rasio fasilitas fisik pendidikan sekolah menengah
pertama per jumlah siswa sekolah menengah pertama, angka partisipasi murni usia 7-12
tahun, dan angka partisipasi murni usia 13-15 tahun.
2.6
Teknologi Informasi dan Komunikasi (TIK)
TIK adalah rangkaian kegiatan yang difasilitasi peralatan elektronik yang
mencakup pengolahan, transmisi, dan penyajian informasi. TIK merupakan konvergensi
dari tiga wilayah yaitu teknologi informasi, data dan informasi, serta masalah-masalah
sosiol ekonominya. Perkembangan TIK dapat diukur berdasarkan 4 dimensi yaitu
keterhubungan, akses, kebijakan dan penggunaan (Hermana, 2007). Indikator – indikator
yang mengukur TIK:
19
1.
penggunaan komputer per 1000 penduduk.
2.
penggunaan internet per 1000 penduduk.
3.
penggunaan telepon per 100 penduduk.
4.
penggunaan telepon selular per 100 penduduk.
Menurut Badan Pusat Statistik (2009), dalam survei sosial ekonomi nasional
2009, yang menjadi indikator TIK adalah
2.6.1
1.
kepemilikan telepon rumah,
2.
kepemilikan telepon selular,
3.
kepemilikan komputer, dan
4.
penggunaan internet sebulan terakhir.
Pengertian Telepon
Menurut Fauzi dan Suherman (2006, p1) telepon adalah alat pengirim suara
(mikropon) dan alat penerima suara (speaker). Pesawat ini dihubungkan dengan sentral
telepon menggunakan sepasang kabel tembaga yang dikenal sebagai saluran 2 kawat.
Telepon secara konvensional adalah untuk komunikasi suara, namun demikian telah
banyak telepon yang digunakan untuk komunikasi data. Secara umum, telepon dibagi
menjadi 2, yaitu telepon rumah dan telepon selular.
2.6.2
Pengertian Komputer
Menurut BPS (2007) komputer adalah mesin penghitung elektronik yang cepat
dan dapat menerima informasi input digital, kemudian memprosesnya sesuai dengan
program yang tersimpan di memorinya, dan menghasilkan output berupa informasi.
Untuk mewujudkan konsepsi komputer sebagai pengolah data untuk menghasilkan suatu
informasi, maka diperlukan sistem komputer yang elemennya terdiri dari:
20
1. Hardware atau perangkat keras, yaitu peralatan komputer yang secara fisik
terlihat dan bisa dipegang, seperti monitor, CPU (Central Processing Unit),
keyboard mouse, dan printer.
2. Software atau perangkat lunak, yaitu program yang berisi instruksi / perintah
untuk melakukan pengolahan data, seperti macam – macam program
windows, Microsoft Word, SPSS, CSPro, dan sebagainya.
3. Brainware, yaitu orang yang mengoperasikan dan mengendalikan sistem
komputer. Rumah tangga dikatakan mempunyai komputer bila menguasai
perangkat keras komputer berupa monitor, CPU, keyboard, dan mouse
(walaupun tidak menguasai printer) yang sudah dilengkapi dengan
perangkat lunak.
2.6.3
Pengertian Internet
Internet adalah sebuah sistem komunikasi global yang menghubungkan
komputer-komputer dan jaringan-jaringan komputer di seluruh dunia (BPS, 2007).
2.7
Pemetaan
Menurut Ukur, Ramadijanti dan Basofi (2010, p1), pemetaan adalah proses
pengukuran dan penggambaran permukaan bumi dengan menggunakan metode tertentu
sehingga didapatkan hasil berupa file yang berbentuk vektor atau raster. Pembuatan peta
secara konvensional dapat dibantu dengan bantuan komputer, mulai dari pembacaan
data di lapangan sampai proses download ke komputer untuk proses perhitungan
poligon, perataan penghitungan (koreksi) dan lain-lain, bahkan sampai pada proses
pembuatan pemisahan warna secara digital sebagai bagian dari proses pencetakan peta.
21
2.8
Berbasis Komputer
Yang dimaksud berbasis komputer dalam skripsi ini adalah membuat aplikasi
program. Aplikasi program dibuat dengan menggunakan bahasa pemrograman Java dan
R Language.
2.8.1
Java
Menurut Horton (2005, p1), Java adalah bahasa pemrograman inovatif yang telah
menjadi pilihan untuk digunakan dalam hal menjalankannya pada berbagai sistem
komputer yang berbeda. Java memungkinkan untuk menulis program kecil yang
biasanya disebut applet dan kebanyakan digunakan di halaman web untuk menyediakan
berbagai macam fungsi. Selain dapat merepresentasikan teks dan gambar, Java juga
dapat menyertakan animasi game, aplikasi yang interaktif dan kemungkinan lainnya.
2.8.2
R Language
Menurut Torgo (2011, p1), R adalah bahasa pemrograman yang baik untuk
komputasi statistik. Hal ini mirip dengan bahasa S yang dikembangkan oleh AT&T Bell
Laboratories oleh Rick Becker, John Chambers dan Allan Wilks. Ada beberapa macam
versi untuk R antara lain R untuk Unix, Windows, dan berbagai macam Mac. Selain itu
R juga dapat berjalan di berbagai arsitektur komputer seperti Intel, PowerPC, Alpha
sistem, dan sistem Sparc. Sumber kode dari setiap komponen R tersedia secara bebas
sehingga dapat diadaptasikan dengan baik. R memiliki keterbatasan dalam penanganan
dataset yang sangat besar karena semua perhitungan dilakukan dalam memori utama
komputer.
Download