BAB II LANDASAN TEORI 2.1 Regresi Nonparametrik Metode

advertisement
BAB II
LANDASAN TEORI
2.1 Regresi Nonparametrik
Metode statistika nonparametrik merupakan metode statistika yang dapat
digunakan dengan mengabaikan asumsi-asumsi yang melandasi penggunaan metode
statistik parametrik. Terutama yang berkaitan dengan distribusi normal. Nama lain
yang sering digunakan untuk statistika nonparametrik adalah statistik bebas
distribusi.
Istilah yang
sering digunakan untuk statistika nonparametrik
adalah
distribution free statistic atau assumption free test. Dari istilah ini dapat dikatakan
bahwa pendekatan statistika nonparametrik merupakan metode penggunaan yang
tidak terikat asumsi tentang kurva regesi tertentu. Kurva regresi berdasarkan model
regresi nonparametrik ini diawali oleh model yang disebut model regresi
nonparametrik.
Regresi nonparametrik memiliki fleksibelitas yang tinggi dalam menafsirkan
kurva regresi, karena tidak mengasumsikan bentuk kurva regresi. Dalam pandangan
regresi nonparametrik berdasarkan data yang diharapkan dapat dicari taksiran kurva
tanpa dipengaruhi oleh subyektifitas dari peneliti (Eubank,1999 : 10).
Ada beberapa teknik penaksiran nilai variabel respon (Y) dalam regresi
nonparametrik yakni estimator kernel dan estimator spline.
Berikut ini adalah bentuk umum regresi nonparametrik :
yi = f ( xi ) + ε i
Universitas Sumatera Utara
Dengan
yi
= variabel respon
f (x i ) = fungsi nonparametrik
εi
= error, faktor pengguna yang tidak dapat dijelaskan oleh model
Tujuan dari regresi nonparametrik adalah untuk menentukan pada penaksiran
fungsi
regresi
daripada
penaksiran
parameter,
kebanyakan
nonparametrik sederhana secara tidak langsung juga disebut
dari
regresi
“ scratles plot
smoothing “ karena penggunaannya adalah untuk menentukan kurva yang mulus
melalui plot pencar y terhadap x (Simanjuntak,2009)
Statistika nonparametrik disebut juga statistika bebas sebaran, statistika
nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistika
nonparametrik dapat digunakan pada data yang sebaran normal atau ordinal.
Conover (1980) menjelaskan bahwa penggunaan regresi nonparametrik dilandasi
pada asumsi:
a. contoh yang diambil bersifat acak dan kontinu ;
b. regresi (Y/X) bersifat linier;
c. semua nilai X i saling bebas.
Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola
data yang tidak diketahui bentuknya atau tidak terdapat informasi masa lalu tentang
pola data.
Regresi nonparametrik merupakan suatu metode statistika yang digunakan
untuk mengetahui hubungan antara variabel respon dengan prediktor yang tidak
diketahui bentuk fungsinya, diasumsikan sebagai pemulus dalam suatu ruang fungsi
tertentu.
Universitas Sumatera Utara
2.1.1 Regresi Nonparametrik Spline
Ada beberapa teknik estimasi dalam regresi nonparametrik antara lain
pendekatan histogram, estimator spline, estimator kernel, estimator deret orthogonal,
analisis wavelet dan lain-lain. Pendekatan estimator spline ada bermacam-macam
antara lain spline original, spline type M, spline relaxed, spline terbobot dan lainlain.
Diantara model-model regresi nonparametrik di atas, Spline merupakan
model regresi yang mempunyai interpretasi Statistik dan Visual sangat khusus dan
sangat baik. Disamping itu Spline mampu menangani karakter data/fungsi yang
mulus (smooth). Spline juga memiliki kemampuan yang sangat baik untuk
menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu.
Bentuk umum dari regresi nonparametrik spline
yi = f (t i ) + ε i
Dimana f(t i ) merupakan fungsi yang tidak diketahui yang diduga dan diasumsikan
merupakan fungsi yang kontinu diferensiabel.
Dalam regresi nonparametrik Spline, penduga kurva regresi diperoleh dari
optimasi PLS atau Penalized Likelihood (PL). Namun untuk menduga kurva regresi
yang diperoleh dari optimasi Likelihood dapat menjadi pilihan yang cukup baik
karena secara matematik mudah dan sederhana.
2.2 Metode Maksimum Likelihood
Metode maksimum likelihood adalah suatu teknik yang sering digunakan
pada model parametrik baik untuk mencari penduga parameter maupun kontruksi
statistik uji. Metode ini pada. perkembangannya dapat digunakan pula pada model
Universitas Sumatera Utara
nonparametrik dengan pendekatan secara. empiris pada fungsi distribusinya,
sehingga dinamakan metode empirical Likelihood.
Dari dua metode tersebut, dapat digunakan untuk mengkontruksi statistik uji
kesamaan dua mean pada model semiparametrik (situ Model parametrik dan model
yang lain nonparametrik), yaitu dengan metode Maximum Semi — empirical
Likelihood Rati test (kombinasi dari metode Likelihood clan metode empirical
Likelihood ).
Misalkan X 1 ,X 2 ,…,X n menyatakan peubah acak yang saling bebas dengan
fungsi pada peluangnya dinyatakan oleh f(x i ,β) dengan β adalah parameter yang
ditaksir
dengan metode maksimum likelihood, maka fungsi padat peluang
gabungannya adalah :
f (X 1 ,X 2 , …, X n :β) = f(X 1 ,β), f(X 2 ,β), …,f( X n ,β)
n
=
∏ f ( Xi, β )
i =1
= L(β ǀ X 1 ,X 2 , …, X n )
Sedangkan metode maximum likelihood estimation adalah merupakan suatu
metode untuk memilih estimator yang membuat probabilitas sampel yang diteliti
menjadi maksimum.
Adapun Fungsi Likelihood yaitu:
L=
 ( y1 − ( β 0 + β1 X 1 ))2 
 −
 X
exp
(2πσ 2 )0,5
2σ 2


1
Universitas Sumatera Utara
 ( y2 − ( β 0 + β1 X 2 )) 2 
 −
 X . . . X
exp
(2πσ 2 )0,5
2σ 2


1
 ( yn − ( β 0 + β1 X n )) 2 
 −
 .
exp
(2πσ 2 )0,5
2σ 2


1
L=
 1 n

exp
 − 2 ∑ ( yi − ( β 0 + β1 X i )) 2 
2 0,5 n
(2πσ )
 2σ i =1

1
. ln fungsi likelihood :
2
 1  n ( y − ( β 0 + β 1 X i ))
ln L = ln(2πσ 2 ) −0,5 n +  − 2 ∑ i
 2σ  i =1
 (σ 2 ) −1  n
∑ ( y i − ( β 0 + β 1 X i )) 2
= ln(2πσ 2 ) −0,5 n +  −
2

 i =1
Penurunan fungsi likelihood
d ln L
n 1
1
 n
=−
− (−1) (σ 2 ) − 2 ∑ ( yi − ( β 0 + β1 X i )) 2
2
2
d (σ )
2σ
2
 i =1
=−
n 1
 1 2 −2  n
2
−
(
−
1
)
 (σ ) ∑ (ε i ) = 0
2σ2
 i =1
2
n
n 1  1 −2  n
2
2
ˆ
=
maka
(
)
(ε i ) 2 / n
σ
ε
σ
=


∑
∑
i
2σ2 2
 i =1
i =1
2.3 Estimasi Parameter Metode Maximum Likelihood
Maximum likelihood Estimation adalah suatu metode pendugaan klasik yang
paling popular untuk digunakan pada proses pendugaan parameter. Cryer (1986)
MLE menggunakan keseluruhan informasi dari data pengamatan. Tahap penggunaan
metode MLE terdiri dari tahap utama yaitu pengkontruksian fungsi likelihood
(perkalian fungsi kepadatan peluang tiap-tiap amatan) dan memaksimumkan fungsi
likelihoodnya.
Universitas Sumatera Utara
2.4 Distribusi Normal Multivariat
Distribusi normal multivariat merupakan suatu distribusi yang diperoleh dari
perluasan distribusi normal univariat, perbedaannya dapat dilihat pada dimensinya.
Pada univariat dimensi yang digunakan adalah 1 (p=1), sedangkan untuk
bivariat dimensi yang digunakan adalah 2 (p=2) dan untuk multivariate dimensi
yang digunakan lebih dari 2 (p>2). Salah satu keuntungan yang diperoleh dari
distribusi normal multivariat, adalah secara matematis mudah digunakan dan hasil
yang diperoleh memuaskan dan baik serta serta menarik dalam pelaksanaannya
(Johnson dan Wicher,2002).
Meskipun demikian, distribusi normal multivariat dalam prakteknya
digunakan untuk 2 alasan. Pertama, distribusi normal disajikan sebagai model
populasi yang dapat dipercaya di beberapa hal. Kedua, distribusi sampel dari
beberapa statistic multivariat secara pendekatannya adalah berdistribusi normal
(Johnson danWichern,2002)
Menurut Rencher (2002), beberapa sifat penting dari distribusi normal
multivariat diantaranya adalah
(1) distribusi dapat secara lengkap digambarkan hanya melalui rata-rata,
variansi dan kovariansi;
(2) plot bivariat dari data multivariat dapat menunjukkan trend linier;
(3) fungsi linier dari variabel yang berdistribusi normal multivariat juga akan
berdistribusi normal;
Apabila X mempunyai distribusi normal multivariat dengan vektor ratarata μ
dan matriks kovariansi Ʃ, maka fungsi densitas normal multivariatnya
Universitas Sumatera Utara
1
=
f ( x)

( 2π )
p
2
.∑
1
ex
2
1
− p( x − µ )T ∑ −1 ( x − µ ) ; − ∞ < x < ∞ ;
2  
 
Dengan
p : banyaknya variabel
Ʃ : matriks kovariansi
µ : vector
Variabel acak X dikatakan berdistribusi normal dengan rata-rata=µ, dan
variansi =
,
dimana
> 0, jika fungsi kepadatan probabilitas dari X tertentu oleh
rumus
f(X)=
, untuk -∞ <X<∞
Grafik dari y= f(X) merupakan kurva atau garis lengkung, yang lazim
dikatakan berbentuk lonceng (irisan bentuk lonceng).
Pada situasi multivariate terlihat lebih dari satu variabel. Sekelompok
variabel (X 1 ,X 2 ,…,X n ) dikatakan berdistribusi normal p-variate dengan vector ratarataµ= (µ 1 ,µ 2 ,…,µ n ) dan matriks kovarian atau matriks dispersi Ʃ.
Universitas Sumatera Utara
Download