aplikasi metode maksimum likelihood dalam regresi linier berganda

advertisement
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Metode analisis yang telah dibicarakan hingga sekarang adalah analisis terhadap data
mengenai sebuah karakteristik atau atribut (jika data itu kualitatig) dan mengenai
sebuah karakteristik (jika data itu kuantitatif). Tetepi, sebagaimana disadari banyak
persoalan atau fenomena yang meliputi lebih dari sebuah variabel. Misalnya, berta
orang dewasa laki-laki sampai taraf tertentu bergantung pada tingginya, tekanan
semacam gas bergantung pada temperatur, hasil produksi padi tergantung pada jumlah
pupuk yang digunakan, banyak curah hujan, cuaca dan sebagainya.
Maka dalam hal ini dirasa perlu untuk mempelajari analisis data yang terdiri
atas banyak variabel. Jika kita mempunyai data yang terdiri atas dua variabel atau
lebih variabel, adalah sewajarnya untuk mempelajari cara bagaimana variabel-variabel
itu berhubungan. Hubungan yang didapat pada umumnya dinyatakan dalam bentuk
persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel.
Analisa yang menyangkut masalah ini dikenal dengan analisis regresi.
Analsis regresi dibedakan atas dua jenis variabel yaitu variabel bebas dan
variabel terikat. Penetuan variabel bebas dan terikat dalam beberapa hal tidak mudah
dilaksanakan. Analisis yang cermat, analisa yang seksama, berbagai pertimbanagn,
kewajaran masalah yang dihadapi dan pengalaman akan memudahakan penentuan.
Variabel yang mudah didapat atau tersedia sering dapat digolongkan kedalam variabel
bebas, sedangkan variabel yang terjadi karena variabel bebas itu merupakan varabel
Universitas Sumatera Utara
terikat. Untuk keperluan analisis, variabel bebas akan dinyatakan dengan
X 1 , X 2 ,  X k (k ≥ 1) , sedangkan variabel terikat akan dinyatakan dengan Y.
Statistika bermaksud menyimpulkan populasi yang pada umumnya dengan
menggunakan hasil analisis data sampel. Khusus mengenai regresi dalam menentukan
hubungan fungsional yang diharapkan berlaku untuk populasi berdasarkan data
sampel yang diambil dari populasi yang bersangkutan. Seperti dikatakan di atas,
hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematik yang
disebut dengan persamaan regresi dan bergantung pada parameter-parameter.
Regresi linier merupakan suatu metode analisis statistik yang mempelajari pola
hubungan anatara dua atau lebih variabel. Pada kenyataan sahari-hari sering dijumpai
sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karenanya
dikembangkan analisis regresi linier berganda. Regresi linier berganda adalah
perluasan dari regresi sederhana yang mempunyai lebih dari satu variabel bebas X.
Regresi linier berganda digunakan untuk memodelkan hubungan antara variabel
terikat dan variabel bebas. Untuk mendapatkan estimasi β 0 , β1 ,  , β k digunakan
metode
maksimum
likelihood,
dimana
metode
ini
secara
prinsip
dapat
meminimumkan jumlah kuadrat kesalahan.
Salah satu cara untuk mendapatkan penaksir yang baik adalah dengan
menggunakan metode maksimum likelihood, yang telah diperkenalkan oleh seorang
ahli genetika dan statistik Sir R. A. Fisher antara tahun1912 sampai 1922 dan
memiliki aplikasi yang luas diberbagai bidang. Cara memaksimumkan likelihood
berkaiatan dengan metode estimasi dalan statistik. Estimasi maksimum likelihood
berguna untuk menentukan parameter yang memaksimalkan kemungkinan dari data
sampel. Dari sudut pandang statistik, metode maksimum likelihood ini dianggap lebih
kuat pada hasil estimator dengan sifat statistik. Selain itu, metode ini juga lebih efisin
untuk ketidakpastian pengukuran melalui batas keyakinan. Meskipun metodologi
untuk estimasi maksimum likelihood termasuk sederhana namun pelaksanaan
matematiknya sangat kuat. Parameter yang diperoleh dari fungsi estimasi maksimum
likelihood merupakan nilai yang sebenarnya. Jelas bahwa ukuran sampel menentukan
Universitas Sumatera Utara
ketelitian dari estimator. Jika ukuran sampel sama dengan populasi, maka estimator
memiliki sifat tidak bias, konsisten, dan efisien.
1.2 Perumusan Masalah
Masalah dalam penelitian ini adalah bagaimana menetukan model koefisien regresi
linier berganda dengan menggunakan maksimum likelihood.
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk menguraikan cara mengestimasi parameter
regresi linier berganda dengan meminimumkan error menggunakan maksimum
likelihood.
1.4 Kontribusi Penelitian
Kontribusi penelitian ini adalah:
1. Menambah wawasan dan memperkaya literature dalam bidang statistika yang
berhubungan dengan regresi linier berganda dan maksimum likelihood.
2. Dengan diketahuinya bagaimana cara mengestimasi parameter regresi linier
berganda menggunakan maksimum likehood diharapkan dapat meminimumkan
jarak antara titik data dan garis regresi.
3. Untuk mengetahui besarnya pengaruh dari setiap variabel bebas ( yang tercakup)
dalam persamaan) terhadap varabel tak bebas.
1.5 Tinjauan Pustaka
Universitas Sumatera Utara
Dalam penelitian ini penulis menggunakan buku - buku berikut sebagai sumber utama,
diantaranya adalah:
1
Supranto J : apabila variabel mempunyai hubungan linier dengan n buah variabel
X, maka model matematik regresi bergandanya adalah:
Y = β 0 + β1 X 1 +  + β k X k + ε
Keterngan:
= variabel terikat
Y
X 1 , X 2 , X k = variabel bebas
β 0 , β1 ,, β k = parameter regresi
ε
2.
= nilai kesalahan (error)
Wonnacott, T. H dan Wonnacott, R. J : jika X dikurangi dengan rata-ratanya,
maka akan diperoleh variabel baru x (xi = X i − X ) . Dan persamaan regresi
linier bergandanya menjadi:
Yi = β 0 + β1 x1i +  + β k x ki + ε
Keterangan:
Yi
= variabel terikat ke-i
x1i ,  , x ki
= selisih antara variabel bebas X dengan nilai rata-ratanya pada
pengamatan ke-i
β 0 , β1 ,, β k = parameter regresi
ε
= nilai kesalahan (error)
Secara umum, bila ada sampel berukuran n dan kemungkinan sampel yang diamati,
dan nilai fungsi kemungkinan untuk β 0 , β1 ,  , β k : p(Y1 , Y2 ,  , Yk / β 0 , β1 ,  , β k ) .
Untuk nilai Y bebas dengan mengalikan semua kemungkinan bersama, dimana:
Universitas Sumatera Utara
p (Y1 , Y2 ,  , Yk / β 0 , β1 ,  , β k )
 1
−1  Yi − ( β 0 + β1 x1i ++ β k xki ) 

2
σ


e 
=
σ 2π

 1
−1  Y2 − ( β 0 + β1 x1i ++ β k xki ) 

2
σ


e 
 σ 2π

2
 1
−1  Yi − ( β 0 + β1 x1i ++ β k xki ) 

2
σ


e 
=∏

σ
π
2
i =1

n
2
2








n
Dengan
∏
i =1
menyatakan hasil kali kemungkinan bersama untuk nilai Yi yang
penggunaannya dikenal dengan penjumlahan eksponen:
 1
p(Y1 , Y2 ,  , Yk / β 0 , β1 ,  , β k ) = 
 σ 2π
Mengingat Yi
n
(−12 ) Yi −( β 0 + β1xσ1i ++ β k xki ) 
 ∑


i =1
 e

n
2
amatan yang diberikan dipertimbangkan untuk berbagai nilai
β 0 , β1 ,, β k . Sehingga persamaan diatas dinamakan fungsi likelihood:
L(β 0 , β1 ,  β k ) =
(σ
1
2π
−1
)
n
e
 Yi − β 0 − β1 x1i −− β k xki 

σ

i =1
n
2
∑ 
2
Keterangan:
L(β 0 , β1 ,  β k ) = fungsi maksimum likelihood pada parameter β 0 , β1 ,  , β k
σ
= parameter yang merupakan simpangan baku untuk distribusi
π
= nilai konstan ( π = 3,14)
n
= banyak data sampel
e
= bilangan konstan (e= 2,718)
Yi
= variabel terikat ke-i
βi
= parameter regresi ke-i
Universitas Sumatera Utara
1.6 Metode Penelitian
Uraian metode yang digunakan dalam penelitian secara rinci meliputi:
a. Membentuk persamaan dari data dengan cara subsitusi.
b. Menganalisa persamaan dengan menggunakan maksimum likelihood.
c. Mengambil kesimpulan dari analisa yang diperoleh.
Universitas Sumatera Utara
Download