TM 3 BAB II Sifat2 Analisis Regresi

advertisement
BAB II
SIFAT- SIFAT ANALISIS REGRESI
A. Sejarah dan Pengertian Regresi
Istilah regresi diperkenalkan oleh Francis Galton dalam artikelnya “Family Likeness in
Stature” (Proceeding of Royal Society, London, Vol.40,1886), yang menyatakan bahwa
meskipun ada kecenderunga bagi orang tua yang tinggi mempunyai anak yang tinggi dan orang
tua pendek mempunyai anak pendek, distribusi mengenai tinggi dari suatu populasi tidak
berubah dari generasi ke generasi. Menurut istilah Galton: “regression to mediocrity” yang bisa
disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tua.
Karl Pearson menemukan bahwa rata- rata tinggi anak dari kelompok orang tua yang
tinggi ternyata lebih kecil dari tinggi ayahnya, dan rata- rata tinggi anak dari kelompok
orang tua yang pendek ternyata lebih besar dari pada tinggi ayahnya.
Interpretasi Modern Regresi
Damodar Gujarati dalam bukunya Basic Econometrics menyebutkan bahwa
interpretasi modern tentang regresi adalah:
Regression analysis is concerned with the study of the dependence of one variable,on one or
more other variables, the explanatory varuable, with a view to estimating and or predicting the
(population) mean or average value of the former in terms of the known or fiexed (in repeated
sampling) values of the latter.
Contoh penggunaan garis regresi:
a. Garis regresi tinggi badan anak terhadap umur anak
b. Ramalan tekanan darah dari seorang pasien jika berat badanya diketahui
c.
Ramalan akan banyaknya konsumsi setelah pendapatan diketahui
B. Regresi Hubungan Sebab Akibat (Kausalitas) dan Korelasi
Walaupun analisis regresi berkenaan dengan ketergantungan suatu variabel terhadap variabel
lainnya tidak harus diartikan sebagai hubungan sebab dan akibat (causal relationship).
Hubungan statistik tidak merupakan hubungan sebab akibat, bukan hubungan yang eksak
(exact relationship), maksudnya jika nilai X sudah diketahui sekian, maka kita tidak bisa
memastikan bahwa nilai Y harus sekian. Tetapi kita hanya bisa mengatakan bahwa jika X naik
sekian maka dapat diharapkan bahwa rata-rata nilai Y akan mencapai sekian. Hal ini disebabkan
karena yang mempengaruhi Y bukan hanya X, melainkan masih banyak faktor yang lain.
Analisis korelasi bertujuan mengukur kuatnya tingkat hubungan linear antara dua variabel.
Untuk mengukur kuatnya hubungan (korelasi) antara dua variabel X dan Y, kemudian nilai yang
disebut koefisien korelasi (rxy atau r). Nilai r terletak antara -1 dan 1.
C. Konsep Tentang Fungsi Regresi Populasi (FRP), Arti Linear dan Kesalahan
Pengganggu
Setiap probabilita bersyarat (conditional probability) Y, untuk X tertentu (p(Y/X) dapat
dihitung rata-ratanya, yang disebut rata-rata bersyarat (conditional mean), atau harapan bersyarat
(conditional ekspextation) dengan simbul E(Y/X). Setiap rata-rata bersyarat E(Y/Xi) merupakan
fungsi dari Xi. Jadi E(Y/Xi)=f(Xi).....................................................................................(2.1)
dimana f(Xi) merupakan fungsi dari variabel bebas Xi
Persamaan (2.1) merupakan fungsi regresi populasi (FRP) atau sering disebut regresi populasi
(RP), yang merupakan regresi sebenarnya.
Jika fungsi regresi populasi E(Y/Xi) merupakan fungsi linear dari X1, maka bentuk
persamaannya menjadi:
E(Y|Xi) = β0 + β1 Xi.....................................................................................(2.2)
Dimana: β0= Intercept/Konstanta, yaitu jarak dari titik asal ke titik perpotongan antara garis
regresi dengan sumbu tegak
β1= Koefisien arah (slope) atau koefisien regresi
β0 dan β1 disebut parameter
Dalam analisis regresi kita tertarik untuk membuat perkiraan (estimate) dari parameter
tersebut berdasarkan hasil penelitian sampel. Apabila nilai a dan b sebagai perkiraan A dan B
sudah dihitung, maka perkiraan garis regresi Y’=a+bX.
Pengertian Linear
Pengertian linear dapat diartikan menjadi 2 hal, yaitu:
a. Linear dalam variabel
Artinya bahwa ekspektasi bersyarat dari Y adalah fungsi linier dari Xi seperti pada persamaan:
b. Linear dalam parameter
Artinya bahwa ekspektasi bersyarat dari Y adalah fungsi linier dari parameter β yang dapat
linier atau tidak linier dalam variabel Xi .
Oleh sebab itu, E(Y|Xi) = β0 + β1 Xi adalah linier dalam parameter dan variabel, dan
E(Y|Xi) = β0 + β1 𝑋𝑖2 adalah linier dalam parameter dan non linier dalam variabel disebut
Linear Regression Model (LRM), Sebaliknya model regresi yang non-linier dalam parameter
dan linier atau non linier dalam variabel disebut Non-Linear Regression Model (NLRM)
Kesalahan Pengganggu
Deviasi suatu nilai individu Yi, terhadap nilai rata-rata E(Y/Xi) sebagai berikut:
εi =Yi - E(Y/Xi), atau Yi = E(Y/Xi) + εi
Dimana εi = deviasi antara individu Yi dengan rata –rata bersyarat E(Y/Xi), yang juga disebut
kesalahan pengganggu ( disturbance’s error).
Keterangan lebih lanjut mengenai kesalahan pengganggu:
Pertanyaan yang perlu diajukan adalah mengapa dalam model/persaman regresi harus
dicantumkan kesalahan pengganggu? Berikut adalah alasannya:
a.
Suatu teori, kalau ada, yang menentukan tingkah laku (behavior) daripada variable bebas
Y, seringkali tidak lengkap. Mungkin teori dengan jelas menyebutkan bahwa pendapatan
(X) akan mempengaruhi konsumsi (Y), atau pupuk (X) mempengaruhi produksi (Y),
akan tetapi mungkin teori tidak dapat menyebutkan secara eksplisit faktor apa saja selain
pendapatan/pupuk yang mempengaruhi konsumsi/produksi. Maka dari itu kesalahan
pengganggu (εi ) menampung kesalahan-kesalahan yang disebabkan oleh faktor lain yang
mempengaruhi Y akan tetapi tidak dimasukkan dalam persamaan regresi.
b.
Walaupun secara teori kita mengetahui semua variable yang mempengaruhi Y, dan kita
dimaksud ingin memasukkan variable-variabel tersebut, tetapi ada kemungkinan dalam
prakteknya variabel tersebut sulit diukur secara kuantitatif, atau datanya tidak tersedia.
Dalam hal ini kesalahan pengganggu tetap diperlukan.
c.
Jika misalnya Y= konsumsi, maka faktor yang mempengaruhi Y ini banyak sekali,
misalnya selain Pendapatan(X1), juga besarnya anggota rumah tangga(X2), Sex (X3),
Agama(X4), tingkat pendidikan(X5), dan lain-lain. Ada kemungkinan salah satu atau
beberapa variable tersebut pengaruhnya terhadap Y tidak besar atau biaya pengumpulan
datanya mahal sekali, sehingga tidak dimasukkan ke dalam persamaan. Kesalahan yang
ditimbulkan akan ditampung dalam εi.
d.
Misalkan secara teoritis kita sudah tahu semua variable yang mempengaruhi Y dan
mampu membiayai pengumpulan datanya sehingga bisa dimasukkan ke dalam
persamaan. Namun demikian juga masih ada kesalahan yang ditimbulkan oleh sifat
kerandoman (intrinsic randomness) dari variable Y. Kesalahan inipun masih dapat
ditampung oleh εi.
e.
Seringkali kita ingin membuat model regresi yang sesederhana mungkin yang mencakup
hanya satu atau dua variable bebas saja, sebab berdasarkan teori, variabel- variabel
lainnya, walaupun ada pengaruhnya kurang begitu berarti. Dalam hal inipun sudah jelas
bahwa kekurangan yang ditimbulkan akan ditampung oleh εi.
D. Fungsi Regresi Sampel (FRS)
Fungsi Regresi Populasi merupakan fungsi regresi sebenarnya, dalam prakteknya kita tidak
tahu, sebab kita hanya menyelidiki sampel bukan populasi. Jadi yang kita peroleh adalah fungsi
regresi sampel (FRS) sebagai perkiraan dari fungsi regresi populasi (FRP). FRS ini yang kita
pergunakan untuk meramalkan Y kalau variabel bebas sudah diketahui.
Seperti halnya untuk populasi ada fungsi regresi E(Y/Xi), Yi=A+BXi maka untuk sampel
bentuk fungsi regresinya sebagai berikut: Ýi=a+bXi, , dimana: Ýi sebagai perkiraan E(Y/Xi); a,b,
perkiraan A,B. a dan b disebut estimator atau statistic. Nilai a dan b disebut estimate atau nilai
perkiraan.
Download