BAB II SIFAT- SIFAT ANALISIS REGRESI A. Sejarah dan Pengertian Regresi Istilah regresi diperkenalkan oleh Francis Galton dalam artikelnya “Family Likeness in Stature” (Proceeding of Royal Society, London, Vol.40,1886), yang menyatakan bahwa meskipun ada kecenderunga bagi orang tua yang tinggi mempunyai anak yang tinggi dan orang tua pendek mempunyai anak pendek, distribusi mengenai tinggi dari suatu populasi tidak berubah dari generasi ke generasi. Menurut istilah Galton: “regression to mediocrity” yang bisa disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tua. Karl Pearson menemukan bahwa rata- rata tinggi anak dari kelompok orang tua yang tinggi ternyata lebih kecil dari tinggi ayahnya, dan rata- rata tinggi anak dari kelompok orang tua yang pendek ternyata lebih besar dari pada tinggi ayahnya. Interpretasi Modern Regresi Damodar Gujarati dalam bukunya Basic Econometrics menyebutkan bahwa interpretasi modern tentang regresi adalah: Regression analysis is concerned with the study of the dependence of one variable,on one or more other variables, the explanatory varuable, with a view to estimating and or predicting the (population) mean or average value of the former in terms of the known or fiexed (in repeated sampling) values of the latter. Contoh penggunaan garis regresi: a. Garis regresi tinggi badan anak terhadap umur anak b. Ramalan tekanan darah dari seorang pasien jika berat badanya diketahui c. Ramalan akan banyaknya konsumsi setelah pendapatan diketahui B. Regresi Hubungan Sebab Akibat (Kausalitas) dan Korelasi Walaupun analisis regresi berkenaan dengan ketergantungan suatu variabel terhadap variabel lainnya tidak harus diartikan sebagai hubungan sebab dan akibat (causal relationship). Hubungan statistik tidak merupakan hubungan sebab akibat, bukan hubungan yang eksak (exact relationship), maksudnya jika nilai X sudah diketahui sekian, maka kita tidak bisa memastikan bahwa nilai Y harus sekian. Tetapi kita hanya bisa mengatakan bahwa jika X naik sekian maka dapat diharapkan bahwa rata-rata nilai Y akan mencapai sekian. Hal ini disebabkan karena yang mempengaruhi Y bukan hanya X, melainkan masih banyak faktor yang lain. Analisis korelasi bertujuan mengukur kuatnya tingkat hubungan linear antara dua variabel. Untuk mengukur kuatnya hubungan (korelasi) antara dua variabel X dan Y, kemudian nilai yang disebut koefisien korelasi (rxy atau r). Nilai r terletak antara -1 dan 1. C. Konsep Tentang Fungsi Regresi Populasi (FRP), Arti Linear dan Kesalahan Pengganggu Setiap probabilita bersyarat (conditional probability) Y, untuk X tertentu (p(Y/X) dapat dihitung rata-ratanya, yang disebut rata-rata bersyarat (conditional mean), atau harapan bersyarat (conditional ekspextation) dengan simbul E(Y/X). Setiap rata-rata bersyarat E(Y/Xi) merupakan fungsi dari Xi. Jadi E(Y/Xi)=f(Xi).....................................................................................(2.1) dimana f(Xi) merupakan fungsi dari variabel bebas Xi Persamaan (2.1) merupakan fungsi regresi populasi (FRP) atau sering disebut regresi populasi (RP), yang merupakan regresi sebenarnya. Jika fungsi regresi populasi E(Y/Xi) merupakan fungsi linear dari X1, maka bentuk persamaannya menjadi: E(Y|Xi) = β0 + β1 Xi.....................................................................................(2.2) Dimana: β0= Intercept/Konstanta, yaitu jarak dari titik asal ke titik perpotongan antara garis regresi dengan sumbu tegak β1= Koefisien arah (slope) atau koefisien regresi β0 dan β1 disebut parameter Dalam analisis regresi kita tertarik untuk membuat perkiraan (estimate) dari parameter tersebut berdasarkan hasil penelitian sampel. Apabila nilai a dan b sebagai perkiraan A dan B sudah dihitung, maka perkiraan garis regresi Y’=a+bX. Pengertian Linear Pengertian linear dapat diartikan menjadi 2 hal, yaitu: a. Linear dalam variabel Artinya bahwa ekspektasi bersyarat dari Y adalah fungsi linier dari Xi seperti pada persamaan: b. Linear dalam parameter Artinya bahwa ekspektasi bersyarat dari Y adalah fungsi linier dari parameter β yang dapat linier atau tidak linier dalam variabel Xi . Oleh sebab itu, E(Y|Xi) = β0 + β1 Xi adalah linier dalam parameter dan variabel, dan E(Y|Xi) = β0 + β1 𝑋𝑖2 adalah linier dalam parameter dan non linier dalam variabel disebut Linear Regression Model (LRM), Sebaliknya model regresi yang non-linier dalam parameter dan linier atau non linier dalam variabel disebut Non-Linear Regression Model (NLRM) Kesalahan Pengganggu Deviasi suatu nilai individu Yi, terhadap nilai rata-rata E(Y/Xi) sebagai berikut: εi =Yi - E(Y/Xi), atau Yi = E(Y/Xi) + εi Dimana εi = deviasi antara individu Yi dengan rata –rata bersyarat E(Y/Xi), yang juga disebut kesalahan pengganggu ( disturbance’s error). Keterangan lebih lanjut mengenai kesalahan pengganggu: Pertanyaan yang perlu diajukan adalah mengapa dalam model/persaman regresi harus dicantumkan kesalahan pengganggu? Berikut adalah alasannya: a. Suatu teori, kalau ada, yang menentukan tingkah laku (behavior) daripada variable bebas Y, seringkali tidak lengkap. Mungkin teori dengan jelas menyebutkan bahwa pendapatan (X) akan mempengaruhi konsumsi (Y), atau pupuk (X) mempengaruhi produksi (Y), akan tetapi mungkin teori tidak dapat menyebutkan secara eksplisit faktor apa saja selain pendapatan/pupuk yang mempengaruhi konsumsi/produksi. Maka dari itu kesalahan pengganggu (εi ) menampung kesalahan-kesalahan yang disebabkan oleh faktor lain yang mempengaruhi Y akan tetapi tidak dimasukkan dalam persamaan regresi. b. Walaupun secara teori kita mengetahui semua variable yang mempengaruhi Y, dan kita dimaksud ingin memasukkan variable-variabel tersebut, tetapi ada kemungkinan dalam prakteknya variabel tersebut sulit diukur secara kuantitatif, atau datanya tidak tersedia. Dalam hal ini kesalahan pengganggu tetap diperlukan. c. Jika misalnya Y= konsumsi, maka faktor yang mempengaruhi Y ini banyak sekali, misalnya selain Pendapatan(X1), juga besarnya anggota rumah tangga(X2), Sex (X3), Agama(X4), tingkat pendidikan(X5), dan lain-lain. Ada kemungkinan salah satu atau beberapa variable tersebut pengaruhnya terhadap Y tidak besar atau biaya pengumpulan datanya mahal sekali, sehingga tidak dimasukkan ke dalam persamaan. Kesalahan yang ditimbulkan akan ditampung dalam εi. d. Misalkan secara teoritis kita sudah tahu semua variable yang mempengaruhi Y dan mampu membiayai pengumpulan datanya sehingga bisa dimasukkan ke dalam persamaan. Namun demikian juga masih ada kesalahan yang ditimbulkan oleh sifat kerandoman (intrinsic randomness) dari variable Y. Kesalahan inipun masih dapat ditampung oleh εi. e. Seringkali kita ingin membuat model regresi yang sesederhana mungkin yang mencakup hanya satu atau dua variable bebas saja, sebab berdasarkan teori, variabel- variabel lainnya, walaupun ada pengaruhnya kurang begitu berarti. Dalam hal inipun sudah jelas bahwa kekurangan yang ditimbulkan akan ditampung oleh εi. D. Fungsi Regresi Sampel (FRS) Fungsi Regresi Populasi merupakan fungsi regresi sebenarnya, dalam prakteknya kita tidak tahu, sebab kita hanya menyelidiki sampel bukan populasi. Jadi yang kita peroleh adalah fungsi regresi sampel (FRS) sebagai perkiraan dari fungsi regresi populasi (FRP). FRS ini yang kita pergunakan untuk meramalkan Y kalau variabel bebas sudah diketahui. Seperti halnya untuk populasi ada fungsi regresi E(Y/Xi), Yi=A+BXi maka untuk sampel bentuk fungsi regresinya sebagai berikut: Ýi=a+bXi, , dimana: Ýi sebagai perkiraan E(Y/Xi); a,b, perkiraan A,B. a dan b disebut estimator atau statistic. Nilai a dan b disebut estimate atau nilai perkiraan.