REGRESI DAN KORELASI SEDERHANA Apa yang disebut Regresi? Korelasi ? • Analisa regresi dan korelasi sederhana membahas tentang keterkaitan antara sebuah variabel (variabel terikat/dependen) dengan (sebuah) variabel lain (variabel bebas/independen). Alat analisa ini digunakan untuk melihat besar, arah, dan tingkat keeratan variabel­variabel yang diuji. Hubungan antara dua variabel berkisar pada: 1. Regresi: menentukan bentuk persamaan yang akan digunakan untuk meramal (predict) rerata Y melalui X. Dan menduga kesalahan(selisih)­nya. Seringkali peramalan hanya dipusatkan pada variabel­variabel tertentu, sementara yang lain dianggap konstan. 2. Korelasi: pengukuran mengenai derajat keeratan antara dua variabelnya yang bergantung pada pola variasi atau inter­relasi yang dapat bersifat simultan. Variasinya merupakan variasi bersama (joint variation) dan dapat berhubungan secara dependen/independen sempurna. • Pasangan observasi dapat digambarkan dalam rangkaian titik­titik koordinat yang dinamakan diagram pencar (scatter diagram). Diagram Pencar = Scatter Diagram Diagram yang menggambarkan nilai­nilai observasi peubah takbebas dan peubah bebas. Nilai peubah bebas ditulis pada sumbu X (sumbu horizontal) Nilai peubah takbebas ditulis pada sumbu Y (sumbu vertikal) Nilai peubah takbebas ditentukan oleh nilai peubah bebas Bagaimana menentukan mana peubah takbebas dan peubah bebas? Contoh : Umur Vs Tinggi Tanaman (X : Umur, Y : Tinggi) Biaya Promosi Vs Volume penjualan (X : Biaya Promosi, Y : Vol. penjualan) Konsumsi vs Pendapatan 120 Konsumsi 100 80 60 40 20 0 0 50 100 150 200 Pendapatan • Jenis­jenis Persamaan Regresi : a. Regresi Linier ( parameter ): ­ Regresi Linier Sederhana = Y = a + bX ­ Regresi Linier Berganda = Y = a + b1X1 + b2X2 + ...+ bnXn b. Regresi Nonlinier – Regresi Eksponensial Y = abx log Y = log a + (log b) x Regresi Sederhana: A. Garis­duga regresi dan koefisien regresi (a dan b) • Garis duga adalah garis linier yang ditarik/diterapkan melalui titik­titik koordinat pasangan variabel disebut: garis regresi. • Tidak semua titik­titik kombinasi dari observasi akan berada pada garis regresi (umumnya tersebar disekitar garis regresi). • Jadi garis regresi merupakan garis yang menghubungkan rerata distribusi Y dengan seluruh kemungkinan nilai X, dimana hubungannya berbentuk: μ Υ / Χ=ΑΒΧ • Dimana: μ Υ / Χ= rerata Y untuk X tertentu Β= slope/condong garis regresi terhadap sumbu X adalah tingkat perubahan μ Y / X terhadap X; atau besarnya perubahan rerata Y akibat X berubah satu unit Α= konstanta/titik perpotongan garis regresi terhadap sumbu X adalah besar nilai Y jika X=0 • Fungsi regresi populasi Υi =αβΧ iε i Parameternya adalah α dan β . α= perkiraan Y bila X bernilai 0. β= besar perubahan Y akibat X berubah satu unit. ε i= random error/error terms/disturbance terms; unsur yang sifatnya random dan sulit untuk dideteksi terhadap Y (dependen variabel). • Asumsinya ε i terdistribusi secara normal dengan μ=0 dan σ e tertentu ( Homoskedastisitas). • Fungsi regresi sampelnya dapat dinyatakan sebagai: y i=abx i e i Dimana: • e i= deviasi random y dari rerata ΑΒΧ i juga bisa disebut sebagai kesalahan atau selisih (residual) • e i umumnya didistribusikan secara normal dengan Ε e i =0 dan varians 2 ei =s y / x • e i merupakan hasil penjumlahan dari dua komponen: (1) kesalahan pengukuran dan (2) kesalahan random (kesalahan pencatatan hasil observasi dan kesalahan yang tidak dapat diduga sebelumnya). • Maka persamaan regresinya bisa diduga dengan: Persamaan garis duga: y i =abx i . Persamaan garis ini adalah persamaan garis yang dianggap paling mencerminkan persamaan garis y i • Metode penduga yang umum digunakan adalah metode kuadrat terkecil (Ordinary Least Square = OLS), dengan tiga asumsi y yang harus selalu diingat: 1. nilai x harus diketahui dan tertentu. 2. untuk tiap nilai X, nilai Y terdistribusi secara normal dan independen 2 dengan rerata μ Υ / Χ=ΑΒΧ dan var ians=σ Υ / Χ . Dimana nilai A, B dan σ 2 Υ /Χ tidak diketahui 3. untuk tiap X, var ians=σ 2 Υ / Χ adalah sama atau σ 2 Υ /Χ =σ 2 untuk se­ mua X • OLS merupakan suatu metode untuk mendapatkan suatu garis duga yang sedemikian rupa sehingga tercapai ∑ ei 2 minimum. e i= y−a−bx i ⇒ ∑ e 2 =∑ yi −a−bx i 2 , setelah proses minimisasi didapat: i ∑ ΧΥ−n Χ Υ n ∑ Χ 2 − ∑ Χ 2 ∑ Χ 2−n Χ 2 ∑ Χ dan Υ= ∑Υ dimana Χ= a= y −b Χ b= n ∑ ΧΥ−∑ Χ ∑ Υ a= = n n , atau ∑ Υ−b ∑ Χ n Dari nilai a dan b diatas barulah dibuat persamaan garis duganya y i =abx i ANOVA • SST (Sum of Square Total) 2 =∑ Υ −n Υ 2⇒ SST =∑ Υ i − Υ keseluruhan variasi Y (dari rerata­nya) 2 i =∑ y 2 i • SSR (Sum of Square Regression) 2 =a ∑ Υ b ∑ Χ Υ −n Υ ⇒ SSR=∑ Υ i− Υ i i i i 2 i variasi Y yang dapat dijelaskan oleh garis regresi =∑ yi 2 • SSE (Sum of Square Error) 2 = Υ −a SSE =∑ Υ i − Υ ∑ 2 ∑ Υi −b ∑ Χ i Υi ⇒ variasi Y yang tidak dapat i i dijelaskan oleh garis regresi =∑ ei 2 B. Kesalahan Duga (Standard Error of Estimate) • Menunjukkan kesalahan standar dari nilai regresi (perbedaan antara Y ). dengan Υ Se= 2 ∑ Υ− Υ = n−2 SST −SSR = n−2 ∑ Υ 2−b ∑ ΧΥ = MSE ; n−2 MSE(mean of standard error) C. Analisa Korelasi • Tujuannya untuk mengetahui apakah antara satu variabel dengan variabel lainnya ada hubungannya atau korelasi. Pengukurannya terbagi menjadi dua: 1. Koefisien determiniasi =r 2 Menunjukkan berapa bagian dari total variasi dalam dependen variabelnya (Y) yang bisa dijelaskan oleh hubungan antara dependen variabel (Y) dengan independen variabelnya (X). Nilainya berkisar pada 0≤r 2 ≤1 . Bila nilainya 0, persamaan tidak dapat digunakan, sebaliknya bila bernilai 1, persamaannya akan sangat baik. r 2= 2 exp lained var iation SSR ∑ y −y = = total var iation SST ∑ y−y 2 2. Koefisien korelasi =r Untuk mengetahui hubungan antara variabel dependen dengan variabel independen. Karena; r = r 2 , nilainya akan selalu absolut. Akan tetapi nilai sebenarnya berkisar pada −1≤r ≤1 . Jika: r =−1 hubungannya negatif dan erat sekali ⇒ r =1 ⇒ hubungannya positif dan erat sekali r =0 ⇒ tidak ada hubungan sama sekali Cntoh soal: 1. Berikut ini adalah data index harga komoditi dalam negeri (X) dengan permintaan akan barang impor (Y). Carilah model regresinya, nilai r, beserta interpretasinya! (Digabungkan dengan perhitungan): Tahun 1980 1981 1982 1983 1984 1985 1986 1987 xi 35 37.5 30 32 35.5 30 41.5 48 yi xi yi 104.5 104.5 106 105.75 105 105.25 106.5 109.7 3657.5 3918.75 3180 3384 3727.5 3157.5 4419.75 5265.6 y2 i x i 2 1225 10920.25 1406.25 10920.25 900 11236 1024 11183.063 1260.25 11025 900 11077.563 1722.25 11342.25 2304 12034.09 1988 1989 1990 1991 1992 1993 1994 Total 50 42 45 41.5 53 44 45.5 610.5 110 5500 2500 12100 108.4 4552.8 1764 11750.56 109 4905 2025 11881 109.25 4533.875 1722.25 11935.563 108.75 5763.75 2809 11826.563 108 4752 1936 11664 110 5005 2070.25 12100 1610.6 65723.025 25568.25 172996.15 n=15 b= a= n ∑ ΧΥ−∑ Χ ∑ Υ 2 2 n ∑ Χ − ∑ Χ = 1 5 ×65723 . 0 25 − 6 1 0 . 5×1 6 1 0 . 6 1 5 ×1729 9 6 . 1 5 − 1 6 1 0 .6 2 =2 . 829 ∑ Υ−b ∑ Χ =6 1 0 . 5 − 2 . 829×1 6 1 0 . 6 =−263 . 0 5 9 n 15 Maka persamaan regresinya adalah: y =−263 . 0592 . 829 X Interpretasi: • Bila index harga komoditi dalam negeri 0 maka demand barang impor adalah –263.059. • Bila terjadi perubahan index harga komoditi dalam negeri sebesar satu unit, maka akan terjadi perubahan pada tingkat demand barang impor sebesar 2.829 unit. 2 [ n ∑ xy− ∑ x ∑ y ] SSR r = = SST [ n ∑ x 2 − ∑ x 2 ][ n ∑ y 2 − ∑ y 2 ] 2 [ 15×65723. 03 −1610 . 6×610 . 5 ] 2 r = 2 [ 15×172996 .15 −1610 . 6 2 ][ 15×25568 . 25− 610 . 52 ] =0 . 6734 r =0 . 82 Interpretasi: Hanya 67.34% hubungan antara demand barang impor dan index harga komoditi dalam negeri yang dapat dijelaskan sistem, sedangkan sisanya tidak dapat dijelaskan akibat pengaruh variabel lain. 2. Berikut ini adalah data bulanan pendapatan per kapita (X) dan besar penjualan produk (Y) dalam ratusan ribu rupiah. Carilah persamaan regresinya, interpretasikan, kemudian dugalah parameter B­nya! (gunakan α=5 (Disertai dengan perhitungan) Χ Bulan Jan Feb Mar Apr Mei Jun TOTAL b= a= 4.4 5.2 6.8 4.8 4.3 5.7 31.2 1.7 1.3 2.1 1.4 0.7 1.8 9 n ∑ ΧΥ−∑ Χ ∑ Υ 2 Χ2 Υ 2 n ∑ Χ − ∑ Χ = 19.36 27.04 46.24 23.04 18.49 32.49 166.66 Υ2 ΧΥ 2.89 1.69 4.41 1.96 0.49 3.24 14.68 7.48 6.76 14.28 6.72 3.01 10.26 48.51 6×48. 51 − 31 . 2×9 6×166 . 66 − 31 . 2 2 =0 . 39 ∑ Υ−b ∑ Χ = 9− 0 . 39×31. 2 =−0 . 528 n 6 Maka persamaan regresinya adalah: y =−5280039000 X Interpretasi: • Bila pendapatan per kapita 0 maka besar penjualan produk adalah –52.800 rupiah. • Bila terjadi pendapatan per kapita berubah sebesar satu rupiah, maka akan terjadi perubahan pada penjualan produk sebesar 39000 rupiah.