REGRESI DAN KORELASI SEDERHANA

advertisement
REGRESI DAN KORELASI SEDERHANA
Apa yang disebut Regresi? Korelasi ?
•
Analisa regresi dan korelasi sederhana membahas tentang keterkaitan antara sebuah variabel (variabel terikat/dependen) dengan (sebuah) variabel lain (variabel bebas/independen). Alat analisa ini digunakan untuk melihat besar, arah, dan tingkat keeratan variabel­variabel yang diuji.
Hubungan antara dua variabel berkisar pada:
1. Regresi: menentukan bentuk persamaan yang akan digunakan untuk meramal (predict) rerata Y melalui X. Dan menduga kesalahan(selisih)­nya. Seringkali peramalan hanya dipusatkan pada variabel­variabel tertentu, sementara yang lain dianggap konstan.
2. Korelasi: pengukuran mengenai derajat keeratan antara dua variabelnya yang bergantung pada pola variasi atau inter­relasi yang dapat bersifat simultan. Variasinya merupakan variasi bersama (joint variation) dan dapat berhubungan secara dependen/independen sempurna.
•
Pasangan observasi dapat digambarkan dalam rangkaian titik­titik koordinat yang dinamakan diagram pencar (scatter diagram).
Diagram Pencar = Scatter Diagram
Diagram yang menggambarkan nilai­nilai observasi peubah takbebas dan peubah bebas.
Nilai peubah bebas ditulis pada sumbu X (sumbu horizontal)
Nilai peubah takbebas ditulis pada sumbu Y (sumbu vertikal)
Nilai peubah takbebas ditentukan oleh nilai peubah bebas
Bagaimana menentukan mana peubah takbebas dan peubah bebas?
Contoh :
Umur Vs Tinggi Tanaman (X : Umur, Y : Tinggi)
Biaya Promosi Vs Volume penjualan (X : Biaya Promosi, Y : Vol. penjualan)
Konsumsi vs Pendapatan
120
Konsumsi
100
80
60
40
20
0
0
50
100
150
200
Pendapatan
• Jenis­jenis Persamaan Regresi : a. Regresi Linier ( parameter ):
­ Regresi Linier Sederhana = Y = a + bX
­ Regresi Linier Berganda = Y = a + b1X1 + b2X2 + ...+ bnXn
b. Regresi Nonlinier
–
Regresi Eksponensial
Y = abx
log Y = log a + (log b) x
Regresi Sederhana:
A. Garis­duga regresi dan koefisien regresi (a dan b)
•
Garis duga adalah garis linier yang ditarik/diterapkan melalui titik­titik koordinat pasangan variabel  disebut: garis regresi.
•
Tidak semua titik­titik kombinasi dari observasi akan berada pada garis regresi (umumnya tersebar disekitar garis regresi).
•
Jadi garis regresi merupakan garis yang menghubungkan rerata distribusi Y dengan seluruh kemungkinan nilai X, dimana hubungannya berbentuk:
μ Υ / Χ=ΑΒΧ
•
Dimana: μ Υ / Χ= rerata Y untuk X tertentu
Β= slope/condong garis regresi terhadap sumbu X  adalah tingkat perubahan μ Y / X terhadap X; atau  besarnya perubahan rerata Y akibat X berubah satu unit Α= konstanta/titik perpotongan garis regresi terhadap sumbu X  adalah besar nilai Y jika X=0
•
Fungsi regresi populasi
Υi =αβΧ iε i
Parameternya adalah α dan β . α= perkiraan Y bila X bernilai 0. β= besar perubahan Y akibat X berubah satu unit.
ε i= random error/error terms/disturbance terms; unsur yang sifatnya random dan sulit untuk dideteksi terhadap Y (dependen variabel).
•
Asumsinya ε i terdistribusi secara normal dengan μ=0 dan σ e tertentu ( Homoskedastisitas).
•
Fungsi regresi sampelnya dapat dinyatakan sebagai:
y i=abx i e i Dimana: •
e i= deviasi random y dari rerata ΑΒΧ i juga bisa disebut sebagai kesalahan atau selisih (residual)
•
e i umumnya didistribusikan secara normal dengan Ε  e i  =0 dan varians 2
 ei =s y / x •
e i merupakan hasil penjumlahan dari dua komponen: (1) kesalahan pengukuran dan (2) kesalahan random (kesalahan pencatatan hasil observasi dan kesalahan yang tidak dapat diduga sebelumnya).
•
Maka persamaan regresinya bisa diduga dengan:
Persamaan garis duga: y i =abx i . Persamaan garis ini adalah persamaan garis yang dianggap paling mencerminkan persamaan garis y i
•
Metode penduga yang umum digunakan adalah metode kuadrat terkecil (Ordinary Least Square = OLS), dengan tiga asumsi y yang harus selalu diingat:
1. nilai x harus diketahui dan tertentu.
2. untuk tiap nilai X, nilai Y terdistribusi secara normal dan independen 2
dengan rerata μ Υ / Χ=ΑΒΧ dan var ians=σ Υ / Χ . Dimana nilai A, B dan σ
2
Υ
/Χ tidak diketahui
3. untuk tiap X, var ians=σ
2
Υ
/ Χ adalah sama atau σ
2
Υ
/Χ =σ 2 untuk se­
mua X
•
OLS merupakan suatu metode untuk mendapatkan suatu garis duga yang sedemikian rupa sehingga tercapai ∑ ei 2 minimum.
e i= y−a−bx i ⇒ ∑ e 2 =∑  yi −a−bx i 2 , setelah proses minimisasi didapat:
i
∑ ΧΥ−n Χ Υ
n ∑ Χ 2 − ∑ Χ 2
∑ Χ 2−n Χ 2
 ∑ Χ dan Υ=
 ∑Υ
 dimana Χ=
a= y −b Χ
b=
n ∑ ΧΥ−∑ Χ ∑ Υ

a=
=
n
n
, atau
∑ Υ−b ∑ Χ
n
Dari nilai a dan b diatas barulah dibuat persamaan garis duganya y i =abx i
ANOVA
•
SST (Sum of Square Total)
 2 =∑ Υ −n Υ
 2⇒
SST =∑  Υ i − Υ
keseluruhan variasi Y (dari rerata­nya)
2
i
=∑ y 2
i
•
SSR (Sum of Square Regression)
 2 =a ∑ Υ  b ∑ Χ Υ −n Υ
 ⇒
SSR=∑  Υ i− Υ
i
i
i i
2
i
variasi Y yang dapat dijelaskan oleh garis regresi =∑ yi 2
•
SSE (Sum of Square Error)
 2 = Υ −a
SSE =∑  Υ i − Υ
∑ 2 ∑ Υi −b ∑ Χ i Υi ⇒ variasi Y yang tidak dapat i
i
dijelaskan oleh garis regresi =∑ ei 2
B. Kesalahan Duga (Standard Error of Estimate)
•
Menunjukkan kesalahan standar dari nilai regresi (perbedaan antara Y  ).
dengan Υ
Se=

 2
∑  Υ− Υ
=
n−2

SST −SSR
=
n−2

∑ Υ 2−b ∑ ΧΥ = MSE ;
n−2
MSE(mean of standard error)
C. Analisa Korelasi
•
Tujuannya untuk mengetahui apakah antara satu variabel dengan variabel lainnya ada hubungannya atau korelasi. Pengukurannya terbagi menjadi dua:
1. Koefisien determiniasi =r 2
Menunjukkan berapa bagian dari total variasi dalam dependen variabelnya (Y) yang bisa dijelaskan oleh hubungan antara dependen variabel (Y) dengan independen variabelnya (X). Nilainya berkisar pada 0≤r 2 ≤1 . Bila nilainya 0, persamaan tidak dapat digunakan, sebaliknya bila bernilai 1, persamaannya akan sangat baik.
r 2=
2
exp lained var iation SSR ∑  y −y 
=
=
total var iation
SST ∑  y−y 2
2. Koefisien korelasi =r
Untuk mengetahui hubungan antara variabel dependen dengan variabel independen. Karena;
r = r 2 , nilainya akan selalu absolut. Akan tetapi nilai sebenarnya berkisar pada −1≤r ≤1 .
Jika: r =−1
hubungannya negatif dan erat sekali
⇒
r =1
⇒
hubungannya positif dan erat sekali
r =0
⇒
tidak ada hubungan sama sekali
Cntoh soal:
1. Berikut ini adalah data index harga komoditi dalam negeri (X) dengan permintaan akan barang impor (Y). Carilah model regresinya, nilai r, beserta interpretasinya!
(Digabungkan dengan perhitungan):
Tahun
1980
1981
1982
1983
1984
1985
1986
1987
xi
35
37.5
30
32
35.5
30
41.5
48
yi
xi yi
104.5
104.5
106
105.75
105
105.25
106.5
109.7
3657.5
3918.75
3180
3384
3727.5
3157.5
4419.75
5265.6
y2
i
x
i
2
1225 10920.25
1406.25 10920.25
900
11236
1024 11183.063
1260.25
11025
900 11077.563
1722.25 11342.25
2304 12034.09
1988
1989
1990
1991
1992
1993
1994
Total
50
42
45
41.5
53
44
45.5
610.5
110
5500
2500
12100
108.4
4552.8
1764 11750.56
109
4905
2025
11881
109.25 4533.875 1722.25 11935.563
108.75
5763.75
2809 11826.563
108
4752
1936
11664
110
5005 2070.25
12100
1610.6 65723.025 25568.25 172996.15
n=15
b=
a=
n ∑ ΧΥ−∑ Χ ∑ Υ
2
2
n ∑ Χ − ∑ Χ 
=
1 5 ×65723 . 0 25 − 6 1 0 . 5×1 6 1 0 . 6 
1 5 ×1729 9 6 . 1 5 − 1 6 1 0 .6 2
=2 . 829
∑ Υ−b ∑ Χ =6 1 0 . 5 − 2 . 829×1 6 1 0 . 6  =−263 . 0 5 9
n
15
Maka persamaan regresinya adalah:
y =−263 . 0592 . 829 X
Interpretasi:
•
Bila index harga komoditi dalam negeri 0 maka demand barang impor adalah –263.059.
•
Bila terjadi perubahan index harga komoditi dalam negeri sebesar satu unit, maka akan terjadi perubahan pada tingkat demand barang impor sebesar 2.829 unit.
2
[ n ∑ xy− ∑ x  ∑ y  ]
SSR
r =
=
SST [ n ∑ x 2 − ∑ x 2 ][ n ∑ y 2 − ∑ y 2 ]
2
[ 15×65723. 03 −1610 . 6×610 . 5 ]
2
r =
2
[  15×172996 .15 −1610 . 6 2 ][  15×25568 . 25− 610 . 52 ]
=0 . 6734
r =0 . 82
Interpretasi:
Hanya 67.34% hubungan antara demand barang impor dan index harga komoditi dalam negeri yang dapat dijelaskan sistem, sedangkan sisanya tidak dapat dijelaskan akibat pengaruh variabel lain. 2. Berikut ini adalah data bulanan pendapatan per kapita (X) dan besar penjualan produk (Y) dalam ratusan ribu rupiah. Carilah persamaan regresinya, interpretasikan, kemudian dugalah parameter B­nya! (gunakan α=5
(Disertai dengan perhitungan)
Χ
Bulan
Jan
Feb
Mar
Apr
Mei
Jun
TOTAL
b=
a=
4.4
5.2
6.8
4.8
4.3
5.7
31.2
1.7
1.3
2.1
1.4
0.7
1.8
9
n ∑ ΧΥ−∑ Χ ∑ Υ
2
Χ2
Υ
2
n ∑ Χ − ∑ Χ 
=
19.36
27.04
46.24
23.04
18.49
32.49
166.66
Υ2
ΧΥ
2.89
1.69
4.41
1.96
0.49
3.24
14.68
7.48
6.76
14.28
6.72
3.01
10.26
48.51
6×48. 51 − 31 . 2×9
6×166 . 66 − 31 . 2 2
=0 . 39
∑ Υ−b ∑ Χ = 9− 0 . 39×31. 2  =−0 . 528
n
6
Maka persamaan regresinya adalah:
y =−5280039000 X
Interpretasi:
•
Bila pendapatan per kapita 0 maka besar penjualan produk adalah –52.800 rupiah.
•
Bila terjadi pendapatan per kapita berubah sebesar satu rupiah, maka akan terjadi perubahan pada penjualan produk sebesar 39000 rupiah.
Download