Uploaded by User93848

Regresi Majemuk Presentasi

advertisement
REGRESI MAJEMUK
1. Penaksiran Persamaan Regresi Berganda
Pada kenyataannya bahwa suatu variable terikat dapat dipengaruhi oleh lebih dari
satu variable bebas. Misalnya, harga beras tidak saja dipengaruhi oleh adanya persediaan,
tetapi juga dipengaruhi oleh harga input sebagai factor untuk memproduksi beras, harga
bensin, atau harga-harga barang lainnya. Dengan demikian, maka dalam bagian ini akan
dibahas regresi berganda. Regresi berganda adalah model regresi atau prediksi yang
melibatkan lebih dari satu variabel bebas atau prediktor. Istilah regresi berganda
dapat disebut juga dengan istilah multiple regression. Kata multiple berarti jamak atau
lebih dari satu variabel.
Banyak yang tidak bisa membedakan antara multiple regression dengan multivariat
regression. Perbedaannya adalah jika multiple regression atau regresi berganda adalah
adanya lebih dari satu variabel prediktor (variabel bebas/variabel independen. Sedangkan
multivariat regression atau regresi multivariat adalah analisis regresi dimana melibatkan
lebih dari satu variabel response (variabel terikat/variabel dependen).
Salah satu contoh persamaan populasi dari regresi berganda adalah :
π‘Œ = 𝛼 + 𝛽1 𝑋1 + 𝛽2 𝑋2 … … . . π›½π‘˜ π‘‹π‘˜ + πœ‡π‘–
Dimana : 𝛼1
𝛽1 𝛽2 π›½π‘˜ ditentuka berdasarkan hasil pengamatan dan persamaan regresi
sampelnya dapat dituliskan :
π‘Œ = π‘Ž + 𝑏1 𝑋1 + 𝑏2 𝑋2 … … . . π‘π‘˜ π‘‹π‘˜ + 𝑒𝑖
Metode OLS bertujuan meminimalkan jumlah kuadrat dari residual sekecil
mungkin. Apabila variabelnya adalah sebanyak 3 buah, termasuk satu variable terikat maka
persamaan estimasinya adalah :
∑ π‘Œπ‘– = π‘π‘Ž + 𝑏𝑖 ∑ 𝑋1𝑖 + 𝑏2 ∑ 𝑋2𝑖
2
∑ 𝑋1𝑖 π‘Œπ‘– = π‘Ž ∑ 𝑋1𝑖 + 𝑏1 𝑋1𝑖
+ 𝑏2 𝑋1𝑖 𝑋2𝑖
2
∑ 𝑋2𝑖 π‘Œπ‘– = π‘Ž ∑ 𝑋1𝑖 + 𝑏1 𝑋2𝑖
+ 𝑏2 𝑋1𝑖 𝑋2𝑖
Dari persamaan-persamaan ini dengan menggunakan nilai deviasi masing-masing variabel, maka
persamaan diatas dapat disederhakan menjadi :
𝑏1 =
2
(∑ 𝑦𝑖 π‘₯1𝑖 )(∑ π‘₯2𝑖
) − (∑ 𝑦𝑖 π‘₯2𝑖 )(∑ π‘₯1𝑖 π‘₯2𝑖 )
2
2)
(∑ π‘₯1𝑖 )(∑ π‘₯2𝑖
− (∑ π‘₯1𝑖 π‘₯2𝑖 )2
2
(∑ 𝑦𝑖 π‘₯2𝑖 )(∑ π‘₯1𝑖
) − (∑ 𝑦𝑖 π‘₯1𝑖 )(∑ π‘₯1𝑖 π‘₯2𝑖 )
𝑏2 =
2
2)
(∑ π‘₯1𝑖 )(∑ π‘₯2𝑖
− (∑ π‘₯1𝑖 π‘₯2𝑖 )2
π‘Ž = π‘ŒΜ… − 𝑏1 𝑋̅1 − 𝑏2 𝑋̅2
Dimana π‘₯1𝑖 = 𝑋1𝑖 − Μ…Μ…Μ…
𝑋1
Μ…Μ…Μ…2
π‘₯2𝑖 = 𝑋2𝑖 − 𝑋
dan
𝑦𝑖 = π‘Œπ‘– − π‘ŒΜ…
Selanjutnya dapat dihitung varian dan standar deviasi dari koefisien regresi dengan rumus :
2
∑ 𝑋2𝑖
π‘‰π‘Žπ‘Ÿ(𝑏1) =
𝜎2
2
2
(∑ π‘₯1𝑖
)(∑ π‘₯2𝑖
) − (∑ π‘₯1𝑖 π‘₯2𝑖 )2
2
∑ 𝑋1𝑖
π‘‰π‘Žπ‘Ÿ(𝑏2 ) =
𝜎2
2
2
(∑ π‘₯1𝑖
)(∑ π‘₯2𝑖
) − (∑ π‘₯1𝑖 π‘₯2𝑖 )2
Dimana :
∑ 𝑒𝑖2
𝜎 =
𝑛−3
2
∑ 𝑒𝑖2 = ∑ 𝑦𝑖2 − 𝑏1 ∑ 𝑦𝑖 π‘₯1𝑖 + 𝑏2 ∑ 𝑦𝑖 π‘₯2𝑖
2. Jenis Regresi Berganda
Regresi berganda sebagai salah satu jenis analisis statistik, banyak sekali
macamnya, tergantung pada skala data per variabel. Berikut saya jelaskan satu persatu:
a. Regresi Linear Berganda
Merupakan model regresi berganda jika variabel terikatnya berskala data interval
atau rasio (kuantitatif atau numerik). Sedangkan variabel bebas pada umumnya
juga berskala data interval atau rasio. Namun ada juga regresi linear dimana
variabel bebas menggunakan skala data nominal atau ordinal, yang lebih lazim
disebut dengan istilah data dummy. Maka regresi linear yang seperti itu disebut
dengan istilah regresi linear dengan variabel dummy. Contoh regresi berganda jenis
ini adalah: “pengaruh DER dan NPM terhadap Return Saham.”
b. Regresi Logistik Berganda
Regresi Logistik berganda adalah model regresi berganda jika variabel terikatnya
adalah data dikotomi. Dikotomi artinya dalam bentuk kategorik dengan jumlah
kategori sebanyak 2 kategori. Misal: Laki-laki dan perempuan, baik dan buruk, ya
dan tidak, benar dan salah serta banyak lagi contoh lainnya. Sedangkan variabel
bebas jenis regresi berganda ini pada umumnya adalah juga variabel dikotomi.
Namun tidak masalah jika variabel dalam skala data interval, rasio, ordinal maupun
multinomial. Contoh regresi berganda jenis ini adalah: pengaruh rokok dan jenis
kelamin terhadap kejadian kanker paru. Dimana rokok kategorinya ya dan tidak,
jenis kelamin kategorinya laki-laki dan perempuan, sedangkan kejadian kanker
paru kategorinya ya dan tidak. Ada dua metode yang sering dipakai dalam jenis
regresi berganda ini, yaitu metode logit dan probit.
c. Regresi Ordinal berganda
Regresi berganda jenis ini adalah analisis regresi dimana variabel terikat adalah
berskala data ordinal. Sedangkan variabel bebas pada umumnya juga ordinal,
namun tidak masalah jika variabel dengan skala data yang lain, baik kuantitatif
maupun kualitatif. Keunikan regresi ini adalah jika variabel bebas adalah data
kategorik atau kualitatif, maka disebut sebagai faktor. Sedangkan jika data numerik
atau kuantitatif, maka disebut sebagai covariates. Contoh regresi berganda jenis ini
adalah: pengaruh tingkat penghasilan dan usia terhadap tingkat pengetahuan
terhadap IT. Dimana tingkat penghasilan sebagai faktor dengan kategori: rendah,
menengah dan tinggi. Usia sebagai covariates dengan skala data numerik. Dan
tingkat pengetahuan terhadap IT sebagai variabel terikat berskala data ordinal
dengan kategori: baik, cukup dan kurang.
d. Regresi Multinominal Berganda
Regresi multinomial berganda adalah jenis regresi dimana variabel terikat adalah
data nominal dengan jumlah kategori lebih dari 2 (dua) dan variabel bebas ada lebih
dari satu variabel. Jenis regresi ini hampir sama dengan regresi logistik berganda,
namun bedanya adalah variabel terikat kategorinya lebih dari dua, sedangkan
regresi logistik berganda variabel terikatnya mempunyai kategori hanya dua
(dikotomi). Regresi ini juga mirip dengan regresi ordinal, hanya saja bedanya skala
data pada regresi ini tidak bertingkat (bukan ordinal) atau dengan kata lain tidak
ada yang lebih baik atau lebih buruk. Contoh regresi ini adalah: Pengaruh
Pendidikan Orang Tua dan Penghasilan Orang Tua terhadap pilihan jurusan kuliah.
Dimana pendidikan dan penghasilan orang tua berskala data ordinal dan pilihan
jurusan kuliah adalah variabel berskala data nominal lebih dari dua kategori, yaitu:
jurusan kesehatan, hukum, sosial, sastra, pendidikan, lain-lain.
e. Regresi Data Panel Berganda
Dari jenis-jenis di atas, sebenarnya masih ada jenis lain yang merupakan
pengembangan dari jenis-jenis di atas, yaitu dengan adanya kompleksitas berupa
data time series atau runtut waktu, atau data panel. Seperti yang terjadi pada regresi
data panel ataupun regresi cochrane orcutt. Kalau misalnya regresi linear data
panel, jika ada lebih dari satu variabel bebas, maka bisa disebut dengan istilah
regresi linear data panel berganda. Namun kebanyakan orang atau peneliti, cukup
menggunakan istilah yang umum digunakan, yaitu cukup dengan menyebut sebagai
regresi data panel saja.
Koefisien Regresi Berganda (R2)
Koefisien determinasi berganda merupakan ukuran kesesuaian (godness of fit) dari
persamaan regresi, yaitu variasi dari variabel terikat yang mampu dijelaskan oleh variabel bebas.
Koefisien determinasi dari regresi berganda dapat dihitung dengan rumus:
𝐸𝑆𝑆
𝑇𝑆𝑆
̂𝑖 − π‘ŒΜ… )2
∑(π‘Œ
𝑅2 =
∑(π‘Œπ‘– − π‘ŒΜ… )2
𝑅2 =
Koefisien determinasi juga dapat dihitung dengan rumus:
𝑅𝑆𝑆
𝑇𝑆𝑆
̂𝑖 )2
∑(π‘Œπ‘– − π‘Œ
2
𝑅 = 1−
∑ π‘Œπ‘– − π‘ŒΜ… )2
𝑅2 = 1 −
∑ 𝑒𝑖2
𝑅 =1−
∑ 𝑦𝑖2
2
2
2
𝑏 2 ∑ π‘₯1𝑖
+ 𝑏2 ∑ π‘₯2𝑖
𝑅 =
∑ 𝑦𝑖2
2
Koefisien Regresi Berganda yang Disesuaikan (Adjusted R2)
Umumnya makin banyak variabel bebas yang dilibatkan pada suatu persamaan regresi
menyebabkan nilai R2 semakin besar dan hampir tidak pernah menurun (non decreasing).
Sedangkan R2 tersebut merupakan ukuran baik tidaknya suatu garis regresi. Apabila kita
bermaksud membandingkan beberapa persamaan regresi tentu tidaklah valid apabila sekedar
membandingkan R2. Untuk itu R2 perlu disesuaikan berdasarkan jumlah variabel yang dilibatkan
dengan rumus sebagai berikut :
̅𝑅̅̅2Μ… = 1 −
∑ 𝑒𝑖2 /(𝑛 − π‘˜)
∑ 𝑦𝑖2 /(𝑛 − 1)
Pengujian Signifikasi pada Regresi Berganda
Seperti telah disebutkan sebelumnya bahwa pengujian statistic terhadap persamaan regresi
sangat penting untuk meyakinkan kebenaran atau kepalsuan hubungan antara variabel X dan
variabel Y. Pengujian parsial antara masing-masing variabel bebas terhadap variabel terikat
digunakan uji t, sedangkan pengujian secara serempak seluruh variabel bebas terhadap variabel
terikat digunakan uji F. Perhitungan nilai t dapat digunakan rumus :
𝑑𝑖 =
𝑏𝑖 − 𝛽𝑖
𝑆𝛽𝑖
Karena 𝛽𝑖 tidak diketahui, maka persamaan diatas ditransformasikan menjadi :
𝑑𝑖 =
𝑏𝑖
𝑆(𝛽𝑖)
Perhitungan F untuk 3 Variabel dilakukan dengan rumus :
𝐹=
2
2
(𝑏1 ∑ π‘₯1𝑖
+ 𝑏2 ∑ π‘₯2𝑖
) /(π‘˜ − 1)
2
∑ 𝑒𝑖 /(𝑛 − 2)
𝐹=
𝑅 2 /(π‘˜ − 1)
(1 − 𝑅 2 )/(𝑛 − π‘˜)
𝐹=
𝐸𝑆𝑆 /(π‘˜ − 1)
𝑅𝑆𝑆 /(𝑛 − π‘˜)
Dalam pengujian ini F tabel dilihat pada derajat bebas(k-1);(n-k) dan hipotesis diformulasikan :
Ho : tidak ada pengaruh serempak variabel X1 dan X2 terhadap Y
H1 : ada pengaruh secara serempak variabel X1 dan X2 terhadap Y
Pelaporan Hasil Analisis Regresi
Terdapat berbagai cara pelaporan hasil regresi. Namun format laporan akan tergantung dari
jumlah variabel yang dianalisis. Setelah ditampilkan hasil taksiran persamaan/model regresi pada
prinsipnya laporan regresi memuat uraian empat paragraph (alenia) dengan kronologi yang
dikemukakan Gujarati (2009) yang juga banyak diaplikasikan pada analisis statistic multivariate,
sehingga disini disebut standar Gujarati, yaitu :
1. Menguraikan mengenai signifikasi pengaruh seluruh variabel bebas secara serempak
terhadap variabel terikat, yang mana ini juga disebut uji serempak (uji F) atau uji validitas
model.
2. Menginterprentasikan makna dari koefisien determinasi (R2).
3. Menguraikan mengenai signifikasi (pentingnya) pengaruh masing-masing variabel bebas
terhadap variabel terikat, yang mana ini juga disebut uji parsial (ujit t).
4. Menginterpretasikan makna koefisien regresi.
Contoh Soal :
Dibawah ini adalag konsumsi untuk barang A (Y) dalam kg, harga barang A (X1 = dalam
Rp.1.000,-) dan pendapatan konsumen (X2 = Rp.1.000) adalah sebagai berikut :
Konsumsi A (Y)
4
4
6
6
8
8
10
10
12
12
Harga Barang A (X1)
7
7
4
3
6
4
3
2
2
2
Pendapatan (X2)
30
35
45
40
65
50
60
45
70
80
Apabila data tersebut dibuat persamaan regresinya, perhitungannya adalah sebagai berikut :
Tabel Perhitungan Analisis Regresi Konsumsi Barang A
π‘ŒΜ… =
Y
X1
X2
y
x1
x2
y2
x12
x22
yx1
yx2
x1x2
4
7
30
-4
3
-22
16
9
484
-12
88
-66
4
7
35
-4
3
-17
16
9
289
-12
68
-51
6
4
45
-2
0
-7
4
0
49
0
14
0
6
3
40
-2
-1
-12
4
1
144
2
24
12
8
6
65
0
2
13
0
4
169
0
0
26
8
4
50
0
0
-2
0
0
4
0
0
0
10
3
60
2
-1
8
4
1
64
-2
16
-8
10
2
45
2
-2
-7
4
4
49
-4
-14
14
12
2
70
4
-2
18
16
4
324
-8
72
-36
12
2
80
4
-2
28
16
4
784
-8
112
-56
80
40
520
0
0
0
80
36
2360
-44
380
-165
80
10
=8
Μ…Μ…Μ…1 =
𝑋
40
10
=4
Μ…Μ…Μ…2 =
𝑋
520
10
= 52
Cara menggunakan perhitungan regresi berganda pada SPSS
(Aplikasi yang digunakan SPSS ver.16.0)
1. Langkah pertama. Untuk memudahkan kita melakukan perhitungannya maka kita buat
terlebih dahulu datanya di excel
2. Buka aplikasi SPSS (disini penyaji menggunakan Aplikasi SPSS Ver.16.0)
3. Klik Variabel View
4. Pada kolom Name : ketik X1, kita tab, lalu X2 kita tab dan Y (disini penyaji menggunakan
2 Variabel Independen dan 1 Variabel Dependen dan pada kolom Label : beri sesuai nama
variabel kita
5. Selanjutnya klik Data View, selanjutnya copy data excel yang kita buat lalu paste pada data
view di SPSS
6. Klik Analyze οƒ  Regression οƒ  Linear
7. Pada kolom Dependent klik variabel dependen nya, sebagai contoh soal diatas maka
variabel dependennya adalah Konsumsi A. Selanjutnya pada kolom Independent klik
variabel independen nya, untuk contoh disini variabel independen nya adalah Harga
Barang dan Pendapatan
8. Klik OK
9. Maka akan muncul hasil pengolahan data regresi berganda kita pada program SPSS
Maka Pelaporan Hasil Analisis Regresi dari contoh diatas diuraikan sebagai berikut :
1. Menguraikan mengenai signifikasi pengaruh seluruh variabel bebas secara serempak
terhadap variabel terikat, yang mana ini juga disebut uji serempak (uji F) atau uji validitas
model.
 Hasil perhitungan F menunjukkan angka sebesar 40,305 dengan siginifikasi sebesar
0,000. Angka tersebut jauh lebih kecil dari level of significat 5 persen yang biasa
digunakan dalam penelitian ekonomi. Hal ini berarti bahwa secara serempak variabel
harga barang A (X1) dan tingkat pendapatan konsumen (X2) berpengaruh serempak
terhadap konsumsi barang A.
2. Menginterprentasikan makna dari koefisien determinasi (R2).
 Koefisien Determinasi atau R2 = 0,920 mempunyai arti bahwa 92% variasi konsumsi
barang A dipengaruhi oleh variasi harga barang A dan variasi tingkat pendapatan
konsumen, sedangkan sisanya 8% dipengaruhi oleh faktor lainnya yang tidak
dimasukkan dalam model tersebut.
3. Menguraikan mengenai signifikasi (pentingnya) pengaruh masing-masing variabel bebas
terhadap variabel terikat, yang mana ini juga disebut uji parsial (ujit t).
 Dari angka tersebut diatas dapat dijelaskan bahwa variabel harga barang A (X1) dan
pendapatan konsumen (X2) berpengaruh sangat nyata terhadap konsumsi barang A. Hal
ini dibuktikan dari t hitung masing-masing sebesar -3,688 dan 4,660 sedangkan t tabel
pada derajat bebas 7 adalah 2,365 (t tabel = t(𝛼/2 ; n-k-1) = t (0,025 ; 7 ) = 2,365).
Pengaruh variabel harga barang A (X1) dan tingkat pendapatan konsumen terhadap
konsumsi barang A juga dapat dilihat dari nilai signifikasi kedua variabel itu
berdasarkan hasil olahan data SPSS masing-masing 0,008 dan 0,002 atau dengan
probabilitas lebih kecil dari 1%.
4. Menginterpretasikan makna koefisien regresi.
π‘ŒΜ‚ = 5,068 − 0,713 𝑋1 + 0,111 𝑋2
 Koefisien regresi dari harga barang A sebesar -0,713 berarti bahwa apabila harga
barang A naik sebesar Rp.1.000,- dengan anggapan bahwa variabel bebas lainnya
konstan, maka konsumsi akan barang A turun 0,713 kg.
 Koefisien regresi tingkat pendapatan sebesar 0,111 berarti bahwa apabila pendapatan
naik sebesar Rp.1.000,- dengan anggapan variabel bebas lainnya konstan maka
konsumsi akan barang A naik 0,111 kg.
Misalnya, jika dari persamaan regresi diatas diketahui bahwa harga barang A adalah Rp.5.000,dan pendapatan konsumen adalah Rp.40.000,- maka jumlah barang A yang diminta adalah
sebanyak 5,943 kg. Perhitungan seperti dibawah ini :
π‘ŒΜ‚ = 5,068 − 0,713(𝑋1 ) + 0,111(𝑋2 )
π‘ŒΜ‚ = 5,068 − 0,713(5) + 0,111(40) = 5,943
Download