REGRESI MAJEMUK 1. Penaksiran Persamaan Regresi Berganda Pada kenyataannya bahwa suatu variable terikat dapat dipengaruhi oleh lebih dari satu variable bebas. Misalnya, harga beras tidak saja dipengaruhi oleh adanya persediaan, tetapi juga dipengaruhi oleh harga input sebagai factor untuk memproduksi beras, harga bensin, atau harga-harga barang lainnya. Dengan demikian, maka dalam bagian ini akan dibahas regresi berganda. Regresi berganda adalah model regresi atau prediksi yang melibatkan lebih dari satu variabel bebas atau prediktor. Istilah regresi berganda dapat disebut juga dengan istilah multiple regression. Kata multiple berarti jamak atau lebih dari satu variabel. Banyak yang tidak bisa membedakan antara multiple regression dengan multivariat regression. Perbedaannya adalah jika multiple regression atau regresi berganda adalah adanya lebih dari satu variabel prediktor (variabel bebas/variabel independen. Sedangkan multivariat regression atau regresi multivariat adalah analisis regresi dimana melibatkan lebih dari satu variabel response (variabel terikat/variabel dependen). Salah satu contoh persamaan populasi dari regresi berganda adalah : π = πΌ + π½1 π1 + π½2 π2 … … . . π½π ππ + ππ Dimana : πΌ1 π½1 π½2 π½π ditentuka berdasarkan hasil pengamatan dan persamaan regresi sampelnya dapat dituliskan : π = π + π1 π1 + π2 π2 … … . . ππ ππ + ππ Metode OLS bertujuan meminimalkan jumlah kuadrat dari residual sekecil mungkin. Apabila variabelnya adalah sebanyak 3 buah, termasuk satu variable terikat maka persamaan estimasinya adalah : ∑ ππ = ππ + ππ ∑ π1π + π2 ∑ π2π 2 ∑ π1π ππ = π ∑ π1π + π1 π1π + π2 π1π π2π 2 ∑ π2π ππ = π ∑ π1π + π1 π2π + π2 π1π π2π Dari persamaan-persamaan ini dengan menggunakan nilai deviasi masing-masing variabel, maka persamaan diatas dapat disederhakan menjadi : π1 = 2 (∑ π¦π π₯1π )(∑ π₯2π ) − (∑ π¦π π₯2π )(∑ π₯1π π₯2π ) 2 2) (∑ π₯1π )(∑ π₯2π − (∑ π₯1π π₯2π )2 2 (∑ π¦π π₯2π )(∑ π₯1π ) − (∑ π¦π π₯1π )(∑ π₯1π π₯2π ) π2 = 2 2) (∑ π₯1π )(∑ π₯2π − (∑ π₯1π π₯2π )2 π = πΜ − π1 πΜ 1 − π2 πΜ 2 Dimana π₯1π = π1π − Μ Μ Μ π1 Μ Μ Μ 2 π₯2π = π2π − π dan π¦π = ππ − πΜ Selanjutnya dapat dihitung varian dan standar deviasi dari koefisien regresi dengan rumus : 2 ∑ π2π πππ(π1) = π2 2 2 (∑ π₯1π )(∑ π₯2π ) − (∑ π₯1π π₯2π )2 2 ∑ π1π πππ(π2 ) = π2 2 2 (∑ π₯1π )(∑ π₯2π ) − (∑ π₯1π π₯2π )2 Dimana : ∑ ππ2 π = π−3 2 ∑ ππ2 = ∑ π¦π2 − π1 ∑ π¦π π₯1π + π2 ∑ π¦π π₯2π 2. Jenis Regresi Berganda Regresi berganda sebagai salah satu jenis analisis statistik, banyak sekali macamnya, tergantung pada skala data per variabel. Berikut saya jelaskan satu persatu: a. Regresi Linear Berganda Merupakan model regresi berganda jika variabel terikatnya berskala data interval atau rasio (kuantitatif atau numerik). Sedangkan variabel bebas pada umumnya juga berskala data interval atau rasio. Namun ada juga regresi linear dimana variabel bebas menggunakan skala data nominal atau ordinal, yang lebih lazim disebut dengan istilah data dummy. Maka regresi linear yang seperti itu disebut dengan istilah regresi linear dengan variabel dummy. Contoh regresi berganda jenis ini adalah: “pengaruh DER dan NPM terhadap Return Saham.” b. Regresi Logistik Berganda Regresi Logistik berganda adalah model regresi berganda jika variabel terikatnya adalah data dikotomi. Dikotomi artinya dalam bentuk kategorik dengan jumlah kategori sebanyak 2 kategori. Misal: Laki-laki dan perempuan, baik dan buruk, ya dan tidak, benar dan salah serta banyak lagi contoh lainnya. Sedangkan variabel bebas jenis regresi berganda ini pada umumnya adalah juga variabel dikotomi. Namun tidak masalah jika variabel dalam skala data interval, rasio, ordinal maupun multinomial. Contoh regresi berganda jenis ini adalah: pengaruh rokok dan jenis kelamin terhadap kejadian kanker paru. Dimana rokok kategorinya ya dan tidak, jenis kelamin kategorinya laki-laki dan perempuan, sedangkan kejadian kanker paru kategorinya ya dan tidak. Ada dua metode yang sering dipakai dalam jenis regresi berganda ini, yaitu metode logit dan probit. c. Regresi Ordinal berganda Regresi berganda jenis ini adalah analisis regresi dimana variabel terikat adalah berskala data ordinal. Sedangkan variabel bebas pada umumnya juga ordinal, namun tidak masalah jika variabel dengan skala data yang lain, baik kuantitatif maupun kualitatif. Keunikan regresi ini adalah jika variabel bebas adalah data kategorik atau kualitatif, maka disebut sebagai faktor. Sedangkan jika data numerik atau kuantitatif, maka disebut sebagai covariates. Contoh regresi berganda jenis ini adalah: pengaruh tingkat penghasilan dan usia terhadap tingkat pengetahuan terhadap IT. Dimana tingkat penghasilan sebagai faktor dengan kategori: rendah, menengah dan tinggi. Usia sebagai covariates dengan skala data numerik. Dan tingkat pengetahuan terhadap IT sebagai variabel terikat berskala data ordinal dengan kategori: baik, cukup dan kurang. d. Regresi Multinominal Berganda Regresi multinomial berganda adalah jenis regresi dimana variabel terikat adalah data nominal dengan jumlah kategori lebih dari 2 (dua) dan variabel bebas ada lebih dari satu variabel. Jenis regresi ini hampir sama dengan regresi logistik berganda, namun bedanya adalah variabel terikat kategorinya lebih dari dua, sedangkan regresi logistik berganda variabel terikatnya mempunyai kategori hanya dua (dikotomi). Regresi ini juga mirip dengan regresi ordinal, hanya saja bedanya skala data pada regresi ini tidak bertingkat (bukan ordinal) atau dengan kata lain tidak ada yang lebih baik atau lebih buruk. Contoh regresi ini adalah: Pengaruh Pendidikan Orang Tua dan Penghasilan Orang Tua terhadap pilihan jurusan kuliah. Dimana pendidikan dan penghasilan orang tua berskala data ordinal dan pilihan jurusan kuliah adalah variabel berskala data nominal lebih dari dua kategori, yaitu: jurusan kesehatan, hukum, sosial, sastra, pendidikan, lain-lain. e. Regresi Data Panel Berganda Dari jenis-jenis di atas, sebenarnya masih ada jenis lain yang merupakan pengembangan dari jenis-jenis di atas, yaitu dengan adanya kompleksitas berupa data time series atau runtut waktu, atau data panel. Seperti yang terjadi pada regresi data panel ataupun regresi cochrane orcutt. Kalau misalnya regresi linear data panel, jika ada lebih dari satu variabel bebas, maka bisa disebut dengan istilah regresi linear data panel berganda. Namun kebanyakan orang atau peneliti, cukup menggunakan istilah yang umum digunakan, yaitu cukup dengan menyebut sebagai regresi data panel saja. Koefisien Regresi Berganda (R2) Koefisien determinasi berganda merupakan ukuran kesesuaian (godness of fit) dari persamaan regresi, yaitu variasi dari variabel terikat yang mampu dijelaskan oleh variabel bebas. Koefisien determinasi dari regresi berganda dapat dihitung dengan rumus: πΈππ πππ Μπ − πΜ )2 ∑(π π 2 = ∑(ππ − πΜ )2 π 2 = Koefisien determinasi juga dapat dihitung dengan rumus: π ππ πππ Μπ )2 ∑(ππ − π 2 π = 1− ∑ ππ − πΜ )2 π 2 = 1 − ∑ ππ2 π =1− ∑ π¦π2 2 2 2 π 2 ∑ π₯1π + π2 ∑ π₯2π π = ∑ π¦π2 2 Koefisien Regresi Berganda yang Disesuaikan (Adjusted R2) Umumnya makin banyak variabel bebas yang dilibatkan pada suatu persamaan regresi menyebabkan nilai R2 semakin besar dan hampir tidak pernah menurun (non decreasing). Sedangkan R2 tersebut merupakan ukuran baik tidaknya suatu garis regresi. Apabila kita bermaksud membandingkan beberapa persamaan regresi tentu tidaklah valid apabila sekedar membandingkan R2. Untuk itu R2 perlu disesuaikan berdasarkan jumlah variabel yang dilibatkan dengan rumus sebagai berikut : Μ π Μ Μ 2Μ = 1 − ∑ ππ2 /(π − π) ∑ π¦π2 /(π − 1) Pengujian Signifikasi pada Regresi Berganda Seperti telah disebutkan sebelumnya bahwa pengujian statistic terhadap persamaan regresi sangat penting untuk meyakinkan kebenaran atau kepalsuan hubungan antara variabel X dan variabel Y. Pengujian parsial antara masing-masing variabel bebas terhadap variabel terikat digunakan uji t, sedangkan pengujian secara serempak seluruh variabel bebas terhadap variabel terikat digunakan uji F. Perhitungan nilai t dapat digunakan rumus : π‘π = ππ − π½π ππ½π Karena π½π tidak diketahui, maka persamaan diatas ditransformasikan menjadi : π‘π = ππ π(π½π) Perhitungan F untuk 3 Variabel dilakukan dengan rumus : πΉ= 2 2 (π1 ∑ π₯1π + π2 ∑ π₯2π ) /(π − 1) 2 ∑ ππ /(π − 2) πΉ= π 2 /(π − 1) (1 − π 2 )/(π − π) πΉ= πΈππ /(π − 1) π ππ /(π − π) Dalam pengujian ini F tabel dilihat pada derajat bebas(k-1);(n-k) dan hipotesis diformulasikan : Ho : tidak ada pengaruh serempak variabel X1 dan X2 terhadap Y H1 : ada pengaruh secara serempak variabel X1 dan X2 terhadap Y Pelaporan Hasil Analisis Regresi Terdapat berbagai cara pelaporan hasil regresi. Namun format laporan akan tergantung dari jumlah variabel yang dianalisis. Setelah ditampilkan hasil taksiran persamaan/model regresi pada prinsipnya laporan regresi memuat uraian empat paragraph (alenia) dengan kronologi yang dikemukakan Gujarati (2009) yang juga banyak diaplikasikan pada analisis statistic multivariate, sehingga disini disebut standar Gujarati, yaitu : 1. Menguraikan mengenai signifikasi pengaruh seluruh variabel bebas secara serempak terhadap variabel terikat, yang mana ini juga disebut uji serempak (uji F) atau uji validitas model. 2. Menginterprentasikan makna dari koefisien determinasi (R2). 3. Menguraikan mengenai signifikasi (pentingnya) pengaruh masing-masing variabel bebas terhadap variabel terikat, yang mana ini juga disebut uji parsial (ujit t). 4. Menginterpretasikan makna koefisien regresi. Contoh Soal : Dibawah ini adalag konsumsi untuk barang A (Y) dalam kg, harga barang A (X1 = dalam Rp.1.000,-) dan pendapatan konsumen (X2 = Rp.1.000) adalah sebagai berikut : Konsumsi A (Y) 4 4 6 6 8 8 10 10 12 12 Harga Barang A (X1) 7 7 4 3 6 4 3 2 2 2 Pendapatan (X2) 30 35 45 40 65 50 60 45 70 80 Apabila data tersebut dibuat persamaan regresinya, perhitungannya adalah sebagai berikut : Tabel Perhitungan Analisis Regresi Konsumsi Barang A πΜ = Y X1 X2 y x1 x2 y2 x12 x22 yx1 yx2 x1x2 4 7 30 -4 3 -22 16 9 484 -12 88 -66 4 7 35 -4 3 -17 16 9 289 -12 68 -51 6 4 45 -2 0 -7 4 0 49 0 14 0 6 3 40 -2 -1 -12 4 1 144 2 24 12 8 6 65 0 2 13 0 4 169 0 0 26 8 4 50 0 0 -2 0 0 4 0 0 0 10 3 60 2 -1 8 4 1 64 -2 16 -8 10 2 45 2 -2 -7 4 4 49 -4 -14 14 12 2 70 4 -2 18 16 4 324 -8 72 -36 12 2 80 4 -2 28 16 4 784 -8 112 -56 80 40 520 0 0 0 80 36 2360 -44 380 -165 80 10 =8 Μ Μ Μ 1 = π 40 10 =4 Μ Μ Μ 2 = π 520 10 = 52 Cara menggunakan perhitungan regresi berganda pada SPSS (Aplikasi yang digunakan SPSS ver.16.0) 1. Langkah pertama. Untuk memudahkan kita melakukan perhitungannya maka kita buat terlebih dahulu datanya di excel 2. Buka aplikasi SPSS (disini penyaji menggunakan Aplikasi SPSS Ver.16.0) 3. Klik Variabel View 4. Pada kolom Name : ketik X1, kita tab, lalu X2 kita tab dan Y (disini penyaji menggunakan 2 Variabel Independen dan 1 Variabel Dependen dan pada kolom Label : beri sesuai nama variabel kita 5. Selanjutnya klik Data View, selanjutnya copy data excel yang kita buat lalu paste pada data view di SPSS 6. Klik Analyze ο Regression ο Linear 7. Pada kolom Dependent klik variabel dependen nya, sebagai contoh soal diatas maka variabel dependennya adalah Konsumsi A. Selanjutnya pada kolom Independent klik variabel independen nya, untuk contoh disini variabel independen nya adalah Harga Barang dan Pendapatan 8. Klik OK 9. Maka akan muncul hasil pengolahan data regresi berganda kita pada program SPSS Maka Pelaporan Hasil Analisis Regresi dari contoh diatas diuraikan sebagai berikut : 1. Menguraikan mengenai signifikasi pengaruh seluruh variabel bebas secara serempak terhadap variabel terikat, yang mana ini juga disebut uji serempak (uji F) atau uji validitas model. ο¨ Hasil perhitungan F menunjukkan angka sebesar 40,305 dengan siginifikasi sebesar 0,000. Angka tersebut jauh lebih kecil dari level of significat 5 persen yang biasa digunakan dalam penelitian ekonomi. Hal ini berarti bahwa secara serempak variabel harga barang A (X1) dan tingkat pendapatan konsumen (X2) berpengaruh serempak terhadap konsumsi barang A. 2. Menginterprentasikan makna dari koefisien determinasi (R2). ο¨ Koefisien Determinasi atau R2 = 0,920 mempunyai arti bahwa 92% variasi konsumsi barang A dipengaruhi oleh variasi harga barang A dan variasi tingkat pendapatan konsumen, sedangkan sisanya 8% dipengaruhi oleh faktor lainnya yang tidak dimasukkan dalam model tersebut. 3. Menguraikan mengenai signifikasi (pentingnya) pengaruh masing-masing variabel bebas terhadap variabel terikat, yang mana ini juga disebut uji parsial (ujit t). ο¨ Dari angka tersebut diatas dapat dijelaskan bahwa variabel harga barang A (X1) dan pendapatan konsumen (X2) berpengaruh sangat nyata terhadap konsumsi barang A. Hal ini dibuktikan dari t hitung masing-masing sebesar -3,688 dan 4,660 sedangkan t tabel pada derajat bebas 7 adalah 2,365 (t tabel = t(πΌ/2 ; n-k-1) = t (0,025 ; 7 ) = 2,365). Pengaruh variabel harga barang A (X1) dan tingkat pendapatan konsumen terhadap konsumsi barang A juga dapat dilihat dari nilai signifikasi kedua variabel itu berdasarkan hasil olahan data SPSS masing-masing 0,008 dan 0,002 atau dengan probabilitas lebih kecil dari 1%. 4. Menginterpretasikan makna koefisien regresi. πΜ = 5,068 − 0,713 π1 + 0,111 π2 ο¨ Koefisien regresi dari harga barang A sebesar -0,713 berarti bahwa apabila harga barang A naik sebesar Rp.1.000,- dengan anggapan bahwa variabel bebas lainnya konstan, maka konsumsi akan barang A turun 0,713 kg. ο¨ Koefisien regresi tingkat pendapatan sebesar 0,111 berarti bahwa apabila pendapatan naik sebesar Rp.1.000,- dengan anggapan variabel bebas lainnya konstan maka konsumsi akan barang A naik 0,111 kg. Misalnya, jika dari persamaan regresi diatas diketahui bahwa harga barang A adalah Rp.5.000,dan pendapatan konsumen adalah Rp.40.000,- maka jumlah barang A yang diminta adalah sebanyak 5,943 kg. Perhitungan seperti dibawah ini : πΜ = 5,068 − 0,713(π1 ) + 0,111(π2 ) πΜ = 5,068 − 0,713(5) + 0,111(40) = 5,943