10 BAB 2 LANDASAN TEORI 2.1 Pengertian Regresi Dalam ilmu statistika teknik yang umum digunakan untuk menganalisa hubungan antara dua variabel atau lebih adalah analisa regresi linier. Regresi pertama digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia telah melakukan studi tentang kecenderungan tinggi badan anak. Hasil studi tersebut merupakan suatu kesimpulan bahwa kecenderungan tinggi badan anak yang lahir terhadap orang tuanya adalah menurun mengarah pada tinggi badan rata-rata penduduk. Istilah regresi pada mulanya bertujuan untuk membuat perkiraan nilai satu variabel terhadap variabel yang lain. Pada perkembangan selanjutnya, analisis regresi dapat digunakan sebagai alat untuk membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain yang berhubungan dengan variabel tersebut. (Alfigari, 2000.Analisis Regresi Teori, kasus dan solusi, Edisi Kedua, Yogyakarta : BPFE halaman 1 dan 2) Pada dasarnya dalam suatu persamaan regresi terdapat dua macam variabel, yaitu variabel bebas (independent variable) yang dinyatakan dengan simbol X dan variabel terikat (dependent variable) yang biasanya dinyatakan dengan simbol Y. Variabel terikat adalah variabel yang dipengaruhi atau yang nilainya bergantung dari nilai variabel lain. Variabel bebas adalah variabel yang memberikan pengaruh. Bila variabel bebas diketahui maka variabel terikatnya dapat diprediksi besarnya. Prinsip dasar yang harus dipenuhi dalam membangun Universitas Sumatera Utara 11 suatu persamaan regresi adalah bahwa antara variabel terikat dengan variabel bebas mempunyai sifat hubungan sebab-akibat. 2.2 Analisis Regresi Linier Analisis regresi merupakan teknik yang digunakan dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel. Analisis regresi linier atau regresi garis lurus digunakan untuk: 1. Menentukan hubungan fungsional antar variabel dependent dengan independent. Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang berbentuk linier. 2. Meramalkan atau menduga nilai dari satu variabel dengan hubungannya dengan variabel yang lain yang diketahui melalui persamaan garis regresi. Variabel yang lain diketahui melalui persamaan garis regresinya. Analisis regresi terdiri dari dua bentuk, yaitu: 1. Analisis Regresi Linier Sederhana 2. Analisis Regresi Linier Berganda Analisis Regresi Linier Sederhana adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel terikat dan variabel bebas. Sedangkan analisis regresi berganda adalah bentuk regresi dengan model yang memiliki hubungan antara satu variabel terikat dengan dua atau lebih variabel bebas. Variabel bebas adalah variabel yang nilainya tergantung dengan variabel lainya, sedangkan variabel terikat adalah variabel yang nilainya tergantung dari variabel lainya. Universitas Sumatera Utara 12 Analisi regresi digunakan untuk mengetahui hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel bebas mempengaruhi variabel terikat dalam suatu fenomena yang komplek. Jika adalah variabel-variabel bebas dan Y adalah variabel terikat, maka terdapat hubungan antara fungsional antara X dan Y dimana variasi dari X akan diiringi pula oleh variasi dari Y. Jika dibuat secara matematis hubungan ini dapat dijabarkan sebagai berikut: ( ) Keterangan: Y = Variabel terikat (Dependent) X = Variabel bebas (Independent) e = Variabel residu (Disturbace term) Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang lazim dilaksanakan yakni: 1. Mengadakan estimasi terhadap parameter berdasarkan data empiris. 2. Menguji berapa besar variasi variabel dependent dapat diterangkan oleh variasi independent. 3. Menguji apakah estimasi parameter tersebut signifikan atau tidak. 4. Melihat apakah tanda menghitung dari estimasi parameter cocok dengan teori. Universitas Sumatera Utara 13 2.2.1 Analisis Regresi Linier Sederhana Analisis regresi linier sederhana terdiri dari satu variabel bebas dan satu variabel terikat. Dengan kata lain variabel yang dianalisis terdiri dari satu variabel prediktor dan satu variabel kriterium. Model regresi linier sederhananya adalah: Keterangan: Y = Variabel terikat (dependent variable) X = Variabel bebas (independent variable) a = Konstanta (intercept) b = Kemiringan (slope) Penggunaan regresi linier sederhana didasarkan pada asumsi, diantaranya sebagai berikut: 1. Model regresi harus linier dalam parameter. 2. Variabel bebas tidak berkolerasi dengan disturbance term (eror). 3. Nilai disturbance term sebesar 0 atau dengan simbol sebagai e. 4. Varian untuk masing-masing error term (kesalahan) konstan 5. Tidak terjadi autokorelasi 6. Model regresi dispesifikasikan secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris. Koefisien - koefisien regresi a dan b dapat dihitung dengan rumus: (∑ )(∑ ∑ ) (∑ )(∑ (∑ ) ) Universitas Sumatera Utara 14 (∑ ) ∑ (∑ (∑ )(∑ ) ) Jika koefisien b terlebih dahulu dihitung, maka koefisien a dapat dihitung dengan rumus: ̅ ̅ Dengan ̅ dan ̅ masing-masing rata-rata untuk variabel-variabel X dan Y. 2.2.2 Analisis Regresi Linier Berganda Regresi linier ganda (Multiple Regression) berguna untuk mencari pengaruh atau untuk meramalkan dua variabel prediktor atau lebih terhadap variabel kriteriumnya. Suatu persamaan regresi linier yang memiliki lebih dari satu variabel bebas X dan satu variabel terikat Y akan membentuk suatu persamaan regresi yang baru, disebut persamaan regresi linieer berganda (multiple regression). Model persamaan regresi linier berganda hampir sama dengan model regrei linier sederhana, letak perbedaanya hanya pada jumlah variabel bebasnya. Secara umum model regresi linier berganda adalah sebagai berikut: Keterangan: Y = Variabel terikat (dependent variable) X = Variabel bebas (independent variable) Universitas Sumatera Utara 15 = Konstanta regresi = Koefisien regresi variabel bebas = Pengamatn variabel error Untuk memudahkan pengolahan data, maka data-data dapat dimasukkan ke dalam tabel. Bentuk umum dari tabel untuk variabel penduga yang lebih dari satu adalah seperti bentuk tabel di bawah ini: Tabel 2.1 Bentuk Umum Tabel Data Regresi Linier Berganda NO RESPON OBSERVASI VARIABEL VARIABEL VARIABEL VARIABEL BEBAS BEBAS BEBAS BEBAS 1 ... 2 ... 3 ... . . . . ... . . . . . ... . . . . . ... . N ... Dalam penelitian ini digunakan enam variabel yang terdiri dari satu variabel terikat (Y) dan lima variabel bebas (X). Maka persamaan regresi bergandanya adalah: Universitas Sumatera Utara 16 Persamaan diatas dapat diselesaikan dengan enam bentuk, yaitu: ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ Dalam notasi matriks maka persamaan di atas dapat ditulis sebagai berikut: ∑ ∑ ∑ ∑ [∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ( ∑ ∑ ∑ ∑ ∑ ∑ ) ∑ ∑ ∑ = ∑ ∑ ] [ ] [∑ b ( ] ) Untuk dapat memperoleh nilai-nilai dugaan bagi parameter model, maka perlu ditentukan invers matriks ( ), yaitu: ( ( ) ) ( ( ) ) ( ) Universitas Sumatera Utara 17 Sistem persamaan diatas tersebut dapat disederhanakan sedikit, apabila diambil ̅ ̅ ̅ ̅ ̅ ̅ Maka persamaan sekarang menjadi: untuk persamaan tersebut dapat dihitung Koefisien-koefisien dengan rumus: ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ Dengan penggunaan ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ dan y yang baru, maka diperoleh harga . Harga setiap koefisien penduga yang diperoleh kemudian disubsitusikan ke persamaan awal sehingga diperoleh model regresi linier berganda y atas dan . Universitas Sumatera Utara 18 2.3 Uji Keberartian Regresi Sebelum persamaan regresi yang diperoleh digunakan untuk membuat kesimpulan, terlebih dahulu diperiksa setidak-setidaknya mengenai kelinieran dan keberartiannya. Pemeriksaan ini ditempuh melalui pengujian hipotesis. Uji keberartian dilakukan untuk meyakinkan diri apakah regresi yang didapat berdasarkan penelitian ada artinya bila dipakai untuk membuat kesimpulan mengenai hubungan sejumlah peubah yang sedang dipelajari. Untuk itu diperlukan dua macam jumlah kuadrat (JK) yaitu jumlah kuadrat untuk regresi yang ditulis dengan dan jumlah kuadrat untuk sisa (residu) yang ditulis ̅ . Jika ̅ ̅ ̅ maka secara umum jumlah kuadrat-kuadrat tersebut dapat dihitung dengan rumus: ∑ ∑ ∑ Dengan derajat kebebasan dk=k ̂) ∑( Dengan derajat kebebasan dk= (n – k – 1) untuk sampel berukuran n. Dengan demikian uji keberartian regresi berganda dapat dihitung dengan: ( ) Universitas Sumatera Utara 19 Dimana statistik F yang menyebar mengikuti distribusi F dengan derajat kebebasan pembilang 2.3.1 Pengujian Hipotesis Pengujian hipotesis merupakan salah satu tujuan yang akan dibuktikan dalam penelitian. Jika terdapat deviasi antara sampel yang ditentukan dengan jumlah populasi maka tidak tertutup kemungkinan untuk terjadinya kesalahan dalam mengambil keputusan antara menolak atau menerima suatu hipotesis. Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu : tingkat signifikansi atau probabilitas ( ) dan tingkat kepercayaan atau confidence interval. Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat signifikansi adalah probabilitas melakukan kesalahan tipe 1, yaitu kesalahan menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada umumnya ialah sebesar 95%, yang dimaksud dengan tingkat kepercayaan ialah tingkat dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel berasal. Dalam melakukan uji hipotesis terdapat dua hipotesis, yaitu: (hipotesis 0) dan (hipotesis alternatif). bertujuan untuk memberikan usulan dugaan kemungkinan tidak adanya perbedaan antara perkiraan penelitian dengan keadaan yang sesungguhnya yang akan diteliti. bertujuan memberikan usulan dugaan adanya perbedaan perkiraan dengan keadaan sesungguhnya yang akan diteliti. Universitas Sumatera Utara 20 Pembentukan suatu hipotesis memerlukan toeri-teori maupun hasil penelitian terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam membentuk hipotesis ada beberapa hal yang dipertimbangkan, yaitu: 1. Hipotesis nol dan hipotesis alternative yang diusulkan 2. Daerah penerimaan dan penolakan serta teknik arah pengujian (one tailed atau two tailed). 3. Penentuan nilai hitung statistik. 4. Menarik kesimpulan apakah menerima atau menolak hipotesis yang diusulkan dalam uji keberartian regresi. Langkah-langkah yang dibutuhkan untuk pengujian hipotesis ini antara lain. 1. Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel terikat. Terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel terikat. 2. Pilih taraf nyata yang diinginkan. 3. Hitung statistik 4. Nilai yaitu: dengan menggunakan persamaan. menggunakan daftar table F dengan taraf signifikansi ( )( ) ( ). Universitas Sumatera Utara 21 5. Kriteria pengujian : jika , maka diterima. Sebaliknya jika , maka ditolak dan diterima dan ditolak. 2.4 Koefisien Determinasi Koefisien determinasi yang dinyatakan dengan untuk pengujian regresi linier berganda yang mencakup lebih dari dua variabel adalah untuk mengetahui proporsi keragaman total dalam variabel tak bebas (Y) yang dapat dijelaskan atau diterangkan oleh variabel-variabel bebas (X) yang ada di dalam model persamaan regresi linier berganda secara bersama-sama. Maka akan ditentukan dengan rumus, yaitu: ∑ Keterangan: = Jumlah kuadrat regresi Harga yang diperoleh sesuai dengan variansi yang dijelaskan masing- masing variabel yang tinggal dalam regresi tersebut. Hal ini mengakibatkan variansi yang dijelaskan penduga yang disebabkan oleh variabel yang berpengaruh saja ataupun dengan kata lain hanya yang bersifat nyata. 2.5 Uji Korelasi Analisa korelasi dilakukan untuk mengetahui hubungan antara dua variabel (bivariate correlation) atau lebih dari 2 variabel (multivariate correlation) dalam Universitas Sumatera Utara 22 suatu penelitian. Untuk menentukan seberapa besar hubungan antar variabel tersebut dapat dihitung dengan menggunakan rumus koefisien korelasi. Rumus untuk koefisien regresi adalah: ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } Adapun untuk menghitung koefisien korelasi antara variabel terikat Y dan yaitu : variabel bebas 1. Koefisien korelasi antara Y dan ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } 2. Koefisien korelasi antara Y dengan ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } 3. Koefisien korelasi antara Y dan ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } Universitas Sumatera Utara 23 4. Koefisien korelasi antara Y dan ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } 5. Koefisien korelasi antara Y dan ∑ √{ ∑ (∑ (∑ )(∑ ) ) }{ ∑ (∑ ) } Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi adalah (+) ataupun minus (-) yang menunjukan arah korelasi. Makna dari sifat korelasi adalah: 1. Tanda positif (+) pada koefisien korelasi menunjukan hubungan searah atau koefisien positif. Artinya jika nilai suatu variabel mengalami kenaikan maka nilai variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya. 2. Tanda negatif (-) pada koefisien korelasi menunjukan hubungan yang berlawanan arah atau korelasi negatif. Artinya jika nilai suatu variabel mengalami kenaikan maka nilai variabel yang lain akan mengalami penurunan dan demikian juga sebaliknya. Universitas Sumatera Utara 24 Sifat korelasi akan menentukan arah korelasi. Keeratan korelasi dapat dikelompokan sebagai berikut. 1. 0,00 - 0,20 berarti korelasi memiliki keeratan sangat lemah. 2. 0,21 - 0,40 berarti korelasi memiliki keeratan lemah. 3. 0,41 - 0,70 berarti korelasi memiliki keeratan kuat. 4. 0,71 - 0,90 berarti korelasi memiliki keeratan sangat kuat. 5. 0,91 - 0,99 berarti korelasi memiliki keeratan sangat kuat sekali. 6. 1 berarti korelasi sempurna. 2.6 Kesalahan Standart Estimasi Untuk mengetahui ketetapan persamaan estimasi dapat digunakan kesalahan standar estimasi (standard error of estimate). Besarnya kesalahan standar estimasi menunjukan ketetapan persamaan estimasi untuk menjelaskan nilai variabel tidak bebas yang sesungguhnya. Semakin kecil nilai kesalahan standar estimasi tersebut, makin tinggi ketetapan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak bebas sesungguhnya. Sebaliknya, semakin besar nilai kesalahan standar estimasi, maka semakin rendah persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak sesungguhnya. (Alfigari, 2000.Analisis Regresi Teori, kasus dan solusi, Edisi Kedua, Yogyakarta : BPFE halaman 1 dan 2). Kesalahan standar estimasi (kekeliruan baku taksiran) dapat ditentukan dengan rumus: ∑ √ ̂) Universitas Sumatera Utara 25 Dimana 2.7 adalah nilai data sebenarnya dan ̂ adalah nilai taksiran. Uji Koefisien Regresi Linier Berganda Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu diadakan pengujian tersendiri mengenai koefisien-koefisien regresi. Model persamaan regresi linier berganda: ̂ Perumusan Hipotesa: : dimana i =1,2,…, k : dimana i =1,2,…, k Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran = elemen matriks ( ) , dan dari baris i kolom i yang terletak pada diagonal utama. Dengan besaran-besaran ini dibentuk kekeliruan baku koefisien b, yakni: √( ) Selanjutnya hitung statistik: Kriteria Pengujan: Jika , maka ditolak dan diterima Jika , maka diterima dan ditolak Dengan derajat kebebasan dk = (n-k-1) dan Dimana ( ) ⁄ dimana α = 0,05 Universitas Sumatera Utara