EKONOMETRIKA (EKI 304 B1 EP) The Simple Regression Model (CS) Dosen : Prof. Dr. Dra. Ida Ayu Nyoman Saskara, M.Si. OLEH KELOMPOK I 1. I GEDE RASTAKA PUTRA (1907511003) 2. DYRAS SUCI PRISINTYA (1907511056) 3. I DEWA AYU MADE NATASAH DEWANI (1907511057) SI PROGRAM STUDY EKONOMI FAKULTAS EKONOMI DAN BISNIS UNIVERSITAS UDAYANA 2020 KATA PENGANTAR Puji syukur kehadirat Tuhan Yang Maha Esa karena atas rahmat- nya penulis dapat menyelesaikan Tugas Mata Kuliah Ekonometrika yang berjudul "The Simple Regression Model" Adapun tujuan umum dari penulisan ini adalah agar mahasiswa mendapatkan bekal dasar mata kuliah yang dapat menunjang dalam penulisan paper nantinya. Dalam penyelesaian paper ini, penulis mendapatkan bayangan mengenai materi dari Satuan Acara Perkuliahan (SAP) yang diberikan oleh dosen pengampu mata kuliah Ekonometrika, dan disamping itu penulis mencari dan mendapatkan bahan-bahan dari buku yang telah direferensikan. Paper ini diharapkan dapat dijadikan acuan untuk membuat paper selanjutnya. Kami menyadari paper ini masih jauh dari kata sempurna, oleh karena itu sangat diperlukan kritik dan saran dari berbagai pihak yang bersifat membangun untuk dijadΔ«kan pelajaran kedepannya. Berbagai kesalahan dalam penulisan ini, baik disengaja ataupun tidak disengaja, mohon dimaafkan. Semoga paper ini bermanfaat bagi para pembaca. Bukit Jimbaran, Oktober 2020 Kelompok I i DAFTAR ISI KATA PENGANTAR .................................................................................................................. i DAFTAR ISI................................................................................................................................ ii BAB I ............................................................................................................................................1 PENDAHULUAN ........................................................................................................................1 1.1 Latar Belakang ............................................................................................................1 1.2 Rumusan Masalah .......................................................................................................1 1.3 Tujuan .........................................................................................................................1 BAB II...........................................................................................................................................2 PEMBAHASAN ...........................................................................................................................2 2.1 Definisi Model Regresi Sederhana .............................................................................2 2.2 Memperoleh Ordinary Least Squares Estimates ........................................................2 2.3 Properti OLS pada Sampel Data .................................................................................3 2.4 Satuan Ukuran dan Bentuk Fungsional .......................................................................4 2.5 Nilai dan Varian Diharapkan dari Pengukur OLS ......................................................4 2.6 Variansi Estimator OLS ..............................................................................................5 2.7 Regresi melalui Asal dan Regresi pada Konstan ........................................................6 BAB III .........................................................................................................................................7 PENUTUP ....................................................................................................................................7 3.1 Simpulan .................................................................................................................................7 ii BAB I PENDAHULUAN 1.1 Latar Belakang Kata “Regression” dikenalkan pertama kali oleh Sir Francis Galton pada tahun 1885. Analisis regresi ini memberikan sumbangan besar lahirnya teori-teori ekonomi seperti yang kita pahami sekarang ini. Model regresi adalah suatu penyederhanaan pola hubungan suatu variabel dengan variabel lain. Variabel yang nilainya tergantung atau ditentukan variabel lain dinamakan dependent variable(variabel terikat), sementara variabel yang lainnya tidak dipengaruhi oleh apapun tapi justru menerangkan perubahan nilai variabel pertama dinamakan independent/explanatory variable (variabel bebas). Model regresi yang hanya berisi satu variabel dinamakan regresi sederhana (The Simple Regression Model). 1.2 1.3 Rumusan Masalah 1.2.1 Bagaimana Definisi Model Regresi Sederhana? 1.2.2 Bagaimana Memperoleh OLS Estimates? 1.2.3 Bagaimana Properti OLS Pada Sampel Data? 1.2.4 Bagaimana Satuan Ukuran dan Bentuk Fungsional? 1.2.5 Bagaimana Nilai dan Varian yang Diharapkan dari Pengukur OLS? 1.2.6 Bagaimana Variansi Estimator OLS? 1.2.7 Bagaimana Regresi melalui Asal dan Regresi pada Konstan? Tujuan 1.3.1 Memahami Definisi Model Regresi Sederhana 1.3.2 Memahami Memperoleh OLS Estimates 1.3.3 Memahami Properti OLS Pada Sampel Data 1.3.4 Memahami Satuan Ukuran dan Bentuk Fungsional 1.3.5 Memahami Nilai dan Varian yang Diharapkan dari Pengukur OLS 1.3.6 Memahami Variansi Estimator OLS 1.3.7 Memahami Regresi melalui Asal dan Regresi pada Ko 1 BAB II PEMBAHASAN 2.1 Definisi Model Regresi Sederhana Sebagian besar analisis ekonometrik terapan dimulai dengan premis berikut: y dan x adalah dua variabel, mewakili beberapa populasi, dan kita tertarik untuk (2.1) "menjelaskan y dalam istilah x," atau "belajar bagaimana y bervariasi dengan perubahan x.”. Persamaan (2.1), yang diasumsikan berlaku dalam populasi yang diminati, mendefinisikan model linear sederhana regresi. Ini juga disebut model regresi linier dua variabel atau linier bivariat. model regresi karena menghubungkan dua variabel x dan y. Persamaan linier (2.1) menyiratkan bahwa perubahan satu unit dalam x memiliki efek yang sama pada y, terlepas dari nilai awal x. Misalnya, dalam Sebagai contoh pendidikan-upah, kita mungkin ingin memperbolehkan peningkatan pendapatan: tahun pendidikan berikutnya memiliki efek yang lebih besar pada upah dibandingkan tahun sebelumnya. 2.2 Memperoleh Ordinary Least Squares Estimates (2.4) (2.2) (2.3) Perkiraan yang diberikan dalam (2,2) dan (2,4) disebut ordinary least squares (OLS) yang merupakan perkiraan dari β0 dan β1. Persamaan (2.2) dan (2.3) sering disebut kondisi urutan pertama untuk perkiraan OLS, istilah yang berasal dari optimisasi menggunakan kalkulus. Nama "ordinary least squares" berasal dari fakta bahwa perkiraan ini meminimalkan jumlah residu kuadrat. Setelah menentukan perkiraan penyadapan dan kemiringan OLS, kami membentuk garis regresi OLS (2.5) di mana dipahami bahwa π½Μ 0 dan π½Μ 1 telah diperoleh menggunakan persamaan (2.2) dan (2.4). Notasi π¦Μ , dibaca sebagai "y topi," menekankan bahwa nilai yang diprediksi dari persamaan (2.5) adalah perkiraan. Penahan, π½Μ 0, adalah nilai prediksi y ketika x = 0, meskipun dalam beberapa kasus tidak masuk akal untuk mengatur x = 0. Dalam situasi tersebut π½Μ 0 tidak, dengan sendirinya, sangat menarik. Saat menggunakan (2.25) untuk menempatkan nilai prediksi y untuk berbagai nilai x, kita harus memperhitungkan penyadapan dalam kalkulasi. Persamaan (2.5) juga disebut sample regression function (SRF) karena itu adalah versi perkiraan dari fungsi regresi populasi E(y|x) = . π½Μ 0 + π½Μ 1x. Contoh OLS pada Pendidikan dan Upah Untuk populasi orang yang bekerja pada tahun 1976, misalkan y =upah, dimana upah diukur dalam dolar per jam. Jadi, untuk orang tertentu, jika upah = 6,75, upah per jam adalah $ 6,75. Misalkan x = pendidikan menunjukkan tahun 2 sekolah; misalnya, pendidikan = 12 sesuai dengan pendidikan sekolah menengah yang lengkap. Karena upah rata-rata dalam sampel adalah $ 5,90, Indeks Harga Konsumen menunjukkan bahwa jumlah ini setara dengan $ 19,06 dalam dolar tahun 2003. Menggunakan data dalam UPAH1 di mana n = 526 orang, kami memperoleh garis regresi OLS berikut (atau sampel fungsi regresi): Μ = -0.90 + 0.54pendidikan (a) πΌπππ Kita harus menafsirkan persamaan ini dengan hati-hati. Perpotongan −0.90 secara harfiah berarti bahwa seseorang yang tidak berpendidikan memiliki perkiraan upah per jam −90 ¢ per jam. Ini tentu saja tidak masuk akal. Ternyata hanya 18 orang dari sampel 526 yang memiliki pendidikan kurang dari delapan tahun. Akibatnya, tidak mengherankan bahwa garis regresi berkinerja buruk pada tingkat pendidikan yang sangat rendah. dengan pendidikan delapan tahun, upah Μ = -0.90 + 0.54(8) atau $ 3,42 per jam (Dollar pada yang dihitung adalah πΌπππ tahun 1976). Perkiraan kemiringan di (a) menyiratkan bahwa satu tahun lebih pendidikan meningkatkan upah per jam sebesar 54 ¢ per jam. Oleh karena itu, pendidikan empat tahun lagi meningkatkan upah yang diperkirakan sebesar 4(0.54) = 2.16 , atau $ 2.16 per jam. Ini adalah efek yang cukup besar Karena sifat linier (a), satu tahun pendidikan berikutnya meningkatkan upah dengan jumlah yang sama, terlepas dari tingkat pendidikan awal. 2.3 Properti OLS pada Sampel Data Diasumsikan bahwa intersep dan perkiraan kemiringan, π½Μ 0 dan π½Μ 1, telah diperoleh untuk sampel permintaan data. Diketahui π½Μ 0 dan π½Μ 1 , kita dapat memperoleh nilai yang cocok π¦Μi untuk setiap pengamatan. Menurut definisi, setiap nilai yang dipasang dari π¦Μi ada di garis regresi OLS. Sisa OLS terkait dengan observasi i , π’Μi , adalah perbedaan antara yi dan nilai pasnya. Ada beberapa properti aljabar yang berguna dari perkiraan OLS dan statistiknya yang terkait. Jumlahnya, dan oleh karena itu, rata-rata sampel dari residu OLS adalah nol π π’Μπ = 0 π=1 Sampel kovarians antara regressor dan sisa OLS adalah nol. Berikut ini dari kondisi orde pertama yang dapat ditulis π π₯1 π’Μ1 =0 π=1 Variasi total dalam y selalu dapat dinyatakan sebagai jumlah dari variasi yang dijelaskan dan variasi SSR yang tidak dapat dijelaskan. Jadi, SST = SSE + SSR Dengan asumsi bahwa jumlah total kotak, SST, tidak sama dengan nol yang benar kecuali dalam kejadian yang sangat tidak mungkin bahwa semua y i sama dengan nilai yang sama — kita dapat membagi dengan SST untuk mendapatkan 1 = SSE / SST + SSR / SST. The R-squared regresi, kadang-kadang disebut koefisien penentuan, didefinisikan sebagai R2 = SSE/SST = 1- SSR/SST 3 R2 adalah rasio variasi menjelaskan dibandingkan dengan total variasi; dengan demikian, itu diartikan sebagai pecahan variasi sampel dalam y yang dijelaskan oleh x. 2.4 Satuan Ukuran dan Bentuk Fungsional Secara umum, mengubah satuan pengukuran hanya pada variabel independen tidak berpengaruh intersep tersebut. Di bagian sebelumnya, kami mendefinisikan R-squared sebagai ukuran goodness-of-fit untuk regresi OLS. Tanpa mengisi aljabar apapun, kita harus tahu hasilnya: kebaikan kesesuaian model tidak harus bergantung pada unit pengukuran variabel kita. Misalnya, file jumlah variasi gaji dijelaskan oleh pengembalian ekuitas tidak harus bergantung pada apakah gaji diukur dalam dolar atau dalam ribuan dolar atau apakah laba atas ekuitas adalah persentase atau a desimal. Intuisi ini dapat diverifikasi secara matematis: menggunakan definisi R2, dapat ditunjukkan bahwa Faktanya, R2 adalah invarian terhadap perubahan dalam unit y atau x. Sejauh ini, kami telah memfokuskan pada hubungan linier antara variabel dependen dan independen. Di sini, kita akan membahas dua hal kemungkinan yang sering muncul dalam pekerjaan terapan. Dalam membaca karya terapan dalam ilmu sosial, kita akan sering menjumpai persamaan regresi di mana variabel dependen muncul dalam bentuk logaritmik. Mengapa ini dilakukan? Ingat upah contoh pendidikan, di mana kami menurunkan upah per jam pada tahun pendidikan. Kami memperoleh perkiraan kemiringan pasangan 0,54, yang berarti bahwa setiap tahun tambahan pendidikan diprediksikan tingkatkan upah per jam sebesar 54 sen. Karena sifat linier, 54 sen adalah kenaikan baik tahun pertama pendidikan atau tahun kedua puluh; ini mungkin tidak masuk akal. Model yang memberikan (kurang-lebih) efek persentase konstan adalah Log(upah)= π½Μ 0 + π½Μ 1 educ u dimana log(.) menunjukkan logaritma natural 2.5 Nilai dan Varian yang Diharapkan dari Pengukur OLS Model populasi π¦ = π0 + π1π₯ + π’, dan kami mengklaim bahwa kuncinya asumsi untuk analisis regresi sederhana yang bermanfaat adalah bahwa nilai yang diharapkan diberi nilai apa pun dari π₯ adalah nol. Dengan kata lain, kita sekarang lihat π½Μ 0 dan π½Μ 1 sebagai penduga untuk parameter β0 dan β1 yang muncul dalam model populasi. Ini berarti bahwa kita akan mempelajari sifat-sifat distribusi π½Μ 0 dan π½Μ 1 atas sampel acak yang berbeda dari populasi. Agar realistis, π¦, π₯, dan π’ semuanya dipandang sebagai variabel acak dalam menyatakan model populasi. estimasi kemiringan dan intersepsi OLS tidak ditentukan kecuali memiliki beberapa variasi sampel dalam variabel penjelas. 4 adalah asumsi yang sangat lemah — tentu saja tidak layak untuk ditekankan, tetapi tetap dibutuhkan. Jika x bervariasi dalam populasi, sampel acak pada x biasanya akan berisi variasi, kecuali populasi variasi minimal atau ukuran sampel kecil. Selain membatasi hubungan antara u dan x dalam populasi, syarat nol asumsi rata-rata — ditambah dengan asumsi pengambilan sampel acak — memungkinkan teknik yang praktis penyederhanaan. Secara khusus, kita dapat memperoleh properti statistik dari penaksir OLS sebagai persyaratan pada nilai-nilai xi dalam sampel. 2.6 Variansi Estimator OLS Ternyata varian penaksir OLS dapat dihitung berdasarkan Asumsi SLR.1 melalui SLR.4. Namun, ungkapan-ungkapan ini akan agak rumit. Sebagai gantinya, kami menambahkan asumsi yang tradisional untuk analisis cross-sectional. Asumsi ini menyatakan bahwa varian unobservable, u, bersyarat pada x, adalah konstan. Ini dikenal sebagai homoskedasticity atau “konstan asumsi varians. Seringkali berguna untuk menulis Asumsi SLR.4 dan SLR.5 dalam kaitan dengan mean bersyarat dan varian bersyarat dari y Dengan kata lain, ekspektasi bersyarat dari y diberikan x adalah linear dalam x, tetapi varians dari y diberikan x adalah konstan. Situasi ini digambarkan pada di mana ß0> 0 dan ß1> 0. Dalam memperkirakan varians error, kita dapat menggunakan persamaan untuk menulis residual sebagai fungsi dari error: 5 Estimator SSR / n pada dasarnya bias karena tidak memperhitungkan dua batasan itu harus dipenuhi oleh residual OLS. Pembatasan ini diberikan oleh dua urutan pertama OLS kondisi: 2.7 Regresi melalui Asal dan Regresi pada Konstan Dalam kasus yang jarang terjadi, kami ingin memaksakan pembatasan bahwa, ketika x = 0, nilai yang diharapkan dari y adalah nol. Ada hubungan tertentu yang masuk akal. Misalnya, jika penghasilan (x) adalah nol, maka pendapatan pajak penghasilan (y) juga harus nol. Selain itu, ada pengaturan model mana yang semula telah mencegat bukan nol diubah menjadi model tanpa intercept. Untuk mendapatkan estimasi kemiringan di kami masih mengandalkan metode kuadrat terkecil biasa, yang dalam hal ini meminimalkan jumlah residu kuadrat: Pembilang di sini masuk akal karena itu adalah jumlah residu kuadrat, tetapi penyebutnya bertindak seolah-olah kita tahu nilai rata-rata y dalam populasi adalah nol. Salah satu alasan versi ini dari R2 yang digunakan adalah bahwa jika kita menggunakan jumlah total kuadrat biasa, yaitu, kita menghitung R2 sebagai 6 BAB III PENUTUP 3.1 Simpulan Persamaan y = β0 + β1x + u, yang diasumsikan berlaku dalam populasi yang diminati, mendefinisikan model linear sederhana regresi. Ini juga disebut model regresi linier dua variabel atau linier bivariat. model regresi karena menghubungkan dua variabel x dan y. dan merupakan perkiraan yang disebut ordinary least squares (OLS) yang merupakan perkiraan dari β0 dan β1. Setelah menentukan perkiraan penyadapan dan kemiringan OLS, didapatkan bentuk garis regresi OLS π¦Μ = π½Μ 0 + π½Μ 1π₯ Diasumsikan bahwa intersep dan perkiraan kemiringan, π½Μ 0 dan π½Μ 1, telah diperoleh untuk sampel permintaan data. Diketahui π½Μ 0 dan π½Μ 1 , kita dapat memperoleh nilai yang cocok π¦Μi untuk setiap pengamatan. Menurut definisi, setiap nilai yang dipasang dari π¦Μi ada di garis regresi OLS. Sisa OLS terkait dengan observasi i , π’Μi , adalah perbedaan antara yi dan nilai pasnya. Secara umum, mengubah satuan pengukuran hanya pada variabel independen tidak berpengaruh intersep tersebut. Di bagian sebelumnya, kami mendefinisikan R-squared sebagai ukuran goodness-of-fit untuk regresi OLS. Tanpa mengisi aljabar apapun, kita harus tahu hasilnya: kebaikan kesesuaian model tidak harus bergantung pada unit pengukuran variabel kita. Model populasi π¦ = π0 + π1π₯ + π’, dan kami mengklaim bahwa kuncinya asumsi untuk analisis regresi sederhana yang bermanfaat adalah bahwa nilai yang diharapkan diberi nilai apa pun dari π₯ adalah nol. Dengan kata lain, kita sekarang lihat π½Μ 0 dan π½Μ 1 sebagai penduga untuk parameter β0 dan β1 yang muncul dalam model populasi. Dalam kasus yang jarang terjadi, kami ingin memaksakan pembatasan bahwa, ketika x = 0, nilai yang diharapkan dari y adalah nol. Ada hubungan tertentu yang masuk akal. Misalnya, jika penghasilan (x) adalah nol, maka pendapatan pajak penghasilan (y) juga harus nol. Selain itu, ada pengaturan model mana yang semula telah mencegat bukan nol diubah menjadi model tanpa intercept. 7