Uploaded by User89568

The Simple Regression - Kelompok 1

advertisement
EKONOMETRIKA (EKI 304 B1 EP)
The Simple Regression Model (CS)
Dosen : Prof. Dr. Dra. Ida Ayu Nyoman Saskara, M.Si.
OLEH
KELOMPOK I
1. I GEDE RASTAKA PUTRA
(1907511003)
2. DYRAS SUCI PRISINTYA
(1907511056)
3. I DEWA AYU MADE NATASAH DEWANI
(1907511057)
SI PROGRAM STUDY EKONOMI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS UDAYANA
2020
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa karena atas rahmat- nya penulis dapat
menyelesaikan Tugas Mata Kuliah Ekonometrika yang berjudul "The Simple Regression
Model" Adapun tujuan umum dari penulisan ini adalah agar mahasiswa mendapatkan bekal
dasar mata kuliah yang dapat menunjang dalam penulisan paper nantinya.
Dalam penyelesaian paper ini, penulis mendapatkan bayangan mengenai materi dari
Satuan Acara Perkuliahan (SAP) yang diberikan oleh dosen pengampu mata kuliah
Ekonometrika, dan disamping itu penulis mencari dan mendapatkan bahan-bahan dari buku
yang telah direferensikan.
Paper ini diharapkan dapat dijadikan acuan untuk membuat paper selanjutnya. Kami
menyadari paper ini masih jauh dari kata sempurna, oleh karena itu sangat diperlukan kritik dan
saran dari berbagai pihak yang bersifat membangun untuk dijadΔ«kan pelajaran kedepannya.
Berbagai kesalahan dalam penulisan ini, baik disengaja ataupun tidak disengaja, mohon
dimaafkan. Semoga paper ini bermanfaat bagi para pembaca.
Bukit Jimbaran, Oktober 2020
Kelompok I
i
DAFTAR ISI
KATA PENGANTAR .................................................................................................................. i
DAFTAR ISI................................................................................................................................ ii
BAB I ............................................................................................................................................1
PENDAHULUAN ........................................................................................................................1
1.1
Latar Belakang ............................................................................................................1
1.2
Rumusan Masalah .......................................................................................................1
1.3
Tujuan .........................................................................................................................1
BAB II...........................................................................................................................................2
PEMBAHASAN ...........................................................................................................................2
2.1
Definisi Model Regresi Sederhana .............................................................................2
2.2
Memperoleh Ordinary Least Squares Estimates ........................................................2
2.3
Properti OLS pada Sampel Data .................................................................................3
2.4
Satuan Ukuran dan Bentuk Fungsional .......................................................................4
2.5
Nilai dan Varian Diharapkan dari Pengukur OLS ......................................................4
2.6
Variansi Estimator OLS ..............................................................................................5
2.7
Regresi melalui Asal dan Regresi pada Konstan ........................................................6
BAB III .........................................................................................................................................7
PENUTUP ....................................................................................................................................7
3.1 Simpulan .................................................................................................................................7
ii
BAB I
PENDAHULUAN
1.1
Latar Belakang
Kata “Regression” dikenalkan pertama kali oleh Sir Francis Galton pada tahun
1885. Analisis regresi ini memberikan sumbangan besar lahirnya teori-teori ekonomi
seperti yang kita pahami sekarang ini. Model regresi adalah suatu penyederhanaan pola
hubungan suatu variabel dengan variabel lain. Variabel yang nilainya tergantung atau
ditentukan variabel lain dinamakan dependent variable(variabel terikat), sementara
variabel yang lainnya tidak dipengaruhi oleh apapun tapi justru menerangkan perubahan
nilai variabel pertama dinamakan independent/explanatory variable (variabel bebas).
Model regresi yang hanya berisi satu variabel dinamakan regresi sederhana (The Simple
Regression Model).
1.2
1.3
Rumusan Masalah
1.2.1
Bagaimana Definisi Model Regresi Sederhana?
1.2.2
Bagaimana Memperoleh OLS Estimates?
1.2.3
Bagaimana Properti OLS Pada Sampel Data?
1.2.4
Bagaimana Satuan Ukuran dan Bentuk Fungsional?
1.2.5
Bagaimana Nilai dan Varian yang Diharapkan dari Pengukur OLS?
1.2.6
Bagaimana Variansi Estimator OLS?
1.2.7
Bagaimana Regresi melalui Asal dan Regresi pada Konstan?
Tujuan
1.3.1
Memahami Definisi Model Regresi Sederhana
1.3.2
Memahami Memperoleh OLS Estimates
1.3.3
Memahami Properti OLS Pada Sampel Data
1.3.4
Memahami Satuan Ukuran dan Bentuk Fungsional
1.3.5
Memahami Nilai dan Varian yang Diharapkan dari Pengukur OLS
1.3.6
Memahami Variansi Estimator OLS
1.3.7
Memahami Regresi melalui Asal dan Regresi pada Ko
1
BAB II
PEMBAHASAN
2.1 Definisi Model Regresi Sederhana
Sebagian besar analisis ekonometrik terapan dimulai dengan premis berikut: y
dan x adalah dua variabel, mewakili beberapa populasi,
dan kita tertarik untuk
(2.1)
"menjelaskan y dalam istilah x," atau "belajar bagaimana y bervariasi dengan
perubahan x.”.
Persamaan (2.1), yang diasumsikan berlaku dalam populasi yang diminati,
mendefinisikan model linear sederhana regresi. Ini juga disebut model regresi linier
dua variabel atau linier bivariat. model regresi karena menghubungkan dua variabel
x dan y. Persamaan linier (2.1) menyiratkan bahwa perubahan satu unit dalam x
memiliki efek yang sama pada y, terlepas dari nilai awal x. Misalnya, dalam Sebagai
contoh pendidikan-upah, kita mungkin ingin memperbolehkan peningkatan
pendapatan: tahun pendidikan berikutnya memiliki efek yang lebih besar pada upah
dibandingkan tahun sebelumnya.
2.2 Memperoleh Ordinary Least Squares Estimates
(2.4)
(2.2)
(2.3)
Perkiraan yang diberikan dalam (2,2) dan (2,4) disebut ordinary least squares
(OLS) yang merupakan perkiraan dari β0 dan β1. Persamaan (2.2) dan (2.3) sering
disebut kondisi urutan pertama untuk perkiraan OLS, istilah yang berasal dari
optimisasi menggunakan kalkulus. Nama "ordinary least squares" berasal dari
fakta bahwa perkiraan ini meminimalkan jumlah residu kuadrat.
Setelah menentukan perkiraan penyadapan dan kemiringan OLS, kami
membentuk garis regresi OLS
(2.5)
di mana dipahami bahwa 𝛽̂ 0 dan 𝛽̂ 1 telah diperoleh menggunakan persamaan
(2.2) dan (2.4). Notasi 𝑦̂ , dibaca sebagai "y topi," menekankan bahwa nilai yang
diprediksi dari persamaan (2.5) adalah perkiraan. Penahan, 𝛽̂ 0, adalah nilai prediksi
y ketika x = 0, meskipun dalam beberapa kasus tidak masuk akal untuk mengatur x
= 0. Dalam situasi tersebut 𝛽̂ 0 tidak, dengan sendirinya, sangat menarik. Saat
menggunakan (2.25) untuk menempatkan nilai prediksi y untuk berbagai nilai x,
kita harus memperhitungkan penyadapan dalam kalkulasi. Persamaan (2.5) juga
disebut sample regression function (SRF) karena itu adalah versi perkiraan dari
fungsi regresi populasi E(y|x) = . 𝛽̂ 0 + 𝛽̂ 1x.
Contoh OLS pada Pendidikan dan Upah
Untuk populasi orang yang bekerja pada tahun 1976, misalkan y =upah,
dimana upah diukur dalam dolar per jam. Jadi, untuk orang tertentu, jika upah =
6,75, upah per jam adalah $ 6,75. Misalkan x = pendidikan menunjukkan tahun
2
sekolah; misalnya, pendidikan = 12 sesuai dengan pendidikan sekolah menengah
yang lengkap. Karena upah rata-rata dalam sampel adalah $ 5,90, Indeks Harga
Konsumen menunjukkan bahwa jumlah ini setara dengan $ 19,06 dalam dolar
tahun 2003.
Menggunakan data dalam UPAH1 di mana n = 526 orang, kami memperoleh
garis regresi OLS berikut (atau sampel fungsi regresi):
Μ‚ = -0.90 + 0.54pendidikan (a)
𝑼𝒑𝒂𝒉
Kita harus menafsirkan persamaan ini dengan hati-hati. Perpotongan −0.90
secara harfiah berarti bahwa seseorang yang tidak berpendidikan memiliki
perkiraan upah per jam −90 ¢ per jam. Ini tentu saja tidak masuk akal. Ternyata
hanya 18 orang dari sampel 526 yang memiliki pendidikan kurang dari delapan
tahun. Akibatnya, tidak mengherankan bahwa garis regresi berkinerja buruk pada
tingkat pendidikan yang sangat rendah. dengan pendidikan delapan tahun, upah
Μ‚ = -0.90 + 0.54(8) atau $ 3,42 per jam (Dollar pada
yang dihitung adalah 𝑼𝒑𝒂𝒉
tahun 1976).
Perkiraan kemiringan di (a) menyiratkan bahwa satu tahun lebih pendidikan
meningkatkan upah per jam sebesar 54 ¢ per jam. Oleh karena itu, pendidikan
empat tahun lagi meningkatkan upah yang diperkirakan sebesar 4(0.54) = 2.16 ,
atau $ 2.16 per jam. Ini adalah efek yang cukup besar
Karena sifat linier (a), satu tahun pendidikan berikutnya meningkatkan upah
dengan jumlah yang sama, terlepas dari tingkat pendidikan awal.
2.3 Properti OLS pada Sampel Data
Diasumsikan bahwa intersep dan perkiraan kemiringan, 𝛽̂ 0 dan 𝛽̂ 1, telah
diperoleh untuk sampel permintaan data. Diketahui 𝛽̂ 0 dan 𝛽̂ 1 , kita dapat
memperoleh nilai yang cocok 𝑦̂i untuk setiap pengamatan. Menurut definisi, setiap
nilai yang dipasang dari 𝑦̂i ada di garis regresi OLS. Sisa OLS terkait dengan
observasi i , 𝑒̂i , adalah perbedaan antara yi dan nilai pasnya. Ada beberapa properti
aljabar yang berguna dari perkiraan OLS dan statistiknya yang terkait.
Jumlahnya, dan oleh karena itu, rata-rata sampel dari residu OLS adalah nol
𝑛
𝑒̂𝑖 = 0
𝑖=1
Sampel kovarians antara regressor dan sisa OLS adalah nol. Berikut ini dari
kondisi orde pertama yang dapat ditulis
𝑛
π‘₯1 𝑒̂1
=0
𝑖=1
Variasi total dalam y selalu dapat dinyatakan sebagai jumlah dari variasi yang
dijelaskan dan variasi SSR yang tidak dapat dijelaskan. Jadi,
SST = SSE + SSR
Dengan asumsi bahwa jumlah total kotak, SST, tidak sama dengan nol yang
benar kecuali dalam kejadian yang sangat tidak mungkin bahwa semua y i sama
dengan nilai yang sama — kita dapat membagi dengan SST untuk mendapatkan 1
= SSE / SST + SSR / SST. The R-squared regresi, kadang-kadang disebut
koefisien penentuan, didefinisikan sebagai
R2 = SSE/SST = 1- SSR/SST
3
R2 adalah rasio variasi menjelaskan dibandingkan dengan total variasi; dengan
demikian, itu diartikan sebagai pecahan variasi sampel dalam y yang dijelaskan
oleh x.
2.4 Satuan Ukuran dan Bentuk Fungsional
Secara umum, mengubah satuan pengukuran hanya pada variabel independen
tidak berpengaruh intersep tersebut. Di bagian sebelumnya, kami mendefinisikan
R-squared sebagai ukuran goodness-of-fit untuk regresi OLS. Tanpa mengisi
aljabar apapun, kita harus tahu hasilnya: kebaikan kesesuaian model tidak harus
bergantung pada unit pengukuran variabel kita. Misalnya, file jumlah variasi gaji
dijelaskan oleh pengembalian ekuitas tidak harus bergantung pada apakah gaji
diukur dalam dolar atau dalam ribuan dolar atau apakah laba atas ekuitas adalah
persentase atau a desimal. Intuisi ini dapat diverifikasi secara matematis:
menggunakan definisi R2, dapat ditunjukkan bahwa Faktanya, R2 adalah invarian
terhadap perubahan dalam unit y atau x.
Sejauh ini, kami telah memfokuskan pada hubungan linier antara variabel
dependen dan independen. Di sini, kita akan membahas dua hal kemungkinan yang
sering muncul dalam pekerjaan terapan. Dalam membaca karya terapan dalam ilmu
sosial, kita akan sering menjumpai persamaan regresi di mana variabel dependen
muncul dalam bentuk logaritmik. Mengapa ini dilakukan? Ingat upah contoh
pendidikan, di mana kami menurunkan upah per jam pada tahun pendidikan. Kami
memperoleh perkiraan kemiringan pasangan 0,54, yang berarti bahwa setiap tahun
tambahan pendidikan diprediksikan tingkatkan upah per jam sebesar 54 sen. Karena
sifat linier, 54 sen adalah kenaikan baik tahun pertama pendidikan atau tahun kedua
puluh; ini mungkin tidak masuk akal. Model yang memberikan (kurang-lebih) efek
persentase konstan adalah
Log(upah)= 𝛽̂ 0 + 𝛽̂ 1 educ u
dimana log(.) menunjukkan logaritma natural
2.5 Nilai dan Varian yang Diharapkan dari Pengukur OLS
Model populasi 𝑦 = 𝑏0 + 𝑏1π‘₯ + 𝑒, dan kami mengklaim bahwa kuncinya
asumsi untuk analisis regresi sederhana yang bermanfaat adalah bahwa nilai yang
diharapkan diberi nilai apa pun dari π‘₯ adalah nol. Dengan kata lain, kita sekarang
lihat 𝛽̂ 0 dan 𝛽̂ 1 sebagai penduga untuk parameter β0 dan β1 yang muncul dalam
model populasi. Ini berarti bahwa kita akan mempelajari sifat-sifat distribusi 𝛽̂ 0
dan 𝛽̂ 1 atas sampel acak yang berbeda dari populasi.
Agar realistis, 𝑦, π‘₯, dan 𝑒 semuanya dipandang sebagai variabel acak dalam
menyatakan model populasi. estimasi kemiringan dan intersepsi OLS tidak
ditentukan kecuali memiliki beberapa variasi sampel dalam variabel penjelas.
4
adalah asumsi yang sangat lemah — tentu saja tidak layak untuk ditekankan,
tetapi tetap dibutuhkan. Jika x bervariasi dalam populasi, sampel acak pada x
biasanya akan berisi variasi, kecuali populasi variasi minimal atau ukuran sampel
kecil.
Selain membatasi hubungan antara u dan x dalam populasi, syarat nol asumsi
rata-rata — ditambah dengan asumsi pengambilan sampel acak — memungkinkan
teknik yang praktis penyederhanaan. Secara khusus, kita dapat memperoleh
properti statistik dari penaksir OLS sebagai persyaratan pada nilai-nilai xi dalam
sampel.
2.6 Variansi Estimator OLS
Ternyata varian penaksir OLS dapat dihitung berdasarkan Asumsi SLR.1
melalui SLR.4. Namun, ungkapan-ungkapan ini akan agak rumit. Sebagai gantinya,
kami menambahkan asumsi yang tradisional untuk analisis cross-sectional. Asumsi
ini menyatakan bahwa varian unobservable, u, bersyarat pada x, adalah konstan. Ini
dikenal sebagai homoskedasticity atau “konstan asumsi varians.
Seringkali berguna untuk menulis Asumsi SLR.4 dan SLR.5 dalam kaitan
dengan mean bersyarat dan varian bersyarat dari y
Dengan kata lain, ekspektasi bersyarat dari y diberikan x adalah linear dalam
x, tetapi varians dari y diberikan x adalah konstan. Situasi ini digambarkan pada di
mana ß0> 0 dan ß1> 0.
Dalam memperkirakan varians error, kita dapat menggunakan persamaan
untuk menulis residual sebagai fungsi dari error:
5
Estimator SSR / n pada dasarnya bias karena tidak memperhitungkan dua
batasan itu harus dipenuhi oleh residual OLS. Pembatasan ini diberikan oleh dua
urutan pertama OLS kondisi:
2.7 Regresi melalui Asal dan Regresi pada Konstan
Dalam kasus yang jarang terjadi, kami ingin memaksakan pembatasan bahwa,
ketika x = 0, nilai yang diharapkan dari y adalah nol. Ada hubungan tertentu yang
masuk akal. Misalnya, jika penghasilan (x) adalah nol, maka pendapatan pajak
penghasilan (y) juga harus nol. Selain itu, ada pengaturan model mana yang semula
telah mencegat bukan nol diubah menjadi model tanpa intercept.
Untuk mendapatkan estimasi kemiringan di kami masih mengandalkan metode
kuadrat terkecil biasa, yang dalam hal ini meminimalkan jumlah residu kuadrat:
Pembilang di sini masuk akal karena itu adalah jumlah residu kuadrat, tetapi
penyebutnya bertindak seolah-olah kita tahu nilai rata-rata y dalam populasi adalah
nol. Salah satu alasan versi ini dari R2 yang digunakan adalah bahwa jika kita
menggunakan jumlah total kuadrat biasa, yaitu, kita menghitung R2 sebagai
6
BAB III
PENUTUP
3.1 Simpulan
Persamaan y = β0 + β1x + u, yang diasumsikan berlaku dalam populasi yang
diminati, mendefinisikan model linear sederhana regresi. Ini juga disebut model
regresi linier dua variabel atau linier bivariat. model regresi karena menghubungkan
dua variabel x dan y.
dan
merupakan perkiraan yang disebut
ordinary least squares (OLS) yang merupakan perkiraan dari β0 dan β1. Setelah
menentukan perkiraan penyadapan dan kemiringan OLS, didapatkan bentuk garis
regresi OLS 𝑦̂ = 𝛽̂ 0 + 𝛽̂ 1π‘₯
Diasumsikan bahwa intersep dan perkiraan kemiringan, 𝛽̂ 0 dan 𝛽̂ 1, telah
diperoleh untuk sampel permintaan data. Diketahui 𝛽̂ 0 dan 𝛽̂ 1 , kita dapat
memperoleh nilai yang cocok 𝑦̂i untuk setiap pengamatan. Menurut definisi, setiap
nilai yang dipasang dari 𝑦̂i ada di garis regresi OLS. Sisa OLS terkait dengan
observasi i , 𝑒̂i , adalah perbedaan antara yi dan nilai pasnya.
Secara umum, mengubah satuan pengukuran hanya pada variabel
independen tidak berpengaruh intersep tersebut. Di bagian sebelumnya, kami
mendefinisikan R-squared sebagai ukuran goodness-of-fit untuk regresi OLS.
Tanpa mengisi aljabar apapun, kita harus tahu hasilnya: kebaikan kesesuaian model
tidak harus bergantung pada unit pengukuran variabel kita.
Model populasi 𝑦 = 𝑏0 + 𝑏1π‘₯ + 𝑒, dan kami mengklaim bahwa
kuncinya asumsi untuk analisis regresi sederhana yang bermanfaat adalah bahwa
nilai yang diharapkan diberi nilai apa pun dari π‘₯ adalah nol. Dengan kata lain, kita
sekarang lihat 𝛽̂ 0 dan 𝛽̂ 1 sebagai penduga untuk parameter β0 dan β1 yang muncul
dalam model populasi.
Dalam kasus yang jarang terjadi, kami ingin memaksakan pembatasan
bahwa, ketika x = 0, nilai yang diharapkan dari y adalah nol. Ada hubungan tertentu
yang masuk akal. Misalnya, jika penghasilan (x) adalah nol, maka pendapatan pajak
penghasilan (y) juga harus nol. Selain itu, ada pengaturan model mana yang semula
telah mencegat bukan nol diubah menjadi model tanpa intercept.
7
Download