Kelompok 5 Nama : 1. Bumi Zulhendra Herman 2. Laen Sugi Rante

advertisement
Kelompok 5
Nama :
1. Bumi Zulhendra Herman
2. Laen Sugi Rante Tandung
3. Harimurty Rusli
REGRESI DUA VARIABEL: ESTIMASI INTERVAL DAN PENGUJIAN HIPOTESIS
Hati-hati dala pengujian hipotesis yang terlalu banyak, semakin banyak data yang
anda “siksa” semakin besar kemungkinan mereka akan memberikan “pengakuan”namun
pengakuan yang didapatkan di bawah tekanan, keungkinan tidak akan dapat diterima dalam
pengadilan pendapat keilmuan.
Seperti yang telah ditunjukkan dalam bab.4 , estimasi pengujian hipotesis terdiri atas dua
cabang statistik klasik . teori estimasi terdiri atas dua bagian “ estimasi titik dan estimasi
interval(interval estimation). Kita telah membahas estimati titik secara mendalam dalam
dua bab sebelumnya, dimana kita memperkenalkan metode ordinary least square (OLS) dan
maximum likehood(ML) pada estimasi titik. Pada bab ini, pertama kita akan
mempertimbangkan estimasi interval untuk kemudian mengangkat topik pengujian
hipotesis, sebuah topik sangat berkaitan erat dengan estimasi interval.
5.1persyaratan Statistik
Sebelum kita mendemonstrasikan mekanisme sebenarnya dalam embangun interval
kepercayaan dan menguji hipotesis secara statistik , diasumsikan bahwa pembaca terlah
mengenali konsep dasar probabilitas dalam statistik. Walaupun bukan pengganti dari
pelajaran statistik . Lampiran A mengajikan ini dari statistik yang seharusnya, konspe-konsep
secara menyeluruh telah dikenal dengan baik oleh pembaca. Konsep kunci, seperti
probabilitas, kesalahan tipe I dan tipe II, tingkat signifikansi, kekuatan uji statistik dan
interval kepercayaan sangatlaghh penting bagi kita semua untuk memahami bahan-bahan
yang dibahas dalam bab ini dan dalam bab-bab selanjutnya.
5.2 estimasi interval : beberapa ide mendasar
Untuk menetapkan ide mengenai hal ini, kita kembali pada contoh upah-tingkat pendidkan
dalam bab 3. Persamaan (3.6.2) menunjukkan bahwa peningkatan rerata upah perjam
berhunungan dengan peningkatan tingkat pendidikan satu tahun( β2-δ2. Β+ δ) mengandung
β2yang sebenarnya . yaitu 1-α secara simbolis
Pr (β2- δ≤ β2≤β2+δ=1-α
Interval seperti itu , jika ada diokenal sebagai interval kepercayaan: 1-α dikenal sebagai
koefisien kepercayaan. Dan α(0< α<1) dikenal sebagai signifikansi/ tingkat kepercayaan.
Kedua titik ujung dari interval kepercayaan dikenal sebagai batasan kepercayaan )- batas
kepercayaan juga dikenal sebagai nilai kritis β2-δ berfungsi sebagi batas kepecayaan bawah
dan β2+δ dikenal sebagai batas kepercayaan atas. Sambil lalu , pertikan bahwa pada
praktiknya 1-α sering kali diekspresikan dalam bentuk presentase , yaitu 100α dan 100(1α)persen.
Persamaan (5.2.1) menunjukkan bajwa sebuah estimator interval, dibandingkan dengan
estimator titik, adalah sebuah interval uyang membangun dalam sebuah keadaan dengan
probabilitas tertentu, 1-α , dimana di dalamnya dan diantara kedua batasannya, terkandung
nilai sebenarnya dari parameter. Sebagai conyoh, jikaα=0.05 atau 5% dari persamaan (5.2.1)
kita dapat membacanya sebagai berikut : Probabilitas yang ditunjukkan dari interval (acak)
tersebut mengandung nilai B2 yang sebenarnya adalah sebesar 0,95 atau 95%. Oleh karena
itu, estimator interval memberikan rentang nilai, dimana nilai yang sebenarnya dari β2
mungkin tidak sebenarnya.
Sangatlah penting untuk mengatahui aspek aspek dari estimasi interval berikut ini :
1. Persamaan (5.2.1) tidak menyatakan mengenai probabilitas, dari β2 yang verada di
antara batasan yang diberikan yaitu 1-α walaupun tidak diketahui, β2 diasumsikan
merupakan besaran angka yang tetap meskipun berada di antra interval atau
tidak.persamaan (5.2.1) menyatakan bahwa untuk metode yang dijelaskan dalam
bab ini, probabilitas untuk mmengembangkan sebuah interval yang mengandung
nilai nyata dari β2 ada;ah sebesar 1- α.
2. Interval dari persamaan (5.2.1) merupakan interval acak yaitu akan bervariasi
nilainya dari satu sampel terhadap sampel lainnya karena dibuat berdasarkan β2 yang
juga versifat acak (mengapa?)
3. Oleh karena interval kepercayaan bersifat acaj, pernyataan probabilitas yang
melekat padanya harus diartikan dalam. Secara jangka panjang , yaitu sampling
berulang. Lebih spesifik lagi, persamaan (5.2.1) memberikan arti : apabila dalam
sampling berulang , interval kepercayaan seperti itu dibvuat berkali-kali dalam julah
yang besar dengan probabilitas 1- α , maka dalam jangka panjang ,secara rata-rata
terdapat parameter 1- α nilai nyata yang terdapat dalam kasus sampling berulang
tersebut.
4. Seperti yang dinyatakan dalam bab 2, interval pada persamaan (5.2.1) bersifat acak
selama β2 tidak diketahui, tetapi apabila sekali saja kita memiliki sebuah sampel yang
spesifik dan mendapatkan sebuah nilai angka spesifik dari β2maka interval dalam
persamaan (5.2.1) tidak lagi bersifat acaj. Dia bersifat tetap. Dalam kasus ini kita
tidam dapat membuat pernyataan probabiitas pada persamaan(5.2.1) yaitu kita
tidak dapat mengatakan bahwa probabilitas dalam sebuah interval yang tetap
terkandung nilai β2adalah 1- α . dalam situasi ini β2 terdapat dalam interval yang
tetap berada di luar interval tersebut. Oleh karena itu, probabilitas adalah 1 atau 0.
Jadi , untuk contoh upah-tingkat pendidikan hipotesis kita, apabila interval
keperdayaan yang didapatkan sebesar 95 % (0,5700≤ β2≤0.8780) seperti yang
ditunjukan secara singkat dalam persamaan (5.3.9) maka kita tidak dapat
mengatakan bahwa 95% probabilitasnya adalah bahwa dalam interva tersebut
terdapat nilai yang sebenarnya dari β2 probabilitasnya adalah 1 atau 0.
Lalu bagaimaan inteval kepercayaan ini dibentuk? Dari pembahasan yang telah
dilakukan terlebih dahulu, seseorang mungkin mengharapkan jika distribusi sampling
atau distribusi probabilitas dari estimator telah diketahui, seseorang dapat membuat
pernyataan interval kepercayaan seperti yang terdapat dalam prsamaan (5.2.1)
dalam bab 4, kita telah melihat di bawah asumsi kenormalan dar sebuah gangguan u i
, estimator OLSβ1
dan β2 juga didistribusikan normal dan estimator OLS δ2
berhubungan dengan distribusi X2 (chi square) dengan demikkian, akan terlihat
bahwa seolah-olah tugas untuk membentuk interval kepercayaan adalah sebuah
tugas yang sangat sederhana. Dan memang benar!
5.3 INTERVAL KEPERCAYAAN UNTUK KOEFISIEN REGRESI β1 dan β2
Interval kepercayaan untuk β2
Seperti yang telah ditunjukkan dalam bab 4, subbab 4.4 bahwa dengan asumsi
kenormalan untuk Up estimator β1 dan β2 dengan sendirinya terdistribusi secara
normal rerata dan varian yang juga mengikuti . oleh karena itu sebagai contoh
variabel
Seperti yang tedapat dalam persamaan (4.3.6) variabel tersebut merupakan variabel
normal yang terstandarisasi (standardized normal variabel). Oleh karena itu, tampak
seolah-olah kita dapat menggunakan distribusik normal unutk membentuk
pernyataan probabilitas mengenai β2 . dengan kondisi varians ó2 yang diketahui jika
ó2 diketahui sebuah sifat utama variabel yang didistribusikan secara normal dengan
rerata µ dan varians ó2 alah daerah di bawah kurva normal di antara batasan µ+2
óadalah 68 persen, daerah yang terletak di antara batasan µ±2 ó sebesar 95 persen,
dan daerah yang terletak antara µ±3ósebesar 99,7 persen.
Namun demikian ó2 jarang sekali diketahui dan pada praktiknya ditentukan oleh
estimator ó2yang tidak boas. Apabila kita menggantikan ódengan ó^ maka persamaan
(5.3.1) dapat ditulis sebagai:
Dimana Se(β2) kini mengacu pada standar error yang terestimasi. Dapat dilihat (lihat
lampiran 5A . 2) bahwa variabel t bisa didefinisikan mengikuti distribusi t dengan
derajat bebas (df) , n-2 [ Perhatikan perbedaan atanra persamaan (5.3.1) dan (5.3.2].
oleh karena itu, selain menggunakan distribusi normal, kita dapat menggunakan
distribusi t unutk membentuk interval kepercayaan untuk β2 sebagai berikut:
Di mana nilai t yang terdapat dalam pertidaksamaan ganda ini merupakan nilai t
yang dihasilkan dari persamaan (5.3.2) dan tα/2 adalah nilai dari variabel t yang
didapatkan dari distribusi t untuk tingkat kepercayaan α/2 dan df n-2 yang sering kali
disebut juga sebagai nilai t kritis pada tingkat signifikasi α/2. Substitusi dari
persamaan (5.3.2) ke persamaan 5.3.3 menghasilkan
Apabila kita atur kembali persamaan 5.3.4 maka kita dapatkan
Persamaan (5.3.5) menyediakan 100(1- α) persen interval kepercayaan untuk β2 yang dapat
dituliskan secara lebih sederhana sebagai
100- (1-α)% interval kepercayaan untuk β2:
dan lebih sederhana lagi
100- (1-α)% interval kepercayaan untuk β1:
Perhatikan pentingnya fitur dari intaerval kepercayaan yang diberikan pada persamaan 5.3.6
dan (5.3.8) pada kedua kasus itu, rentang lebar dari interbal kepercayaan proporsional
terhadap standard error dari estimator. Di mana , semakin besar standard error semakin
rentang lebal interbal kepercayaan, atau jika kita ubah cara pandang kita, semakin besar
standard error dari simolator , semakin besar ketidakpastiaan dalam mengestimasi nilai
sebenarnya dari parameter yang tidak diketahui tersebut . jadi , standard error dari
estimator sering kali dijelaskan sebagai ukuran keakuratan dari estimator (seberapa tepat
ukuran estimator dari nilai populasi sebenarnya)pada contoh regresi kita lam bab 3 (subbab
3.6t) tentang rerata upah per jam (Y) terhadap tingkat pendidikan (X) , ingat kembali kita
menemukan pada tabel 3.2 bahwa β2=0,7240; se(β^2)=0,0700. Oleh karena itu terdapat 12
observasi df adalah 11. Apabila kita mengasumsikan α adalah 5% atau koefisien
kepercayaan sebesar 95% maka tabel t menunjukkan bahwa untuk df=11 tα/2 =2,201 .
dengan menyubstitusikan nilai-nilai ini ke dalam persamaan (5.3.5) pembaca dapat
membuktikan interval kepercayaan 95 % sebagai berikut:
0.5700≤ β2≤0,8780
(5.3.9)
Atau dengan menggunakan (5.3.6) adalah
0,7240±0,1540
(5.3.10)
Interprestasi dari interval kepercayaan adalah: bedasarkan koefisien kepercayaan sebasar
95% , 95 dari 100 kasus interval, seperti persamaan (5.3.9) akan mengandung nilai yang
sebenarnya dari β2 , akan tetapi seperti yang telah diingatkan sebelumnya, ktia tidak dapat
menyatakan bahwa probabilitas interval spesidik dari persamaan (5.3.9) , dimana
mengandung nilai sebenarnya dari β2 adalah sebesar 95%, sebab interval ni tetpa dan tidak
lagi acak. Sehingga β2 terletak dalam interval tersebut atau tidak. Probabilitas dari sebuah
interval yang telah ditetapkan dan terkandung di dalamnya adala β2 adalah 1 atau 0.
Mengikuti persamaan (5.3.7) dan data pada tabel 3.2 pembaca dapat dengan mudah
membuktikan bahwa 95 persen interval kepercayaan unuk β1 untuk contoh kita adalah
-1,8871 ≤ β1≤ 1,8583
(5.3.11)
Lalu, anda sebaiknya berhati-hati dalam mengiterprestasikan interval kepercayaan ini.
Dalam 95 dari 10 kasus, interval seperti persamaan 5.3.11 akan mengandung nilai yang
sebenarnya dari β1; probabilitas dari interval tetap khusus ini yang terkandung nilai
sebenarnya dari β1 adalah 1 atau 0.
Interval kepercayaan untuk β1 dan β2 secara simultan
Terdapat wakut ketika seseorang memerlukan untuk membuiat interval kepercayaan
bersama (joint confidence iunterval) untuk β1 dan β2 adalah sebuah koefisien kepercayaan
(1-α), katakanlah 95 % , bahwa interval mengandung β1 dan β2 secara simultan . oleh karena
topik ini dilibatkan. Pembaca tertarik mungkin ingin mengusulkan referensi-refrensi yang
sesuai. Kita akan membahas kembali topik ini dalam bab 8 dan 10.
5.4 INTERVAL KEPERCAYAAN UNTUK ó2
Seperti yang ditunjukkan pada bab 4, subbab 4.3 dibawah asusi kenormalan, variabel
Mengikuti distribusi x2 dengan f n-26 . oleh karena itu , ktia dapat menggunakan distribusi X2
untuk membentuk sebuah interval kepercayaan untuk ó2
Dimana nilai x2 berada di tengah-tengah kedua pertidaksamaan yang diberikan pada
persaman (5.4.1)di mana x21-α/2 dan X2α/2 adalah dua nilai dari X2, seperti yanf terlihat pada
figure 5.1
Dengan menyubstitusikan X2 dari persamaan (5.4.1) ke persamaan (5,.4.2) dan
dengan mengatur sedemikian rupa, kita dapatkan
Yang memberikan interval kepercayaan seberas 100 (1-α) untuk ó2
Melanjutkan dengan contoh tingkat upah pendidikan. Kita peroleh dari tabel 3.2. bahwa
untuk data kita kita mendapatkan ó2 = 0,8936 . jika kita menentukan α sebesar 5%, X20,975=
3,8157 . nilai ini menunjukkan bahwa probabilitas sebuah nilai chi-square yang melebihi
21,9200 adalah 2,5 persen dan yang melebihi 3,8157 adalah 95 persen. Oleh karena itu,
interval di antara kedua nilai inin adalah interval kepercayaan untuk X 2 , seperti yang
digambarkan pada figur 5.1 (perhatikan karakterisktik distribusi X2 pada kurva)
Dengan menyubstitusikan data dari contoh kita ke persamaan (5.3.4) pembaca dapat
membuktikan bahwa interval kepercayaan 95 % untuk ó2 adalah sebagai berikut
0,4484≤ ó2 ≤2,5760
Interprestasi dari interval adalah: apabila kita membuat batasa kepercayaan 95 persen
untuk ó2 dan apabila kita mempertahankan perkiraan awal kita bahwa dalam batasan ini
terdapat nilai sebenarnya dari ó2 maka 95% dari perkiraan kita dalam hangka panjang dan
seterusnya akan benar.
5.5 pengujian hipotesis umum : komentar umum
Setelah membahas permasalahan estimasi titik dan estimasi interval, sekarang saatnya kita
membahas topik pengujian hiptesis. Pada subbab ini, kita akan membahas secara
menyeluruh mengenai beberapa aspek umum dari topik ini. Lampiran A memberikan
beberapa penjalasan tambahan.
Permasalahan dalam pengujian hipotesis statistik dapat dinyatakan secara sederhana
sebagai berikut : apakah sebuah pengamatan atau penemuan sesuai dengan beberapa
hipotesis yang dinyatakan atau tidak? Kata “sesuai” seperti yang digunakan dalam kalimat
tersebut berarti “cukup” mendekati nilai hipotesis sehingga kita tidak perlu menolak
pernyataan yang dihipotesikan. Jadi, jika beberapa teori atau pengalaman sebeumnya
membawa kita kepada sebuiah kepercyaan bahwa koefisien kemiringan β2 dari contoh
upah-tingkat pendidikan adalah tak terhingga, apakah β2 =0,724 yang dinyatakan dari
sampel pada tabel 3,2 konsisten dengan hipotesis yang dinyatakan ? jika ya, kita tidak akan
menolak hipotesisnya, jika sebaliknya kita dapat menolaknya.
Dalam pembahasan statistika, hipotesis yang dinyatakan dikenal sebagai hipotesis nol (null
hypothesis) dan dilambangkan dengan simbol Ho. Hipotess nol biasanya dilawankan
pengujiananya terhadap hipotesis alternatif-hipotesis yang dipertahankan (alternative
hypothesis) yang dilabahngkan dengan H1 ; β2 =1.5 adalah hipotesis sederhana, tetapi
pernyataan H1: β2 adalah hipotesis komposit.
Teori pengujian hipotesis memberikan perhatian pada pengembangan peraturan atau
prosedur dalam menentukan apakah perlu untuk menolak atak tidak menolak hipotesis nol.
Terdapat dua pendekatan komplementar yang berkaitan untuk melengkapi peraturan
tersebut yang disebut interval kepercayaan dan pengujian signifikansi. Kedua pendekatan
ini membuat prediksi bahwa variabel (statistik maupun estimator) yang sedang dibahas
memiliki distribusi probabilitas dan pengunjian hipotesis yang melibatkan dalam pembuatan
pernyataan atau perkiraan mengenai nila(-nilai)- dan parameter (-parameter) dari sebuah
distribusi, sebagai contoh, kita mengetahui bahwa dengan asumsi kenormalan β 2 juga
didistribusikan secara normal dengan rerata yang sama β2,=1 , kita sedang membuat sebuah
pernyataan mengenai salah satu paramter dari distribusi normal, lebih tepat lagi rerata.
Sebagian besar hipotesis statistik yang ditemui dalam buku ini cenderung pada tipe seperti
yang telah dijelakan sebelumnya-memmbuat pernyataan mengenai satu atau lebih nilai
parameter dari beberapa distribusi probabilitas yang diasumsikan, seperti F,t,atau X2 .
bagaimana perolehan hasilnya akan di bahas pada dua subab selanjutnya.
Pengujian hipotesis : pendekatan interval kepercayaan
Pengujian dua arah atau pengujian dua ekor
Untuk memberikan penjelasan mengenai pendekatan interval kepercayaan , sekali lagi kita
akan melihat kebali pada contoh upah-tingkat pendidikan dari hasil regresi yang ditentukan
oleh persmaaan (3.6.1) kita mengetahui bahwa koefisien keminringan adalah 0,7240 .
anggap kita menetapkan bahwa:
Di mana –berdasarkan hipotesis nol nilai yang sebenarnya dari koefisien kemiringan adalah
0,5 tetapi koefisien kemiringan dinyatakan dalam hipotesis alternatif bernilai lebih kecil atau
lebih besar dari 0,3 . hipotesis nol adalah hipotesis sederhana , sedangkan hipotesis
alternatif bersifat komposit ,yang sebenanrya yang dikenal sebagai hipotesis dua arah .
sering kali hipotesis alternatif yang bersifat dua arah ini mencerminkan kenyataan bahwa
kita sebenanrya tidak memiliki perkiraan awal atau eskpektasu secara teoritis mengenaik ke
maknakah seharusnya arah pergerakan hipotesis alternatif ini dari hipotesis nol.
Apakah β2 yang telah diobservasi sesuai dengan Ho nya? Unutk menjawab pertanyaan ini,
mari kita merujuk pada interval kepercayaan dalam persamaan (5.3.9) kita ketahui bahwa
dalam jangka panjang , beberapa interval seperti (0,5700;0,8780) mengandung nilai dari β2
yang sebenarnya, dengan probabilitas 95 %. Bersamaan dengan itu, dalam jangka panjang
(misal: sampling berulang ) interval seperti itu menyediakan sebuah rentang atau batasan,
dimana β2 nyata terdapat di dalamnya koefisien kepercaaaan . katakanlah sebesar 95%. Jadi,
interval kepercayaan memberikan sekelompok hipteiss nol yang memungkinan . oleh karena
itu, jika β2 nyata terdapat di bawah Ho terdapat di antara interval kepercayaan 100(1-α)%
kita tidak akan menolak hipotesis nol : namun demikian jika terletak di luar interval . kita
mungkin akan menolaknya rentang ini diilustrasikan secara skematis dalam figur 5.2
aturan pengambilan keputusan : buatlah interval kepercayaan 100 (1-α)% untuk β2 jika β2
yang berada di bawah Ho nerada di antara interval keperdcayaan ini, kita tidak akan
menolak Ho. Namun demikikan jika terletak di luar interval ini, kita akan menolak Ho.
Dengan mengikuti aturan ini, untuk contoh hipotesis Kita Ho:β2= 0,3 jelas b ke[erada di luar
interval kepercayaan 95% yang diberikan dalam persamaan (5.3.9) oleh karena itu, kita
dapat menolak hipotesis bahwa kemiringan nayata adalah 0,5 berdasarkan tingkat
kepercayyaan 95%. Jika hiptesis nol memang benar secara nyata, probabilitas unutk
mendapatkan sebuah nilai kemiringan sebeasar 0,7240 secara kebetulan adalah sekitar 5%,
sebuah probabilitas yang rendah.
Dalam statistika, sika kita menolak hipotesis nol, kita akan mengatakan bahwa penemuan
kita secara statistik signifikan. Di sisi lain, jika kita tidak menolak hipotesis nol, kita akan
mengatakan
bahwa
penemuan
kita
secara
statistik
tidak
signifikan.
Beberapa penulis penggunakan kata-kata “sangat signifikan secara statistik “ dengna katakata ini, mereka umumnya mmemberikan makna bahwa ketika mereka menolak hipotesis
nol, probabilitas untuk melakukan kesalahan tipe I (α) merupakan akngka yang kecil.
Biasanya 1 %. Akan tetapi, pada pembahasan kita mengenai P-value (nilai p) dalam subbab
5,8 kita ketahui bahwa a,an lebih baik jika kita serahkan pada si peneliti untuk menentukan
apakah sebuah penemuan secara statistik itu “signifikan” “cukup signifikan “ atau “sangat
signifikan”.
Pengujian satu arah atau satu ekor
Kadang kala, kita memiliki perkiraan atau ekspektasi teoritis yang sangat kuat )atau
eskperktasi berdasarkan beberapa pembuktian empiris sebelunmnya) bahwa hipotesis
alternatidf itu satu sisi atau berarah tunggal dibandingkan dua arah, seperti yang telah
dibahas sebelumnya.
Jadi, untuk contoh upah-tingkat pendidikan, kita tetapkan bahwa:
Ho:β2 ≤0.5 dan H1:β2>0.5
Keemungkinan teori ekonomi atau beberapa pembuktian empiris sebelumnya menyarankan
bahwa kemiringan lebih besar dari 0,5. Walaupun prosedur untuk menguji hipotesis ini
dapat deengan mudah diturunkan dari persamaan (5.3.5) mekanisme sebenarnya dapat
dijelaskan lebih baik dengan pendekatan uji signigikansi yang akan dijelaskan selanjutnya.
5.7 pengujian hipotesis : pendekatan uji signifikansi
Menguji sifnifikansi dari koefisien regresi : Uji t
Sebuha pendekatan alternatid, nammun juga sebagai pelengkap untuk meotde interval
kepercayaan dari pengujian hipotesis statistik merupakan pendekatan pengujian signifikasi
yang dibangun secara masing-masing oleh R.A Fisher serta bersama-sama oleh neyman dan
pearson. Atau secara umum, uji signifikansi merupakan sebuah prosedur, di maan hasil
sampel digunakan untuk membuktikan kebenaran atau kesalahan dari hipotesis nol. Ide
kunci di balik pengujian signifikasi ini adalah bahwa sebuah uji statistik (estimator) dan
distribusi sampling dari statistik tersevut dinyatakan oleh hipotesis nol. Keputusan untuk
menerima atau menolak Ho dibuat berdasarkan nilai dari uji statistik yang didapatkan dari
data yang telah kita miliki.
Sebagai sebuah ilustarasi, kita ingant lagi mengenai variabel berikut yang berada di bawah
asumsi kenormalan
Yang menigkuti distribusi t dengan df n-2 . jika nilai dari β2 sebenarnya dinyatakan dalam
hipotesis nol., nilai t dari persamaan (5.3.2) dapat dengan mudah dihitung dari sampel yang
ada sehingga hasilnya juga digunakan sepagai uji statistik kemudian oleh karena uji statistik
ini mengikuti distribusi t, pernyataan interval kepercayaan dapat dibuat seperti berikut:
Di mana β*2 adalah nilai β2 yang dinyatakan di bawah Ho -tα/2 dan tα/2 adalah nilai dari t
(nilai
t kritis) yang didapatkan dari tabel t untuk tingkat sifnifikasi (α/2) dan df n-2.
[persamaan (5.3.2) . tabel t diberikan dalam lampiran D.
Dengan menyederhanakan persamaan (5.7.1) kita dapatkan
Yang memberikan interval dimana nilai ^β2 terletak dengan probabilitas 1-α dan
memberikan kondisi β2 = β*2. Dalam bahasa pengujian hipotesis, interval kepecayaan 100(
1-α) didapatkan dari persamaan (5.7.2) yang dikenal sebagai daerah penerimaan dari Ho
dan daerah(-daerah) yang berada di luar interval kepercayaan, disebut sebagai daerah
penolahkan (dari Ho) atau daerah kritis .
Sekarang, pendekatan hubungan antra pendekatan interval kepercayaan dan pendekatan uji
signifikansi untuk pengujian hipotesis dapat dilihat dengan membandingkan persamaan
(5.3.5) dengan persmaan (5.7.2.) dalam prosedur interval kepercayaan , kita mencoba untuk
membangun sebuah rentang atau interval yang memiliki probabilitas tertentu dimana
mengandung β2 sebenarnya, namun belum diketahui keberadaannya. Dalam pendekatan uji
signifikansi, kita membuat sebuah hipotesis mengenai nilai β2 dan mencoba melihat apakah
β2 yang sudah dihitung berada dalam sebuah batasan (kepercayaan ) yang memungkinkan di
sekitar nilai yang dihipotesiskan.
Sekali lagi, mari kita kembali pada ocntoh upah-tingkat pendidikan yang telah kita
bahas , sudah kita mengatahui bahwa ^β2=0,7240 , se (^β2)=0,0700 dan df=11. Jika kita
asumsikan bahwa α=5%, tα/2= 2,201
Jika kita asumsikan habwa Ho: β2 = β*2=0.5 dan H1: β2≠0,5 ,sehingga persamaan (5.7.2)
menjadi:
Pr (0,3460≤^β2≤0,6540)
(5.7.3)
Pada praktiknya, kita tidak perlu untuk mengestimasi persamaan (5.7.2)secara eskplisit.
Seorang dapat menghitung nilai t yang berada di tengah-tengah pertidaksamaan yang
diberikan ke dalam persamaan (5.7.1) dan untuk mengetahui apakah nilanunya bedada di
antara nila t kritis atau berada di luarnya sebagai contoh :
Seperti yang digambarkan pada figur 5.3
yang secara jelas berada di daerah kritis figur 5.4 . kesimpulan masih sama ; kita menolak H0
perhatikan juga bahwa jika β2 yang telah diestimasikan (^β2) sama dengan β2 yang
dihipotesiskan , nilai t dala persamaan (5.7.4) adalah nol. Bagaimanapun, ketika nilai β2
beranjak dari nilai β2 yang dihipotesiskan |t| (nilai t absolut ;catatp; nilai t bisa bernilai
negatif atau positif) akan meningkat. Oleh karena itu , nilai |t| “yang besar” dapat menjadi
bukti yang menentang hiptesis nol. Tentu saja, kta selalu dapat menggunakan tabel t untuk
menentukan apakah sebuah nilai t tertentu besar atau kecil; jawabannya seeortu yang kita
ketahui, bergantung nilai derajat bebas dan juga probabilitas dari kesalahn tipe I yang kita
mau terima. Jika anda melihat tabel t yaang diberikan dalam lampiran D (tabel D.2) anda
akan melihat bahwa , untuk nila df tertentu, probabilitas akan semakin mengecil secara
progresif untuk mendapatkan nilai |t| yang terus menerus meningkat. Jadi untuk df=20 ,
prbabilitas untuk mendapatkan nilai |t| sebesar 1.725 atau lebih adalah 0,10 atau 10%.
Akan tetapi untuk df yang sama, probabilitas untuk mendapatkan nilai |t| sebesar 3.552
atau lebih hanya 0,002 atau 0,2%.
Oleh karena kita menggunakan distribusi t, proisedur pengujian seperti yang telah dijelaskan
tadi dinamakan uji t. Dalam baha uji signifikansi, sebuah statistik dinyatakan signifikansi,
sebuah statistik dinyatakan signifikansi secara statistik jika nilai dari uji statistiknya
berada di daerah kritis, pada kasus ini, hipotesis nol ditolak. Sebaliknya, sebuah pengujian
dikatakan tidak signifikan secara statistik, jika nilai dari uji statistiknya berada di daerah
penerimaan. dalam situasi ini, hipotesis nol tidak ditolak. Pada contoh kita, uji t signifikan
sehingga enolak Ho.
Sebelum membuat kesimpulan atas pembahasan kita mengenai uji statistik , perhatikan
bahwa prosedur pengujian yang baru tetntu saja ditekankan, dikenal sebagai prosedur uji
signifikansi dua arah atau dua ekor, dimana kita mempertimbangkan kedua sisi estrim dari
ekor distribusi yang relevan dalam distribusi probabilitas, daerah penolakan dan daerah
hipotesis nol, jika berada pada sisi.ekor manapun. Namun demikian, hal tersebut terjadi
karena H1 kita merupakan sebuah hiptesis komposit dua arah β2≠0,5 yang berarti β2>0,5 .
walaupun H1 masih merupakan hipotesis yang komposit/ berganda, sekarang menjadi satuh
arah. Untuk menguji hipotesis ini kita gunakan uji satu arah, seperti yang ditnjukkan dalam
figur 5.5 (lihat juga subba 5.6)
Prosedur pengujian sama dengan sebelumnya, kecuali batas atas tingkat kepercayaan atau
nilai kritis yang sekarang berhubungan dengan tα= t0.05 , yaitu tingkat 5 %. Seperi yang
diperlihatkan dalam figur 5.5 kita tidak perlu mempertimbangkan ekor bawah distribusi t
dalam kasus ini. Apakah seseorang menggunakan uji signifikansi satu arah atau dua arah,
tergantung bagaimana hipotesis alternatif ini diformulasikan sehingga pada akhirnya
bergantung pada dari perkiraan awal atau pengalaman empiris sebelumnya.
Kita dapat merangkum pendekatan uji signifikansi t sehingga pengujian hipotesis seperti
yang diperlihatkan pada tabel 5.1
Tabel 5.1 uji signifikasi t : [pengammbilan keputusan
Menguji signifikasi dari ó2 dan uji x2
Menguji sifnifikansi dari metodologi uji sifnifikansi , mari kita pertimbangkan variabel
berikut ini:
Yang seperti telah dibahas sebelumnya, mengikuti distribusi x2 dengan df n-2 . unutk contoh
hipotesisnya , ktia gunakan ó2 =0,8937 dan df=8, jika kita tetapkan bahwa Ho ; α2 versus
H1:ó2≠0,6 persamaan (5.4.1) menyediakan uji statistik untuk Ho, dengan menyubstitusikan
nilai yang sesuai dari persamaan (5.41) kita dapatkan bahwa di bawah Hp, X 2 adalah 3,18575
dan 21,9200. Oleh karena x2terhitung berada di atanra kedua batasan itu data yang ada
mendukung hipotesis nol dan kita akan menolak hipotesis nol (lihat figur 5.1) prosedur
pengujian ini dikenal sebagi uji signifikansi chi swuare . pendekatan uji signifikansi hipotesis
X2 terangkum dalam tabel 5.2
5.8 pengujian hipotesis : beberapa aspek praktis
Arti dari “menerima” atau “menolak” hipotesis
jika berdasarkan dari sebua uji signifikansi, katakanlah berdasarkan uji t, kita memutuskan
untuk menerima hipotesis nol, yang sebenarnya sedang kata bicarakan adalah bahwa
berdasarkan bukti sampel. kita tidak memiliki alasan utnuk menolaknya; kita tidak
mengatakan bahwa hipotesis nol adalah nyata tanpa keraguan sama sekali. Mengapa?
Unutk menjawab pertanyaan ini , kita kembali kepada contoh upah-0tingkat pendidikan
dengan asukmsi bahwa H0 :β2= 0,70, kini nilai kemiringan yang diestimasikan adalah ^
β2=0,7241 dengan kita peroleh t=(0,7241-0,7)/0,0701= 0,3438, di mana tidak signifikan
misalkan pada α=5%. Oleh karena itu, kita akan katakan bahwa kita “terima: Ho. Akan tetapi
, sekarang , jika kita asumsikan Ho:β2= 0,6. Dengan melakukan uji t kembali, kita peroleh t=
(0,7241-0,6)/0,0701=1,7703 yang juga secara statistik tidak signifikan.
Jadi, sekarang kita akan katakan bahwa kita “terima” Ho dimanakah dari kedua hipotesis nol
ini yang “benar”? kita tidak tahu. Oleh karena itu, dalam “menerima”n sebuah hipotesis nol
kita sebaiknya menyadari adanya hipotesis nol yang lain yang mungkin sesuai dengan data
oleh karena itu lebih baik unutk mengatakan bahwa kita mungkin menerima hipotesis nol
dari pada kita (secara jelas) menerimkanya. Namun demikian, akan lebih baik jika,
“seperti yang diucapkan dalam keputusan pengadilan bahwa keputusan “tidak bersalah”
dari pada ‘suci’ sehingga kesim,kpulan dari sebuah uji statistik adalah ‘tidak menolak’ dari
pada menerima”.
Hipotesis nol yang sering kali diuji dalam sebuah pembuktian empiris adah Ho: β2=0 atau
dengan kata lain koefisien kemiringan adalah nol. Hipotesis nol yang “no”ini merupakan
orang –orangan sawah. Objek yang menjadi perhatian utamama untuk dicari apakah Y
berhungunan dengan semmua X, variabel penjelas. Apabila tidak ada hubungan antara Y
dan X sebagai asal mula. Maka untuk menguji sebuah hipotesis seperti β 2=0,3 atau nilai
manapun tidak akan ada artinya.
Hipotesis nol seperti ini dapat dengan mmudah diuji dengan interval kepercayaan atau
pendekatan uji t seperti yang telah dibahas pada subbab awal. Namun demikian , sering kali,
penguijian formal seperti ini dapat ditempuh dengan shortcut, seperti mengadopsi atauran
signifikansi “2-t” yang dapat dinyatakan sebagai berikut
Aturan “2-t”apabila angka derajat bebas adalah 20 atau lebih dan jika tingkat signifikansi α
ditetnukan sebagai 0,05 , hipotesis nol β2=0 dapat ditolak jika nilai t =[^β2/se(^β2)] yang
didapatkan dari persamaan (5.,3.2) melebihi 2 dalam nilai absolut
Logika do belakang aturan ini tidaklah sulit dipahami. Dari persamaan (5.7.1) kita ketahui
bahwa kita akan menolak H0: β2 =0 jika
Menurut derajat bebas tertentu.
Sekarang , jika kita lihat tabel t yang terdapat dalam lampiran D, kita akan melihat bahwa
untuk df 20 atau lebih. Nilai t yang dihitung (dikenal juga sebagai t hitung) adalah lebih besar
dari 2 (secara absolut) misalkan nilai 2,1 yang secara statistik signifikan. Pada tingkat 5% dan
mengakibatkan penolakan terhadap hipotesis nol. Oleh karena itu, jika kita mendapatkan
df20 atau lebih dan nilai t hitung , misalkan 2,5 atau 3, kta tidak lagi perlu mengacu pada
tabel t unutk menguji signifikansi dari koefisien kemiringan yang diestimasi. Tentu saja,
siapappun dapat selalu mengacu pada tabel t unutk mendapatkan tingkat sifnifikansi yang
tepat dan seorang harus melakukannya jika df-nya lebih kecil misalkan 20.
Sambil lalu perhatikan bahwa apabila kita menguji hipotesis satu arah β2=0 diibandingkan
dengan β2>0 atau β2< 0 , maka hipotesis nol akan ditolak jika
Apabila kita tetapkan nilai α pada 0,05 maka dari tabel t kita dapatkan bahwa untuk df
bernilai 20 atau lebih, nilai t yang lebih besar dari 1,73 secara statistik signigikan pada
tingkat signifikansi 5% (satu arah) dengan demikian, kitika nilai t melebihi, misalkan 1,8
(secara absolut) dan nilai df adalah 20 atau lebih, seseorang tidak perlu mengacu pada tabel
t unutk menentukan signigikansi secara statistik unutk memperoleh koefisien yang
diobservasi. Tentu saja, jika kita memilih α pada tingkat 0,01 atau pada tingkat berapapun.
Kita perlu menentukan nilai t yang sesuai dengan nilai acuannya. Namun demikian, pada
tahap ini pembaca seharusnya sudah mampu untuk melakukannya
Membuat hipotesis nol dan hipotesis alternatif
Berdasarkan hipotesis nol dan hipotesis alternatif yang ada, maka menguji signifikansi
statistik dari hipotesis ini seharusnya bukan lagi sebuah misteri. Namun demikian,
bagaimanakah seseorang dapat memformulasikan hipoteis-hipotesis ini? Tidak ada aturan “
susah namun cepat” sering kali fenomena yang sedang dipelajari memberikan saran
mengenai karakteristik alamiah dari hipotesis nol dan hipotesis alternatif. Sebagai contoh,
mari kita pertimbangkan alur pasar modal (capital market line –CML) dari teori surat
berharga, yang menetapkan bahwa Ei=β1+ β2ói dimana standar deviasi dari tingkat
pengembalian atau sebuah ukuran resiko
oleh larea tingkat pengemmbalian dan tingkat resiko diekspektasikan ememiliki hubungan
positig –semakin besar resiko, semakin tinggi tingkat pengembalian_ pernyataan hipotesis
alternatifterhadap hipotesis nolo adalah β2= 0 dan β2>0 . hal tersebut menunjukkan bahwa
seseorang tidak memilih β2 yang bernilai lebih kecil dari nol.
Namun demikian, mari kita pertimbangkan kasus permintaan uang seperti yang akan
kita tunjukkan nanti, salah satu faktor penting yang memengaruhi permintaan uang adalah
pendapatan. Studi-studi sebelumnya dari fungsi permintaan uang memperlihatkan bahwa
elastisitas pendapatan dari permintaan terhadap uang (persentase perubahan permintaan
uang akibat perubahan 1 persen dari pendapatan ) secara umum bernilai antara 0,7 dan 1,3
. oleh karena itu, berdasarkan sebuah studi terbaru mengenai permintaan uang, apabila
seorang menetapkan bahwa koefisien elastisitas pendapatan β2 ≠ 1 hipotesis alternatif dua
arah.
Jadi ekspektasi secara teoritis atau berdasarkan pembuktian empiris sebelumnya.
Ataupun keduanya dapat dipercaya sebagai dasar dalam memformulasikan sebuah
hipotesis. Namun demikian, bagaimanapun hipotesis ini dibentuk sangatlah penting bagi
peneliti untuk membentuk hipotesis ini sebelum melakikan inverstigasi secara empiris.
Sebaliknya sang peniliti akan bersalah akibat “penalaran pelingkar” atau ramalan/prediksi
yangg telah dia buat. Hal ini dapt dilihat apabila seseorang harus membuat hipotesis setelah
mempelajari hasil empirisnya. Maka ada sedikit keinginnan bagi seseorang tersebut unutk
membuat sebuah hipotesis yang digunakan dalam menguji hasil yang didapatkan oleh orang
lain . praktik seperti ini sebaiknya dihindari untuk alasan apapun. Setidaknya untuk
kepentingan objektivitas ilmiah. Penting unutk tetap diingant bahwa pernyataan stigler
diberikan dapa permulaan bab ini.
Memilih α , tingkat signifikansi
Seharusnya udah jelas berdasarkan pembahasan yang telah kita lakukan sampai saat ini,
apakah sebainya menolak atau menerima hipotesis nol ini sangat tergantung nilai α, yaitu
tingkat signifikansi atau probabilitas unutk melakukan sebuah kesalahan tipe I,-probabilitas
tingkat signifikansi atau probabilitas untuk menolak sebuah hipotesis nyata. Dalam lampiran
A , kita telah membahas secara lengkap mengenai karekteristik alamiah dari kesalahan tipe
I, hubungan dengan kesalahan tipe II (probabilitas untuk menerima sebuah hipotesis yang
salah) dan mengapa statistik klasik umumnya memusatkan perhatian pada kesalahan tipe I.
Kemudian mengapa α seringkali ditetapkan pada tingkat 1,5, atau maksimal pada tingkat 10
%?
Pada kenyataannya, tidak ada nilai lain yang lebih penting selain nilai-nilai ini; seperti halnya
nilai bagi setiap nilai lainnya.
Dalam sebuah bagian pendahuluan suatau buku seperti buku ini bukan tidak mungkin untuk
melakukan diskusi yang mendalam mengapa seseorang memiliki tingkat signifikansi 1,5 atau
10 %, yang akan membawa kkita dalam dangn pengambilan keputusan statistik, disiplin ilmu
tersendiri. Sebuah penjelasan singkat, bagaimanapun dapat ditawarkan sebarit yang kita
bahas dalam lampiran A untuk sebuah ukuran sampel tertentu jika kita coba unutk
mengurangi kesalahan tipe I kemungkinan kesalahan tipe II akan meningkat, dan sebaliknya.
Demikian juga unutk sebuah ukuran sampel tertentu , jika kita berusaha untuk mengurangi
probabilitas dari menolak hipotesis ang benar, pada saat yang bersamaan kita meningkatkan
probabilitas dari menerima hipotessi yang salah. Jadi, terdapat trade-off (biaya kesempatan)
yang ada/ terlibat di anatara kedua tipe kesalahan ini. Berdasarkan ukuran sampel tertentu.
Sekarang satu-satunya cara bagi kita unutk memutuskan mengenai trade off ini adalah
dengan mencari biaya relatif di antara dua tipe kesalahan ini. Kemudian
Apabila kesalahan menolak hipotesis nol yang sebenarnya merupakan pertanyaan
yang benar (keslahan tipe I) adalah lebih besar dalam hal biaya dibandingkan dengan
kesalahan unutk tidak menolak hopotesis nol. Yang sebenarnya secara nyata salah
(kesalahan tipe II) , maka sangatlah masuk akal unutk menentukan probabilitas dari
kesalahan tipe pertama, rendah. Di sisi lain, apabila biaya melakukan kesalahan tipe 1
secara relatif lebih rendah terhadap biaya membuat kesalahan tipe II , maka akan
terbayarkan unutk membuat probabilitas dari kesalahn tipe pertama (sehingga
menyebabkan probabilitas dari kesalahan tipe kedua rendah)
tentu saja , kesulitannya adalah jarang sekali bagi kita unutk mengetahui biaya dalam
melakukan kedua tipe kesalahan . oleh karena itu, aplikasi dari ahli ekonometrika umumnya
mengikuti praktik dalam menentukan nilai α pada tingkat 1,5 atau maksimum 10 %.
Dan memilih sebuah statistik pengujian yang dapat membuat probabilitas dalam melakukan
kesalahan tipe II sekecil mungkin . oleh karena 1 dikurangi probabilitas dalam melakukan
kesalahan tipe II dikenal sebagai keuatan pengujian (power of the test) prosedur ini
bertujuan unutk memaksimalkan kekuatan pengujian (lihat lampiran A untuk mendiskusikan
kekuatan pengujian.
Untungnya, dilema yang ada saat ini memilih nilai α yang tepat dihindari menggunakan
dengan apa yang kita kenal sebagai nilai p dari uji statistik yang akan dibahas selanjutnya
Tingkat signifikasi paling tepat : nilai p
Seperti yang baru saja kita bahas , faktor yang melemahkan dari pendekatan klasik suatu
pengujian hipotesis merupakan keacakan dalam mimilih α. Ketika sebuah uji statistik (misal:
statistik) telah didapatkan dalam sebuah contoh, mmengapa kita tidak langsung saja menuju
kepada tabel statistik yang sesuai unutk mecari tahu probabilitas nyatanya sama besar atau
lebih besar dari uji statistik yang didapatkan dalam contoh? Probabilitas ini dikenal sebgai
nilai p) nilai probabilitas) atau dikenal juga sebgai tingkat signifikansi yang tepat atau
yang terboservasi maupun probabilitas yang tepat dalam melakukan kesalahan tipe I.
Secara teknis, nilai p didefinisikan sebagai tingkat signigikansi yang paling rendah, dimana
hipotesis nol tidak dapat ditolak.
Sebagai ilustrasi, mari kita mengacu kembali pada contoh kita, upah-tingkat pendidikan.
Berdasarkan hipotesis nol yang telah ada, koefisien sebenarnya dari tingkat pendidikan
adalah 0,5 kita dapatkan nilai t sebesar 3,2 dari Persamaan (5.7.4) keudian berapakah nilai p
dalam mendapatkan sebuah nilai t yang sama besar atau lebih besar dari 3,2?
Signifikansi statistik dibandingkan dengan signifikansi praktis
Perhatikan kembali contoh 3.1 dan hasil regresi yang diberikan dari persamaan (3.7.1)
regresi ini memberikan / menggambarkan hubugnan pengeluaran pengeluaran konsumsi
pribadi (PCE) dengan PDB , di amerika serikat (AS) periode 1960-2005 , keduanya diukur
dalam satuan miliar dolar harga konstan tahun 2000.
Dari regresi ini, kita akan melihat bahwa kecenderungan tambahan konsumsi (MPC) yaitu
konsumsi tambahan sebagai hasil dari tambahan pendapat (yang diukur dengan PDN)
sebesar 0,72 atau 72 sen . menggunakan data dalam persamaan (3.71.) pembaca dapat
membuktikan bahwa interval kepercayaan 95 persen untuk MPC adalah (0,7129;0,7306)
(catatan : oleh karena terdapat 44 df di dalam contoh ini, kita tidak memiliki nilai t kritis
yang tepat untuk nilai- nilai df tersebut. Dengan demikian, anda daoat menggunakan aturan
“2-t” untuk menghitung interval kepercayaan 95%)
Ketika ada sebuah hipotesis nol, katakanlah telah ditententukan bahwah β1=1 , akan benarbenar menimbulkan kesan bahwa β1 mendekati 1 sangat dekat sehingga unutk berbagai
tujuan penggunaan akan diperlakukan seolah nilainya benar-benar 1. Akan tetapi meskipun
1,1 nilai itu “ hampir sama secara praktis” demgam 1,0 dalam sudut pandang ekonomi ,
namun akan menjadi berbeda dalam sudut pandang statistika. Masalah tersebut tidak dapat
diselesaikan dengan mengacu pada pengujian hipotesis karena pengujian statistika [t=](b110/ óbj mengukur koefisien yang diestimasi dalam satuan standard error, unit yang tidak
dapat digunakan dalam mengukur penggunaan parameter ekonomi β1-1 . akan lebih banyak
menggunakan istilah “signifikan: dalam konsep statistik yang bermakna sama dengan istilah
“substatisial dalam konsep ekonomi.
Pilihan antara interval kepercayaand dan pendekatan pengujian signifikansi untuk
pengujian hipotesisd
Dalam sebagian aplikasi analisis ekonomi, penyusunan hipotesis nol dapat diibaratkan
sebagai pembuatan : orang-orang sawah” dan tujuan dari pembuktian empiris adalah untuk
“menjatuhkannya” yaitu untuk menolak hipotesis nol. Jadi, dalam contoh kita, pendapatan
konsumsi , hipotesis yang enyatakan bahwa MPC β2=0 menjadi tidak masuk akal, tetapi kita
sering kali menggunakan untuk mendramatisasi hasil empiris. Sepertinya, editor dari jurnal
yang memiliki reputasi menggngap bahwa tidak terlalu menarik unutk mempublikasikan
hasil penelitian empiris yang tidak menolak hipotessi no. Bagaimanapun, pembuktian bahwa
MPX secara statistik bukanlah nol jauh lebih penting dibandingkan dengan pembuktian
bahwa nilainya smma dengan , atakanlah 0,7
Oleh karena itu J.bradfor De long dan Kevin Lang berpendapat bahwa lebih baik bagi
ekonom jika:
Unutk berkonsentrasi dalam besar jiedisien dan mencari tingkat kepercayaan, serta buka
pengujian signifikansi. Jika semua atau hampir semua hipotesis nol salah, terdapat poin yang
berkonsentrasi dengan apakah sebuah estimasi tidak dapat dibedakan dari nilai prediksi
yang berasal dari hipotesis nol. Sebgai gantinya diharapkan dapat ditemujan model yang
dapat menjadi perkiraan yang baik, dengna jangkauan nilai parameter yang dikeluarkan oleh
estimasi empiris.
Siingkatnya, penulis/pengarang lebih suka menggunakan pendekatan interval kepercayaan
dibandingkan dengan pendekatan pengujian signigikansi. Hal ini harus diingat oleh siapapun
yang sedang mempelajarinya.
5.9 analisis regresi dan analisis varians
Dalam subbab ini kita akan mempelajari mengenai analisis regresi dari sudut panjang
analisis varian serta memperkenalkan cara unutk menjelaskan dan melengkapi pandangan
mengenai masalah pengambilan kesimpulan dalam statistika
Dalam bab 3 , subba 3.5 kita telah membentuk persamaan sebagai berikut:
Artinya bahwa TSS=ESS +RSS yang menguraikan total jumlah kuadrat (TSS) ke dalam dua
komponen :penjelasan atas jumlah kuadrat (ESS) dan jumlah kuadrat residual RSS sebuah
pemahaman mendalam engenai kompotnen TSS dikenal sebagai analisis varians.
Apabila digabungkan dengan setiap jumlah kuadrat ( sum of swuares) maka akan menjadi
df-nya yaitu jjumlah dari observasi terpisah yang menjadi dasar pembentuk YSS memiliki df
senilai n-1 ketika kehilangan 1 df ketika menghitung rerata sampel Y. ESS memiliki df n-2
(menganpa?)
Catatan : hal ini hanya berlaku unutk model regresi dua variabel dengan adanya tersep β 1.
Mari kita susun berbagai jum;lah kuadrat dan hubungannya denga df, yang ditunjukkan
dalam tabel 5.3 tabel ini merupakan bentuk standar dari batel OAV yang terkadang juga
disebut sebagai tabel ANOVA. Dengan menggunakan data pada tabel 5.3 selanjutnya
terdapat variabel 5.9.1
Apabila diasumsikan bahwa faktor gangguan ui terdistribusi secara normal yang dilakukan
sclassical normal linear regression model ( CNLRM) dan apabila hipotesis nol H0 adalah β2
maka dapat diitujikkan bahwa variabel F dari persamaan (5.9.1) mengikuti distribusi D
dengan dF 1 sebagai pembilang dan df (n-2)) sebagai penyebut. (lihat lampirran 5A.3 sebagai
pembuktian . sifat umum dari distribusi F dibahas dalam Lampiran A.
Tujuan penggunaan suatu sampel tidak boleh berasal dari sebuah populasi dengan nilai β 2
adalah nol dan tidak dapat disimpulkan dengan kepercayaan yang sangat tinggi bahwa X ,
tingkat pendidikan memengaruhi Y, rata-rata upah.
Mengacu pada teori 5.7 di lampiran 5A. Di lampiran 5A.1 yang dinyatakan bahwa hasil
kuadrat dari nilai t dengan df k merupakan sebuah nilai F dengan df 1 sebagai pebilang dan
df K sebagai penyebut. Unutk contoh kita, jika diasumsikan bahwa Ho: β2 =0 , kita dapat
dengan mudah membuktikan bahwa nilai t uyang diestimasi adalah 10,41 dari persamaan
5.3.2 nilai t ini memiliki df senilai 11 . sengan menggunakan hiptesis nol yang sama , nilai F
adalah 108,3026 dengan df1 dan 11. Oleh karena itu (10,34289)2 = nilai F kecuali untuk
pembulatan.
Jadi, pengujian t dan F memberikan dua alternatif yang saling melengkapi un tuk menguji
hipotesis nol bahwa β2=0, jika hal ini adalah masalah yang ingin diselesaikan mengapa tidak
hanya mengandalkan pengujian t tanpa perlu melakukan pengujian F. akan tetapi dalam
pembahasan mengenai analissi regresi majemuk , kita akan melihat bahwa uji F memiliki
beberapa aplikasi menarik yang membuatnya menjadi metode untuk pengujian hiptesis
statistik yang sangat berguna dan berpengaruh.
5.10 Aplikasi dari Analisis Regresi: Masalah Prediksi
Sebagai dasar dari data sampel pada Tabel 3.2, regresi sampel yang diperoleh sebagai
berikut :
di mana Yi merupakan estimator dari nilai sebenarnya E(Yi) dengan nilai X tertentu. Apakah
yang bisa dilakukan dengan regresi historis (historical regression) ini? Salah satunya adalah
untuk “memprediksi” atau “meramalkan” rerata upah Y di masa depan pada beberapa
tingkat pendidikan X. Saat ini, telah ada dua jenis prediksi : (1) prediksi nilai rerata bersyarat
dari Y pada X yang dipilih, katakanlah X0, yang merupakan titik dari garis regresi populasi itu
sendiri (Iihat Figur 2.2) dan (2) prediksi dari nilai individu Y pada X0. Kedua prediksi ini harus
dikatakan
sebagai
prediksi
rerata
(mean
prediction)
dan
prediksi
individu
(individualprediction).
Prediksi Rerata
Untuk menjelaskan topik ini, asumsikan bahwa X0 = 20, dan ingin membuat prediksi atas
E(Y| X0 = 20). Kini, topik ini dapat menggambarkan bahwa regresi historis pada Persamaan
(3.61) memberikan titik estimasi dari prediksi rerata sebagai berikut:
di mana Y0 estimator dari E(Y| X0). Hal ini membuktikan bahwa titik prediksi ini merupakan
sebuah estimator terbaik, linear, dan tidak bias (BLUE).
Oleh karena Y0 merupakan sebuah estimator, nilainya akan berbeda dari nilai sebenarnya.
Perbedaan di antara kedua nilai tersebut akan memunculkan pembahasan mengenai
prediksi atau forecast atas error. Untuk menilai error, kita perlu untuk mengetahui distribusi
sampel dari Y0. Hal ini ditunjulckan dalam Lampiran 5A, Bagian 5A.4 bahwa Y0 dalam
Persamaan (5.1O.1) terdistribusi secara normal dengan rerata (β1 + β2X0) dan Varians yang
diperoleh dari formula sebagai berikut :
Dengan menggantikan σ2 yang tidak diketahui dengan estimator tak bias σ’2, maka variabel
:
Mengikuti distribusi t dengan df n - 2. Distribusi t selanjutnya dapat digunakan untuk
melakukan turunan terhadap interval kepercayaan agar dapat menemukan nilai sebenarnya
dari E(Y| X0) dan pengujian hipotesis mengenainya melalui cara yang biasa digunakan,
menjadi,
di mana se(Y0) diperoleh dari Persamaan (5.10.2).
Untuk data kita (lihat Tabel 3.2),
Interval kepercayaan (berkas) untuk rerata Y dan nilai individu Y.
Jadi, dengan nilai X0 = 100, dalam sampling berulang, 95 dari 100 interval seperti dalam
Persamaan (5.10.5) akan mencakup nilai rerata sebenarnya; estimasi tunggal terbaik dari
nilai rerata yang berada pada titik estirnasi 14,4656.
Apabila kita mendapatkan interval kepercayaan sebesar 95% seperti pada Persamaan
(5.10.5) untuk setiap nilai X yang ada pada Tabel 3.2, maka akan diperoleh apa yang disebut
sebagai interval kepercayaan atau confidence band untuk FRP, seperti yang ditunjukkan
oleh Figur 5.6.
Prediksi Individual
Apabila tertarik untuk memprediksi nilai individu Y, yaitu Y0, pada sebuah nilai X tertentu,
katakanlah X0, maka seperti yang ditunjukkan oleh Lampiran 5A, Bagian 5A.4, sebuah BLUE
untuk Y0 juga berasal dari Persamaan (5.10.1), tetapi dengan varians sebagai berikut:
Lebih jauh dapat ditunjukkan bahwa Y0 juga mengikuti distribusi normal dengan rerata dan
varian yang secara berturut-turut diperoleh dari Persamaan (5.10.1) dan (5.10.6). Dengan
menyubstitusikan σ’2 untuk σ2 yang tidak diketahui, akan menjadi
yang juga mengikuti distribusi t. Oleh karena itu, distribusi t dapat digunakan untuk menarik
kesimpulan mengenai nilai sebenarnya dari Y0. Melanjutkan contoh kita, kita akan lihat
bahwa titik prediksi dari Y0 adalah 14,4656, sama dengan Y’0, dan varians-nya sebesar
1,2357 (penghitungan ini harus dibuktikan). Oleh karena itu, interval kepercayaan sebesar
95% untuk Y0 pada X0 = 100 akan menjadi
Membandingkan interval ini dengan Persamaan (5.10.5), akan terlihat bahwa interval
kepercayaan untuk Y0 individu lebih luas daripada nilai rerata Y0. (Mengapa?) Menghitung
interval kepercayaan seperti Persamaan bersyarat (5.10.7) dengan nilai X yang diberikan
oleh Tabel 3.2, kita akan memperoleh interval kepercayaan 95% untuk nilai individu Y pada
nilai X ini. Interval kepercayaan tersebut dengan interval kepercayaan Y’0 berkaitan dengan
X yang sama, seperti yang ditunjukkan oleh Figur 5.6.
Perhatikan sebuah ciri penting dari interval kepercayaan yang ditunjukkan oleh Figur5.6.
Lebar band ini memiliki nilai terkecil ketika X0 = X. (Mengapa?) Bagaimanapun, lebar band
ini akan menjadi semakin luas dengan cepat seiring X0 yang semakin menjauh, secara
progresif, dari X bar. Oleh karena itu, seseorang harus benar-benar memperhatikan saat
“meramalkan” garis regresi historis untuk memprediksikan E(Y I X0) atau Y0 yang terkait
dengan nilai X0 yang telah dipindahkan jauh dari rerata sampel, X bar.
5.11 Melaporkan Hasil dari Analisis Regresi
Ada berbagai cara untuk melaporkan hasil dari analisis regresi, tetapi dalam buku ini akan
digunakan pola berikut, menggunakan contoh upah-tingkat pendidikan dari Bab 3 sebagai
ilustrasi:
Dalam Persamaan (5.11.1), bilangan yang berada dalam kelompok bertanda kurung pertama
adalah estimasi standard error dari koefisien regresi, bilangan dalam tanda kurung kedua
adalah nilai estimasi t hitung dari Persamaan (5.3.2) di bawah hipotesis nol yang
menyatakan bahwa nilai populasi sebenarnya dari setiap koeflsien regresi individu adalah
nol (misal: 10,3428 = 0,7240/0,0700), dan bilangan dalam kelompok ketiga adalah estimasi
dari nilai p. Jadi, untuk df 11, probabilitas dari memperoleh nilai ttsebesar 10,3428 atau
lebih, secara praktis, adalah nol.
Dengan menyajikan nilai p dari koefisien tyang diestimasi, dapat kita ketahui tingkat
signifikansi yang tepat dari setiap nilai t yang diestimasi. Jadi, di bawah hipotesis nol yang
menyatakan bahwa nilai kemiringan populasi yang sebenarnya adalah nol (misal: tingkat
pendidikan tidak memengaruhi rerata upah), probabilitas yang tetap untuk mendapatkan
nilai t sebesar 10,3428 atau lebih, secara praktis, adalah nol. Tetap diingat bahwa
semakinkecil nilai p, semakin kecil probabilitas untuk melakukan kesalahan jika kita menolak
hipotesis nol.
Sejak awal, telah ditunjukkan bahwa ada hubungan yang sangat dekat antara nilai Fstatistik
dan t statistik, yaitu F1,k( = t2k. Di bawah hipotesis nol bahwa β2 = 0, Persamaan (5.11.1)
menunjukkan bahwa nilai F adalah 108,30 (df untuk pembilang adalah 1 dan df untuk
penyebut adalah 11) dan nilai t adalah 10,34 (df 11); seperti yang diekspektasikan, nilai yang
terbentuk adalah kuadrat nilai terakhir, kecuali untuk pembulatan. Tabel ANOVA untuk soal
ini telah dibahas sebelumnya.
5.12 Mengevaluasi Hasil Analisis Regresi
Dalam Figur P.4 di Bagian Pendahuluan, kita menyajikan sketsa anatomi model
ekonometrika. Sekarang, setelah kita jelaskan hasil analisis regresi dari contoh upah-tingkat
pendidikan dalam Persamaan (5.11.1), selanjutnya kita akan mempertanyakan mengenai
kelengkapan dari model yang paling sesuai. Sebaik apakah model yang sesuai? Diperlukan
beberapa kriteria untuk menjawab soal ini.
Pertama, apakah tanda dari koefisien estimasi sesuai dengan teori atau ekspektasi yang
terlebih dahulu dibuat? Dalam Studi sebelumnya, β2 dalam contoh upah-tingkat pendidikan
seharusnya positif. Dalam contoh yang telah disajikan, hal ini telah dibuktikan. Kedua, jika
statistik, apakah hal ini tersebut telah terpenuhi dalam aplikasi ini? Seperti yang telah
dibahas dalam Subbab 5.11, koefisien tingkat pendidikan tidak hanya bernilai positif, tetapi
secara statistik signifikan terbukti bukanlah nol; nilai p dari nilai tyang diestimasi sangatlah
kecil. Hal yang sama juga diaplikasikan dalam koefisien intersep. Ketiga, sebaik apakah
model regresi menjelaskan variasi dalam contoh kita? Konsep r kuadrat dapat digunakan
untuk menjawab pertanyaan ini. Dalam contoh yang telah disajikan, nilai r kuadrat sekitar
0,90 adalah nilai yang sangat tinggi mengingat nilai tertinggi dari r kuadrat adalah 1.
Jadi, model yang telah dipilih untuk menjelaskan rerata upah sepertinya cukup baik. Akan
tetapi, sebelum meninggalkan topik ini, kita sebaiknya mengetahui apakah model yang telah
dipilih-telah memenuhi asumsi CNLRM. Tidak diperlikan banyakasumsi karena model ini
sebenarnya cukup sederhana. Namun demikian, ada satu asumsi yang harus diuji, yakni uji
normalitas faktor gangguan, ui. Ingat kembali bahwa penggunaan uji tdan F sebelumnya
mengharuskan faktor kesalahan mengikuti distribusi normal. Sebaliknya, prosedur pengujian
tidak akan valid dalam sampel yang kecil atau terbatas.
Uji Normalitas (Normality Tests)
Walaupun beberapa uji normalitas telah dibahas dalam referensi, terdapat tiga hal yang
harus diperhatikan: (1) histogram residual, (2) pola/plot probabilitas normal (normal
probability plot-NPP), yang digambarkan dalam grafik , dan (3) uji normalitas Jarque-Bera
(JB).
Histogram Residual
Histogram residual adalah sebuah grafik sederhana yang digunakan untuk mempelajari
bentuk fungsi densitas probabilitas (PDF) darisebuah variabel acak. Pada garis horizontal,
nilai dari variabel yang ingin dicari (misal: residu (DLS) dibagi ke dalam interval yang sesuai,
dan di setiap kelas interval dibentuk bujur sangkar dengan tinggi yang sama dengan jumlah
observasi pada kelas interval (misal: frekuensi). Apabila dalam pikiran telah membayangkan
bentuk lonceng (bell-shaped) dari kurva distribusi normal dalam histogram, maka kita akan
memperoleh gambaran apakah perkiraan (PDF) normal akan sesuai. Untuk regresi upahtingkat pendidikan, histogram residual ditunjukkan pada Figur 5.7.
Diagram ini menunjukkan bahwa residual tidak secara sempurna terdistribusi normal; untuk
sebuah variabel yang terdistrbusi secara normal, skewness-kemiringan (ukuran simetri)
seharusnya bernilai 0 dan kurtosis-keruncingan (yang mengukur seberapa tinggi atau
pendek kurva distribusi normal tersebut) dari kurva seharusnya bernilai 3.
Namun demikian, hal ini merupakan praktik yang baik untuk membuat histogram residual
regresi apa pun karena merupakan metode yang dapat digunakan (“kasar”) untuk menguji
asumsi normalitas.
Pola Probabilitas Normal
Sebuah grafik pembanding sederhana untuk mempelajari mengenai bentuk PDF dari sebuah
variabel acak adalah NPP yang menggunakan normal probability paper, sebuah kertas grafik
yang dirancang secara khusus. Untuk sumbu horizontal, atau X, dibuat bagan nilai dari
variabel yang ingin diketahui (katakanlah, residu OLS, ui) dan pada sumbu vertikal, atau
akan ditunjukkan nilai ekspektasi dari variabel jika memiliki distribusi normal. Oleh karena
itu, jika variabel benar-benar berasa dari populasi normal, NPP akan mendekati sebuah garis
lurus. NPP residual dari regresi contoh upah-tingkat pendidikan ditunjukkan pada Figur 5.8,
yang diperoleh dari paket software MINITAB versi 15. Seperti yang telah dijelaskan
sebelumnya, apabila garis yang sesuai dengan NPP mendekati garis lurus, maka dapat
disimpulkan bahwa variabel yang ingin dicari terdistribusi secara normal. Pada Figur 5.8, kita
akan melihat bahwa residual dari contoh ilustrasif mendekati distribusi normal karena
sebuah garis lurus akan menyesuaikan data dengan baik.
MINITAB juga menyediakan uji normalitas Anderson-Darling, yang juga dikenal sebagai uji A
kuadrat statistik. Hipotesis nol yang berlaku menunjukkan bahwa variabel yang ingin
diketahui memiliki distribusi normal. Seperti yangditunjukkan dalam Figur 5.8, sebagai
contoh, perhitungan atas A2 statistik adalah 0,289 Kita memperoleh nilai p dari A2 adalah
O,558; merupakan angka yang cukup tinggi. Oleh karena itu, kita tidak akan menolak
hipotesis yang menggambarkan bahwa residual dari contoh ilustratif kita memiliki distribusi
normal. Secara kebetulan, Figur 5,8 menunjukkan parameter dari distribusi normal, dengan
nilai rata-rata mendekati nol dan standar deviasi sekitar 0,8987.
Uji Normalitas Jarque-Bera (JB)20
Uji Normalitas Jarque-Bera (JB) adalah sebuah asimtotik atau pengujian dengan sampel
berukuran besar. Hal ini juga didasarkan pada residual OLS. Pengujian ini diawali dengan
menghitung skewness dan kurtosis (yang dibahas dalam Lampiran A) yang mengukur
residual OLS dan menggunakan pengujian statistik:
di mana n = ukuran sampel, S = 2 koefisien skewness, danK= koefisien kurtesis. Untuk
variabel dengan distribusi normal, S = 0 dan K = 3. Oleh karena itu, uji normalitas JB
merupakan pengujian dari hipotesis bersama, di mana S dan K, secara berturut-turut, adalah
0 dan 3. Dalam kasus ini, nilai dari JB statistik diekspektasikan bernilai 0.
Di bawah hipotesis nol, residual memiliki distribusi normal, Jarque dan Bera menunjukkan
bahwa JB statistik dalam Persamaan (5.12.1) mengikuti distribusi chi-square dengan df2
secara asimtotik (misal: dalam sampel berukuran besar). Jika nilai p yang dihitung dalam
aplikasi JB statistik cukup rendah-hal yang akan terjadi apabila nilai statistiknya bukanlah 0seseorang dapat menolak hipotesis yang menyatakan bahwa residual terdistribusi secara
normal. Akan tetapi, jika nilai p cukup tinggi-hal yang akan terjadi jika nilai statistiknya
mendekati nol-asumsi normalitas tidak akan kita tolak.
Untuk contoh kita, upah-tingkat pendidikan, JB statistik yang diestimasi adalah 0,8286.
Hipotesis nol yang menyatakan bahwa residual pada contola berikutnya terdistribusi secara
normal tidak dapat ditolak, untuk nilai p sekitar 0,66 atau 66 persen; saat mendapatkan JB
statistik sebesar 0,8286 atau lebih. Probabilitas ini cukup tinggi. Perhatikan bahwa,
walaupun regresi kita memiliki 13 observasi, observasi tersebut diperoleh dari sebuah
sampel yang terdiri atas 528 observasi, di mana hal ini terlihat cukup tinggi.
Jika rumus dari JB diaplikasikan ke dalam contoh ini, JB statistik akan bernilai 0,7769. Nilai p
diperoleh dari distribusi chi-square dengan df 2 adalah 0,68, yakni nilai yang cukup tinggi.
Dengan kata lain, asumsi normalitas untuk contoh ini dapat ditolak. Tentu saja, harus
diperhatikan mengenai ukuran sampel.
Pengujian Lain dari Model Lengkap
lngatlah bahwa CNLRM membuat lebih banyak asumsi dibandingkan normalitas faktor
kesalahan.
Sebagaimana
pendalaman
atas
teori
ekonometrika
lebih
jauh,
beberapapengujian dari model yang sesuai (lihat Bab 13) akan diperhatikan. Setelah itu,
tetaplahingat bahwa model regresi berasal dari asumsi sederlaana yang tidak al<an berlaku
di setiap kasus permasalahan.
Sebuah Contoh yang Menyimpulkan
Mari kembali ke Contoh 3.2, pengeluaran untuk makanan di India. Menggunakan data yang
diberikan pada Persamaan (3.72) dan memakai format dari Persamaan (5.11.1), akan
diperoleh persamaan pengeluaran sebagaiberikut :
di mana * melambangkan angka yang sangat kecil; = pengeluaran makanan; dan T.Expi =
total pengeluaran.
Pertama, interpretasikan regresi ini. Seperti yang telah diekspektasikan, terdapat hubungan
positif antara pengeluaran untuk makanan dan pengeluaran total. Iika pengeluaran total
diukur dalam mata uang satu rupee, secara rata-rata, pengeluaran untuk makanan
meningkat sekitar 44 paise. Jika pengeluaran total adalah nol, pengeluaran rata-rata untuk
makanan adalah sekitar94 rupee, Tentu saja interpretasi dari intersep ini tidak begitu
banyak memiliki makna ekonomi.
Nilai r kuadrat sekitar 0,37 menunjukkan bahwa 37% dari variasi dalam pengeluaran untuk
makanan dijelaskan oleh pengeluaran total, yang sangat bergantung pada pendapatan.
Anggap bahwa kita ingin melakukan pengujian atas hipotesis nol yang menyatakan bahwa
tidak ada hubungan antara pengeluaran untuk makanan dan pengeluaran total, maka
koefisien sebenarnya dari kemiringan β2 = O. Nilai β2 yang diestimasi adalah 0,4368. Jika
hipotesis nol benar, berapakah probabilitas untuk memperoleh nilai0,4368? Di bawah
hipotesis nol, observasi yang kita lakukan atas Persamaan (5.12.2) menunjukkan bahwa nilai
t adalah 5,5770 dan nilai p untuk memperoleh nilai t tersebut adalah nol. Dengan kata lain,
hipotesis nol langsung dapat ditolak. Akan tetapi, jika hipotesis nol menyatakan bahwa β2 =
0,5. Maka, apa yang terjadi? Dengan menggunakan uji t, kita peroleh :
Probabilitas dari memperoleh nilai |t| senilai 0,8071 adalah lebih dari 20%. Akibatnya,
hipotesis yang menyatakanβ2 = 0,5 tidak Clitolak.
Perhatikan bahwa di bawah hipotesis nol, koefisien kemiringan yang sebenarnya adalah nol
dan nilai F adalah 31,1034, seperti yang ditunjukkan oleh Persamaan (5.12.2). Di bawah
hipotesis nol yang sama, kita akan peroleh nilai t sebesar 5,5770. Iika nilai ini dikuadratkan,
nilai t yang diperoleh adalah 31,029, yang hampir sama dengan nilai F. Sekali lagi, hal
tersebut menunjukkan adanya hubungan yang dekat antara nilai statistik t dan F. (Catatan:
Pembilang df untuk statistik F haruslah 1, seperti yang terjadi dalam soal ini).
Menggunakan residual yang diestimasi dari regresi, apakah yang dapat kita katakan
mengenai-probabilitas distribusi dari faktor kesalahan? Informasi ini diberikan pada Figur
5.9. Seperti yang telah ditunjukkan oleh Figur 5.9, residu dari regresi atas pengeluaran
makanan terdistribusi secara simetris. Pengaplikasian dari uji Jarque-Bera menunjukkan
bahwa JB statistik adalah 0,2576 dan probabilitas untuk memperoleh nilai tersebut terletak di bawah asumsi normal adalah 88 persen. Oleh karena itu, hipotesis bahwa faktor
kesalahan memiliki distribusi normal akan ditolak. Namun demikian, ingatlah bahwa ukuran
sampel dari 55 observasi tidaklah begitu besar.
Download