Kelompok 5 Nama : 1. Bumi Zulhendra Herman 2. Laen Sugi Rante Tandung 3. Harimurty Rusli REGRESI DUA VARIABEL: ESTIMASI INTERVAL DAN PENGUJIAN HIPOTESIS Hati-hati dala pengujian hipotesis yang terlalu banyak, semakin banyak data yang anda “siksa” semakin besar kemungkinan mereka akan memberikan “pengakuan”namun pengakuan yang didapatkan di bawah tekanan, keungkinan tidak akan dapat diterima dalam pengadilan pendapat keilmuan. Seperti yang telah ditunjukkan dalam bab.4 , estimasi pengujian hipotesis terdiri atas dua cabang statistik klasik . teori estimasi terdiri atas dua bagian “ estimasi titik dan estimasi interval(interval estimation). Kita telah membahas estimati titik secara mendalam dalam dua bab sebelumnya, dimana kita memperkenalkan metode ordinary least square (OLS) dan maximum likehood(ML) pada estimasi titik. Pada bab ini, pertama kita akan mempertimbangkan estimasi interval untuk kemudian mengangkat topik pengujian hipotesis, sebuah topik sangat berkaitan erat dengan estimasi interval. 5.1persyaratan Statistik Sebelum kita mendemonstrasikan mekanisme sebenarnya dalam embangun interval kepercayaan dan menguji hipotesis secara statistik , diasumsikan bahwa pembaca terlah mengenali konsep dasar probabilitas dalam statistik. Walaupun bukan pengganti dari pelajaran statistik . Lampiran A mengajikan ini dari statistik yang seharusnya, konspe-konsep secara menyeluruh telah dikenal dengan baik oleh pembaca. Konsep kunci, seperti probabilitas, kesalahan tipe I dan tipe II, tingkat signifikansi, kekuatan uji statistik dan interval kepercayaan sangatlaghh penting bagi kita semua untuk memahami bahan-bahan yang dibahas dalam bab ini dan dalam bab-bab selanjutnya. 5.2 estimasi interval : beberapa ide mendasar Untuk menetapkan ide mengenai hal ini, kita kembali pada contoh upah-tingkat pendidkan dalam bab 3. Persamaan (3.6.2) menunjukkan bahwa peningkatan rerata upah perjam berhunungan dengan peningkatan tingkat pendidikan satu tahun( β2-δ2. Β+ δ) mengandung β2yang sebenarnya . yaitu 1-α secara simbolis Pr (β2- δ≤ β2≤β2+δ=1-α Interval seperti itu , jika ada diokenal sebagai interval kepercayaan: 1-α dikenal sebagai koefisien kepercayaan. Dan α(0< α<1) dikenal sebagai signifikansi/ tingkat kepercayaan. Kedua titik ujung dari interval kepercayaan dikenal sebagai batasan kepercayaan )- batas kepercayaan juga dikenal sebagai nilai kritis β2-δ berfungsi sebagi batas kepecayaan bawah dan β2+δ dikenal sebagai batas kepercayaan atas. Sambil lalu , pertikan bahwa pada praktiknya 1-α sering kali diekspresikan dalam bentuk presentase , yaitu 100α dan 100(1α)persen. Persamaan (5.2.1) menunjukkan bajwa sebuah estimator interval, dibandingkan dengan estimator titik, adalah sebuah interval uyang membangun dalam sebuah keadaan dengan probabilitas tertentu, 1-α , dimana di dalamnya dan diantara kedua batasannya, terkandung nilai sebenarnya dari parameter. Sebagai conyoh, jikaα=0.05 atau 5% dari persamaan (5.2.1) kita dapat membacanya sebagai berikut : Probabilitas yang ditunjukkan dari interval (acak) tersebut mengandung nilai B2 yang sebenarnya adalah sebesar 0,95 atau 95%. Oleh karena itu, estimator interval memberikan rentang nilai, dimana nilai yang sebenarnya dari β2 mungkin tidak sebenarnya. Sangatlah penting untuk mengatahui aspek aspek dari estimasi interval berikut ini : 1. Persamaan (5.2.1) tidak menyatakan mengenai probabilitas, dari β2 yang verada di antara batasan yang diberikan yaitu 1-α walaupun tidak diketahui, β2 diasumsikan merupakan besaran angka yang tetap meskipun berada di antra interval atau tidak.persamaan (5.2.1) menyatakan bahwa untuk metode yang dijelaskan dalam bab ini, probabilitas untuk mmengembangkan sebuah interval yang mengandung nilai nyata dari β2 ada;ah sebesar 1- α. 2. Interval dari persamaan (5.2.1) merupakan interval acak yaitu akan bervariasi nilainya dari satu sampel terhadap sampel lainnya karena dibuat berdasarkan β2 yang juga versifat acak (mengapa?) 3. Oleh karena interval kepercayaan bersifat acaj, pernyataan probabilitas yang melekat padanya harus diartikan dalam. Secara jangka panjang , yaitu sampling berulang. Lebih spesifik lagi, persamaan (5.2.1) memberikan arti : apabila dalam sampling berulang , interval kepercayaan seperti itu dibvuat berkali-kali dalam julah yang besar dengan probabilitas 1- α , maka dalam jangka panjang ,secara rata-rata terdapat parameter 1- α nilai nyata yang terdapat dalam kasus sampling berulang tersebut. 4. Seperti yang dinyatakan dalam bab 2, interval pada persamaan (5.2.1) bersifat acak selama β2 tidak diketahui, tetapi apabila sekali saja kita memiliki sebuah sampel yang spesifik dan mendapatkan sebuah nilai angka spesifik dari β2maka interval dalam persamaan (5.2.1) tidak lagi bersifat acaj. Dia bersifat tetap. Dalam kasus ini kita tidam dapat membuat pernyataan probabiitas pada persamaan(5.2.1) yaitu kita tidak dapat mengatakan bahwa probabilitas dalam sebuah interval yang tetap terkandung nilai β2adalah 1- α . dalam situasi ini β2 terdapat dalam interval yang tetap berada di luar interval tersebut. Oleh karena itu, probabilitas adalah 1 atau 0. Jadi , untuk contoh upah-tingkat pendidikan hipotesis kita, apabila interval keperdayaan yang didapatkan sebesar 95 % (0,5700≤ β2≤0.8780) seperti yang ditunjukan secara singkat dalam persamaan (5.3.9) maka kita tidak dapat mengatakan bahwa 95% probabilitasnya adalah bahwa dalam interva tersebut terdapat nilai yang sebenarnya dari β2 probabilitasnya adalah 1 atau 0. Lalu bagaimaan inteval kepercayaan ini dibentuk? Dari pembahasan yang telah dilakukan terlebih dahulu, seseorang mungkin mengharapkan jika distribusi sampling atau distribusi probabilitas dari estimator telah diketahui, seseorang dapat membuat pernyataan interval kepercayaan seperti yang terdapat dalam prsamaan (5.2.1) dalam bab 4, kita telah melihat di bawah asumsi kenormalan dar sebuah gangguan u i , estimator OLSβ1 dan β2 juga didistribusikan normal dan estimator OLS δ2 berhubungan dengan distribusi X2 (chi square) dengan demikkian, akan terlihat bahwa seolah-olah tugas untuk membentuk interval kepercayaan adalah sebuah tugas yang sangat sederhana. Dan memang benar! 5.3 INTERVAL KEPERCAYAAN UNTUK KOEFISIEN REGRESI β1 dan β2 Interval kepercayaan untuk β2 Seperti yang telah ditunjukkan dalam bab 4, subbab 4.4 bahwa dengan asumsi kenormalan untuk Up estimator β1 dan β2 dengan sendirinya terdistribusi secara normal rerata dan varian yang juga mengikuti . oleh karena itu sebagai contoh variabel Seperti yang tedapat dalam persamaan (4.3.6) variabel tersebut merupakan variabel normal yang terstandarisasi (standardized normal variabel). Oleh karena itu, tampak seolah-olah kita dapat menggunakan distribusik normal unutk membentuk pernyataan probabilitas mengenai β2 . dengan kondisi varians ó2 yang diketahui jika ó2 diketahui sebuah sifat utama variabel yang didistribusikan secara normal dengan rerata µ dan varians ó2 alah daerah di bawah kurva normal di antara batasan µ+2 óadalah 68 persen, daerah yang terletak di antara batasan µ±2 ó sebesar 95 persen, dan daerah yang terletak antara µ±3ósebesar 99,7 persen. Namun demikian ó2 jarang sekali diketahui dan pada praktiknya ditentukan oleh estimator ó2yang tidak boas. Apabila kita menggantikan ódengan ó^ maka persamaan (5.3.1) dapat ditulis sebagai: Dimana Se(β2) kini mengacu pada standar error yang terestimasi. Dapat dilihat (lihat lampiran 5A . 2) bahwa variabel t bisa didefinisikan mengikuti distribusi t dengan derajat bebas (df) , n-2 [ Perhatikan perbedaan atanra persamaan (5.3.1) dan (5.3.2]. oleh karena itu, selain menggunakan distribusi normal, kita dapat menggunakan distribusi t unutk membentuk interval kepercayaan untuk β2 sebagai berikut: Di mana nilai t yang terdapat dalam pertidaksamaan ganda ini merupakan nilai t yang dihasilkan dari persamaan (5.3.2) dan tα/2 adalah nilai dari variabel t yang didapatkan dari distribusi t untuk tingkat kepercayaan α/2 dan df n-2 yang sering kali disebut juga sebagai nilai t kritis pada tingkat signifikasi α/2. Substitusi dari persamaan (5.3.2) ke persamaan 5.3.3 menghasilkan Apabila kita atur kembali persamaan 5.3.4 maka kita dapatkan Persamaan (5.3.5) menyediakan 100(1- α) persen interval kepercayaan untuk β2 yang dapat dituliskan secara lebih sederhana sebagai 100- (1-α)% interval kepercayaan untuk β2: dan lebih sederhana lagi 100- (1-α)% interval kepercayaan untuk β1: Perhatikan pentingnya fitur dari intaerval kepercayaan yang diberikan pada persamaan 5.3.6 dan (5.3.8) pada kedua kasus itu, rentang lebar dari interbal kepercayaan proporsional terhadap standard error dari estimator. Di mana , semakin besar standard error semakin rentang lebal interbal kepercayaan, atau jika kita ubah cara pandang kita, semakin besar standard error dari simolator , semakin besar ketidakpastiaan dalam mengestimasi nilai sebenarnya dari parameter yang tidak diketahui tersebut . jadi , standard error dari estimator sering kali dijelaskan sebagai ukuran keakuratan dari estimator (seberapa tepat ukuran estimator dari nilai populasi sebenarnya)pada contoh regresi kita lam bab 3 (subbab 3.6t) tentang rerata upah per jam (Y) terhadap tingkat pendidikan (X) , ingat kembali kita menemukan pada tabel 3.2 bahwa β2=0,7240; se(β^2)=0,0700. Oleh karena itu terdapat 12 observasi df adalah 11. Apabila kita mengasumsikan α adalah 5% atau koefisien kepercayaan sebesar 95% maka tabel t menunjukkan bahwa untuk df=11 tα/2 =2,201 . dengan menyubstitusikan nilai-nilai ini ke dalam persamaan (5.3.5) pembaca dapat membuktikan interval kepercayaan 95 % sebagai berikut: 0.5700≤ β2≤0,8780 (5.3.9) Atau dengan menggunakan (5.3.6) adalah 0,7240±0,1540 (5.3.10) Interprestasi dari interval kepercayaan adalah: bedasarkan koefisien kepercayaan sebasar 95% , 95 dari 100 kasus interval, seperti persamaan (5.3.9) akan mengandung nilai yang sebenarnya dari β2 , akan tetapi seperti yang telah diingatkan sebelumnya, ktia tidak dapat menyatakan bahwa probabilitas interval spesidik dari persamaan (5.3.9) , dimana mengandung nilai sebenarnya dari β2 adalah sebesar 95%, sebab interval ni tetpa dan tidak lagi acak. Sehingga β2 terletak dalam interval tersebut atau tidak. Probabilitas dari sebuah interval yang telah ditetapkan dan terkandung di dalamnya adala β2 adalah 1 atau 0. Mengikuti persamaan (5.3.7) dan data pada tabel 3.2 pembaca dapat dengan mudah membuktikan bahwa 95 persen interval kepercayaan unuk β1 untuk contoh kita adalah -1,8871 ≤ β1≤ 1,8583 (5.3.11) Lalu, anda sebaiknya berhati-hati dalam mengiterprestasikan interval kepercayaan ini. Dalam 95 dari 10 kasus, interval seperti persamaan 5.3.11 akan mengandung nilai yang sebenarnya dari β1; probabilitas dari interval tetap khusus ini yang terkandung nilai sebenarnya dari β1 adalah 1 atau 0. Interval kepercayaan untuk β1 dan β2 secara simultan Terdapat wakut ketika seseorang memerlukan untuk membuiat interval kepercayaan bersama (joint confidence iunterval) untuk β1 dan β2 adalah sebuah koefisien kepercayaan (1-α), katakanlah 95 % , bahwa interval mengandung β1 dan β2 secara simultan . oleh karena topik ini dilibatkan. Pembaca tertarik mungkin ingin mengusulkan referensi-refrensi yang sesuai. Kita akan membahas kembali topik ini dalam bab 8 dan 10. 5.4 INTERVAL KEPERCAYAAN UNTUK ó2 Seperti yang ditunjukkan pada bab 4, subbab 4.3 dibawah asusi kenormalan, variabel Mengikuti distribusi x2 dengan f n-26 . oleh karena itu , ktia dapat menggunakan distribusi X2 untuk membentuk sebuah interval kepercayaan untuk ó2 Dimana nilai x2 berada di tengah-tengah kedua pertidaksamaan yang diberikan pada persaman (5.4.1)di mana x21-α/2 dan X2α/2 adalah dua nilai dari X2, seperti yanf terlihat pada figure 5.1 Dengan menyubstitusikan X2 dari persamaan (5.4.1) ke persamaan (5,.4.2) dan dengan mengatur sedemikian rupa, kita dapatkan Yang memberikan interval kepercayaan seberas 100 (1-α) untuk ó2 Melanjutkan dengan contoh tingkat upah pendidikan. Kita peroleh dari tabel 3.2. bahwa untuk data kita kita mendapatkan ó2 = 0,8936 . jika kita menentukan α sebesar 5%, X20,975= 3,8157 . nilai ini menunjukkan bahwa probabilitas sebuah nilai chi-square yang melebihi 21,9200 adalah 2,5 persen dan yang melebihi 3,8157 adalah 95 persen. Oleh karena itu, interval di antara kedua nilai inin adalah interval kepercayaan untuk X 2 , seperti yang digambarkan pada figur 5.1 (perhatikan karakterisktik distribusi X2 pada kurva) Dengan menyubstitusikan data dari contoh kita ke persamaan (5.3.4) pembaca dapat membuktikan bahwa interval kepercayaan 95 % untuk ó2 adalah sebagai berikut 0,4484≤ ó2 ≤2,5760 Interprestasi dari interval adalah: apabila kita membuat batasa kepercayaan 95 persen untuk ó2 dan apabila kita mempertahankan perkiraan awal kita bahwa dalam batasan ini terdapat nilai sebenarnya dari ó2 maka 95% dari perkiraan kita dalam hangka panjang dan seterusnya akan benar. 5.5 pengujian hipotesis umum : komentar umum Setelah membahas permasalahan estimasi titik dan estimasi interval, sekarang saatnya kita membahas topik pengujian hiptesis. Pada subbab ini, kita akan membahas secara menyeluruh mengenai beberapa aspek umum dari topik ini. Lampiran A memberikan beberapa penjalasan tambahan. Permasalahan dalam pengujian hipotesis statistik dapat dinyatakan secara sederhana sebagai berikut : apakah sebuah pengamatan atau penemuan sesuai dengan beberapa hipotesis yang dinyatakan atau tidak? Kata “sesuai” seperti yang digunakan dalam kalimat tersebut berarti “cukup” mendekati nilai hipotesis sehingga kita tidak perlu menolak pernyataan yang dihipotesikan. Jadi, jika beberapa teori atau pengalaman sebeumnya membawa kita kepada sebuiah kepercyaan bahwa koefisien kemiringan β2 dari contoh upah-tingkat pendidikan adalah tak terhingga, apakah β2 =0,724 yang dinyatakan dari sampel pada tabel 3,2 konsisten dengan hipotesis yang dinyatakan ? jika ya, kita tidak akan menolak hipotesisnya, jika sebaliknya kita dapat menolaknya. Dalam pembahasan statistika, hipotesis yang dinyatakan dikenal sebagai hipotesis nol (null hypothesis) dan dilambangkan dengan simbol Ho. Hipotess nol biasanya dilawankan pengujiananya terhadap hipotesis alternatif-hipotesis yang dipertahankan (alternative hypothesis) yang dilabahngkan dengan H1 ; β2 =1.5 adalah hipotesis sederhana, tetapi pernyataan H1: β2 adalah hipotesis komposit. Teori pengujian hipotesis memberikan perhatian pada pengembangan peraturan atau prosedur dalam menentukan apakah perlu untuk menolak atak tidak menolak hipotesis nol. Terdapat dua pendekatan komplementar yang berkaitan untuk melengkapi peraturan tersebut yang disebut interval kepercayaan dan pengujian signifikansi. Kedua pendekatan ini membuat prediksi bahwa variabel (statistik maupun estimator) yang sedang dibahas memiliki distribusi probabilitas dan pengunjian hipotesis yang melibatkan dalam pembuatan pernyataan atau perkiraan mengenai nila(-nilai)- dan parameter (-parameter) dari sebuah distribusi, sebagai contoh, kita mengetahui bahwa dengan asumsi kenormalan β 2 juga didistribusikan secara normal dengan rerata yang sama β2,=1 , kita sedang membuat sebuah pernyataan mengenai salah satu paramter dari distribusi normal, lebih tepat lagi rerata. Sebagian besar hipotesis statistik yang ditemui dalam buku ini cenderung pada tipe seperti yang telah dijelakan sebelumnya-memmbuat pernyataan mengenai satu atau lebih nilai parameter dari beberapa distribusi probabilitas yang diasumsikan, seperti F,t,atau X2 . bagaimana perolehan hasilnya akan di bahas pada dua subab selanjutnya. Pengujian hipotesis : pendekatan interval kepercayaan Pengujian dua arah atau pengujian dua ekor Untuk memberikan penjelasan mengenai pendekatan interval kepercayaan , sekali lagi kita akan melihat kebali pada contoh upah-tingkat pendidikan dari hasil regresi yang ditentukan oleh persmaaan (3.6.1) kita mengetahui bahwa koefisien keminringan adalah 0,7240 . anggap kita menetapkan bahwa: Di mana –berdasarkan hipotesis nol nilai yang sebenarnya dari koefisien kemiringan adalah 0,5 tetapi koefisien kemiringan dinyatakan dalam hipotesis alternatif bernilai lebih kecil atau lebih besar dari 0,3 . hipotesis nol adalah hipotesis sederhana , sedangkan hipotesis alternatif bersifat komposit ,yang sebenanrya yang dikenal sebagai hipotesis dua arah . sering kali hipotesis alternatif yang bersifat dua arah ini mencerminkan kenyataan bahwa kita sebenanrya tidak memiliki perkiraan awal atau eskpektasu secara teoritis mengenaik ke maknakah seharusnya arah pergerakan hipotesis alternatif ini dari hipotesis nol. Apakah β2 yang telah diobservasi sesuai dengan Ho nya? Unutk menjawab pertanyaan ini, mari kita merujuk pada interval kepercayaan dalam persamaan (5.3.9) kita ketahui bahwa dalam jangka panjang , beberapa interval seperti (0,5700;0,8780) mengandung nilai dari β2 yang sebenarnya, dengan probabilitas 95 %. Bersamaan dengan itu, dalam jangka panjang (misal: sampling berulang ) interval seperti itu menyediakan sebuah rentang atau batasan, dimana β2 nyata terdapat di dalamnya koefisien kepercaaaan . katakanlah sebesar 95%. Jadi, interval kepercayaan memberikan sekelompok hipteiss nol yang memungkinan . oleh karena itu, jika β2 nyata terdapat di bawah Ho terdapat di antara interval kepercayaan 100(1-α)% kita tidak akan menolak hipotesis nol : namun demikian jika terletak di luar interval . kita mungkin akan menolaknya rentang ini diilustrasikan secara skematis dalam figur 5.2 aturan pengambilan keputusan : buatlah interval kepercayaan 100 (1-α)% untuk β2 jika β2 yang berada di bawah Ho nerada di antara interval keperdcayaan ini, kita tidak akan menolak Ho. Namun demikikan jika terletak di luar interval ini, kita akan menolak Ho. Dengan mengikuti aturan ini, untuk contoh hipotesis Kita Ho:β2= 0,3 jelas b ke[erada di luar interval kepercayaan 95% yang diberikan dalam persamaan (5.3.9) oleh karena itu, kita dapat menolak hipotesis bahwa kemiringan nayata adalah 0,5 berdasarkan tingkat kepercayyaan 95%. Jika hiptesis nol memang benar secara nyata, probabilitas unutk mendapatkan sebuah nilai kemiringan sebeasar 0,7240 secara kebetulan adalah sekitar 5%, sebuah probabilitas yang rendah. Dalam statistika, sika kita menolak hipotesis nol, kita akan mengatakan bahwa penemuan kita secara statistik signifikan. Di sisi lain, jika kita tidak menolak hipotesis nol, kita akan mengatakan bahwa penemuan kita secara statistik tidak signifikan. Beberapa penulis penggunakan kata-kata “sangat signifikan secara statistik “ dengna katakata ini, mereka umumnya mmemberikan makna bahwa ketika mereka menolak hipotesis nol, probabilitas untuk melakukan kesalahan tipe I (α) merupakan akngka yang kecil. Biasanya 1 %. Akan tetapi, pada pembahasan kita mengenai P-value (nilai p) dalam subbab 5,8 kita ketahui bahwa a,an lebih baik jika kita serahkan pada si peneliti untuk menentukan apakah sebuah penemuan secara statistik itu “signifikan” “cukup signifikan “ atau “sangat signifikan”. Pengujian satu arah atau satu ekor Kadang kala, kita memiliki perkiraan atau ekspektasi teoritis yang sangat kuat )atau eskperktasi berdasarkan beberapa pembuktian empiris sebelunmnya) bahwa hipotesis alternatidf itu satu sisi atau berarah tunggal dibandingkan dua arah, seperti yang telah dibahas sebelumnya. Jadi, untuk contoh upah-tingkat pendidikan, kita tetapkan bahwa: Ho:β2 ≤0.5 dan H1:β2>0.5 Keemungkinan teori ekonomi atau beberapa pembuktian empiris sebelumnya menyarankan bahwa kemiringan lebih besar dari 0,5. Walaupun prosedur untuk menguji hipotesis ini dapat deengan mudah diturunkan dari persamaan (5.3.5) mekanisme sebenarnya dapat dijelaskan lebih baik dengan pendekatan uji signigikansi yang akan dijelaskan selanjutnya. 5.7 pengujian hipotesis : pendekatan uji signifikansi Menguji sifnifikansi dari koefisien regresi : Uji t Sebuha pendekatan alternatid, nammun juga sebagai pelengkap untuk meotde interval kepercayaan dari pengujian hipotesis statistik merupakan pendekatan pengujian signifikasi yang dibangun secara masing-masing oleh R.A Fisher serta bersama-sama oleh neyman dan pearson. Atau secara umum, uji signifikansi merupakan sebuah prosedur, di maan hasil sampel digunakan untuk membuktikan kebenaran atau kesalahan dari hipotesis nol. Ide kunci di balik pengujian signifikasi ini adalah bahwa sebuah uji statistik (estimator) dan distribusi sampling dari statistik tersevut dinyatakan oleh hipotesis nol. Keputusan untuk menerima atau menolak Ho dibuat berdasarkan nilai dari uji statistik yang didapatkan dari data yang telah kita miliki. Sebagai sebuah ilustarasi, kita ingant lagi mengenai variabel berikut yang berada di bawah asumsi kenormalan Yang menigkuti distribusi t dengan df n-2 . jika nilai dari β2 sebenarnya dinyatakan dalam hipotesis nol., nilai t dari persamaan (5.3.2) dapat dengan mudah dihitung dari sampel yang ada sehingga hasilnya juga digunakan sepagai uji statistik kemudian oleh karena uji statistik ini mengikuti distribusi t, pernyataan interval kepercayaan dapat dibuat seperti berikut: Di mana β*2 adalah nilai β2 yang dinyatakan di bawah Ho -tα/2 dan tα/2 adalah nilai dari t (nilai t kritis) yang didapatkan dari tabel t untuk tingkat sifnifikasi (α/2) dan df n-2. [persamaan (5.3.2) . tabel t diberikan dalam lampiran D. Dengan menyederhanakan persamaan (5.7.1) kita dapatkan Yang memberikan interval dimana nilai ^β2 terletak dengan probabilitas 1-α dan memberikan kondisi β2 = β*2. Dalam bahasa pengujian hipotesis, interval kepecayaan 100( 1-α) didapatkan dari persamaan (5.7.2) yang dikenal sebagai daerah penerimaan dari Ho dan daerah(-daerah) yang berada di luar interval kepercayaan, disebut sebagai daerah penolahkan (dari Ho) atau daerah kritis . Sekarang, pendekatan hubungan antra pendekatan interval kepercayaan dan pendekatan uji signifikansi untuk pengujian hipotesis dapat dilihat dengan membandingkan persamaan (5.3.5) dengan persmaan (5.7.2.) dalam prosedur interval kepercayaan , kita mencoba untuk membangun sebuah rentang atau interval yang memiliki probabilitas tertentu dimana mengandung β2 sebenarnya, namun belum diketahui keberadaannya. Dalam pendekatan uji signifikansi, kita membuat sebuah hipotesis mengenai nilai β2 dan mencoba melihat apakah β2 yang sudah dihitung berada dalam sebuah batasan (kepercayaan ) yang memungkinkan di sekitar nilai yang dihipotesiskan. Sekali lagi, mari kita kembali pada ocntoh upah-tingkat pendidikan yang telah kita bahas , sudah kita mengatahui bahwa ^β2=0,7240 , se (^β2)=0,0700 dan df=11. Jika kita asumsikan bahwa α=5%, tα/2= 2,201 Jika kita asumsikan habwa Ho: β2 = β*2=0.5 dan H1: β2≠0,5 ,sehingga persamaan (5.7.2) menjadi: Pr (0,3460≤^β2≤0,6540) (5.7.3) Pada praktiknya, kita tidak perlu untuk mengestimasi persamaan (5.7.2)secara eskplisit. Seorang dapat menghitung nilai t yang berada di tengah-tengah pertidaksamaan yang diberikan ke dalam persamaan (5.7.1) dan untuk mengetahui apakah nilanunya bedada di antara nila t kritis atau berada di luarnya sebagai contoh : Seperti yang digambarkan pada figur 5.3 yang secara jelas berada di daerah kritis figur 5.4 . kesimpulan masih sama ; kita menolak H0 perhatikan juga bahwa jika β2 yang telah diestimasikan (^β2) sama dengan β2 yang dihipotesiskan , nilai t dala persamaan (5.7.4) adalah nol. Bagaimanapun, ketika nilai β2 beranjak dari nilai β2 yang dihipotesiskan |t| (nilai t absolut ;catatp; nilai t bisa bernilai negatif atau positif) akan meningkat. Oleh karena itu , nilai |t| “yang besar” dapat menjadi bukti yang menentang hiptesis nol. Tentu saja, kta selalu dapat menggunakan tabel t untuk menentukan apakah sebuah nilai t tertentu besar atau kecil; jawabannya seeortu yang kita ketahui, bergantung nilai derajat bebas dan juga probabilitas dari kesalahn tipe I yang kita mau terima. Jika anda melihat tabel t yaang diberikan dalam lampiran D (tabel D.2) anda akan melihat bahwa , untuk nila df tertentu, probabilitas akan semakin mengecil secara progresif untuk mendapatkan nilai |t| yang terus menerus meningkat. Jadi untuk df=20 , prbabilitas untuk mendapatkan nilai |t| sebesar 1.725 atau lebih adalah 0,10 atau 10%. Akan tetapi untuk df yang sama, probabilitas untuk mendapatkan nilai |t| sebesar 3.552 atau lebih hanya 0,002 atau 0,2%. Oleh karena kita menggunakan distribusi t, proisedur pengujian seperti yang telah dijelaskan tadi dinamakan uji t. Dalam baha uji signifikansi, sebuah statistik dinyatakan signifikansi, sebuah statistik dinyatakan signifikansi secara statistik jika nilai dari uji statistiknya berada di daerah kritis, pada kasus ini, hipotesis nol ditolak. Sebaliknya, sebuah pengujian dikatakan tidak signifikan secara statistik, jika nilai dari uji statistiknya berada di daerah penerimaan. dalam situasi ini, hipotesis nol tidak ditolak. Pada contoh kita, uji t signifikan sehingga enolak Ho. Sebelum membuat kesimpulan atas pembahasan kita mengenai uji statistik , perhatikan bahwa prosedur pengujian yang baru tetntu saja ditekankan, dikenal sebagai prosedur uji signifikansi dua arah atau dua ekor, dimana kita mempertimbangkan kedua sisi estrim dari ekor distribusi yang relevan dalam distribusi probabilitas, daerah penolakan dan daerah hipotesis nol, jika berada pada sisi.ekor manapun. Namun demikian, hal tersebut terjadi karena H1 kita merupakan sebuah hiptesis komposit dua arah β2≠0,5 yang berarti β2>0,5 . walaupun H1 masih merupakan hipotesis yang komposit/ berganda, sekarang menjadi satuh arah. Untuk menguji hipotesis ini kita gunakan uji satu arah, seperti yang ditnjukkan dalam figur 5.5 (lihat juga subba 5.6) Prosedur pengujian sama dengan sebelumnya, kecuali batas atas tingkat kepercayaan atau nilai kritis yang sekarang berhubungan dengan tα= t0.05 , yaitu tingkat 5 %. Seperi yang diperlihatkan dalam figur 5.5 kita tidak perlu mempertimbangkan ekor bawah distribusi t dalam kasus ini. Apakah seseorang menggunakan uji signifikansi satu arah atau dua arah, tergantung bagaimana hipotesis alternatif ini diformulasikan sehingga pada akhirnya bergantung pada dari perkiraan awal atau pengalaman empiris sebelumnya. Kita dapat merangkum pendekatan uji signifikansi t sehingga pengujian hipotesis seperti yang diperlihatkan pada tabel 5.1 Tabel 5.1 uji signifikasi t : [pengammbilan keputusan Menguji signifikasi dari ó2 dan uji x2 Menguji sifnifikansi dari metodologi uji sifnifikansi , mari kita pertimbangkan variabel berikut ini: Yang seperti telah dibahas sebelumnya, mengikuti distribusi x2 dengan df n-2 . unutk contoh hipotesisnya , ktia gunakan ó2 =0,8937 dan df=8, jika kita tetapkan bahwa Ho ; α2 versus H1:ó2≠0,6 persamaan (5.4.1) menyediakan uji statistik untuk Ho, dengan menyubstitusikan nilai yang sesuai dari persamaan (5.41) kita dapatkan bahwa di bawah Hp, X 2 adalah 3,18575 dan 21,9200. Oleh karena x2terhitung berada di atanra kedua batasan itu data yang ada mendukung hipotesis nol dan kita akan menolak hipotesis nol (lihat figur 5.1) prosedur pengujian ini dikenal sebagi uji signifikansi chi swuare . pendekatan uji signifikansi hipotesis X2 terangkum dalam tabel 5.2 5.8 pengujian hipotesis : beberapa aspek praktis Arti dari “menerima” atau “menolak” hipotesis jika berdasarkan dari sebua uji signifikansi, katakanlah berdasarkan uji t, kita memutuskan untuk menerima hipotesis nol, yang sebenarnya sedang kata bicarakan adalah bahwa berdasarkan bukti sampel. kita tidak memiliki alasan utnuk menolaknya; kita tidak mengatakan bahwa hipotesis nol adalah nyata tanpa keraguan sama sekali. Mengapa? Unutk menjawab pertanyaan ini , kita kembali kepada contoh upah-0tingkat pendidikan dengan asukmsi bahwa H0 :β2= 0,70, kini nilai kemiringan yang diestimasikan adalah ^ β2=0,7241 dengan kita peroleh t=(0,7241-0,7)/0,0701= 0,3438, di mana tidak signifikan misalkan pada α=5%. Oleh karena itu, kita akan katakan bahwa kita “terima: Ho. Akan tetapi , sekarang , jika kita asumsikan Ho:β2= 0,6. Dengan melakukan uji t kembali, kita peroleh t= (0,7241-0,6)/0,0701=1,7703 yang juga secara statistik tidak signifikan. Jadi, sekarang kita akan katakan bahwa kita “terima” Ho dimanakah dari kedua hipotesis nol ini yang “benar”? kita tidak tahu. Oleh karena itu, dalam “menerima”n sebuah hipotesis nol kita sebaiknya menyadari adanya hipotesis nol yang lain yang mungkin sesuai dengan data oleh karena itu lebih baik unutk mengatakan bahwa kita mungkin menerima hipotesis nol dari pada kita (secara jelas) menerimkanya. Namun demikian, akan lebih baik jika, “seperti yang diucapkan dalam keputusan pengadilan bahwa keputusan “tidak bersalah” dari pada ‘suci’ sehingga kesim,kpulan dari sebuah uji statistik adalah ‘tidak menolak’ dari pada menerima”. Hipotesis nol yang sering kali diuji dalam sebuah pembuktian empiris adah Ho: β2=0 atau dengan kata lain koefisien kemiringan adalah nol. Hipotesis nol yang “no”ini merupakan orang –orangan sawah. Objek yang menjadi perhatian utamama untuk dicari apakah Y berhungunan dengan semmua X, variabel penjelas. Apabila tidak ada hubungan antara Y dan X sebagai asal mula. Maka untuk menguji sebuah hipotesis seperti β 2=0,3 atau nilai manapun tidak akan ada artinya. Hipotesis nol seperti ini dapat dengan mmudah diuji dengan interval kepercayaan atau pendekatan uji t seperti yang telah dibahas pada subbab awal. Namun demikian , sering kali, penguijian formal seperti ini dapat ditempuh dengan shortcut, seperti mengadopsi atauran signifikansi “2-t” yang dapat dinyatakan sebagai berikut Aturan “2-t”apabila angka derajat bebas adalah 20 atau lebih dan jika tingkat signifikansi α ditetnukan sebagai 0,05 , hipotesis nol β2=0 dapat ditolak jika nilai t =[^β2/se(^β2)] yang didapatkan dari persamaan (5.,3.2) melebihi 2 dalam nilai absolut Logika do belakang aturan ini tidaklah sulit dipahami. Dari persamaan (5.7.1) kita ketahui bahwa kita akan menolak H0: β2 =0 jika Menurut derajat bebas tertentu. Sekarang , jika kita lihat tabel t yang terdapat dalam lampiran D, kita akan melihat bahwa untuk df 20 atau lebih. Nilai t yang dihitung (dikenal juga sebagai t hitung) adalah lebih besar dari 2 (secara absolut) misalkan nilai 2,1 yang secara statistik signifikan. Pada tingkat 5% dan mengakibatkan penolakan terhadap hipotesis nol. Oleh karena itu, jika kita mendapatkan df20 atau lebih dan nilai t hitung , misalkan 2,5 atau 3, kta tidak lagi perlu mengacu pada tabel t unutk menguji signifikansi dari koefisien kemiringan yang diestimasi. Tentu saja, siapappun dapat selalu mengacu pada tabel t unutk mendapatkan tingkat sifnifikansi yang tepat dan seorang harus melakukannya jika df-nya lebih kecil misalkan 20. Sambil lalu perhatikan bahwa apabila kita menguji hipotesis satu arah β2=0 diibandingkan dengan β2>0 atau β2< 0 , maka hipotesis nol akan ditolak jika Apabila kita tetapkan nilai α pada 0,05 maka dari tabel t kita dapatkan bahwa untuk df bernilai 20 atau lebih, nilai t yang lebih besar dari 1,73 secara statistik signigikan pada tingkat signifikansi 5% (satu arah) dengan demikian, kitika nilai t melebihi, misalkan 1,8 (secara absolut) dan nilai df adalah 20 atau lebih, seseorang tidak perlu mengacu pada tabel t unutk menentukan signigikansi secara statistik unutk memperoleh koefisien yang diobservasi. Tentu saja, jika kita memilih α pada tingkat 0,01 atau pada tingkat berapapun. Kita perlu menentukan nilai t yang sesuai dengan nilai acuannya. Namun demikian, pada tahap ini pembaca seharusnya sudah mampu untuk melakukannya Membuat hipotesis nol dan hipotesis alternatif Berdasarkan hipotesis nol dan hipotesis alternatif yang ada, maka menguji signifikansi statistik dari hipotesis ini seharusnya bukan lagi sebuah misteri. Namun demikian, bagaimanakah seseorang dapat memformulasikan hipoteis-hipotesis ini? Tidak ada aturan “ susah namun cepat” sering kali fenomena yang sedang dipelajari memberikan saran mengenai karakteristik alamiah dari hipotesis nol dan hipotesis alternatif. Sebagai contoh, mari kita pertimbangkan alur pasar modal (capital market line –CML) dari teori surat berharga, yang menetapkan bahwa Ei=β1+ β2ói dimana standar deviasi dari tingkat pengembalian atau sebuah ukuran resiko oleh larea tingkat pengemmbalian dan tingkat resiko diekspektasikan ememiliki hubungan positig –semakin besar resiko, semakin tinggi tingkat pengembalian_ pernyataan hipotesis alternatifterhadap hipotesis nolo adalah β2= 0 dan β2>0 . hal tersebut menunjukkan bahwa seseorang tidak memilih β2 yang bernilai lebih kecil dari nol. Namun demikian, mari kita pertimbangkan kasus permintaan uang seperti yang akan kita tunjukkan nanti, salah satu faktor penting yang memengaruhi permintaan uang adalah pendapatan. Studi-studi sebelumnya dari fungsi permintaan uang memperlihatkan bahwa elastisitas pendapatan dari permintaan terhadap uang (persentase perubahan permintaan uang akibat perubahan 1 persen dari pendapatan ) secara umum bernilai antara 0,7 dan 1,3 . oleh karena itu, berdasarkan sebuah studi terbaru mengenai permintaan uang, apabila seorang menetapkan bahwa koefisien elastisitas pendapatan β2 ≠ 1 hipotesis alternatif dua arah. Jadi ekspektasi secara teoritis atau berdasarkan pembuktian empiris sebelumnya. Ataupun keduanya dapat dipercaya sebagai dasar dalam memformulasikan sebuah hipotesis. Namun demikian, bagaimanapun hipotesis ini dibentuk sangatlah penting bagi peneliti untuk membentuk hipotesis ini sebelum melakikan inverstigasi secara empiris. Sebaliknya sang peniliti akan bersalah akibat “penalaran pelingkar” atau ramalan/prediksi yangg telah dia buat. Hal ini dapt dilihat apabila seseorang harus membuat hipotesis setelah mempelajari hasil empirisnya. Maka ada sedikit keinginnan bagi seseorang tersebut unutk membuat sebuah hipotesis yang digunakan dalam menguji hasil yang didapatkan oleh orang lain . praktik seperti ini sebaiknya dihindari untuk alasan apapun. Setidaknya untuk kepentingan objektivitas ilmiah. Penting unutk tetap diingant bahwa pernyataan stigler diberikan dapa permulaan bab ini. Memilih α , tingkat signifikansi Seharusnya udah jelas berdasarkan pembahasan yang telah kita lakukan sampai saat ini, apakah sebainya menolak atau menerima hipotesis nol ini sangat tergantung nilai α, yaitu tingkat signifikansi atau probabilitas unutk melakukan sebuah kesalahan tipe I,-probabilitas tingkat signifikansi atau probabilitas untuk menolak sebuah hipotesis nyata. Dalam lampiran A , kita telah membahas secara lengkap mengenai karekteristik alamiah dari kesalahan tipe I, hubungan dengan kesalahan tipe II (probabilitas untuk menerima sebuah hipotesis yang salah) dan mengapa statistik klasik umumnya memusatkan perhatian pada kesalahan tipe I. Kemudian mengapa α seringkali ditetapkan pada tingkat 1,5, atau maksimal pada tingkat 10 %? Pada kenyataannya, tidak ada nilai lain yang lebih penting selain nilai-nilai ini; seperti halnya nilai bagi setiap nilai lainnya. Dalam sebuah bagian pendahuluan suatau buku seperti buku ini bukan tidak mungkin untuk melakukan diskusi yang mendalam mengapa seseorang memiliki tingkat signifikansi 1,5 atau 10 %, yang akan membawa kkita dalam dangn pengambilan keputusan statistik, disiplin ilmu tersendiri. Sebuah penjelasan singkat, bagaimanapun dapat ditawarkan sebarit yang kita bahas dalam lampiran A untuk sebuah ukuran sampel tertentu jika kita coba unutk mengurangi kesalahan tipe I kemungkinan kesalahan tipe II akan meningkat, dan sebaliknya. Demikian juga unutk sebuah ukuran sampel tertentu , jika kita berusaha untuk mengurangi probabilitas dari menolak hipotesis ang benar, pada saat yang bersamaan kita meningkatkan probabilitas dari menerima hipotessi yang salah. Jadi, terdapat trade-off (biaya kesempatan) yang ada/ terlibat di anatara kedua tipe kesalahan ini. Berdasarkan ukuran sampel tertentu. Sekarang satu-satunya cara bagi kita unutk memutuskan mengenai trade off ini adalah dengan mencari biaya relatif di antara dua tipe kesalahan ini. Kemudian Apabila kesalahan menolak hipotesis nol yang sebenarnya merupakan pertanyaan yang benar (keslahan tipe I) adalah lebih besar dalam hal biaya dibandingkan dengan kesalahan unutk tidak menolak hopotesis nol. Yang sebenarnya secara nyata salah (kesalahan tipe II) , maka sangatlah masuk akal unutk menentukan probabilitas dari kesalahan tipe pertama, rendah. Di sisi lain, apabila biaya melakukan kesalahan tipe 1 secara relatif lebih rendah terhadap biaya membuat kesalahan tipe II , maka akan terbayarkan unutk membuat probabilitas dari kesalahn tipe pertama (sehingga menyebabkan probabilitas dari kesalahan tipe kedua rendah) tentu saja , kesulitannya adalah jarang sekali bagi kita unutk mengetahui biaya dalam melakukan kedua tipe kesalahan . oleh karena itu, aplikasi dari ahli ekonometrika umumnya mengikuti praktik dalam menentukan nilai α pada tingkat 1,5 atau maksimum 10 %. Dan memilih sebuah statistik pengujian yang dapat membuat probabilitas dalam melakukan kesalahan tipe II sekecil mungkin . oleh karena 1 dikurangi probabilitas dalam melakukan kesalahan tipe II dikenal sebagai keuatan pengujian (power of the test) prosedur ini bertujuan unutk memaksimalkan kekuatan pengujian (lihat lampiran A untuk mendiskusikan kekuatan pengujian. Untungnya, dilema yang ada saat ini memilih nilai α yang tepat dihindari menggunakan dengan apa yang kita kenal sebagai nilai p dari uji statistik yang akan dibahas selanjutnya Tingkat signifikasi paling tepat : nilai p Seperti yang baru saja kita bahas , faktor yang melemahkan dari pendekatan klasik suatu pengujian hipotesis merupakan keacakan dalam mimilih α. Ketika sebuah uji statistik (misal: statistik) telah didapatkan dalam sebuah contoh, mmengapa kita tidak langsung saja menuju kepada tabel statistik yang sesuai unutk mecari tahu probabilitas nyatanya sama besar atau lebih besar dari uji statistik yang didapatkan dalam contoh? Probabilitas ini dikenal sebgai nilai p) nilai probabilitas) atau dikenal juga sebgai tingkat signifikansi yang tepat atau yang terboservasi maupun probabilitas yang tepat dalam melakukan kesalahan tipe I. Secara teknis, nilai p didefinisikan sebagai tingkat signigikansi yang paling rendah, dimana hipotesis nol tidak dapat ditolak. Sebagai ilustrasi, mari kita mengacu kembali pada contoh kita, upah-tingkat pendidikan. Berdasarkan hipotesis nol yang telah ada, koefisien sebenarnya dari tingkat pendidikan adalah 0,5 kita dapatkan nilai t sebesar 3,2 dari Persamaan (5.7.4) keudian berapakah nilai p dalam mendapatkan sebuah nilai t yang sama besar atau lebih besar dari 3,2? Signifikansi statistik dibandingkan dengan signifikansi praktis Perhatikan kembali contoh 3.1 dan hasil regresi yang diberikan dari persamaan (3.7.1) regresi ini memberikan / menggambarkan hubugnan pengeluaran pengeluaran konsumsi pribadi (PCE) dengan PDB , di amerika serikat (AS) periode 1960-2005 , keduanya diukur dalam satuan miliar dolar harga konstan tahun 2000. Dari regresi ini, kita akan melihat bahwa kecenderungan tambahan konsumsi (MPC) yaitu konsumsi tambahan sebagai hasil dari tambahan pendapat (yang diukur dengan PDN) sebesar 0,72 atau 72 sen . menggunakan data dalam persamaan (3.71.) pembaca dapat membuktikan bahwa interval kepercayaan 95 persen untuk MPC adalah (0,7129;0,7306) (catatan : oleh karena terdapat 44 df di dalam contoh ini, kita tidak memiliki nilai t kritis yang tepat untuk nilai- nilai df tersebut. Dengan demikian, anda daoat menggunakan aturan “2-t” untuk menghitung interval kepercayaan 95%) Ketika ada sebuah hipotesis nol, katakanlah telah ditententukan bahwah β1=1 , akan benarbenar menimbulkan kesan bahwa β1 mendekati 1 sangat dekat sehingga unutk berbagai tujuan penggunaan akan diperlakukan seolah nilainya benar-benar 1. Akan tetapi meskipun 1,1 nilai itu “ hampir sama secara praktis” demgam 1,0 dalam sudut pandang ekonomi , namun akan menjadi berbeda dalam sudut pandang statistika. Masalah tersebut tidak dapat diselesaikan dengan mengacu pada pengujian hipotesis karena pengujian statistika [t=](b110/ óbj mengukur koefisien yang diestimasi dalam satuan standard error, unit yang tidak dapat digunakan dalam mengukur penggunaan parameter ekonomi β1-1 . akan lebih banyak menggunakan istilah “signifikan: dalam konsep statistik yang bermakna sama dengan istilah “substatisial dalam konsep ekonomi. Pilihan antara interval kepercayaand dan pendekatan pengujian signifikansi untuk pengujian hipotesisd Dalam sebagian aplikasi analisis ekonomi, penyusunan hipotesis nol dapat diibaratkan sebagai pembuatan : orang-orang sawah” dan tujuan dari pembuktian empiris adalah untuk “menjatuhkannya” yaitu untuk menolak hipotesis nol. Jadi, dalam contoh kita, pendapatan konsumsi , hipotesis yang enyatakan bahwa MPC β2=0 menjadi tidak masuk akal, tetapi kita sering kali menggunakan untuk mendramatisasi hasil empiris. Sepertinya, editor dari jurnal yang memiliki reputasi menggngap bahwa tidak terlalu menarik unutk mempublikasikan hasil penelitian empiris yang tidak menolak hipotessi no. Bagaimanapun, pembuktian bahwa MPX secara statistik bukanlah nol jauh lebih penting dibandingkan dengan pembuktian bahwa nilainya smma dengan , atakanlah 0,7 Oleh karena itu J.bradfor De long dan Kevin Lang berpendapat bahwa lebih baik bagi ekonom jika: Unutk berkonsentrasi dalam besar jiedisien dan mencari tingkat kepercayaan, serta buka pengujian signifikansi. Jika semua atau hampir semua hipotesis nol salah, terdapat poin yang berkonsentrasi dengan apakah sebuah estimasi tidak dapat dibedakan dari nilai prediksi yang berasal dari hipotesis nol. Sebgai gantinya diharapkan dapat ditemujan model yang dapat menjadi perkiraan yang baik, dengna jangkauan nilai parameter yang dikeluarkan oleh estimasi empiris. Siingkatnya, penulis/pengarang lebih suka menggunakan pendekatan interval kepercayaan dibandingkan dengan pendekatan pengujian signigikansi. Hal ini harus diingat oleh siapapun yang sedang mempelajarinya. 5.9 analisis regresi dan analisis varians Dalam subbab ini kita akan mempelajari mengenai analisis regresi dari sudut panjang analisis varian serta memperkenalkan cara unutk menjelaskan dan melengkapi pandangan mengenai masalah pengambilan kesimpulan dalam statistika Dalam bab 3 , subba 3.5 kita telah membentuk persamaan sebagai berikut: Artinya bahwa TSS=ESS +RSS yang menguraikan total jumlah kuadrat (TSS) ke dalam dua komponen :penjelasan atas jumlah kuadrat (ESS) dan jumlah kuadrat residual RSS sebuah pemahaman mendalam engenai kompotnen TSS dikenal sebagai analisis varians. Apabila digabungkan dengan setiap jumlah kuadrat ( sum of swuares) maka akan menjadi df-nya yaitu jjumlah dari observasi terpisah yang menjadi dasar pembentuk YSS memiliki df senilai n-1 ketika kehilangan 1 df ketika menghitung rerata sampel Y. ESS memiliki df n-2 (menganpa?) Catatan : hal ini hanya berlaku unutk model regresi dua variabel dengan adanya tersep β 1. Mari kita susun berbagai jum;lah kuadrat dan hubungannya denga df, yang ditunjukkan dalam tabel 5.3 tabel ini merupakan bentuk standar dari batel OAV yang terkadang juga disebut sebagai tabel ANOVA. Dengan menggunakan data pada tabel 5.3 selanjutnya terdapat variabel 5.9.1 Apabila diasumsikan bahwa faktor gangguan ui terdistribusi secara normal yang dilakukan sclassical normal linear regression model ( CNLRM) dan apabila hipotesis nol H0 adalah β2 maka dapat diitujikkan bahwa variabel F dari persamaan (5.9.1) mengikuti distribusi D dengan dF 1 sebagai pembilang dan df (n-2)) sebagai penyebut. (lihat lampirran 5A.3 sebagai pembuktian . sifat umum dari distribusi F dibahas dalam Lampiran A. Tujuan penggunaan suatu sampel tidak boleh berasal dari sebuah populasi dengan nilai β 2 adalah nol dan tidak dapat disimpulkan dengan kepercayaan yang sangat tinggi bahwa X , tingkat pendidikan memengaruhi Y, rata-rata upah. Mengacu pada teori 5.7 di lampiran 5A. Di lampiran 5A.1 yang dinyatakan bahwa hasil kuadrat dari nilai t dengan df k merupakan sebuah nilai F dengan df 1 sebagai pebilang dan df K sebagai penyebut. Unutk contoh kita, jika diasumsikan bahwa Ho: β2 =0 , kita dapat dengan mudah membuktikan bahwa nilai t uyang diestimasi adalah 10,41 dari persamaan 5.3.2 nilai t ini memiliki df senilai 11 . sengan menggunakan hiptesis nol yang sama , nilai F adalah 108,3026 dengan df1 dan 11. Oleh karena itu (10,34289)2 = nilai F kecuali untuk pembulatan. Jadi, pengujian t dan F memberikan dua alternatif yang saling melengkapi un tuk menguji hipotesis nol bahwa β2=0, jika hal ini adalah masalah yang ingin diselesaikan mengapa tidak hanya mengandalkan pengujian t tanpa perlu melakukan pengujian F. akan tetapi dalam pembahasan mengenai analissi regresi majemuk , kita akan melihat bahwa uji F memiliki beberapa aplikasi menarik yang membuatnya menjadi metode untuk pengujian hiptesis statistik yang sangat berguna dan berpengaruh. 5.10 Aplikasi dari Analisis Regresi: Masalah Prediksi Sebagai dasar dari data sampel pada Tabel 3.2, regresi sampel yang diperoleh sebagai berikut : di mana Yi merupakan estimator dari nilai sebenarnya E(Yi) dengan nilai X tertentu. Apakah yang bisa dilakukan dengan regresi historis (historical regression) ini? Salah satunya adalah untuk “memprediksi” atau “meramalkan” rerata upah Y di masa depan pada beberapa tingkat pendidikan X. Saat ini, telah ada dua jenis prediksi : (1) prediksi nilai rerata bersyarat dari Y pada X yang dipilih, katakanlah X0, yang merupakan titik dari garis regresi populasi itu sendiri (Iihat Figur 2.2) dan (2) prediksi dari nilai individu Y pada X0. Kedua prediksi ini harus dikatakan sebagai prediksi rerata (mean prediction) dan prediksi individu (individualprediction). Prediksi Rerata Untuk menjelaskan topik ini, asumsikan bahwa X0 = 20, dan ingin membuat prediksi atas E(Y| X0 = 20). Kini, topik ini dapat menggambarkan bahwa regresi historis pada Persamaan (3.61) memberikan titik estimasi dari prediksi rerata sebagai berikut: di mana Y0 estimator dari E(Y| X0). Hal ini membuktikan bahwa titik prediksi ini merupakan sebuah estimator terbaik, linear, dan tidak bias (BLUE). Oleh karena Y0 merupakan sebuah estimator, nilainya akan berbeda dari nilai sebenarnya. Perbedaan di antara kedua nilai tersebut akan memunculkan pembahasan mengenai prediksi atau forecast atas error. Untuk menilai error, kita perlu untuk mengetahui distribusi sampel dari Y0. Hal ini ditunjulckan dalam Lampiran 5A, Bagian 5A.4 bahwa Y0 dalam Persamaan (5.1O.1) terdistribusi secara normal dengan rerata (β1 + β2X0) dan Varians yang diperoleh dari formula sebagai berikut : Dengan menggantikan σ2 yang tidak diketahui dengan estimator tak bias σ’2, maka variabel : Mengikuti distribusi t dengan df n - 2. Distribusi t selanjutnya dapat digunakan untuk melakukan turunan terhadap interval kepercayaan agar dapat menemukan nilai sebenarnya dari E(Y| X0) dan pengujian hipotesis mengenainya melalui cara yang biasa digunakan, menjadi, di mana se(Y0) diperoleh dari Persamaan (5.10.2). Untuk data kita (lihat Tabel 3.2), Interval kepercayaan (berkas) untuk rerata Y dan nilai individu Y. Jadi, dengan nilai X0 = 100, dalam sampling berulang, 95 dari 100 interval seperti dalam Persamaan (5.10.5) akan mencakup nilai rerata sebenarnya; estimasi tunggal terbaik dari nilai rerata yang berada pada titik estirnasi 14,4656. Apabila kita mendapatkan interval kepercayaan sebesar 95% seperti pada Persamaan (5.10.5) untuk setiap nilai X yang ada pada Tabel 3.2, maka akan diperoleh apa yang disebut sebagai interval kepercayaan atau confidence band untuk FRP, seperti yang ditunjukkan oleh Figur 5.6. Prediksi Individual Apabila tertarik untuk memprediksi nilai individu Y, yaitu Y0, pada sebuah nilai X tertentu, katakanlah X0, maka seperti yang ditunjukkan oleh Lampiran 5A, Bagian 5A.4, sebuah BLUE untuk Y0 juga berasal dari Persamaan (5.10.1), tetapi dengan varians sebagai berikut: Lebih jauh dapat ditunjukkan bahwa Y0 juga mengikuti distribusi normal dengan rerata dan varian yang secara berturut-turut diperoleh dari Persamaan (5.10.1) dan (5.10.6). Dengan menyubstitusikan σ’2 untuk σ2 yang tidak diketahui, akan menjadi yang juga mengikuti distribusi t. Oleh karena itu, distribusi t dapat digunakan untuk menarik kesimpulan mengenai nilai sebenarnya dari Y0. Melanjutkan contoh kita, kita akan lihat bahwa titik prediksi dari Y0 adalah 14,4656, sama dengan Y’0, dan varians-nya sebesar 1,2357 (penghitungan ini harus dibuktikan). Oleh karena itu, interval kepercayaan sebesar 95% untuk Y0 pada X0 = 100 akan menjadi Membandingkan interval ini dengan Persamaan (5.10.5), akan terlihat bahwa interval kepercayaan untuk Y0 individu lebih luas daripada nilai rerata Y0. (Mengapa?) Menghitung interval kepercayaan seperti Persamaan bersyarat (5.10.7) dengan nilai X yang diberikan oleh Tabel 3.2, kita akan memperoleh interval kepercayaan 95% untuk nilai individu Y pada nilai X ini. Interval kepercayaan tersebut dengan interval kepercayaan Y’0 berkaitan dengan X yang sama, seperti yang ditunjukkan oleh Figur 5.6. Perhatikan sebuah ciri penting dari interval kepercayaan yang ditunjukkan oleh Figur5.6. Lebar band ini memiliki nilai terkecil ketika X0 = X. (Mengapa?) Bagaimanapun, lebar band ini akan menjadi semakin luas dengan cepat seiring X0 yang semakin menjauh, secara progresif, dari X bar. Oleh karena itu, seseorang harus benar-benar memperhatikan saat “meramalkan” garis regresi historis untuk memprediksikan E(Y I X0) atau Y0 yang terkait dengan nilai X0 yang telah dipindahkan jauh dari rerata sampel, X bar. 5.11 Melaporkan Hasil dari Analisis Regresi Ada berbagai cara untuk melaporkan hasil dari analisis regresi, tetapi dalam buku ini akan digunakan pola berikut, menggunakan contoh upah-tingkat pendidikan dari Bab 3 sebagai ilustrasi: Dalam Persamaan (5.11.1), bilangan yang berada dalam kelompok bertanda kurung pertama adalah estimasi standard error dari koefisien regresi, bilangan dalam tanda kurung kedua adalah nilai estimasi t hitung dari Persamaan (5.3.2) di bawah hipotesis nol yang menyatakan bahwa nilai populasi sebenarnya dari setiap koeflsien regresi individu adalah nol (misal: 10,3428 = 0,7240/0,0700), dan bilangan dalam kelompok ketiga adalah estimasi dari nilai p. Jadi, untuk df 11, probabilitas dari memperoleh nilai ttsebesar 10,3428 atau lebih, secara praktis, adalah nol. Dengan menyajikan nilai p dari koefisien tyang diestimasi, dapat kita ketahui tingkat signifikansi yang tepat dari setiap nilai t yang diestimasi. Jadi, di bawah hipotesis nol yang menyatakan bahwa nilai kemiringan populasi yang sebenarnya adalah nol (misal: tingkat pendidikan tidak memengaruhi rerata upah), probabilitas yang tetap untuk mendapatkan nilai t sebesar 10,3428 atau lebih, secara praktis, adalah nol. Tetap diingat bahwa semakinkecil nilai p, semakin kecil probabilitas untuk melakukan kesalahan jika kita menolak hipotesis nol. Sejak awal, telah ditunjukkan bahwa ada hubungan yang sangat dekat antara nilai Fstatistik dan t statistik, yaitu F1,k( = t2k. Di bawah hipotesis nol bahwa β2 = 0, Persamaan (5.11.1) menunjukkan bahwa nilai F adalah 108,30 (df untuk pembilang adalah 1 dan df untuk penyebut adalah 11) dan nilai t adalah 10,34 (df 11); seperti yang diekspektasikan, nilai yang terbentuk adalah kuadrat nilai terakhir, kecuali untuk pembulatan. Tabel ANOVA untuk soal ini telah dibahas sebelumnya. 5.12 Mengevaluasi Hasil Analisis Regresi Dalam Figur P.4 di Bagian Pendahuluan, kita menyajikan sketsa anatomi model ekonometrika. Sekarang, setelah kita jelaskan hasil analisis regresi dari contoh upah-tingkat pendidikan dalam Persamaan (5.11.1), selanjutnya kita akan mempertanyakan mengenai kelengkapan dari model yang paling sesuai. Sebaik apakah model yang sesuai? Diperlukan beberapa kriteria untuk menjawab soal ini. Pertama, apakah tanda dari koefisien estimasi sesuai dengan teori atau ekspektasi yang terlebih dahulu dibuat? Dalam Studi sebelumnya, β2 dalam contoh upah-tingkat pendidikan seharusnya positif. Dalam contoh yang telah disajikan, hal ini telah dibuktikan. Kedua, jika statistik, apakah hal ini tersebut telah terpenuhi dalam aplikasi ini? Seperti yang telah dibahas dalam Subbab 5.11, koefisien tingkat pendidikan tidak hanya bernilai positif, tetapi secara statistik signifikan terbukti bukanlah nol; nilai p dari nilai tyang diestimasi sangatlah kecil. Hal yang sama juga diaplikasikan dalam koefisien intersep. Ketiga, sebaik apakah model regresi menjelaskan variasi dalam contoh kita? Konsep r kuadrat dapat digunakan untuk menjawab pertanyaan ini. Dalam contoh yang telah disajikan, nilai r kuadrat sekitar 0,90 adalah nilai yang sangat tinggi mengingat nilai tertinggi dari r kuadrat adalah 1. Jadi, model yang telah dipilih untuk menjelaskan rerata upah sepertinya cukup baik. Akan tetapi, sebelum meninggalkan topik ini, kita sebaiknya mengetahui apakah model yang telah dipilih-telah memenuhi asumsi CNLRM. Tidak diperlikan banyakasumsi karena model ini sebenarnya cukup sederhana. Namun demikian, ada satu asumsi yang harus diuji, yakni uji normalitas faktor gangguan, ui. Ingat kembali bahwa penggunaan uji tdan F sebelumnya mengharuskan faktor kesalahan mengikuti distribusi normal. Sebaliknya, prosedur pengujian tidak akan valid dalam sampel yang kecil atau terbatas. Uji Normalitas (Normality Tests) Walaupun beberapa uji normalitas telah dibahas dalam referensi, terdapat tiga hal yang harus diperhatikan: (1) histogram residual, (2) pola/plot probabilitas normal (normal probability plot-NPP), yang digambarkan dalam grafik , dan (3) uji normalitas Jarque-Bera (JB). Histogram Residual Histogram residual adalah sebuah grafik sederhana yang digunakan untuk mempelajari bentuk fungsi densitas probabilitas (PDF) darisebuah variabel acak. Pada garis horizontal, nilai dari variabel yang ingin dicari (misal: residu (DLS) dibagi ke dalam interval yang sesuai, dan di setiap kelas interval dibentuk bujur sangkar dengan tinggi yang sama dengan jumlah observasi pada kelas interval (misal: frekuensi). Apabila dalam pikiran telah membayangkan bentuk lonceng (bell-shaped) dari kurva distribusi normal dalam histogram, maka kita akan memperoleh gambaran apakah perkiraan (PDF) normal akan sesuai. Untuk regresi upahtingkat pendidikan, histogram residual ditunjukkan pada Figur 5.7. Diagram ini menunjukkan bahwa residual tidak secara sempurna terdistribusi normal; untuk sebuah variabel yang terdistrbusi secara normal, skewness-kemiringan (ukuran simetri) seharusnya bernilai 0 dan kurtosis-keruncingan (yang mengukur seberapa tinggi atau pendek kurva distribusi normal tersebut) dari kurva seharusnya bernilai 3. Namun demikian, hal ini merupakan praktik yang baik untuk membuat histogram residual regresi apa pun karena merupakan metode yang dapat digunakan (“kasar”) untuk menguji asumsi normalitas. Pola Probabilitas Normal Sebuah grafik pembanding sederhana untuk mempelajari mengenai bentuk PDF dari sebuah variabel acak adalah NPP yang menggunakan normal probability paper, sebuah kertas grafik yang dirancang secara khusus. Untuk sumbu horizontal, atau X, dibuat bagan nilai dari variabel yang ingin diketahui (katakanlah, residu OLS, ui) dan pada sumbu vertikal, atau akan ditunjukkan nilai ekspektasi dari variabel jika memiliki distribusi normal. Oleh karena itu, jika variabel benar-benar berasa dari populasi normal, NPP akan mendekati sebuah garis lurus. NPP residual dari regresi contoh upah-tingkat pendidikan ditunjukkan pada Figur 5.8, yang diperoleh dari paket software MINITAB versi 15. Seperti yang telah dijelaskan sebelumnya, apabila garis yang sesuai dengan NPP mendekati garis lurus, maka dapat disimpulkan bahwa variabel yang ingin dicari terdistribusi secara normal. Pada Figur 5.8, kita akan melihat bahwa residual dari contoh ilustrasif mendekati distribusi normal karena sebuah garis lurus akan menyesuaikan data dengan baik. MINITAB juga menyediakan uji normalitas Anderson-Darling, yang juga dikenal sebagai uji A kuadrat statistik. Hipotesis nol yang berlaku menunjukkan bahwa variabel yang ingin diketahui memiliki distribusi normal. Seperti yangditunjukkan dalam Figur 5.8, sebagai contoh, perhitungan atas A2 statistik adalah 0,289 Kita memperoleh nilai p dari A2 adalah O,558; merupakan angka yang cukup tinggi. Oleh karena itu, kita tidak akan menolak hipotesis yang menggambarkan bahwa residual dari contoh ilustratif kita memiliki distribusi normal. Secara kebetulan, Figur 5,8 menunjukkan parameter dari distribusi normal, dengan nilai rata-rata mendekati nol dan standar deviasi sekitar 0,8987. Uji Normalitas Jarque-Bera (JB)20 Uji Normalitas Jarque-Bera (JB) adalah sebuah asimtotik atau pengujian dengan sampel berukuran besar. Hal ini juga didasarkan pada residual OLS. Pengujian ini diawali dengan menghitung skewness dan kurtosis (yang dibahas dalam Lampiran A) yang mengukur residual OLS dan menggunakan pengujian statistik: di mana n = ukuran sampel, S = 2 koefisien skewness, danK= koefisien kurtesis. Untuk variabel dengan distribusi normal, S = 0 dan K = 3. Oleh karena itu, uji normalitas JB merupakan pengujian dari hipotesis bersama, di mana S dan K, secara berturut-turut, adalah 0 dan 3. Dalam kasus ini, nilai dari JB statistik diekspektasikan bernilai 0. Di bawah hipotesis nol, residual memiliki distribusi normal, Jarque dan Bera menunjukkan bahwa JB statistik dalam Persamaan (5.12.1) mengikuti distribusi chi-square dengan df2 secara asimtotik (misal: dalam sampel berukuran besar). Jika nilai p yang dihitung dalam aplikasi JB statistik cukup rendah-hal yang akan terjadi apabila nilai statistiknya bukanlah 0seseorang dapat menolak hipotesis yang menyatakan bahwa residual terdistribusi secara normal. Akan tetapi, jika nilai p cukup tinggi-hal yang akan terjadi jika nilai statistiknya mendekati nol-asumsi normalitas tidak akan kita tolak. Untuk contoh kita, upah-tingkat pendidikan, JB statistik yang diestimasi adalah 0,8286. Hipotesis nol yang menyatakan bahwa residual pada contola berikutnya terdistribusi secara normal tidak dapat ditolak, untuk nilai p sekitar 0,66 atau 66 persen; saat mendapatkan JB statistik sebesar 0,8286 atau lebih. Probabilitas ini cukup tinggi. Perhatikan bahwa, walaupun regresi kita memiliki 13 observasi, observasi tersebut diperoleh dari sebuah sampel yang terdiri atas 528 observasi, di mana hal ini terlihat cukup tinggi. Jika rumus dari JB diaplikasikan ke dalam contoh ini, JB statistik akan bernilai 0,7769. Nilai p diperoleh dari distribusi chi-square dengan df 2 adalah 0,68, yakni nilai yang cukup tinggi. Dengan kata lain, asumsi normalitas untuk contoh ini dapat ditolak. Tentu saja, harus diperhatikan mengenai ukuran sampel. Pengujian Lain dari Model Lengkap lngatlah bahwa CNLRM membuat lebih banyak asumsi dibandingkan normalitas faktor kesalahan. Sebagaimana pendalaman atas teori ekonometrika lebih jauh, beberapapengujian dari model yang sesuai (lihat Bab 13) akan diperhatikan. Setelah itu, tetaplahingat bahwa model regresi berasal dari asumsi sederlaana yang tidak al<an berlaku di setiap kasus permasalahan. Sebuah Contoh yang Menyimpulkan Mari kembali ke Contoh 3.2, pengeluaran untuk makanan di India. Menggunakan data yang diberikan pada Persamaan (3.72) dan memakai format dari Persamaan (5.11.1), akan diperoleh persamaan pengeluaran sebagaiberikut : di mana * melambangkan angka yang sangat kecil; = pengeluaran makanan; dan T.Expi = total pengeluaran. Pertama, interpretasikan regresi ini. Seperti yang telah diekspektasikan, terdapat hubungan positif antara pengeluaran untuk makanan dan pengeluaran total. Iika pengeluaran total diukur dalam mata uang satu rupee, secara rata-rata, pengeluaran untuk makanan meningkat sekitar 44 paise. Jika pengeluaran total adalah nol, pengeluaran rata-rata untuk makanan adalah sekitar94 rupee, Tentu saja interpretasi dari intersep ini tidak begitu banyak memiliki makna ekonomi. Nilai r kuadrat sekitar 0,37 menunjukkan bahwa 37% dari variasi dalam pengeluaran untuk makanan dijelaskan oleh pengeluaran total, yang sangat bergantung pada pendapatan. Anggap bahwa kita ingin melakukan pengujian atas hipotesis nol yang menyatakan bahwa tidak ada hubungan antara pengeluaran untuk makanan dan pengeluaran total, maka koefisien sebenarnya dari kemiringan β2 = O. Nilai β2 yang diestimasi adalah 0,4368. Jika hipotesis nol benar, berapakah probabilitas untuk memperoleh nilai0,4368? Di bawah hipotesis nol, observasi yang kita lakukan atas Persamaan (5.12.2) menunjukkan bahwa nilai t adalah 5,5770 dan nilai p untuk memperoleh nilai t tersebut adalah nol. Dengan kata lain, hipotesis nol langsung dapat ditolak. Akan tetapi, jika hipotesis nol menyatakan bahwa β2 = 0,5. Maka, apa yang terjadi? Dengan menggunakan uji t, kita peroleh : Probabilitas dari memperoleh nilai |t| senilai 0,8071 adalah lebih dari 20%. Akibatnya, hipotesis yang menyatakanβ2 = 0,5 tidak Clitolak. Perhatikan bahwa di bawah hipotesis nol, koefisien kemiringan yang sebenarnya adalah nol dan nilai F adalah 31,1034, seperti yang ditunjukkan oleh Persamaan (5.12.2). Di bawah hipotesis nol yang sama, kita akan peroleh nilai t sebesar 5,5770. Iika nilai ini dikuadratkan, nilai t yang diperoleh adalah 31,029, yang hampir sama dengan nilai F. Sekali lagi, hal tersebut menunjukkan adanya hubungan yang dekat antara nilai statistik t dan F. (Catatan: Pembilang df untuk statistik F haruslah 1, seperti yang terjadi dalam soal ini). Menggunakan residual yang diestimasi dari regresi, apakah yang dapat kita katakan mengenai-probabilitas distribusi dari faktor kesalahan? Informasi ini diberikan pada Figur 5.9. Seperti yang telah ditunjukkan oleh Figur 5.9, residu dari regresi atas pengeluaran makanan terdistribusi secara simetris. Pengaplikasian dari uji Jarque-Bera menunjukkan bahwa JB statistik adalah 0,2576 dan probabilitas untuk memperoleh nilai tersebut terletak di bawah asumsi normal adalah 88 persen. Oleh karena itu, hipotesis bahwa faktor kesalahan memiliki distribusi normal akan ditolak. Namun demikian, ingatlah bahwa ukuran sampel dari 55 observasi tidaklah begitu besar.