STATISTIKA DAN PROBABILITAS 10 PENGUJIAN HIPOTESIS JUMLAH PERTEMUAN : 1 PERTEMUAN TUJUAN INSTRUKSIONAL KHUSUS : Mahasiswa dapat memprediksi kejadian berikutnya. Materi 10.1. : PENDAHULUAN Variabel dibedakan dalam dua jenis dalam analisis regresi: Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan dengan π1 , π2 , … , ππ Dengan π ≥ 1 Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan dengan Y. Contoh: fenomena yang meliputi hasil panen padi dengan volume pupuk yang digunakan, sebaiknya diambil variabel bebas X = volume pupuk dan variabel takbebas Y = hasil panen padi. Persamaan regresi secara umum: ππ¦,π₯1 ,π₯2 ,..,π₯π = π(π1 , π2 , … , ππ |π1 , π2 , … , ππ ) Dengan π1 , π2 , … , ππ parameter-parameter yang ada dalam regresi itu. Jenis-jenis regresi adalah 1. Regresi linier: regresi linier sederhana dan regresi linier berganda Regresi non linier: regresi eksponensial, regresi parabola kuadratik, regresi parabola kubik, regresi logistik, regresi geometric STATISTIKA DAN PROBABILITAS 10.2. Regresi Linier 10.1.1. Regresi Linier Sederhana Merupakan regresi dengan satu variabel bebas, regresi dengan variabel bebas X dan variabel takbebasnya Y atau dinamakan juga regresi Y atas X, bentuk persamaannya: ππ¦.π₯ = π1 + π2 π Regresi linear sederhana berdasarkan sampel, maka π1 ditaksir dengan a dan π2 ditaksir dengan b diperoleh: πΜ = π + ππ Cara penentuan nilai a dan b dapat dilakukan dengan dua cara: 1. Metode tangan bebas Metode Tangan Bebas adalah metode penentuan persamaan regresi kira-kira menggunakan diagram pencar. Jika fenomena meliputi sebuah variabel bebas X dan variabel tak bebas Y, maka data yang didapat digambarkan pada diagram dengan sumbu datar menyatakan X dan sumbu tegak menyatakan Y. Jika letak titik-titik sekitar garis lurus maka untuk menentukan persamaan regresinya, dapat dicari dengan menggunakan dua titik yang dilalui garis tersebut, kemudian dicari persamaan garisnya, yaitu jika garis melewati titik-titik (π₯1 , π¦1 ) dan (π₯2 , π¦2 ) maka: π¦ − π¦1 π₯ − π₯1 = π¦2 − π¦1 π₯2 − π₯1 Penetuan regresi dengan cara ini bersifat tidak tunggal, artinya tiap orang akan memberikan perkiraan yang berbeda bergantung pada pertimbangan pribadi masing-masing. 2. Metode kuadrat terkecil Seperti dikatakan sebelumnya regresi dengan variabel bebas X dan variabel takbebas Y dimana model regresi linier untuk populasi yaitu ππ¦.π₯ = π1 + π2 π akan ditaksir harga-harga π1 dan π2 oleh a dan b sehingga didapat persamaan regresi menggunakan data sampel: πΜ = π + ππ STATISTIKA DAN PROBABILITAS Dengan π= (∑ ππ )(∑ ππ2 ) − (∑ ππ )(∑ ππ ππ ) π ∑ ππ2 − (∑ ππ )2 π= π ∑ ππ ππ − (∑ ππ )(∑ ππ ) π ∑ ππ2 − (∑ ππ )2 Dimana n adalah jumlah sampel, ππ adalah data variabel bebas ke – i dan ππ adalah data variabel takbebas ke – i. Jika terlebih dahulu dihitung koefisien b, maka koefisien a dapat pula ditentukan oleh rumus: π = πΜ − ππΜ dimana πΜ dan πΜ adalah rata-rata untuk masing-masing variabel X dan Y. Koefisien b dinamakan koefisien arah regresi linier dan menyatakan perubahan rata-rata variabel Y untuk setiap perubahan variabel X sebesar satu unit. Perubahan ini merupakan pertambahan jika b bertanda positif dan penurunan atau pengurangan jika bertanda negatif. Contoh: Data berikut melukiskan hasil pengamatan mengenai banyak orang yang datang (X) dan banyak orang yang berbelanja (Y) di sebuah toko selama 30 hari. STATISTIKA DAN PROBABILITAS Daftar 2.1 Banyak Pengunjung dan yang Berbelanja Di Sebuah Toko Selama 30 Hari Pengunjung (ππ ) 34 38 34 40 30 40 40 34 35 39 33 32 42 40 42 Berbelaja (ππ ) 32 36 31 38 29 35 33 30 32 36 31 31 36 37 35 Pengunjung (ππ ) 42 41 32 34 36 37 36 37 39 40 33 34 36 37 38 Berbelanja (ππ ) 38 37 30 30 30 33 32 34 35 36 32 32 34 32 34 39 y = 0,6821x + 8,2437 R² = 0,7673 Belanja (Y) 37 35 33 31 29 30 35 40 Pengunjung (X) Gambar 2.1 45 STATISTIKA DAN PROBABILITAS Jawab: ππ ππ 34 32 38 36 34 31 40 38 30 29 40 35 40 33 34 30 35 32 39 36 33 31 32 31 42 36 40 37 42 35 Setelah dijumlahkan didapat: ππ2 1156 1444 1156 1600 900 1600 1600 1156 1225 1521 1089 1024 1764 1600 1764 ππ ππ 1088 1368 1054 1520 870 1400 1320 1020 1120 1404 1023 992 1512 1480 1470 ππ 42 41 32 34 36 37 36 37 39 40 33 34 36 37 38 ππ 38 37 30 30 30 33 32 34 35 36 32 32 34 32 34 ππ ππ 1596 1517 960 1020 1080 1221 1152 1258 1365 1440 1056 1088 1224 1184 1292 ππ2 1764 1681 1024 1156 1296 1369 1296 1369 1521 1600 1089 1156 1296 1369 1444 ∑ ππ = 1105, ∑ ππ = 1001, ∑ ππ ππ = 37094 dan ∑ ππ2 = 41029 Maka diperoleh: π= (1001)(41029) − (1105)(37094) = 8,2437 30(41029) − (1105)2 π= 30(37094) − (1105)(1001) = 0,6821 30(41029) − (1105)2 Sehingga persamaan linier Y atas X adalah πΜ = 8,2437 + 0,6821π Artinya untuk setiap X bertambah dengan seorang maka rata-rata pembeli Y bertambah dengan 0,68 orang. Berbagai Varians Sehubungan Dengan Regresi Linear Sederhana Untuk analisis selanjutnya tentang regresi linier sederhana, beberapa asumsi harus diambil. Pertama, mengingat hasil pengamatan variabel takbebas Y belum tentu sama besarnya dengan harga diharapkan, yakni πΜ yang didapat dari regresi hasil pengamatan, maka terjadi perbedaan π = |π − πΜ|, STATISTIKA DAN PROBABILITAS biasa disebut kekeliruan prediksi atau galat prediksi. Dalam populasi, galat prediksi ini dimisalkan berbentuk variabel acak yang mengikuti distribusi normal dengan rata-rata nol dan varians ππ2 . Kedua, untuk setiap harga X yang diberikan, variabel tak bebas Y independen dan berdistribusi normal 2 2 denga rata-rata (π1 + π2 π) dan varians ππ.π . Varians ππ.π dimisalkan sama untuk setiap X dan 2 karenanya dapat dinyatakan oleh ππ yang biasa pula dinamakan varians kekeliruan taksiran sedangkan ππ¦.π₯ dikenal dengan kekeliruan baku taksiran. Berpegang kedua asumsi di atas, maka varians ππ2 ditaksir oleh rata-rata kuadrat penyimpangan sekitar regresi atau disebut juga rata-rata kuadrat residu, dinyatakan oleh varians π π2 yaitu 2 π π.π = π π2 = Μπ )2 ∑(ππ − π (π − 2) Dengan Y = variabel tak bebas hasil pengamatan dan πΜ = didapat dari regresi berdasarkan sampel, dan n = ukuran sampel. Dapat ditulis juga 2 π π.π =( π−1 ) (π π2 − π 2 π π2 ) π−2 Dengan π π2 dan π π2 masing-masing menyatakan varians untuk variabel-variabel Y dan X. Varians koefisien b: π π2 = 2 π π.π ∑(ππ − πΜ )2 Varians koefisien a: 1 πΜ 2 2 π π2 = π π.π { + } π ∑(ππ − πΜ )2 Varians ramalan rata-rata Y untuk π0 yang diketahui: 1 (π0 − πΜ )2 2 π π2Μ = π π.π { + } π ∑(ππ − πΜ )2 Varians ramalan individu Y untuk π0 yang diketahui STATISTIKA DAN PROBABILITAS 1 (π0 − πΜ )2 2 π π2Μ = π π.π {1 + + } π ∑(ππ − πΜ )2 2 (∑ π₯ ) Untuk rumus-rumus di atas ∑(ππ − πΜ )2 dapat diganti oleh {∑ ππ2 − ππ } Contoh: Untuk dengan data dalam daftar 2.1, kita dapat menghitung varians-varians di atas. Kita perlu πΜ = 36,8; π π₯2 = 11,32; π π¦2 = 6,86 dan∑(ππ − πΜ )2 = 328,2, diperoleh b = 0,68 dan n = 30 didapat 2 π π.π = 30 − 1 {6,86 − (0,68)2 (11,32)} = 1,684 30 − 2 π π2 = 1,684 = 5,13 × 10−3 328,2 π π2 = 1,684 { 1 36,82 + } = 7,005 30 328,2 Varians ramalan rata-rata Y untuk π0 = 40 adalah π π2Μ = 1,684 { 1 (40 − 36,8)2 + } = 0,1087 30 328,2 Varians ramalan individu Y untuk π0 = 40 adalah π π2Μ 1 (40 − 36,8)2 = 1,684 {1 + + } = 1,7927 30 328,2 Korelasi Koefisien korelasi (r): ukuran hubungan linier peubah X dan Y Nilai r berkisar antara -1 dan 1. π = −1 π = +1 Hubungan linier sempurna tak langsung. Titik-titik yang ditentukan oleh (ππ , ππ ) seluruhnya terletak pada garis regresi dan harga X besar berpasangan dengan Y kecil dan X kecil berpasangan dengan Y besar Hubungan linier sempurna langsung. Titik-titik yang ditentukan oleh (ππ , ππ ) seluruhnya terletak pada garis regresi dan harga X STATISTIKA DAN PROBABILITAS besar berpasangan dengan Y besar dan X kecil berpasangan dengan Y kecil Korelasi tak langsung atau korelasi negatif π<1 Korelasi langsung atau korelasi positif π>1 Tidak terdapat hubungan linier antara variabel X dan Y π=0 Untuk keperluan perhitungan koefisien korelasi r berdasarkan sekumpulan data (ππ , ππ ) berukuran n dapat digunakan rumus: π ∑ ππ ππ − (∑ ππ )(∑ ππ ) π= √{π ∑ ππ2 − (∑ ππ )2 }{π ∑ ππ2 − (∑ ππ )2 } Bentuk lain dapat pula digunakan: π = √1 − 2 π π¦.π₯ π π¦2 dengan π π¦.π₯ = kekeliruan baku taksiran dan π π¦ = simpangan baku untuk variabel Y. Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didapat koefisien arah,b, maka koefisien determinasi, π 2 , dapat ditentukan oleh rumus: π2 = π{π ∑ ππ ππ − (∑ ππ )(∑ ππ )} π ∑ ππ2 − (∑ ππ )2 atau dapat juga menggunakan formula: π= ππ π₯ π π¦ dengan π π₯ simpangan baku untuk variabel X dan π π¦ simpangan baku untuk variabel Y. Jika π1 adalah koefisien arah regresi Y atas X dan π2 adalah koefisien arah regresi X atas Y untuk data yang sama, maka π 2 = π1 π2 Rumus ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien-koefisien arah π1 dan π2 . Contoh: Untuk dengan data dalam daftar 2.1, untuk menentukan korelasi diperlu πΜ = 36,8; π π₯2 = 11,32; π π¦2 = 6,86 dan∑(ππ − πΜ )2 = 328,2, diperoleh b = 0,68 dan n = 30 didapat STATISTIKA DAN PROBABILITAS 11.32 π = 0.68√ = 0.87 6.86 10.1.2. Regresi Linier Berganda Banyak data pengamatan yang terjadi sebagai akibat lebih dari dua variabel. Misalnya, rata-rata pertambahan berat daging sapi (Y) bergantung pada berat permulaan (π1 ), umur sapi ketika pengamatan dimulai dilakukan (π2 ), berat makanan yang diberikan setiap hari (π3 ) dan mungkin masih ada faktor lain. Akan ditentukan hubungan antara Y dan π1 , π2 , … , ππ sehingga didapat regresi Y atas π1 , π2 , … , ππ . Yang akan ditinjau di sini hanyalah garis regresi sederhana ialah yang dikenal dengan regresi linier ganda. Model tersebut ditaksir oleh: πΜ = π0 + π1 π1 + π2 π2 + β― + +ππ ππ Koefisien-koefisien π0 , π1 , … , ππ ditentukan dengan menggunakan metode kuadrat terkecil. Untuk regresi linier ganda dua variabel bebas: πΜ = π0 + π1 π1 + π2 π2 maka untuk mengetahui koefisien-koefisiennya harus menyelesaikan persamaan-persamaan berikut: ∑ ππ = π0 π + π1 ∑ π1 π + π2 ∑ π2 π ∑ ππ π1 π = π0 ∑ π1 π + π1 ∑ π12 π + π2 ∑ π1 π π2 π ∑ ππ π2 π = π0 ∑ π2 π + π1 ∑ π1 π π2 π + π2 ∑ π22 π persamaan (*) π0 = πΜ − π1 Μ Μ Μ π1 − π2 Μ Μ Μ π2 π1 = π2 = (∑ π₯12 π )(∑ π₯1 π π¦π ) − (∑ π₯1 π π₯2 π )(∑ π₯2 π π¦π ) 2 (∑ π₯12 π )(∑ π₯22 π ) − (∑ π₯1 π π₯2 π ) (∑ π₯12 π )(∑ π₯2 π π¦π ) − (∑ π₯1 π π₯2 π )(∑ π₯1 π π¦π ) 2 (∑ π₯12 π )(∑ π₯22 π ) − (∑ π₯1 π π₯2 π ) STATISTIKA DAN PROBABILITAS Koefisien π1 merupakan perubahan rata-rata Y unutuk setiap perubahan satuan dalam variabel π1 apabila π2 , π3 , … , ππ semua dianggap tetap, begitu juga π2 merupakan perubahan rata-rata Y unutuk setiap perubahan satuan dalam variabel π2 apabila π1 , π3 , … , ππ semua dianggap tetap dan begitu seterusnya. Jelas bahwa di sini setiap koefisien hanya memberikan gambaran parsial apa yang terjadi pada Y untuk perubahan X yang berhubungan dengan koefisien dimaksud. Karenanya, koefisienkoevisien π1 , π2 , … , ππ disebut pula koefisien regresi parsil. Untuk regresi linier ganda variabel, maka ukuran kekelirua yang digunakan adalah: 2 2 π π¦.1,2,…,π Μπ ) ∑(ππ − π = π−π−1 Μπ = nilai harapan yang didapat dari persamaan regresi. dimana ππ = nilai data hasil pengamatan dan π Korelasi Linier Berganda 2 Koefisien Determinasi Sampel untuk Regresi Linier Berganda diberi notasi sebagai berikut π π¦.12 Sedangkan Koefisien korelasi adalah akar positif koefisien determinasi atau 2 ππ¦.12 = √π π¦.12 Rumus: 2 π π¦.12 =1− π½πΎπΊ (π − 1)π π¦2 Keterangan: JKG: Jumlah Kuadrat Galat π π¦2 : Jumlah Kuadrat y (terkoreksi) Dimana: π π¦2 = π ∑ π¦ 2 − (∑ π¦)2 π(π − 1) π½πΎπΊ = ∑ π¦ 2 − π0 ∑ π¦ − π1 ∑ π₯1 π¦ − π2 ∑ π₯2 π¦ (sumber: thomasyunigunarto) STATISTIKA DAN PROBABILITAS Berikut adalah data Volume Penjualan (juta unit) Mobil dihubungkan dengan variable biaya promosi (π1 dalam juta rupiah/tahun) dan variable biaya penambahan asesoris (π2 dalam ratusan ribu rupiah/unit) π₯1 2 3 5 6 7 8 π₯2 3 4 6 8 9 10 π¦ 4 5 8 10 11 12 π₯1 π₯2 6 12 30 48 63 80 π₯1 π¦ 8 15 40 60 77 96 π₯2 π¦ 12 20 48 80 99 120 π₯12 4 9 25 36 49 64 π₯22 9 16 36 64 81 100 π¦2 16 25 64 100 121 144 ∑ π₯1 ∑ π₯2 ∑π¦ ∑ π₯1 π₯2 ∑ π₯1 π¦ ∑ π₯2 π¦ ∑ π₯12 ∑ π₯22 ∑ π¦2 = 187 = 306 = 470 = 31 = 40 = 50 = 239 = 296 = 379 Tetapkan persamaan regresi linier berganda: π0 + π1 π1 + π2 π2 Substitusi kedalam persamaan: (i) (ii) (iii) 6π0 + 31π1 + 40π2 = 50 31π0 + 187π1 + 239π2 = 296 40π0 + 239π1 + 306π2 = 379 Gunakan eliminasi dan substitusi untuk mendapatkan nilai π0 , π1 , π2 yaitu: Sehingga diperoleh: 3 4 1 2 π0 = , π1 = , π3 = 3 4 Maka bentuk regresi linier berganda: πΜ = 3 1 3 + π1 + π2 4 2 4 Koefisien korelasi adalah π π¦2 = 6(470) − 502 = 10.667 6(5) π½πΎπΊ = 470 − 0.75(50) − 0.5(296) − 0.75(379) = 0.25 2 π π¦.12 =1− 0.25 = 0.99 5(10.667) STATISTIKA DAN PROBABILITAS 10.3. Regresi Non Linier 1. Parabola kuadratik: πΜ = π + ππ + ππ 2 Dengan menggunakan metode kuadrat terkecil, maka a, b, dan c dapat dihitung dari sistem persamaan: ∑ ππ = ππ + π ∑ ππ + π ∑ ππ2 ∑ ππ ππ = π ∑ ππ + π ∑ ππ2 + π ∑ ππ3 ∑ ππ2 ππ = π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4 2. Parabolik kubik: πΜ = π + ππ + ππ 2 + ππ 3 Untuk menentukan nilai a, b, c, dan d gunakan sistem persamaan berikut: ∑ ππ = ππ + π ∑ ππ + π ∑ ππ2 + π ∑ ππ3 ∑ ππ ππ = π ∑ ππ + π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4 ∑ ππ2 ππ = π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4 + π ∑ ππ5 ∑ ππ3 ππ = π ∑ ππ3 + π ∑ ππ4 + π ∑ ππ5 + π ∑ ππ6 3. Eksponen : πΜ = ππ π Besar nilai a dan b ditentukan menggunakan persamaan: ∑ log ππ ∑ ππ log π = − (log π) ( ) π π π(∑ ππ log ππ ) − (∑ ππ )(∑ log ππ ) log π = π ∑ ππ2 − (∑ ππ )2 4. Geometrik: πΜ = ππ π Besar nilai a dan b ditentukan menggunakan persamaan: ∑ log ππ ∑ log ππ log π = −π π π π(∑ log ππ log ππ ) − (∑ log ππ )(∑ log ππ ) π= π ∑ πππ2 ππ − (∑ log ππ )2 1 5. Logistik: πΜ = π ππ +π 1 ∑ log ( ) ∑ ππ ππ log π = − (log π) ( ) π π 1 1 π (∑ ππ log ( )) − (∑ ππ ) (∑ log ( )) ππ ππ log π = π ∑ ππ2 − (∑ ππ )2 1 6. Hiperbola: πΜ = π+ππ Jika πΜ tidak ada yang bernilai nol, maka a dan b adalah STATISTIKA DAN PROBABILITAS 1 1 (∑ π ) (∑ ππ2 ) − (∑ ππ ) (∑ ππ π ) π π π= 2 2 ∑ (∑ ) π ππ − ππ