STATISTIKA DAN PROBABILITAS
10
PENGUJIAN HIPOTESIS
JUMLAH PERTEMUAN : 1 PERTEMUAN
TUJUAN INSTRUKSIONAL KHUSUS :
Mahasiswa dapat memprediksi kejadian berikutnya.
Materi
10.1.
:
PENDAHULUAN
Variabel dibedakan dalam dua jenis dalam analisis regresi:
Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan
dengan π1 , π2 , … , ππ Dengan π ≥ 1
Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan
dengan Y.
Contoh: fenomena yang meliputi hasil panen padi dengan volume pupuk yang digunakan, sebaiknya
diambil variabel bebas X = volume pupuk dan variabel takbebas Y = hasil panen padi.
Persamaan regresi secara umum:
ππ¦,π₯1 ,π₯2 ,..,π₯π = π(π1 , π2 , … , ππ |π1 , π2 , … , ππ )
Dengan π1 , π2 , … , ππ parameter-parameter yang ada dalam regresi itu.
Jenis-jenis regresi adalah
1. Regresi linier: regresi linier sederhana dan regresi linier berganda
Regresi non linier: regresi eksponensial, regresi parabola kuadratik, regresi parabola kubik, regresi
logistik, regresi geometric
STATISTIKA DAN PROBABILITAS
10.2.
Regresi Linier
10.1.1. Regresi Linier Sederhana
Merupakan regresi dengan satu variabel bebas, regresi dengan variabel bebas X dan variabel
takbebasnya Y atau dinamakan juga regresi Y atas X, bentuk persamaannya:
ππ¦.π₯ = π1 + π2 π
Regresi linear sederhana berdasarkan sampel, maka π1 ditaksir dengan a dan π2 ditaksir dengan b
diperoleh:
πΜ = π + ππ
Cara penentuan nilai a dan b dapat dilakukan dengan dua cara:
1. Metode tangan bebas
Metode Tangan Bebas adalah metode penentuan persamaan regresi kira-kira menggunakan
diagram pencar. Jika fenomena meliputi sebuah variabel bebas X dan variabel tak bebas Y, maka data
yang didapat digambarkan pada diagram dengan sumbu datar menyatakan X dan sumbu tegak
menyatakan Y.
Jika letak titik-titik sekitar garis lurus maka untuk menentukan persamaan regresinya, dapat dicari
dengan menggunakan dua titik yang dilalui garis tersebut, kemudian dicari persamaan garisnya, yaitu
jika garis melewati titik-titik (π₯1 , π¦1 ) dan (π₯2 , π¦2 ) maka:
π¦ − π¦1
π₯ − π₯1
=
π¦2 − π¦1 π₯2 − π₯1
Penetuan regresi dengan cara ini bersifat tidak tunggal, artinya tiap orang akan memberikan
perkiraan yang berbeda bergantung pada pertimbangan pribadi masing-masing.
2. Metode kuadrat terkecil
Seperti dikatakan sebelumnya regresi dengan variabel bebas X dan variabel takbebas Y dimana
model regresi linier untuk populasi yaitu
ππ¦.π₯ = π1 + π2 π
akan ditaksir harga-harga π1 dan π2 oleh a dan b sehingga didapat persamaan regresi menggunakan
data sampel:
πΜ = π + ππ
STATISTIKA DAN PROBABILITAS
Dengan
π=
(∑ ππ )(∑ ππ2 ) − (∑ ππ )(∑ ππ ππ )
π ∑ ππ2 − (∑ ππ )2
π=
π ∑ ππ ππ − (∑ ππ )(∑ ππ )
π ∑ ππ2 − (∑ ππ )2
Dimana n adalah jumlah sampel, ππ adalah data variabel bebas ke – i dan ππ adalah data variabel
takbebas ke – i.
Jika terlebih dahulu dihitung koefisien b, maka koefisien a dapat pula ditentukan oleh rumus:
π = πΜ
 − ππΜ
dimana πΜ
 dan πΜ
 adalah rata-rata untuk masing-masing variabel X dan Y.
Koefisien b dinamakan koefisien arah regresi linier dan menyatakan perubahan rata-rata variabel Y
untuk setiap perubahan variabel X sebesar satu unit. Perubahan ini merupakan pertambahan jika b
bertanda positif dan penurunan atau pengurangan jika bertanda negatif.
Contoh:
Data berikut melukiskan hasil pengamatan mengenai banyak orang yang datang (X) dan banyak orang
yang berbelanja (Y) di sebuah toko selama 30 hari.
STATISTIKA DAN PROBABILITAS
Daftar 2.1
Banyak Pengunjung dan yang Berbelanja
Di Sebuah Toko Selama 30 Hari
Pengunjung
(ππ )
34
38
34
40
30
40
40
34
35
39
33
32
42
40
42
Berbelaja
(ππ )
32
36
31
38
29
35
33
30
32
36
31
31
36
37
35
Pengunjung
(ππ )
42
41
32
34
36
37
36
37
39
40
33
34
36
37
38
Berbelanja
(ππ )
38
37
30
30
30
33
32
34
35
36
32
32
34
32
34
39
y = 0,6821x + 8,2437
R² = 0,7673
Belanja (Y)
37
35
33
31
29
30
35
40
Pengunjung (X)
Gambar 2.1
45
STATISTIKA DAN PROBABILITAS
Jawab:
ππ
ππ
34
32
38
36
34
31
40
38
30
29
40
35
40
33
34
30
35
32
39
36
33
31
32
31
42
36
40
37
42
35
Setelah dijumlahkan didapat:
ππ2
1156
1444
1156
1600
900
1600
1600
1156
1225
1521
1089
1024
1764
1600
1764
ππ ππ
1088
1368
1054
1520
870
1400
1320
1020
1120
1404
1023
992
1512
1480
1470
ππ
42
41
32
34
36
37
36
37
39
40
33
34
36
37
38
ππ
38
37
30
30
30
33
32
34
35
36
32
32
34
32
34
ππ ππ
1596
1517
960
1020
1080
1221
1152
1258
1365
1440
1056
1088
1224
1184
1292
ππ2
1764
1681
1024
1156
1296
1369
1296
1369
1521
1600
1089
1156
1296
1369
1444
∑ ππ = 1105, ∑ ππ = 1001, ∑ ππ ππ = 37094 dan ∑ ππ2 = 41029
Maka diperoleh:
π=
(1001)(41029) − (1105)(37094)
= 8,2437
30(41029) − (1105)2
π=
30(37094) − (1105)(1001)
= 0,6821
30(41029) − (1105)2
Sehingga persamaan linier Y atas X adalah
πΜ = 8,2437 + 0,6821π
Artinya untuk setiap X bertambah dengan seorang maka rata-rata pembeli Y bertambah dengan 0,68
orang.
Berbagai Varians Sehubungan Dengan Regresi Linear Sederhana
Untuk analisis selanjutnya tentang regresi linier sederhana, beberapa asumsi harus diambil.
Pertama, mengingat hasil pengamatan variabel takbebas Y belum tentu sama besarnya dengan harga
diharapkan, yakni πΜ yang didapat dari regresi hasil pengamatan, maka terjadi perbedaan π = |π − πΜ|,
STATISTIKA DAN PROBABILITAS
biasa disebut kekeliruan prediksi atau galat prediksi. Dalam populasi, galat prediksi ini dimisalkan
berbentuk variabel acak yang mengikuti distribusi normal dengan rata-rata nol dan varians ππ2 .
Kedua, untuk setiap harga X yang diberikan, variabel tak bebas Y independen dan berdistribusi normal
2
2
denga rata-rata (π1 + π2 π) dan varians ππ.π
. Varians ππ.π
dimisalkan sama untuk setiap X dan
2
karenanya dapat dinyatakan oleh ππ yang biasa pula dinamakan varians kekeliruan taksiran sedangkan
ππ¦.π₯ dikenal dengan kekeliruan baku taksiran.
Berpegang kedua asumsi di atas, maka varians ππ2 ditaksir oleh rata-rata kuadrat penyimpangan sekitar
regresi atau disebut juga rata-rata kuadrat residu, dinyatakan oleh varians π π2 yaitu
2
π π.π
= π π2 =
Μπ )2
∑(ππ − π
(π − 2)
Dengan Y = variabel tak bebas hasil pengamatan dan πΜ = didapat dari regresi berdasarkan sampel, dan n
= ukuran sampel.
Dapat ditulis juga
2
π π.π
=(
π−1
) (π π2 − π 2 π π2 )
π−2
Dengan π π2 dan π π2 masing-masing menyatakan varians untuk variabel-variabel Y dan X.
Varians koefisien b:
π π2 =
2
π π.π
∑(ππ − πΜ
)2
Varians koefisien a:
1
πΜ
 2
2
π π2 = π π.π
{ +
}
π ∑(ππ − πΜ
)2
Varians ramalan rata-rata Y untuk π0 yang diketahui:
1 (π0 − πΜ
)2
2
π π2Μ = π π.π
{ +
}
π ∑(ππ − πΜ
)2
Varians ramalan individu Y untuk π0 yang diketahui
STATISTIKA DAN PROBABILITAS
1 (π0 − πΜ
)2
2
π π2Μ = π π.π
{1 + +
}
π ∑(ππ − πΜ
)2
2
(∑ π₯ )
Untuk rumus-rumus di atas ∑(ππ − πΜ
)2 dapat diganti oleh {∑ ππ2 − ππ }
Contoh:
Untuk dengan data dalam daftar 2.1, kita dapat menghitung varians-varians di atas. Kita perlu πΜ
 = 36,8;
π π₯2 = 11,32; π π¦2 = 6,86 dan∑(ππ − πΜ
)2 = 328,2, diperoleh b = 0,68 dan n = 30 didapat
2
π π.π
=
30 − 1
{6,86 − (0,68)2 (11,32)} = 1,684
30 − 2
π π2 =
1,684
= 5,13 × 10−3
328,2
π π2 = 1,684 {
1
36,82
+
} = 7,005
30 328,2
Varians ramalan rata-rata Y untuk π0 = 40 adalah
π π2Μ = 1,684 {
1 (40 − 36,8)2
+
} = 0,1087
30
328,2
Varians ramalan individu Y untuk π0 = 40 adalah
π π2Μ
1 (40 − 36,8)2
= 1,684 {1 +
+
} = 1,7927
30
328,2
Korelasi
Koefisien korelasi (r): ukuran hubungan linier peubah X dan Y
Nilai r berkisar antara -1 dan 1.
π = −1
π = +1
Hubungan linier sempurna tak langsung.
Titik-titik yang ditentukan oleh (ππ , ππ ) seluruhnya terletak pada garis regresi dan harga X
besar berpasangan dengan Y kecil dan X kecil berpasangan dengan Y besar
Hubungan linier sempurna langsung.
Titik-titik yang ditentukan oleh (ππ , ππ ) seluruhnya terletak pada garis regresi dan harga X
STATISTIKA DAN PROBABILITAS
besar berpasangan dengan Y besar dan X kecil berpasangan dengan Y kecil
Korelasi tak langsung atau korelasi negatif
π<1
Korelasi langsung atau korelasi positif
π>1
Tidak terdapat hubungan linier antara variabel X dan Y
π=0
Untuk keperluan perhitungan koefisien korelasi r berdasarkan sekumpulan data (ππ , ππ ) berukuran n
dapat digunakan rumus:
π ∑ ππ ππ − (∑ ππ )(∑ ππ )
π=
√{π ∑ ππ2 − (∑ ππ )2 }{π ∑ ππ2 − (∑ ππ )2 }
Bentuk lain dapat pula digunakan:
π = √1 −
2
π π¦.π₯
π π¦2
dengan π π¦.π₯ = kekeliruan baku taksiran dan π π¦ = simpangan baku untuk variabel Y.
Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didapat koefisien arah,b, maka
koefisien determinasi, π 2 , dapat ditentukan oleh rumus:
π2 =
π{π ∑ ππ ππ − (∑ ππ )(∑ ππ )}
π ∑ ππ2 − (∑ ππ )2
atau dapat juga menggunakan formula:
π=
ππ π₯
π π¦
dengan π π₯ simpangan baku untuk variabel X dan π π¦ simpangan baku untuk variabel Y.
Jika π1 adalah koefisien arah regresi Y atas X dan π2 adalah koefisien arah regresi X atas Y untuk data
yang sama, maka
π 2 = π1 π2
Rumus ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien-koefisien
arah π1 dan π2 .
Contoh:
Untuk dengan data dalam daftar 2.1, untuk menentukan korelasi diperlu πΜ
 = 36,8; π π₯2 = 11,32; π π¦2 =
6,86 dan∑(ππ − πΜ
)2 = 328,2, diperoleh b = 0,68 dan n = 30 didapat
STATISTIKA DAN PROBABILITAS
11.32
π = 0.68√
= 0.87
6.86
10.1.2. Regresi Linier Berganda
Banyak data pengamatan yang terjadi sebagai akibat lebih dari dua variabel. Misalnya, rata-rata
pertambahan berat daging sapi (Y) bergantung pada berat permulaan (π1 ), umur sapi ketika
pengamatan dimulai dilakukan (π2 ), berat makanan yang diberikan setiap hari (π3 ) dan mungkin masih
ada faktor lain.
Akan ditentukan hubungan antara Y dan π1 , π2 , … , ππ sehingga didapat regresi Y atas π1 , π2 , … , ππ . Yang
akan ditinjau di sini hanyalah garis regresi sederhana ialah yang dikenal dengan regresi linier ganda.
Model tersebut ditaksir oleh:
πΜ = π0 + π1 π1 + π2 π2 + β― + +ππ ππ
Koefisien-koefisien π0 , π1 , … , ππ ditentukan dengan menggunakan metode kuadrat terkecil.
Untuk regresi linier ganda dua variabel bebas:
πΜ = π0 + π1 π1 + π2 π2
maka untuk mengetahui koefisien-koefisiennya harus menyelesaikan persamaan-persamaan berikut:
∑ ππ = π0 π + π1 ∑ π1 π + π2 ∑ π2 π
∑ ππ π1 π = π0 ∑ π1 π + π1 ∑ π12 π + π2 ∑ π1 π π2 π
∑ ππ π2 π = π0 ∑ π2 π + π1 ∑ π1 π π2 π + π2 ∑ π22 π
persamaan (*)
π0 = πΜ
 − π1 Μ
Μ
Μ
π1 − π2 Μ
Μ
Μ
π2
π1 =
π2 =
(∑ π₯12 π )(∑ π₯1 π π¦π ) − (∑ π₯1 π π₯2 π )(∑ π₯2 π π¦π )
2
(∑ π₯12 π )(∑ π₯22 π ) − (∑ π₯1 π π₯2 π )
(∑ π₯12 π )(∑ π₯2 π π¦π ) − (∑ π₯1 π π₯2 π )(∑ π₯1 π π¦π )
2
(∑ π₯12 π )(∑ π₯22 π ) − (∑ π₯1 π π₯2 π )
STATISTIKA DAN PROBABILITAS
Koefisien π1 merupakan perubahan rata-rata Y unutuk setiap perubahan satuan dalam variabel π1
apabila π2 , π3 , … , ππ semua dianggap tetap, begitu juga π2 merupakan perubahan rata-rata Y unutuk
setiap perubahan satuan dalam variabel π2 apabila π1 , π3 , … , ππ semua dianggap tetap dan begitu
seterusnya. Jelas bahwa di sini setiap koefisien hanya memberikan gambaran parsial apa yang terjadi
pada Y untuk perubahan X yang berhubungan dengan koefisien dimaksud. Karenanya, koefisienkoevisien π1 , π2 , … , ππ disebut pula koefisien regresi parsil.
Untuk regresi linier ganda variabel, maka ukuran kekelirua yang digunakan adalah:
2
2
π π¦.1,2,…,π
Μπ )
∑(ππ − π
=
π−π−1
Μπ = nilai harapan yang didapat dari persamaan regresi.
dimana ππ = nilai data hasil pengamatan dan π
Korelasi Linier Berganda
2
Koefisien Determinasi Sampel untuk Regresi Linier Berganda diberi notasi sebagai berikut π
π¦.12
Sedangkan Koefisien korelasi adalah akar positif koefisien determinasi atau
2
ππ¦.12 = √π
π¦.12
Rumus:
2
π
π¦.12
=1−
π½πΎπΊ
(π − 1)π π¦2
Keterangan:
JKG: Jumlah Kuadrat Galat
π π¦2 : Jumlah Kuadrat y (terkoreksi)
Dimana:
π π¦2 =
π ∑ π¦ 2 − (∑ π¦)2
π(π − 1)
π½πΎπΊ = ∑ π¦ 2 − π0 ∑ π¦ − π1 ∑ π₯1 π¦ − π2 ∑ π₯2 π¦
(sumber: thomasyunigunarto)
STATISTIKA DAN PROBABILITAS
Berikut adalah data Volume Penjualan (juta unit) Mobil dihubungkan dengan variable biaya promosi (π1
dalam juta rupiah/tahun) dan variable biaya penambahan asesoris (π2 dalam ratusan ribu rupiah/unit)
π₯1
2
3
5
6
7
8
π₯2
3
4
6
8
9
10
π¦
4
5
8
10
11
12
π₯1 π₯2
6
12
30
48
63
80
π₯1 π¦
8
15
40
60
77
96
π₯2 π¦
12
20
48
80
99
120
π₯12
4
9
25
36
49
64
π₯22
9
16
36
64
81
100
π¦2
16
25
64
100
121
144
∑ π₯1
∑ π₯2
∑π¦
∑ π₯1 π₯2
∑ π₯1 π¦
∑ π₯2 π¦
∑ π₯12
∑ π₯22
∑ π¦2
= 187
= 306
= 470
= 31
= 40
= 50
= 239
= 296
= 379
Tetapkan persamaan regresi linier berganda: π0 + π1 π1 + π2 π2
Substitusi kedalam persamaan:
(i)
(ii)
(iii)
6π0 + 31π1 + 40π2 = 50
31π0 + 187π1 + 239π2 = 296
40π0 + 239π1 + 306π2 = 379
Gunakan eliminasi dan substitusi untuk mendapatkan nilai π0 , π1 , π2 yaitu:
Sehingga diperoleh:
3
4
1
2
π0 = , π1 = , π3 =
3
4
Maka bentuk regresi linier berganda:
πΜ =
3 1
3
+ π1 + π2
4 2
4
Koefisien korelasi adalah
π π¦2 =
6(470) − 502
= 10.667
6(5)
π½πΎπΊ = 470 − 0.75(50) − 0.5(296) − 0.75(379) = 0.25
2
π
π¦.12
=1−
0.25
= 0.99
5(10.667)
STATISTIKA DAN PROBABILITAS
10.3.
Regresi Non Linier
1. Parabola kuadratik: πΜ = π + ππ + ππ 2
Dengan menggunakan metode kuadrat terkecil, maka a, b, dan c dapat dihitung dari sistem
persamaan:
∑ ππ = ππ + π ∑ ππ + π ∑ ππ2
∑ ππ ππ = π ∑ ππ + π ∑ ππ2 + π ∑ ππ3
∑ ππ2 ππ = π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4
2. Parabolik kubik: πΜ = π + ππ + ππ 2 + ππ 3
Untuk menentukan nilai a, b, c, dan d gunakan sistem persamaan berikut:
∑ ππ = ππ + π ∑ ππ + π ∑ ππ2 + π ∑ ππ3
∑ ππ ππ = π ∑ ππ + π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4
∑ ππ2 ππ = π ∑ ππ2 + π ∑ ππ3 + π ∑ ππ4 + π ∑ ππ5
∑ ππ3 ππ = π ∑ ππ3 + π ∑ ππ4 + π ∑ ππ5 + π ∑ ππ6
3. Eksponen : πΜ = ππ π
Besar nilai a dan b ditentukan menggunakan persamaan:
∑ log ππ
∑ ππ
log π =
− (log π) (
)
π
π
π(∑ ππ log ππ ) − (∑ ππ )(∑ log ππ )
log π =
π ∑ ππ2 − (∑ ππ )2
4. Geometrik: πΜ = ππ π
Besar nilai a dan b ditentukan menggunakan persamaan:
∑ log ππ
∑ log ππ
log π =
−π
π
π
π(∑ log ππ log ππ ) − (∑ log ππ )(∑ log ππ )
π=
π ∑ πππ2 ππ − (∑ log ππ )2
1
5. Logistik: πΜ = π
ππ +π
1
∑ log ( )
∑ ππ
ππ
log π =
− (log π) (
)
π
π
1
1
π (∑ ππ log ( )) − (∑ ππ ) (∑ log ( ))
ππ
ππ
log π =
π ∑ ππ2 − (∑ ππ )2
1
6. Hiperbola: πΜ = π+ππ
Jika πΜ tidak ada yang bernilai nol, maka a dan b adalah
STATISTIKA DAN PROBABILITAS
1
1
(∑ π ) (∑ ππ2 ) − (∑ ππ ) (∑ ππ π )
π
π
π=
2
2
∑
(∑
)
π ππ −
ππ