Kualitas Fitted Model

advertisement
Kualitas Fitted Model
• Apakah model regresi sudah cukup pas mewakili data?
• Apakah model regresi cukup baik untuk model peramalan?
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Tebaran titik amatan / scatter plot
a.
Mana di antara
gambar–gambar ini yang mo- b.
delnya cukup
pas/sesuai ?
y
x
c.
y
x
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Perlu diuji
y
apakah modelnya sudah pas d.
atau belum 
uji lack of fit
atau secara
eksploratif plot
sisaan
y
x
x
a.
y
Tebaran titik amatan / scatter plot
y
b.
x
c.
y
x
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Mana di antara
gambar–gambar ini
yang modelnya
cukup baik untuk
peramalan?
Perlu suatu besaran
yang dapat mengukur
jauh/dekatnya titik pengamatan thdp garis
regresi
y
x
d.
x
Koefisien Determinasi, R2
 Koefisien determinasi mengukur proporsi keragaman atau variasi
total di sekitar nilai tengah (Y) yang dapat dijelaskan oleh garis
regresi
 secara grafis mengukur jauh/dekatnya titik pengamatan
thdp garis regresi
 Koefisien determinasi juga disebut R-kuadrat dan dinotasikan
sebagai R2
R 
2
JK Reg
JK Tot
( yˆ


(y
CATATAN:
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
i
 y)2
2

y
)
i
2
atau R  1 
0  R2 1
JK Sisa
JK Total
Analisis Korelasi
 Analisis korelasi digunakan untuk mengukur
kekuatan hubungan (hubungan linier) antara
dua peubah
 Korelasi hanya khusus untuk kekuatan hubungan
 Mengukur arah hubungan
 Tidak berdampak pada sebab akibat
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Analisis Korelasi
 Koefisien korelasi populasi dinotasikan dengan ρ
(huruf Greek rho)
 Koefisien korelasi contoh adalah :
r
s xy
sxsy
Koefisien
korelasi
Pearson
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
,
s xy
(x  x)(y  y)


i
n 1
i
Pada Model Regresi Linier Sederhana
yg hub.nya linier :
R2 = r2  r = (tanda b1)
Uji Hipotesis untuk Korelasi
 Untuk melakukan tes bahwa tidak ada
hubungan linier, Hipotesis nol nya :
H0 : ρ  0
Statistik ujinya mengikuti sebaran t Student
dengan derajad bebas (n – 2 )
t
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
r (n  2)
(1  r 2 )
Kaidah Keputusan
Uji Hipotesis untuk Korelasi
H0: ρ  0
H1: ρ < 0
a
H0: ρ ≤ 0
H1: ρ > 0
-ta
tolak H0 jika t < -tn-2, a
ta
a
Tolak H0 jika t > tn-2, a
dengan t 
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
H0: ρ = 0
H1: ρ ≠ 0
r (n  2)
(1  r )
2
, d.b  n - 2
a/2
-ta/2
a/2
ta/2
Tolak H0 jika t < -tn-2, a/2
atau t > tn-2, a/2
Interpretasi beberapa nilai r2
Y
Y
r2 = 1 dapat diinterpretasikan
sbb. :
r2 = 1
r2
=1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
X
X
Adanya hubungan linier
yang tepat antara X dan Y:
100% keragaman Y
dijelaskan oleh keragaman X
Interpretasi beberapa nilai r2
Y
Y
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
0 < r2 < 1 dapat diinterpretasikan sbb. :
X
X
Adanya hubungan linier yang
lemah antara X dan Y:
Sebagian (tidak semuanya)
keragaman Y dijelaskan oleh
keragaman X
Interpretasi beberapa nilai r2
r2 = 0 dapat diinterpretasikan
sbb. :
Y
Tidak ada hubungan linier
antara X dan Y:
r2 = 0
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
X
Nilai Y tidak bergantung pada
nilai X. (Tidak ada keragaman
Y yang dapat diterangkan
oleh keragaman X)
Data contoh Harga Rumah
Harga
Rumah
(Rp.juta) (Y)
Luas Lantai
(m2) (X)
312
1600
245
279
308
199
1400
1700
1875
1100
219
1550
324
2450
405
319
255
FILM :
MENDUGA
KOEFISIEN KORELASI PEARSON
dengan
MENGGUNAKAN MINITAB
2350
1425
1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Klik di sini
Koefisien Determinasi :
Excel Output
SSR 18934.9348
R 

 0.58082
SST 32600.5000
2
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
ANOVA
Regression
Residual
Total
Intercept
Luas Lantai
0.76211
0.58082
58.08% keragaman harga
rumah dijelaskan oleh
keragaman luas lantai
0.52842
41.33032
10
df
SS
1
18934.9348
9
32600.5000
8
Coefficients
98.24833
0.10977
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
13665.5652
Standard Error
58.03348
0.03297
MS
18934.9348
1708.1957
t Stat
1.69296
3.32938
F
Significance F
P-value
Lower 95%
11.0848
0.12892
0.01039
0.01039
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Korelasi dan Koefisien
Determinasi R2
 Koefisien determinasi, R2, untuk regresi linier sederhana
yang hubungannya linier (ordo X = 1) sama dengan
koefisien korelasi kuadrat
R
2
r
rxy  R  (tanda b1 )(R )
2
xy
2 1/ 2
^
 Korelasi antara amatan Yi dengan nilai dugaannya Yi untuk
sembarang regresi linier dengan berapapun banyaknya
peubah bebas
r
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
^
Y Y
 R
Uji Ketidakpasan Model
 Harus ada ulangan pengamatan yi pada nilai xi
yang sama. Mis. :
x
x1
x2
y
y11
y12
y21
y22
y23
x3
x4
y24
y31
y32
y33
y41
y42
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Untuk data contoh di samping dapat
dinotasikan :
m = 4, n1=2, n2=4, n3=3, n4=2
n 

m
j 1
n j  2  4  3  2  11
Uji ketidakpasan model :
Tabel Sidik Ragam
Derajat
Sumber
Keragaman Bebas
(db)
Regresi
1
(b1| b0)
Sisaan
n-2
Ketidakpasan db -db
sisa
GM
model
Galat murni
Total
(terkoreksi)
 nj  m
m
j 1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
n-1
Jumlah
Kuadrat
(JK)
 yˆ  y 
n
i 1
2
i
2
ˆ


y

y
 i i
n
i 1
JKsisa – JKGM
 ( y ju  y j )2
m
nj
 y  y 
j 1 u 1
n
i 1
i
2
Kuadrat
Tengah
(KT)
JK Regresi
1
JK sisaan
n  2 
KTKM 
KTGM 
JKKM
dbKM
JKGM
dbGM
Statistik ujinya :
Fhit 
KT KM
KT GM
Langkah-langkah
Pemilihan Model yang Pas
1. Tentukan model, dapatkan dugaan persamaan garis regresinya,
susun tabel Sidik Ragam, jangan dulu melakukan uji F untuk
regresi keseluruhan
2. Lakukan uji ketidakpasan model.
Jika tidak ada ulangan, cek secara eksploratif : plot sisaan-nya
(akan dijelaskan pada pokok bahasan: Diagnosa Model).
Jika nyata : lanjut ke langkah 3
Jika tidak nyata : gunakan KT sisaan s2 sebagai dugaan bagi
Rag(Y) = σ2 , lakukan uji F secara keseluruhan, hitung R2, periksa asumsi untuk MKT melalui plot sisaan (Diagnosa Model)
3. Hentikan analisis, perbaiki modelnya (lihat pola plot sisaannya).
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Data contoh Harga Rumah
Harga
Rumah
(Rp.juta) (Y)
Luas Lantai
(m2) (X)
312
1600
245
279
308
199
1400
1700
1875
1100
219
1550
324
2450
405
319
255
2350
1425
1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
FILM :
MENGUJI
KETIDAKPASAN MODEL
dengan
MENGGUNAKAN MINITAB
Klik di sini
Data contoh Harga Rumah
Harga
Rumah
(Rp.juta) (Y)
Luas Lantai
(m2) (X)
312
1600
245
279
308
199
1400
1700
1875
1100
219
1550
324
2450
405
319
255
2350
1425
1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Setelah diuji ketidakpasan modelnya,
ternyata model yang pas adalah Model
Regresi Linier Ordo 1. Selanjutnya kita
lakukan pendugaan untuk model linier
tsb. Sekaligus mendapatkan dugaan
garis regresinya
FILM :
Menduga Persamaan
Regresi (Linier)
Klik di sini
Selang Kepercayaan
bagi koefisien kemiringan b1
Selang kepercayaan bagi koefisien
kemiringan adalah :
b1  t n2,α/2 sb1  β1  b1  t n2,α/2 sb1
Output Excel untuk contoh kasus harga rumah:
Intercept
Luas Lantai
Coefficients
Standard Error
0.10977
0.03297
98.24833
58.03348
t Stat
P-value
3.32938
0.01039
1.69296
0.12892
d.b. = n - 2
Lower 95%
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Pada tingkat kepercayaan 95%, selang kepercayaan
bagi koefisien kemiringan garis adalah (0.0337, 0.1858)
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang Kepercayaan
bagi koefisien kemiringan b1
(lanjutan)
Intercept
Luas Lantai
Coefficients
Standard Error
0.10977
0.03297
98.24833
58.03348
t Stat
P-value
3.32938
0.01039
1.69296
0.12892
Lower 95%
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Selama satuan peubah tak bebas (harga rumah) dalam juta rupiah, kita
percaya 95% bahwa rata-rata pengaruh penambahan harga rumah
berada antara Rp. 0,03374 juta sampai dengan Rp.0,18580 juta setiap
penambahan satu m2 luas lantai
Selang kepercayaan 95% ini tidak memuat angka 0.
Kesimpulan : Ada hubungan linier yang nyata antara harga rumah
dengan luas lantai dengan tingkat nyata sebesar 95%
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Peramalan
 Dugaan persamaan garis regresi dapat
digunakan untuk memprediksi/meramal nilai
Y jika x diketahui (hati-hati hanya untuk x
yang berada dalam selang pengamatan)
 Untuk suatu nilai, xn+1 , nilai prediksi bagi Y
adalah
yˆ n1  b0  b1x n1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Memprediksi dengan menggunakan
persamaan garis regresi
Berapa kira-kira harga rumah yang luas lantainya
2000 m2 ! (2000 bukan titik pengamatan, namun
masih dalam selang pengamatan). interpolasi
harga rumah  98.25  0.1098 (luas lantai)
 98.25  0.1098(200 0)
 317.85
Prediksi harga rumah dengan luas lantai
2000 m2 adalah Rp 317,85 juta
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang data yang relevan
 Ketika menggunakan garis regresi sebagai alat
untuk memprediksi, x yang boleh digunakan adalah
x yang nilainya dalam selang pengamatan
Harga Rumah (juta Rp)
Selang yang relevan
450
400
350
300
250
200
150
100
50
0
0
500
1000
1500
2000
Itasia & Y Angraini, Dep Statistika
FMIPA
- IPB(m2)
Luas
Lantai
2500
3000
Sangat riskan
untuk melakukan
ekstrapolasi X di
luar selang
pengamatan
Selang kepercayaan rataan
respon dan dugaan individu
Selang
kepercayaan
bagi rataan Y,
untuk xi
Y

y
y = b0 + b1 xi
Selang kepercayaan bagi nilai pengamatan y, untuk xi
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
xi
X
Selang Kepercayaan bagi nilai harapan Y,
untuk suatu X
Selang kepercayaan bagi
dugaan nilai harapan/rataan y jika diketahui xi
Selang kepercayaan bagi E(Yn 1 | X n 1 ) :
ŷ n 1  t n  2,α/2s e
 1 (x n 1  x) 2 
 
2
 n  (x i  x) 
Perhatikan bahwa rumus tersebut mengandung (x n1  x)2
Jadi beragamnya lebar selang bergantung pada jarak
antara xn+1 terhadap nilai rataan, x
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang Kepercayaan bagi
individu Y, untuk suatu nilai x
Selang kepercayaan individu y untuk suatu
nilai xi
Selang kepercayaa n bagi ŷ n 1 :
ŷ n 1  t n  2, α/2 s e
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
 1 (x n 1  x) 2 
1  
2 
 n  (x i  x) 
Dugaan bagi Nilai Tengah/Rataan:
Contoh harga rumah
Selang kepercayaan bagi E(Yn+1|Xn+1)
Dapatkan selang kepercayaan 95% bagi rataan
harga rumah dengan luas lantai 2.000 m2

harga rumah yi = 317,85 (Rp. juta)
yˆ n1  t n-2,α/2 s e
1
(x i  x)2

 317.85  37.12
2
n  (x i  x)
Selang kepercayaan 95% bagi rataan harga rumah
adalah dari Rp 280.660.000,- sampai Rp. 354.900.000,Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Dugaan bagi individu/respon:
contoh harga rumah

Selang kepercayaan bagi individu yn+1
Dapatkan selang kepercayaan 95% bagi respon individu
harga rumah untuk rumah dengan luas lantai 2.000 m2

yi = 317,85 (Rp. juta)
yˆ n1  t n-1,α/2 s e
1
(Xi  X)2
1 
 317.85  102.28
2
n  (Xi  X)
Selang kepercayaan 95% bagi harga rumah dengan luas lantai
2000m2 ialah dari Rp 215.500.000,- sampai Rp 420.070.000,-.
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Data contoh Harga Rumah
Harga
Rumah
(Rp.juta) (Y)
Luas Lantai
(m2) (X)
312
1600
245
279
308
199
1400
1700
1875
1100
219
1550
324
2450
405
319
255
2350
1425
1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
FILM :
MENGHITUNG
SELANG KEPERCAYAAN BAGI
RAMALAN NILAI TENGAH
&
RAMALAN NILAI INDIVIDU
dengan
MENGGUNAKAN MINITAB
Klik di sini
Download