Kualitas Fitted Model • Apakah model regresi sudah cukup pas mewakili data? • Apakah model regresi cukup baik untuk model peramalan? Itasia & Y Angraini, Dep Statistika FMIPA - IPB Tebaran titik amatan / scatter plot a. Mana di antara gambar–gambar ini yang mo- b. delnya cukup pas/sesuai ? y x c. y x Itasia & Y Angraini, Dep Statistika FMIPA - IPB Perlu diuji y apakah modelnya sudah pas d. atau belum uji lack of fit atau secara eksploratif plot sisaan y x x a. y Tebaran titik amatan / scatter plot y b. x c. y x Itasia & Y Angraini, Dep Statistika FMIPA - IPB Mana di antara gambar–gambar ini yang modelnya cukup baik untuk peramalan? Perlu suatu besaran yang dapat mengukur jauh/dekatnya titik pengamatan thdp garis regresi y x d. x Koefisien Determinasi, R2 Koefisien determinasi mengukur proporsi keragaman atau variasi total di sekitar nilai tengah (Y) yang dapat dijelaskan oleh garis regresi secara grafis mengukur jauh/dekatnya titik pengamatan thdp garis regresi Koefisien determinasi juga disebut R-kuadrat dan dinotasikan sebagai R2 R 2 JK Reg JK Tot ( yˆ (y CATATAN: Itasia & Y Angraini, Dep Statistika FMIPA - IPB i y)2 2 y ) i 2 atau R 1 0 R2 1 JK Sisa JK Total Analisis Korelasi Analisis korelasi digunakan untuk mengukur kekuatan hubungan (hubungan linier) antara dua peubah Korelasi hanya khusus untuk kekuatan hubungan Mengukur arah hubungan Tidak berdampak pada sebab akibat Itasia & Y Angraini, Dep Statistika FMIPA - IPB Analisis Korelasi Koefisien korelasi populasi dinotasikan dengan ρ (huruf Greek rho) Koefisien korelasi contoh adalah : r s xy sxsy Koefisien korelasi Pearson Itasia & Y Angraini, Dep Statistika FMIPA - IPB , s xy (x x)(y y) i n 1 i Pada Model Regresi Linier Sederhana yg hub.nya linier : R2 = r2 r = (tanda b1) Uji Hipotesis untuk Korelasi Untuk melakukan tes bahwa tidak ada hubungan linier, Hipotesis nol nya : H0 : ρ 0 Statistik ujinya mengikuti sebaran t Student dengan derajad bebas (n – 2 ) t Itasia & Y Angraini, Dep Statistika FMIPA - IPB r (n 2) (1 r 2 ) Kaidah Keputusan Uji Hipotesis untuk Korelasi H0: ρ 0 H1: ρ < 0 a H0: ρ ≤ 0 H1: ρ > 0 -ta tolak H0 jika t < -tn-2, a ta a Tolak H0 jika t > tn-2, a dengan t Itasia & Y Angraini, Dep Statistika FMIPA - IPB H0: ρ = 0 H1: ρ ≠ 0 r (n 2) (1 r ) 2 , d.b n - 2 a/2 -ta/2 a/2 ta/2 Tolak H0 jika t < -tn-2, a/2 atau t > tn-2, a/2 Interpretasi beberapa nilai r2 Y Y r2 = 1 dapat diinterpretasikan sbb. : r2 = 1 r2 =1 Itasia & Y Angraini, Dep Statistika FMIPA - IPB X X Adanya hubungan linier yang tepat antara X dan Y: 100% keragaman Y dijelaskan oleh keragaman X Interpretasi beberapa nilai r2 Y Y Itasia & Y Angraini, Dep Statistika FMIPA - IPB 0 < r2 < 1 dapat diinterpretasikan sbb. : X X Adanya hubungan linier yang lemah antara X dan Y: Sebagian (tidak semuanya) keragaman Y dijelaskan oleh keragaman X Interpretasi beberapa nilai r2 r2 = 0 dapat diinterpretasikan sbb. : Y Tidak ada hubungan linier antara X dan Y: r2 = 0 Itasia & Y Angraini, Dep Statistika FMIPA - IPB X Nilai Y tidak bergantung pada nilai X. (Tidak ada keragaman Y yang dapat diterangkan oleh keragaman X) Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y) Luas Lantai (m2) (X) 312 1600 245 279 308 199 1400 1700 1875 1100 219 1550 324 2450 405 319 255 FILM : MENDUGA KOEFISIEN KORELASI PEARSON dengan MENGGUNAKAN MINITAB 2350 1425 1700 Itasia & Y Angraini, Dep Statistika FMIPA - IPB Klik di sini Koefisien Determinasi : Excel Output SSR 18934.9348 R 0.58082 SST 32600.5000 2 Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA Regression Residual Total Intercept Luas Lantai 0.76211 0.58082 58.08% keragaman harga rumah dijelaskan oleh keragaman luas lantai 0.52842 41.33032 10 df SS 1 18934.9348 9 32600.5000 8 Coefficients 98.24833 0.10977 Itasia & Y Angraini, Dep Statistika FMIPA - IPB 13665.5652 Standard Error 58.03348 0.03297 MS 18934.9348 1708.1957 t Stat 1.69296 3.32938 F Significance F P-value Lower 95% 11.0848 0.12892 0.01039 0.01039 -35.57720 0.03374 Upper 95% 232.07386 0.18580 Korelasi dan Koefisien Determinasi R2 Koefisien determinasi, R2, untuk regresi linier sederhana yang hubungannya linier (ordo X = 1) sama dengan koefisien korelasi kuadrat R 2 r rxy R (tanda b1 )(R ) 2 xy 2 1/ 2 ^ Korelasi antara amatan Yi dengan nilai dugaannya Yi untuk sembarang regresi linier dengan berapapun banyaknya peubah bebas r Itasia & Y Angraini, Dep Statistika FMIPA - IPB ^ Y Y R Uji Ketidakpasan Model Harus ada ulangan pengamatan yi pada nilai xi yang sama. Mis. : x x1 x2 y y11 y12 y21 y22 y23 x3 x4 y24 y31 y32 y33 y41 y42 Itasia & Y Angraini, Dep Statistika FMIPA - IPB Untuk data contoh di samping dapat dinotasikan : m = 4, n1=2, n2=4, n3=3, n4=2 n m j 1 n j 2 4 3 2 11 Uji ketidakpasan model : Tabel Sidik Ragam Derajat Sumber Keragaman Bebas (db) Regresi 1 (b1| b0) Sisaan n-2 Ketidakpasan db -db sisa GM model Galat murni Total (terkoreksi) nj m m j 1 Itasia & Y Angraini, Dep Statistika FMIPA - IPB n-1 Jumlah Kuadrat (JK) yˆ y n i 1 2 i 2 ˆ y y i i n i 1 JKsisa – JKGM ( y ju y j )2 m nj y y j 1 u 1 n i 1 i 2 Kuadrat Tengah (KT) JK Regresi 1 JK sisaan n 2 KTKM KTGM JKKM dbKM JKGM dbGM Statistik ujinya : Fhit KT KM KT GM Langkah-langkah Pemilihan Model yang Pas 1. Tentukan model, dapatkan dugaan persamaan garis regresinya, susun tabel Sidik Ragam, jangan dulu melakukan uji F untuk regresi keseluruhan 2. Lakukan uji ketidakpasan model. Jika tidak ada ulangan, cek secara eksploratif : plot sisaan-nya (akan dijelaskan pada pokok bahasan: Diagnosa Model). Jika nyata : lanjut ke langkah 3 Jika tidak nyata : gunakan KT sisaan s2 sebagai dugaan bagi Rag(Y) = σ2 , lakukan uji F secara keseluruhan, hitung R2, periksa asumsi untuk MKT melalui plot sisaan (Diagnosa Model) 3. Hentikan analisis, perbaiki modelnya (lihat pola plot sisaannya). Itasia & Y Angraini, Dep Statistika FMIPA - IPB Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y) Luas Lantai (m2) (X) 312 1600 245 279 308 199 1400 1700 1875 1100 219 1550 324 2450 405 319 255 2350 1425 1700 Itasia & Y Angraini, Dep Statistika FMIPA - IPB FILM : MENGUJI KETIDAKPASAN MODEL dengan MENGGUNAKAN MINITAB Klik di sini Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y) Luas Lantai (m2) (X) 312 1600 245 279 308 199 1400 1700 1875 1100 219 1550 324 2450 405 319 255 2350 1425 1700 Itasia & Y Angraini, Dep Statistika FMIPA - IPB Setelah diuji ketidakpasan modelnya, ternyata model yang pas adalah Model Regresi Linier Ordo 1. Selanjutnya kita lakukan pendugaan untuk model linier tsb. Sekaligus mendapatkan dugaan garis regresinya FILM : Menduga Persamaan Regresi (Linier) Klik di sini Selang Kepercayaan bagi koefisien kemiringan b1 Selang kepercayaan bagi koefisien kemiringan adalah : b1 t n2,α/2 sb1 β1 b1 t n2,α/2 sb1 Output Excel untuk contoh kasus harga rumah: Intercept Luas Lantai Coefficients Standard Error 0.10977 0.03297 98.24833 58.03348 t Stat P-value 3.32938 0.01039 1.69296 0.12892 d.b. = n - 2 Lower 95% -35.57720 0.03374 Upper 95% 232.07386 0.18580 Pada tingkat kepercayaan 95%, selang kepercayaan bagi koefisien kemiringan garis adalah (0.0337, 0.1858) Itasia & Y Angraini, Dep Statistika FMIPA - IPB Selang Kepercayaan bagi koefisien kemiringan b1 (lanjutan) Intercept Luas Lantai Coefficients Standard Error 0.10977 0.03297 98.24833 58.03348 t Stat P-value 3.32938 0.01039 1.69296 0.12892 Lower 95% -35.57720 0.03374 Upper 95% 232.07386 0.18580 Selama satuan peubah tak bebas (harga rumah) dalam juta rupiah, kita percaya 95% bahwa rata-rata pengaruh penambahan harga rumah berada antara Rp. 0,03374 juta sampai dengan Rp.0,18580 juta setiap penambahan satu m2 luas lantai Selang kepercayaan 95% ini tidak memuat angka 0. Kesimpulan : Ada hubungan linier yang nyata antara harga rumah dengan luas lantai dengan tingkat nyata sebesar 95% Itasia & Y Angraini, Dep Statistika FMIPA - IPB Peramalan Dugaan persamaan garis regresi dapat digunakan untuk memprediksi/meramal nilai Y jika x diketahui (hati-hati hanya untuk x yang berada dalam selang pengamatan) Untuk suatu nilai, xn+1 , nilai prediksi bagi Y adalah yˆ n1 b0 b1x n1 Itasia & Y Angraini, Dep Statistika FMIPA - IPB Memprediksi dengan menggunakan persamaan garis regresi Berapa kira-kira harga rumah yang luas lantainya 2000 m2 ! (2000 bukan titik pengamatan, namun masih dalam selang pengamatan). interpolasi harga rumah 98.25 0.1098 (luas lantai) 98.25 0.1098(200 0) 317.85 Prediksi harga rumah dengan luas lantai 2000 m2 adalah Rp 317,85 juta Itasia & Y Angraini, Dep Statistika FMIPA - IPB Selang data yang relevan Ketika menggunakan garis regresi sebagai alat untuk memprediksi, x yang boleh digunakan adalah x yang nilainya dalam selang pengamatan Harga Rumah (juta Rp) Selang yang relevan 450 400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 Itasia & Y Angraini, Dep Statistika FMIPA - IPB(m2) Luas Lantai 2500 3000 Sangat riskan untuk melakukan ekstrapolasi X di luar selang pengamatan Selang kepercayaan rataan respon dan dugaan individu Selang kepercayaan bagi rataan Y, untuk xi Y y y = b0 + b1 xi Selang kepercayaan bagi nilai pengamatan y, untuk xi Itasia & Y Angraini, Dep Statistika FMIPA - IPB xi X Selang Kepercayaan bagi nilai harapan Y, untuk suatu X Selang kepercayaan bagi dugaan nilai harapan/rataan y jika diketahui xi Selang kepercayaan bagi E(Yn 1 | X n 1 ) : ŷ n 1 t n 2,α/2s e 1 (x n 1 x) 2 2 n (x i x) Perhatikan bahwa rumus tersebut mengandung (x n1 x)2 Jadi beragamnya lebar selang bergantung pada jarak antara xn+1 terhadap nilai rataan, x Itasia & Y Angraini, Dep Statistika FMIPA - IPB Selang Kepercayaan bagi individu Y, untuk suatu nilai x Selang kepercayaan individu y untuk suatu nilai xi Selang kepercayaa n bagi ŷ n 1 : ŷ n 1 t n 2, α/2 s e Itasia & Y Angraini, Dep Statistika FMIPA - IPB 1 (x n 1 x) 2 1 2 n (x i x) Dugaan bagi Nilai Tengah/Rataan: Contoh harga rumah Selang kepercayaan bagi E(Yn+1|Xn+1) Dapatkan selang kepercayaan 95% bagi rataan harga rumah dengan luas lantai 2.000 m2 harga rumah yi = 317,85 (Rp. juta) yˆ n1 t n-2,α/2 s e 1 (x i x)2 317.85 37.12 2 n (x i x) Selang kepercayaan 95% bagi rataan harga rumah adalah dari Rp 280.660.000,- sampai Rp. 354.900.000,Itasia & Y Angraini, Dep Statistika FMIPA - IPB Dugaan bagi individu/respon: contoh harga rumah Selang kepercayaan bagi individu yn+1 Dapatkan selang kepercayaan 95% bagi respon individu harga rumah untuk rumah dengan luas lantai 2.000 m2 yi = 317,85 (Rp. juta) yˆ n1 t n-1,α/2 s e 1 (Xi X)2 1 317.85 102.28 2 n (Xi X) Selang kepercayaan 95% bagi harga rumah dengan luas lantai 2000m2 ialah dari Rp 215.500.000,- sampai Rp 420.070.000,-. Itasia & Y Angraini, Dep Statistika FMIPA - IPB Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y) Luas Lantai (m2) (X) 312 1600 245 279 308 199 1400 1700 1875 1100 219 1550 324 2450 405 319 255 2350 1425 1700 Itasia & Y Angraini, Dep Statistika FMIPA - IPB FILM : MENGHITUNG SELANG KEPERCAYAAN BAGI RAMALAN NILAI TENGAH & RAMALAN NILAI INDIVIDU dengan MENGGUNAKAN MINITAB Klik di sini