Metode Statistika Pertemuan XII Analisis Korelasi dan Regresi Pengantar • Apa itu analisis regresi? • Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya. • Apa bedanya dengan korelasi? Korelasi Korelasi Korelasi Koefisien Korelasi Pearson (r) rxy S xy S xy SxS y ( x x )( y Sx i i y) n 1 2 ( x x ) i n 1 dan S y 2 ( y y ) i n 1 Korelasi !!! ANALISIS REGRESI • Hubungan Antar Peubah: • Fungsional (deterministik) Y=f(X) ; misalnya: Y=10X • Statistik (stokastik) amatan tidak jatuh pas pada kurva Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi • Model regresi sederhana: Yi 0 1 X i i ; i 1,2,..., n Regresi Makna 0 & 1 ? Regresi Analisis Regresi • Pendugaan terhadap koefisien regresi: b0 penduga bagi 0 dan b1 penduga bagi 1 ( x )( y ) xy n b1 ( x )2 2 x n b0 y b1 x Metode Kuadrat Terkecil Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien) uji-t • bersama uji-F (Anova) Bagaimana menilai kesesuaian model ?? R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X) Contoh Data Percobaan dalam bidang lingkungan Apakah semakin tua mobil semakin besar juga emisi HC yang dihasilkan? Diambil contoh 10 mobil secara acak, kemudian dicatat jarak tempuh yang sudah dijalani mobil (dalam ribu kilometer) dan diukur Emisi HC-nya (dalam ppm) Emisi = 382 + 5.39 Jarak Jarak Emisi 31 553 38 590 48 608 52 682 63 752 67 725 75 834 84 752 89 845 99 960 Analisis Regresi Plot antara Emisi Hc (ppm) dg Jarak Tempuh Mobil (ribu kilometer) 950 Emisi 850 750 650 550 30 40 50 60 70 Jarak 80 90 100 Analisis Regresi Contoh output regresi dengan Minitab (1) Regression Analysis (Emisi Hc The regression equation is Predictor Constant Jarak Coef 381.95 5.3893 S = 42.01 vs Jarak Tempuh Mobil) Emisi = 382 + 5.39 Jarak StDev 42.40 0.6233 R-Sq = 90.3% T 9.01 8.65 P 0.000 0.000 R-Sq(adj) = 89.1% Analysis of Variance Source Regression Error Total DF 1 8 9 SS 131932 14118 146051 Unusual Observations Obs Jarak Emisi 8 84.0 752.0 MS 131932 1765 Fit 834.7 F 74.76 StDev Fit 18.0 P 0.000 Residual -82.7 R denotes an observation with a large standardized residual St Resid -2.18R Analisis Regresi Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien) uji-t • bersama uji-F (Anova) Bagaimana menilai kesesuaian model ?? R2 Koef. Determinasi (% keragaman Y yang mampu dijelaskan oleh X) Uji Hipotesis H0 : 1=0 vs H1: 10 ANOVA (Analysis of Variance) Uji F n n n i 1 i 1 i 1 2 2 2 ˆ ˆ ( y y ) ( y y ) ( y y ) i i i i JK total = JK regresi + JK error Keragaman total = keragaman yang dapat dijelaskan oleh model + keragaman yang tidak dapat dijelaskan oleh model Anova Sumber db JK KT F Regresi 1 JKR KTR KTR/KTE Error n-2 JKE KTE Total n-1 JKT F~F (1,n-2) Uji Hipotesis H0 : 1≤0 vs H1: 1>0 Uji Parsial Statistik uji: b1 T Sb 1 S b1 s s 2 ( x x ) i 2 ˆ ( y y ) i i n2 ‘All models are wrong, but some are useful’ (G. E. P. Box)