STATISTIKA INFERENSIAL “REGRESI DAN KORELASI “ ( Dosen Pengampu :Febrian, S.Pd., M.Sc / Puji Astuti, S.Pd., M.Sc ) Disusun Oleh: Dio Deri L 170384202011 Sri Rejekina 170384202031 Sabrina Putri 170384202045 Nurul Hafizah 170384202061 UNIVERSITAS MARITIM RAJA ALI HAJI FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN PENDIDIKAN MATEMATIKA 2019 REGRESI DAN KORELASI Pendahuluan Untuk mengetahui hubungan antara dua buah variabel atau lebih: Pengamatan data curah hujan dibandingkan dengan pengamatan data debit sungai dari suatu DPS yang bertujuan untuk kepentingan peramalan, Jumlah pupuk yang digunakan , banyak hujan , cuaca akan berpengaruh pada produksi padi, Menemukan hubungan debit sungai dari dua lokasi pos duga air untuk pengisian data kosong , memperbaiki atau mengecek data dan memperpanjang lama pencatatan data runtut waktu , Menentukan hubungan antara debet sedimen dengan debet aliran sungai , luas DPS dan luas hutan atau variabel lainnya. Hubungan antara dua atau lebih variabel dapat dinyatakan secara matematika sehingga merupakan suatu model yang dapat digunakan untuk berbagai keperluan analisis, misalnya: peramalan (prediction), perpanjangan (extension), perbaikan atau pengecekan ketelitian data, atau pengisan data pada priode kosong untuk kasus hidrologi. Analisis regresi adalah analisis yang membahas hubungan fungsional dua variabel atau lebih disebut. Analisis korelasi ( correlation analisys) adalah analisis yang membahas tentang derajat hubungan dalam analisis regresi disebut. TIK: Diharap Saudara dapat menganalisis hubungan fungsional dua variabel atau lebih, dengan analisis statistik secara komputerisasi. Bagaimana memformulasikan Hubungan Fungsional ? Tentukan variabel bebas (X) dan variabel tak bebas (Y). Variabel bebas (X) yaitu biasanya variabel yang mudah didapat atau yang tersedia, untuk keperluan analisis variabel bebas dinyatakan dengan X1, X2, X3, …, Xk k 1 , Variabel tak bebas atau variabel respon (Y). Contoh: Untuk fonemena antara debet sedimen dengan debet aliran sungai, luas DPS dan luas hutan, sebaiknya diambil variabel tak bebas debet sedimen= Y dan variabel bebas debet aliran sungai= X1, luas DPS= X2 dan luas hutan= X3. Tetapi untuk dua variabel yaitu curah hujan dibandingkan dengan pengamatan data debit sungai dari suatu DPS, maka salah satu bisa dsi ambil sebagai variabel bebas. Buat model persamaan regresi untuk populasi secara umum: Y f X 1 , X 2 ,..., X k / 1 , 2 ,..., m Dimana 1 , 2 ,..., m parameter-parameter yang terdapat dalam regresi itu. Regresi yang sederhana untuk populasi dengan sebuah variabel bebas yang dikenal dengan regresi linier dengan model: Y 1 2 X , 1 dan 2 parameternya. Untuk satu variabel bebas (regersi linier): 1 dan 2 dari sebuah sampel acak dapat ditaksir oleh a dan b maka persamaan regresinya adalah Y a bX Untuk fonemena dua variabel bebas ( regersi non linier): Parameter-parameternya 1 , 2 dan 3 dari sebuah sampel acak dapat ditaksir oleh a, b dan c maka persamaan regresinya berupa parabola yaitu Y 1 2 X 3 x 2 Tentukan persamaan regresinya, dapat dilakukan dengan metode tangan bebas dan metode kuadrat terkecil. Disini hanya dijelaskan dengan metode kuadrat terkecil. Bagaimana Menentukan Regresi Linier Sederhana Secara Metode Kuadrat Terkecil ? Untuk fenomena yang terdiri dari sebuah variabel bebas X dengan persamaan regresinya : Y a bX Data hasil pengamatan sebaiknya dicatat dalam bentuk seperti tabel di bawah ini. Tabel 8.1 Variabel Tak Bebas (Yi) Variabel Bebas (Xi) Y1 X1 Y2 . X2 . . . . . Yn Xn Pasangan X dan Y dan n, menyatakan ukuran sampel. Koefisien-koefisien regresi a dan b untuk regresi linier, dapat dihitung dengan: X X X XY a n X X 2 2 2 dan b n XY X Y n X 2 X 2 Atau dengan cara menghitung terlebih dahulu b, maka a dapat dihitung dari : a Y bX , X dan Y masing-masing rata-rata dari veriabel X dan Y. Rumus diatas digunakan untuk menghitung koefisien-koefisien regresi Y atas X. Untuk menghitung koefisien-koefisien regresi X atas Y, rumus yang sama dapat digunakan tetapi harus dipertukarkan tempat untuk simbul-simbul X dan Y. Koefisien korelasi (R), yang menunjukan derajat hubungan antara Xi dan Yi ditentukan dari: R n X n XY X Y 2 X n Y 2 Y 2 2 Koefisien diterminasi (R2), yaitu menunjukan perbedaan varian dari data pengukuran Yi dan varian dari nilai pada garis regresi untuk nilai Xi, ditentukan dari R. Contoh 1: Tabel dibawah ini, menunjukan data curah hujan (Xi) dalam satuan mm dari DPS Cimanuk-Leuwigoong dan debit alirannya (Yi) dalam m3/det, pada rata-rata bulanan dari tahun 1978-1982. Tentukan: (a) Persamaan regresi, koefisien korelasi dan determinasi data itu ? (b) Apa Artinya koefesien determinasi tersebut ? No. Bulan Curah Hujan (mm)-Xi Debit air (m3/det)-Yi 1. Januari 229 32 2. Februari 205 31 3. Maret 271 38 4. April 304 40 5. Mei 145 28 6. Juni 154 24 7. Juli 98 21 8. Agustus 69 13 9. September 71 14 10. Oktober 96 12 11. November 184 28 12. Desember 280 37 Jawab. a. Dengan menggunakan calculator Casio fx-3600 misalnya, didapat: X 175,5 , X 2106 , X 2 445942 , S X2 6939,91 Y 318 , Y 9492 , S = 96,82 dan XY 64510 sehingga: n XY X Y 12(64510) (2106)(318) 104412 b 0,113 12(445942) (2106) 916068 n X X Y 26,5 , 2 2 2 y 2 2 a Y b X =26,5-(0,113)(175,5)=6,669 didapat persamaan regresinya: Y 6,669 0,113 X , dapat digunakan untuk: Meramal data debit berdasarkan data curah hujan. Koefsien arah (b) menyatakan perubahan rata-rata variabel Y untuk setiap perubahan variabel X sebesar satu satuan. Dengan demikian dapat dikatakan, bahwa terjadi perubahan curah hujan satu satuan, maka diharapkan terjadi perubahan debit rata-rata bulanan sebesar 0,113 m3/det. Bila data curah hujan pada Range data di atas ( 69 X 304 ), maka dapat diramalkan debit di antara kedua batas tersebut, disebut dengan interpolasi debit. Sebaliknya, jika mensubstitusikan variabel X di luar Range data tersebut, misalnya X=500 mm maka didapat Y=74,46 m3/det, disebut ekstrapolasi debit. b. Koefien korelasi adalah: R R n X n XY X Y X nY 2 Y 2 2 2 (12)(64510) (2106)(318) 12(445942) (2106) (12)(9492) (318) 2 2 0,9649 Korelasi positif (R=0,9649) antara debit (Y) dengan curah hujan (X), berarti semakin besar curah hujan semakin besar pula debit DPS Cimanuk-Leuwigoong. Koefisien determinasi (R2)=0,9312=93,12%, artinya bertambah atau menurunnya debit air (Y) sebesar 93,12% dapat dijelaskan oleh hubungan linier antara curah hujan dan debit dengan persamaan Y=0,669+0,113X, sedangkan sisanya 6,88% disebabkan faktor lain yang tidak termasuk dalam analisis ini. Bagaimana Menentukan Batas Daerah Kepercayaan Garis Regresi ? Titik taksiran rata-rata Y dengan mudah dapat diketahui yaitu dengan jalan mensubstitusi harga X kedalam persamaan regresi. Interval taksiran yang taksiran Y untuk X diketahui, dengan rumus: Y t 12 1 sY Y Y t 12 1 sY Y Y dimana S y n 1 2 1 2 atau s y s y 1 R 2 1 2 Sebaliknya kesalahan standar perkiraan untuk meramal X jika Y diketahui adalah: sx sx 1 R 2 1 2 Contoh 2. Dari contoh 1, tentukanlah batas daerah kepercayaan garis regresi tersebut pada derajat kepercayaan 95% ? Jawab: Jadi dari contoh 1 di atas, n=12, X 175,5 , S X2 6939,91, Y 26,5 , S y2 = 96,82 , 0,95 , dan R =0,9649 .akibatnya didapat Sy=9,84 dan R2=0,93, maka : sy sy 1 R2 1 2 = 9,841 0,93 1 2 2,6 Untuk t 12 1 2,23 , didapat: (Y t 12 1 sY Y Y t 12 1 sY ) = (Y (2,23)( 2,6) Y Y (2,23)( 2,6) = Y 5,80 Gambar 8.1, memperlihatkan jumlah titik (X<Y) yang berada di dalam batas kepercayaan adalah sebanyak buah dari 12 titik.tetapi harus diingat bahwa, gambar itu didapat dari suatu sampel (1978-1982). Apabila dipilih 100 sampel secara berulang, maka akan diperoleh 100 batas daerah kepercayaan serupa dan diharapkan 95% dari daerah kepercayaan mencakup garis regresi populasinya. 6,669 -59,02 Gambar 8.1 Perkiraan Debet (X) Berdasarkan Data Hujan (Y) DPS Perkiraan Debet Rata-rata Bulanan DPS Cimanuk-Leuwigoong dengan Model Linier Sederhana adalah: Curah Hujan (mm) Debet rata-rata Bulanan (m3/det) Rata-rata Batas Daerah Kepercayaan 50 12,32 6,52 –18,12 100 17,97 12,17–23,77 150 23,62 17,82-29,42 200 29,27 23,67-35,27 250 34,92 29,12-40,72 300 40,57 34,77-46,37 350 46,22 40,42-52,02 400 51,87 46,07-57,67 450 57,52 51,72-63,32 500 63,17 57,37-68,97 550 68,82 63,03-74,62 600 74,47 68,67-80,27 Bagaimana Menguji Koefisien Korelasi ? Pengujian koefisien korelasi menggunakan rumus sebelumnya, dapat menduga nilai koefisien korelasi populasi (RR). Sampel lain yang mengambil dengan n buah walaupun di ambil dari populasi yang sama akan menghasilkan nilai koefisien sampel (R) yang berbeda. Apabila R dekat ke nol, maka RR cendrung= 0. Akan tetapi nilai R dekat ke +1 atau – 1, maka RR 0. Masalahnya sekarang bagaimana menguji nilai R berada cukup jauh dari nol atau R 0. Pengujian dilakukan dengan rumus: t R n2 1 R2 Contoh 4. Dari contoh 1, diperoleh R=0,96 dan n= 12. Tentukanlah apakah nilai koefisien tersebut berbeda nyata terhadap R = 0. Jawab. Untuk menjawab pernyataan tersebut dapat dikemukan hopotesis: Ho : R 0 Ho : R 0 dari rumus (8.13) didapat: t R n2 1 R 2 0,96 10 1 0,96 2 10,83 Melihat hipotesis ( H o : R 0 ), berarti pengujian dua sisi., untuk 0,05 didapat tt tdk ,1 12 t10;0,975 2,23 . Sehingga –2,23<t<2,23, berarti tolak hipotesis H o , artinya dapat disimpulkan bahwa terima hipotesis H o : R 0 , dengan kata lain dapat diputuskan bahwa debet rata-rata bulanan (Y) dan curah hujan rata-rata bulanan (X) dari DPS Cimanuk-leuwigoong berhubungan linier. Bagaimana Menguji Koefisien Regresi ? Persamaan regresi Y a bX , parameter a satu lebih penting di analisa dari parameter b. Apabila a = 0, maka garis regresinya mendatar, artinya pengurangi dan penambahan X tidak mempengaruhi Y. Oleh karena itu perlu dilakukan pengujian terhadap a = 0 atau tidak. Metode statistik uji t (t student) dapat digunakan untuk melakukan pengujian tersebut: t aA , untuk S a Sa Sy X X 2 1 2 Sy n 1S x2 dimana: t = nilai uji t dengan derajat kebebasan (dk) = n-2 a = koefisien regresi A = koefsien regresi yang telah diketahui Sa = devisi koefisien regresi Sy = kesalahan standar dari perkiraan nilai Y Pendugaan nilai a dapat menggunaakan interval kepercayaan: (a t 12 1 sY Y a t 12 1 sY ) Contoh 3. Lakukan pengujian dan pendugaan nilai koefisien regresi Y 6,669 0,113 X pada tingkat kepercayaan 95%. Jawab. Dari contoh 1 didapat: n=12, a =0,113 , Y 26,5 , S X2 6939,91 dan s y 2,6 maka: Sa Sy n 1S 2 x 2,6 0,000034 (12 1)6939,91 Selanjutnya dapat dibuat hipotesis, Ho : a 0 Ho : a 0 Uji statistik : t a A 0,113 0 3323,53 Sa 0,000034 pada contoh 1: Dengan pengujian dua sisi ( H o : a 0 ), didapat tt = t( dk ,112 ) t(10;0,975) 2.23 .Oleh sebab itu, t jatuh pada daerah tolak H o , kesimpusan menerima hipotesis alternatif: H o : a 0 . Keputusan adalah terdapat hubungan linier antara debet rata-rata bulanan (Y) dan curah hujan rata-rata bulanan (X) dari DPS Cimanuk-leuwigoong. Dengan kata lain variabel curah hujan (X) dapat mempengaruhi debit (Y) dengan model regresi tersebit di atas. Pendugaan a dengan menggunakan derajat kepercayaan 95% diterima diperkirakan dari: (a t 12 1 sY Y a t 12 1 sY ) = 0,113 2,230,000034 a 0,113 2,230,000034=0,99992<a<1,000076 Artinya, koefisien regresi mempunyai batas bawah 0,99992 dan batas atas, 1,000076. Apa dan Bagaimana Koefisien Korelasi Peringkat ? Koefisien korelasi yang telah dibahas, adalah berdasarkan asumsi bahwa pasanganpasangan data (X,Y) mengikuti distribusi normal. Jika pasangan itu tidak demikian, dilakukan pengujian koefisien korelasi peringkat (rank correlation coefficient), pembahasannya dikenal dengan statistika bebas distribusi atau statistika non parametrik. Prosedurnya: Dengan cara menyusun peringkat pasangan data tersebut dari urutan tertinggi. Maka koefisien korelasinya dihitung dengan rumus korelasi Spearman (The Spearmant rank correlation coefficient), sebagai berikut: n RP 1 6 PX i PYi i 1 n n2 1 dimana: RP = Koefisien peingkat PXi= Peringkat variabel X ke-I PYi= Peringkat variabel Y ke-I n = jumlah data Dengan kriteria pengujian: R p N k , maka hipotesis menyatakan tidak ada hubungan antara variabel X dan Y harus ditolak. R p N k , maka hipotesis menyatakan tidak ada hubungan antara variabel X dan Y harus diterima. N k = nilai batas daerah kritis. Contoh 5. Tentukan niali koefisien korelasi peringkat contoh 1 pada derajat kepercayaan 95% ? Jawab. Tabel dibawah ini menunjukan perhitungan peringkat variabel curah hujan (X) dan debet (Y) dari DPS Cimanuk-leuwigoong. No. PXi Debit (X) (Y) 1. 229 32 4 4 0 0 2. 205 31 5 5 0 0 3. 271 38 3 2 1 1 4. 301 40 1 1 0 0 5. 145 28 8 6,5 1,5 2,25 6. 154 24 7 8 -1 1 8. 98 21 9 9 0 0 9. 71 14 11 10 1 1 10. 96 12 10 12 -1 1 11. 184 28 6 6,5 0.5 0.25 12. 280 37 2 3 -1 1 Jumlah - - PYi - PXi-PYi (PXi-PYi)2 Curah Hujan - 11,25 n Didapat RP 1 6 PX i PYi i 1 n n 1 2 1 611,25 0,9597 12(144 1) Untuk 0,05 , dari tabel E untuk n=12 didapat Nk =0,504. Jadi ( RP 0,9597 )> (Nk=0,504). Kesimpulan kita menolak hipotesis yang menyatakan tidak ada hubungan anatar curah hujan dan debet DPS Cimanuk-leuwigoong. Keputusan yang dapat dieberikan dari analisis tersebut adalah terjadi hubungan antara curah hujan dan debet DPS Cimanuk-leuwigoong pada tingkat signikan 5% adalah pernyataan yang dapat diterima. Dengan demikian, penggunaan koefisien korelasi peringkat (RP) mempunyai keuntungan jika dibandingkan dengan penggunaan koeefisien korelasi (R): Perhitungan lebih sederhana dan tepat. Tidak perlu menganggap variabel X dan Y mengikuti distribusi normal. Juga tidak perlu mengganggap bahwa hubungan antara variabel X dan Y harus linier. Hubungan tidak linierpun, misalnya adanya hubungan kurvilinier, maka koefisien korelasi dapat diduga dengan koefisien korelasi peringkat. Regresi Non Linier ? Berdasarkan penegujian kelinieritasan regresi, mungkin saja ditemukan bahwa regresi itu tidak linier (regresi non linier). Regersi non linier disini hanya akan dibicarakan beberapa regresi yang lazim digunakan dalam ilmu teknik, di antaranya: (1) Regresi eksponensial Y = b eaX (2) Regresi kuadratik Y = a + bX + cx2 (3) Regresi Logarimatik Y = b + a log X (4) Regresi Polonomial Y = a + bX +cX2 +…+ bnXn Regresi eksponensial ? Pasangan variabel (Xi,Yi) untuk i=1,2,3,…n apabila dihitung dengan persamaan regersi eksponensia, maka diperoleh modelnya: Y = a ebX disebut regresi eksponensial Y terhadap X, merupakan variabel tak bebas. Untuk: X = Variabel bebas a,b= parameter e = bilangan pokok nolaritma asli = 2,7183 dan Yi>0. Persamaan Y = b eaX, ditransformasi menjadi persamaan linier fungsi (ln) menjadi ln Y = ln aebX ln Y = lna+bXlne karena lne=1, maka: ln Y = lna +bX, merupakan persamaan fungsi semi logaritmik antara lnY dan X, dan merupakan persamaan garis dengan lurus gradien b dan memotong sumbu lnY di lna. Perhatikan gambar : Y=beaX LnY=lnb+aX Gambar 8.2 Transformasi Fungsi eksponensial Sederhanakan lnY = lna +bX, dan dilakukan transformasikan : P=lnY, B=b, X =X, dan A=lna Sehingga ln Y = lnb +aX menjadi : P=A+ BX yaitu persamaan linier dalam P, identik dengan Y = A + BX, Seperti halnya pada regresi linier sederhana, maka nilai A dan B dapat dihitung dengan: X X X XP n X X n XY X P B n X X 2 A 2 2 2 2 Persamaan regresinya dengan rumus R n X n XP X P 2 X n P 2 Y 2 2 Batas daerah kepercayaan dengan rumus: P t 12 1 s P P P t 12 1 s P Dimana : s P s P 1 R 2 1 2 Sebaliknya kesalahan standar perkiraan untuk meramal X jika Y diketahui adalah: sx sx 1 R 2 1 2 untuk s X s X 1 R 2 1 2 Contoh 6. Tabel dibawah ini menunjukan data pengukuran debet dan sedimen melayang DPS Citarum – Nanjung pada bulan Maret 1981. Tentukanlah besarnya koefisien korelasi, persamaan eksponensialnya dan uji ? Debet Sedimen Melayang Debet Sedimen Melayang (m3/det)-X (juta m3/det)-Y (m3/det)-X (juta m3/det)-Y 35 1,73 119 10,44 39 2,45 88 16,36 43 3,31 95 27,47 54 6,83 105 29,06 56 6,99 112 33,96 Jawab. Buat tabel pembentu seperti: No. Debet (m3/det)- Sedimen Melayang X 3 P= ln Y (juta m /det)-Y XY 1. 35 1,73 0,55 19,25 2. 39 2,45 0.90 35,10 3. 43 3,31 1,20 51,60 4. 54 6,83 1,92 103,68 5. 56 6,99 1,94 108,64 6. 88 10,44 2,35 206,80 7. 95 16,36 2,79 265,05 8. 105 27,47 3,31 347,55 9. 112 29,06 3,37 377,44 10 119 33,96 3,53 420,07 746 21,46 Di dapat: P 2,186 , P 21,86 , P 2 58,083 , SP =1,096 X 746 , X 65146 , SX= 32,48 dan XY 1935,18 sehingga: P X X XP 2,18665146 7461935,18 0,018 A 1065146 746 n X X n XY X Y P A 2,186 0,018 B atau B 0,0296 74,6 X n X X X 74,6 , 2 2 2 2 2 2 2 A=lna atau –0,018=lna maka a=0,98 dan B=b maka b=0,0295. Jadi persamaan regresi eksponensialnya adalah: Y = a ebX= 0,98e0,0295X persamaan ini dapat menaksir sedimen melayang jika debetnya diketahui, misalnya: Untuk X = 40, maka Y=0,98e0,0295(40) = 3,19 Untuk X = 100, maka Y=0,98e0,0295(100) =18,72 Dengan membuat koordinat (40;3,19) dan (100;18,72 ) maka kurva garis lurusnya pada kertas semi logaritmik dapat kita gambar. R n XP X P n X 2 X n P P 2 2 2 = (10)(1935,18) (746)( 21,86) 1065146 746 1058,083 21,86 2 2 3074,24 0,9832 9776421,658 R= 98,32%, hal ini menyatakan hubungan linier yang baik antara debit dan sedimen melayang di lokasi pos duga air Nanjumg dari DPS Citarum Kesalahan standar perkiraannya: sP sP 1 R 2 1 2 = 1,096 1 0,98 0,179 2 karena lnY=P, maka lnSP=SP=0,179, didapat SP=1,196 m3/hari Batas daerah kepercayaannya: P t 12 1 s P P P t 12 1 s P 2,186 1,153(1,196) P 2,186 1,153(1,196) 2,186 1,379 Y 1,379 Berikut ini disajikan perkiraan sedimen melayang apabila debit diketahui: Y = a ebX= 0,98e0,0295X No. Debit Sedimen Batas daerah kepercayaan (m3/det) (juta m3/hari) (juta m3/hari) 1. 40 3,19 1,73 - 4,51 2. 60 4,37 3,00 - 5,76 3. 80 12,74 14,12 -16,88 4. 100 18,72 15,96 - 18,72 5. 120 37,32 35,94 - 38,70 Apa dan Bagaimana Menganalisis Regresi Kuadratik ? Regresi kuadratik merupakan regersi polinomial orde ke-2, dengan persamaan umum Y a bX cX 2 a, b dan c harus ditentukan berdasarkan pengamatan, secara: Y XY X Y 2 na a X b X c X 2 b X 2 c X 3 a X 2 b X 3 c X 3 Contoh 7. Pengukuran debit dari sungai Way Seputih-Segala Mider tahun 1980 menghasikan hubungan antara tinggi muka air (X) dan debeit (Y) seperti tabel di bawah ini. Debet dari sungai Way Seputih-Segala Mider tahun 1980 menghasikan hubungan antara tinggi muka air (X) dan debeit (Y) No. Tinggi Muka Air (X)/(m) Debit (Y)/(m3/det) 1. 1,50 26 2. 1,60 29 3. 1,70 33 4. 1,80 37 5. 1,90 43 6. 2,00 49 7. 2,10 52 8. 2,20 57 9. 2,30 63 10. 2,40 71 11. 2,50 79 Dengan menggunakan model kuadratik, tentukan persamaan data tersebut ? Jawab. Persamaan tersebut bukan persamaan linier sederhana ataupun eksponensial (silahkan anda lakukan pengujian sendiri). Data (X,Y) akan lebih cendrung berbentuk kuadratik, Buat tabel pembantu seperti di bawah ini: X Y X2 X3 X4 XY X2Y 1. 1,50 26 2,25 3,375 5,0625 39,00 58,50 2. 1,60 29 2,56 4,096 6,5536 46,40 74,24 3. 1,70 33 2,89 4,913 8,3520 56,10 95,37 4. 1,80 37 3,24 5,832 10,4976 66,60 119,88 5. 1,90 43 3,61 6,859 13,0321 81,70 155,23 6. 2,00 49 4,00 8,000 16,0000 98,00 196,00 7. 2,10 52 4,41 9,261 19,4481 109,20 229,32 8. 2,20 57 4,84 10,648 23,4256 125,40 275,88 9. 2,30 63 5,29 12,167 27,9841 144,90 333,27 10. 2,40 71 5,76 13,824 33,1776 170,40 4408,96 11. 2,50 79 6,25 15,625 39,0625 197,50 493,75 22,00 539 45,10 94,60 202,5958 1.135,20 2440,40 No. Didapat: X 2,0 dan X2 45,10 dan: 11 539 11a 22b 45,10c 1135 22a 45,10b 94,60c 2440,40 45,10a 94,60b 202,59c Menggunakan matriks atau substitusi eliminasi di dapat: a=27,32; b=-32,44 dan c=21,11. Seningga diperoleh persamaan regresi kudratik Y 27,32 32,44 X 21,11X 2 Kesalahan perkiraan standarnya yaitu: 1 2 Y Y S y , dengan menggunakan tabel seperti: n 1 2 X Y Y Y Y (Y Y ) 2 1. 1,50 26 26,15 -0,15 0,0225 2. 1,60 29 19,45 -0,45 0,2025 3. 1,70 33 33,10 -0,10 0,0100 4. 1,80 37 37,32 -0,32 0,1024 5. 1,90 43 41,89 1,11 1,2321 6. 2,00 49 46,88 2,12 4,4944 7. 2,10 52 52,59 -0,29 0,0841 8. 2,20 57 58,12 -1,12 1,2544 9. 2,30 63 64,37 -1,37 1,8769 10. 2,40 71 71,05 -0,05 0,0025 11. 2,50 79 78,15 0,85 0.7225 22,00 539 - 0,32 10,0043 No. 2 Y Y Didapat: S y n 1 1 2 10,0043 10 1 2 1,00m 3 / det Untuk derajat kepercayaan 95% dan dk = n-2 =9 untuk penggujian dua sisi didapat tt=2,262. Dengan demikian didapat batas (a t 12 1 sY Y a t 12 1 sY ) Y 2,262m3 / det merupakan dua garis sejajar dalam persamaan regresi. daerah kepercayaan: Perkiraan Debit DPS Way Seputih Di Pos Duga Air Segala Mider Batas Daerah Kepercayaan Tinggi Muka air (m) Debit (m3/det) 1. 0,80 14,80 1,61 – 17,06 2. 1,00 15,99 13,73 – 18,25 3. 1,50 26,15 23,89 – 28,41 4. 2,00 46,88 44,62 – 49,14 5. 2,50 78,15 75,89 – 80,41 6. 3,00 119,99 117,73– 122,25 7. 3,50 235,32 233,06– 237,58 No. (m3/det) Sumber: Hasil Perhitungan dengan Y 27,32 32,44 X 21,11X 2 Contoh: Berdasarkan hasil pengambilan sampel secara acak tentang pengaruh lamanya belajar (X) terhadap nilai ujian (Y) adalah sebagai berikut : (nilai ujian) X (lama belajar) X2 XY 40 4 16 160 60 6 36 360 50 7 49 350 70 10 100 700 90 13 169 1.170 ΣY = 310 ΣX = 40 ΣX2 = 370 ΣXY = 2.740 Dengan menggunakan rumus di atas, nilai a dan b akan diperoleh sebagai berikut : a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2] a = [(310 . 370) – (40 . 2.740)] / [(5 . 370) – 402] = 20,4 b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2] b = [(5 . 2.740) – (40 . 310] / [(5 . 370) – 402] = 5,4 Sehingga persamaan regresi sederhana adalah Y=20,4+5,2 X Berdasarkan hasil penghitungan dan persamaan regresi sederhana tersebut di atas, maka dapat diketahui bahwa : 1. Lamanya belajar mempunyai pengaruh positif (koefisien regresi (b) = 5,2) terhadap nilai ujian, artinya jika semakin lama dalam belajar maka akan semakin baik atau tinggi nilai ujiannya; 2. Nilai konstanta adalah sebesar 20,4, artinya jika tidak belajar atau lama belajar sama dengan nol, maka nilai ujian adalah sebesar 20,4 dengan asumsi variabelvariabel lain yang dapat mempengaruhi dianggap tetap. Analisis Korelasi (r) : digunakan untuk mengukur tinggi redahnya derajat hubungan antar variabel yang diteliti. Tinggi rendahnya derajat keeratan tersebut dapat dilihat dari koefisien korelasinya. Koefisien korelasi yang mendekati angka + 1 berarti terjadi hubungan positif yang erat, bila mendekati angka – 1 berarti terjadi hubungan negatif yang erat. Sedangkan koefisien korelasi mendekati angka 0 (nol) berarti hubungan kedua variabel adalah lemah atau tidak erat. Dengan demikian nilai koefisien korelasi adalah – 1 ≤ r ≤ + 1. Untuk koefisien korelasi sama dengan – 1 atau + 1 berarti hubungan kedua variabel adalah sangat erat atau sangat sempurna dan hal ini sangat jarang terjadi dalam data riil. Untuk mencari nilai koefisen korelasi (r) dapat digunakan rumus sebagai berikut : r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]} Contoh : Sampel yang diambil secara acak dari 5 mahasiswa, didapat data nilai Statistik dan Matematika sebagai berikut : Sampel X (statistik) Y (matematika) XY X2 Y2 1 2 3 6 4 9 2 5 4 20 25 16 3 3 4 12 9 16 4 7 8 56 49 64 5 8 9 72 64 81 Jumlah 25 28 166 151 186 r = [(N.ΣXY) – (ΣX.ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]} r = [(5 . 166) – (25 . 28) / √{[(5 . 151) – (25)2] . [(5 . 186) – (28)2]} = 0,94 Nilai koefisien korelasi sebesar 0,94 atau 94 % menggambarkan bahwa antara nilai statistik dan matematika mempunyai hubungan positif dan hubungannya erat, yaitu jika mahasiswa mempunyai nilai statistiknya baik maka nilai matematikanya juga akan baik dan sebaliknya jika nilai statistik jelek maka nilai matematikanya juga jelek.