BAB 1 PENDAHULUAN 1.1 Latar Belakang Metode analisis yang telah dibicarakan hingga sekarang adalah analisis terhadap data mengenai sebuah karakteristik atau atribut (jika data itu kualitatig) dan mengenai sebuah karakteristik (jika data itu kuantitatif). Tetepi, sebagaimana disadari banyak persoalan atau fenomena yang meliputi lebih dari sebuah variabel. Misalnya, berta orang dewasa laki-laki sampai taraf tertentu bergantung pada tingginya, tekanan semacam gas bergantung pada temperatur, hasil produksi padi tergantung pada jumlah pupuk yang digunakan, banyak curah hujan, cuaca dan sebagainya. Maka dalam hal ini dirasa perlu untuk mempelajari analisis data yang terdiri atas banyak variabel. Jika kita mempunyai data yang terdiri atas dua variabel atau lebih variabel, adalah sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu berhubungan. Hubungan yang didapat pada umumnya dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel. Analisa yang menyangkut masalah ini dikenal dengan analisis regresi. Analsis regresi dibedakan atas dua jenis variabel yaitu variabel bebas dan variabel terikat. Penetuan variabel bebas dan terikat dalam beberapa hal tidak mudah dilaksanakan. Analisis yang cermat, analisa yang seksama, berbagai pertimbanagn, kewajaran masalah yang dihadapi dan pengalaman akan memudahakan penentuan. Variabel yang mudah didapat atau tersedia sering dapat digolongkan kedalam variabel bebas, sedangkan variabel yang terjadi karena variabel bebas itu merupakan varabel Universitas Sumatera Utara terikat. Untuk keperluan analisis, variabel bebas akan dinyatakan dengan X 1 , X 2 , X k (k ≥ 1) , sedangkan variabel terikat akan dinyatakan dengan Y. Statistika bermaksud menyimpulkan populasi yang pada umumnya dengan menggunakan hasil analisis data sampel. Khusus mengenai regresi dalam menentukan hubungan fungsional yang diharapkan berlaku untuk populasi berdasarkan data sampel yang diambil dari populasi yang bersangkutan. Seperti dikatakan di atas, hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematik yang disebut dengan persamaan regresi dan bergantung pada parameter-parameter. Regresi linier merupakan suatu metode analisis statistik yang mempelajari pola hubungan anatara dua atau lebih variabel. Pada kenyataan sahari-hari sering dijumpai sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karenanya dikembangkan analisis regresi linier berganda. Regresi linier berganda adalah perluasan dari regresi sederhana yang mempunyai lebih dari satu variabel bebas X. Regresi linier berganda digunakan untuk memodelkan hubungan antara variabel terikat dan variabel bebas. Untuk mendapatkan estimasi β 0 , β1 , , β k digunakan metode maksimum likelihood, dimana metode ini secara prinsip dapat meminimumkan jumlah kuadrat kesalahan. Salah satu cara untuk mendapatkan penaksir yang baik adalah dengan menggunakan metode maksimum likelihood, yang telah diperkenalkan oleh seorang ahli genetika dan statistik Sir R. A. Fisher antara tahun1912 sampai 1922 dan memiliki aplikasi yang luas diberbagai bidang. Cara memaksimumkan likelihood berkaiatan dengan metode estimasi dalan statistik. Estimasi maksimum likelihood berguna untuk menentukan parameter yang memaksimalkan kemungkinan dari data sampel. Dari sudut pandang statistik, metode maksimum likelihood ini dianggap lebih kuat pada hasil estimator dengan sifat statistik. Selain itu, metode ini juga lebih efisin untuk ketidakpastian pengukuran melalui batas keyakinan. Meskipun metodologi untuk estimasi maksimum likelihood termasuk sederhana namun pelaksanaan matematiknya sangat kuat. Parameter yang diperoleh dari fungsi estimasi maksimum likelihood merupakan nilai yang sebenarnya. Jelas bahwa ukuran sampel menentukan Universitas Sumatera Utara ketelitian dari estimator. Jika ukuran sampel sama dengan populasi, maka estimator memiliki sifat tidak bias, konsisten, dan efisien. 1.2 Perumusan Masalah Masalah dalam penelitian ini adalah bagaimana menetukan model koefisien regresi linier berganda dengan menggunakan maksimum likelihood. 1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah untuk menguraikan cara mengestimasi parameter regresi linier berganda dengan meminimumkan error menggunakan maksimum likelihood. 1.4 Kontribusi Penelitian Kontribusi penelitian ini adalah: 1. Menambah wawasan dan memperkaya literature dalam bidang statistika yang berhubungan dengan regresi linier berganda dan maksimum likelihood. 2. Dengan diketahuinya bagaimana cara mengestimasi parameter regresi linier berganda menggunakan maksimum likehood diharapkan dapat meminimumkan jarak antara titik data dan garis regresi. 3. Untuk mengetahui besarnya pengaruh dari setiap variabel bebas ( yang tercakup) dalam persamaan) terhadap varabel tak bebas. 1.5 Tinjauan Pustaka Universitas Sumatera Utara Dalam penelitian ini penulis menggunakan buku - buku berikut sebagai sumber utama, diantaranya adalah: 1 Supranto J : apabila variabel mempunyai hubungan linier dengan n buah variabel X, maka model matematik regresi bergandanya adalah: Y = β 0 + β1 X 1 + + β k X k + ε Keterngan: = variabel terikat Y X 1 , X 2 , X k = variabel bebas β 0 , β1 ,, β k = parameter regresi ε 2. = nilai kesalahan (error) Wonnacott, T. H dan Wonnacott, R. J : jika X dikurangi dengan rata-ratanya, maka akan diperoleh variabel baru x (xi = X i − X ) . Dan persamaan regresi linier bergandanya menjadi: Yi = β 0 + β1 x1i + + β k x ki + ε Keterangan: Yi = variabel terikat ke-i x1i , , x ki = selisih antara variabel bebas X dengan nilai rata-ratanya pada pengamatan ke-i β 0 , β1 ,, β k = parameter regresi ε = nilai kesalahan (error) Secara umum, bila ada sampel berukuran n dan kemungkinan sampel yang diamati, dan nilai fungsi kemungkinan untuk β 0 , β1 , , β k : p(Y1 , Y2 , , Yk / β 0 , β1 , , β k ) . Untuk nilai Y bebas dengan mengalikan semua kemungkinan bersama, dimana: Universitas Sumatera Utara p (Y1 , Y2 , , Yk / β 0 , β1 , , β k ) 1 −1 Yi − ( β 0 + β1 x1i ++ β k xki ) 2 σ e = σ 2π 1 −1 Y2 − ( β 0 + β1 x1i ++ β k xki ) 2 σ e σ 2π 2 1 −1 Yi − ( β 0 + β1 x1i ++ β k xki ) 2 σ e =∏ σ π 2 i =1 n 2 2 n Dengan ∏ i =1 menyatakan hasil kali kemungkinan bersama untuk nilai Yi yang penggunaannya dikenal dengan penjumlahan eksponen: 1 p(Y1 , Y2 , , Yk / β 0 , β1 , , β k ) = σ 2π Mengingat Yi n (−12 ) Yi −( β 0 + β1xσ1i ++ β k xki ) ∑ i =1 e n 2 amatan yang diberikan dipertimbangkan untuk berbagai nilai β 0 , β1 ,, β k . Sehingga persamaan diatas dinamakan fungsi likelihood: L(β 0 , β1 , β k ) = (σ 1 2π −1 ) n e Yi − β 0 − β1 x1i −− β k xki σ i =1 n 2 ∑ 2 Keterangan: L(β 0 , β1 , β k ) = fungsi maksimum likelihood pada parameter β 0 , β1 , , β k σ = parameter yang merupakan simpangan baku untuk distribusi π = nilai konstan ( π = 3,14) n = banyak data sampel e = bilangan konstan (e= 2,718) Yi = variabel terikat ke-i βi = parameter regresi ke-i Universitas Sumatera Utara 1.6 Metode Penelitian Uraian metode yang digunakan dalam penelitian secara rinci meliputi: a. Membentuk persamaan dari data dengan cara subsitusi. b. Menganalisa persamaan dengan menggunakan maksimum likelihood. c. Mengambil kesimpulan dari analisa yang diperoleh. Universitas Sumatera Utara