BAB 2 TINJAUAN PUSTAKA 2.1 Fungsi Quasi-Likelihood Menurut Wedderburn (1974), suatu likelihood didefinisikan sebagai suatu spesifikasi bentuk distribusi dari pengamatan-pengamatan, tetapi untuk mendefinisikan suatu fungsi quasi-likelihood dibutuhkan hanya spesifikasi suatu hubungan antara mean dan varians dari pengamatan-pengamatan sampel dan quasi-likelihood dapat kemudian digunakan untuk penaksiran. Untuk suatu log likelihood eksponensial famili satu parameter adalah sama sebagaimana quasi-likelihood dan mengikutinya bahwa menganggap suatu eksponensial famili satu parameter adalah pengandaian distribusi pendek terlemah yang dapat dibuat. Selanjutnya McCullagh (1983), diketahui dengan baik bahwa jika fungsi likelihood mempunyai bentuk eksponensial famili, perkiraan likelihood maksimum dari parameter regresi dapat sering ditemukan menggunakan metode weighted least squares. Disini digunakan istilah weighted least squares dalam suatu pengertian umum agak baik : khusus perhitungan meliputi fungsi respon nonlinier dan bobot berubah-ubah dari satu iterasi ke yang berikutnya : Khusus, ketika varians dianggap konstan kuantitas menjadi berukuran minimum adalah suatu jumlah dari sisa kuadrat, dan hasilhasil asimptotis. Memodifikasi dan likelihood bersyarat kadang-kadang membutuhkan bentuk eksponensial. Hingga metode weighted least square boleh digunakan untuk sebagian likelihood. Untuk likelihood bersyarat dari jenis yang timbul dalam pertimbangan dari kondisi double 2x2 atau tabel kemungkinan yang lebih besar. Pada kenyataannya metode weighted least squares dapat digunakan untuk menemukan perkiraan likelihood maksimum merata dalam beberapa hal dimana fungsi likelihood tidak mempunyai bentuk eksponensial famili. Selanjutnya Firth (1987), suatu metode quasi-likelihood untuk penaksiran parameter dalam model regresi dimana ada beberapa anggapan berkaitan antara mean dan varian dari masing-masing pengamatan, tetapi tidak perlu suatu likelihood khusus secara lengkap, jika yang mendasari distribusi datang dari suatu eksponensial famili alami perkiraan quasi-likelihood berukuran maksimum, likelihood juga mempunyai efisiensi asymptotis yang penuh, dibawah distribusi-distribusi yang lebih umum ada beberapa kehilangan dari efisiensi. Efisiensi asymptotis dari perkiraan quasi-likelihood adalah dihitung dibawah beberapa distribusi-distribusi partikular, dan kemudian lebih Universitas Sumatera Utara 6 7 umum melalui suatu perkiraan untuk small departures dari eksponensial famili alami yang sesuai. Selanjutnya McCullagh dan Nelder (1989), metode quasi-likelihood sering menjadi kompleks dan dengan perhitungan intensif untuk mencocokkan kepasangan atau perhitungan data. Metode ini mempunyai keuntungan dari perhitungan yang relative sederhana , kecepatan dan kekuatan, sebagaimana metode-metode itu dapat digunakan lebih dari algoritma sesungguhnya berkembang menjadi model linier umum yang tepat. Selanjutnya Aldrich (1997), metode likelihood maksimum sesuai untuk banyak metode perkiraan yang dikenal baik dalam statistik. Sebagai contoh, andaikan diambil suatu sampel dari beberapa nomor dari tinggi orang Amerika, tetapi tidak seluruh populasi dan catatan tinggi mereka. Selanjutnya dianggap bahwa tinggi adalah distribusi normal dengan beberapa mean dan varians tidak diketahui. Kemudian sampel mean adalah penaksir likelihood maksimum dari mean populasi, dan sampel varians adalah suatu perkiraan tertutup untuk penaksir likelihood maksimum dari varians populasi. Selanjutnya Youssef (2009), meneliti penerapan penaksiran quasi-Bayesian dan quasi likelihood untuk distribusi Pareto. Pada bab IV tesis ini akan dibahas secara detail. 2.2 Model Linier Tergeneralisir Menurut Hardin dan Hilbe (2007), dalam statistik, model linier teregeneralisasi adalah suatu generalisasi fleksibel dari paling sedikit regresi square biasa. Hubungannya dengan distribusi random dari ukuran variabel dari percobaan (fungsi distribusi) pada porsi sistematik (bukan random) dari percobaan (penduga linier) selanjutnya suatu fungsi dinamakan fungsi link. Universitas Sumatera Utara 8 Model linier tergeneralisasi diformulasikan oleh Nelder dan Wedderburn sebagai suatu cara menyatukan variasi model-model statistika yang lain, termasuk regresi linier, regresi logistik dan regresi Poisson, dibawah satu kerangka. Hal ini memberikan mereka untuk mengembangkan suatu algoritma umum untuk penaksiran likelihood maksimum dalam semua model ini. Perluasannya natural meliputi banyak modelmodel lain yang baik. Dalam suatu model linier tergeneralisasi, masing-masing menghasilkan variabel tak bebas, Y dianggap menjadi generasi dari suatu fungsi distribusi khusus dalam eksponensial famili, suatu range yang besar dari distribusi probabilitas termasuk distribusi-distribusi normal, binomial dan poisson, diantara yang lain. Mean(µ) dari distribusi itu bergantung pada variabel bebas X, berikutnya: E(Y ) = µ = g −1 (Xβ) Dimana E(Y ) adalah nilai perkiraan dari Y ; Xβ adalah penduga linier, suatu kombinasi linier dari parameter tak diketahui β; g adalah fungsi link. Dalam kerangka ini, varians adalah suatu fungsi khusus V , dari mean: Var(Y ) = V (µ) = V = V (g −1 (Xβ)). Tepat jika V mengikuti dari distribusi eksponensial famili, tetapi boleh disederhanakan menjadi varians adalah suatu fungsi dari nilai prediksi. Parameter tak diketahui β adalah perkiraan khusus dengan likelihood maksimum, quasi-likelihood maksimum, atau teknik Bayesian. 2.3 Statistika Bayes Menurut Berger (1985), dalam teori penaksiran dan teori keputusan, suatu penaksir Bayes atau suatu peraturan Bayes adalah suatu penaksir atau peraturan keputusan bahwa ukuran minimum nilai pengharapan posterior dari suatu loss fungsi (posterior expected loss). Ekuivalen, ukuran maksimum posteriornya dari suatu fungsi utilitas. Selanjutnya menurut Lehman dan Casella (1998), andaikan suatu parameter tak diketahui θ adalah mengetahui suatu distribusi prior π. Memperkirakan σ = σ(x) menjadi suatu penaksir dari θ (didasarkan pada beberapa ukuran x), dan memperkirakan L(θ, σ) menjadi suatu loss fungsi, seperti squared error. Resiko Bayes dari σ didefinisikan Eπ{L(θ, σ)}, dimana pengharapan diambil melebihi distribusi probabilitas dari θ : fungsi resiko didefinisikan sebagai suatu fungsi dari σ. Suatu penaksir σ diketahui menjadi suatu penaksir jika ukuran minimumnya resiko Bayes diantara semua penaksir. Ekuivalen, penaksir yang mana ukuran minimum posterior expected loss E{L(θ, σ)|x} untuk masing-masing x juga ukuran minimum resiko Bayes dan Universitas Sumatera Utara 9 oleh karena itu adalah suatu penaksir Bayes. Jika prior adalah tidak layak kemudian suatu penaksir yang posterior expected loss berukuran minimum untuk masing-masing x dinamakan suatu penaksir Bayes tergeneralisir. Contoh : penaksiran minimum mean square error. Kebanyakan fungsi resiko yang lazim digunakan untuk penaksiran Bayesian adalah mean square error (MSE), juga dinamakan squared error risk. MSE didefinisikan sebagai MSE = E[(θ̂(x)θ)]. Dimana pengharapan diambil melebihi distribusi joint dari θ dan x. Menggunakan MSE sebagai resiko, perkiraan Bayes dari parameter tak diketahui R adalah mean simpel dari distribusi posterior, θ̂(x) = E[θ|X] = θf(θ|x) dθ. Dikenal sebagai penaksir minimum mean square error (MMSE). Resiko Bayes dalam hal ini adalah varians posterior. Selanjutnya menurut Walpole (2007), metode klasik dari perkiraan dipelajari begitu jauh semata-mata didasarkan pada informasi yang diberikan oleh sampel random. Metode ini pada dasarnya menafsirkan probabilitas sebagai frekuensi relatif. Sebagai contoh, pada kedatangan 95% interval kepercayaan untuk p, pernyataan ditafsirkan: P (−1, 96 < Z < 1, 96) = 0, 95 untuk mean 95% dari waktu dalam percobaan yang berulang-ulang Z akan turun antara -1,96 dan 1,96. Karena Z = x̄−µ √ . σ/ n Untuk suatu sampel normal dengan varians diketahui, pernyataan probabilitas disini berarti bahwa √ √ 95% dari interval random (x̄ − 1, 96σ/ nx̄ + 1, 96σ/ n) berisi kebenaran rata-rata. Pendekatan lain untuk metode statistik perkiraan dinamakan metodologi Bayesian. Menggunakan metodologi Bayesian dapat diperoleh distribusi posterior dari parameter. Penaksiran Bayes dapat juga diperoleh menggunakan distribusi posterior ketika mendatangkan suatu fungsi loss. Misalnya, perkiraan Bayes yang terpopuler digunakan adalah dibawah squared-error loss function yang mirip dengan least squares estimates. Rata-rata dari distribusi posterior π(θ|X), menunjukkan θ∗ , dinamakan perkiraan Bayes dari θ, dibawah squared- error loss function. Universitas Sumatera Utara