BAB 2 TINJAUAN PUSTAKA 2.1 Fungsi Quasi

advertisement
BAB 2
TINJAUAN PUSTAKA
2.1 Fungsi Quasi-Likelihood
Menurut Wedderburn (1974), suatu likelihood didefinisikan sebagai suatu spesifikasi bentuk distribusi dari pengamatan-pengamatan, tetapi untuk mendefinisikan
suatu fungsi quasi-likelihood dibutuhkan hanya spesifikasi suatu hubungan antara
mean dan varians dari pengamatan-pengamatan sampel dan quasi-likelihood dapat
kemudian digunakan untuk penaksiran. Untuk suatu log likelihood eksponensial famili
satu parameter adalah sama sebagaimana quasi-likelihood dan mengikutinya bahwa
menganggap suatu eksponensial famili satu parameter adalah pengandaian distribusi
pendek terlemah yang dapat dibuat.
Selanjutnya McCullagh (1983), diketahui dengan baik bahwa jika fungsi likelihood mempunyai bentuk eksponensial famili, perkiraan likelihood maksimum dari parameter regresi dapat sering ditemukan menggunakan metode weighted least squares.
Disini digunakan istilah weighted least squares dalam suatu pengertian umum agak
baik : khusus perhitungan meliputi fungsi respon nonlinier dan bobot berubah-ubah
dari satu iterasi ke yang berikutnya : Khusus, ketika varians dianggap konstan kuantitas menjadi berukuran minimum adalah suatu jumlah dari sisa kuadrat, dan hasilhasil asimptotis. Memodifikasi dan likelihood bersyarat kadang-kadang membutuhkan
bentuk eksponensial. Hingga metode weighted least square boleh digunakan untuk
sebagian likelihood. Untuk likelihood bersyarat dari jenis yang timbul dalam pertimbangan dari kondisi double 2x2 atau tabel kemungkinan yang lebih besar. Pada kenyataannya metode weighted least squares dapat digunakan untuk menemukan perkiraan likelihood maksimum merata dalam beberapa hal dimana fungsi likelihood tidak
mempunyai bentuk eksponensial famili.
Selanjutnya Firth (1987), suatu metode quasi-likelihood untuk penaksiran parameter dalam model regresi dimana ada beberapa anggapan berkaitan antara mean
dan varian dari masing-masing pengamatan, tetapi tidak perlu suatu likelihood khusus
secara lengkap, jika yang mendasari distribusi datang dari suatu eksponensial famili
alami perkiraan quasi-likelihood berukuran maksimum, likelihood juga mempunyai
efisiensi asymptotis yang penuh, dibawah distribusi-distribusi yang lebih umum ada
beberapa kehilangan dari efisiensi. Efisiensi asymptotis dari perkiraan quasi-likelihood
adalah dihitung dibawah beberapa distribusi-distribusi partikular, dan kemudian lebih
Universitas Sumatera Utara
6
7
umum melalui suatu perkiraan untuk small departures dari eksponensial famili alami
yang sesuai.
Selanjutnya McCullagh dan Nelder (1989), metode quasi-likelihood sering menjadi kompleks dan dengan perhitungan intensif untuk mencocokkan kepasangan atau
perhitungan data. Metode ini mempunyai keuntungan dari perhitungan yang relative
sederhana , kecepatan dan kekuatan, sebagaimana metode-metode itu dapat digunakan lebih dari algoritma sesungguhnya berkembang menjadi model linier umum
yang tepat.
Selanjutnya Aldrich (1997), metode likelihood maksimum sesuai untuk banyak
metode perkiraan yang dikenal baik dalam statistik. Sebagai contoh, andaikan diambil suatu sampel dari beberapa nomor dari tinggi orang Amerika, tetapi tidak seluruh
populasi dan catatan tinggi mereka. Selanjutnya dianggap bahwa tinggi adalah distribusi normal dengan beberapa mean dan varians tidak diketahui. Kemudian sampel
mean adalah penaksir likelihood maksimum dari mean populasi, dan sampel varians
adalah suatu perkiraan tertutup untuk penaksir likelihood maksimum dari varians
populasi.
Selanjutnya Youssef (2009), meneliti penerapan penaksiran quasi-Bayesian dan
quasi likelihood untuk distribusi Pareto. Pada bab IV tesis ini akan dibahas secara
detail.
2.2 Model Linier Tergeneralisir
Menurut Hardin dan Hilbe (2007), dalam statistik, model linier teregeneralisasi
adalah suatu generalisasi fleksibel dari paling sedikit regresi square biasa. Hubungannya dengan distribusi random dari ukuran variabel dari percobaan (fungsi distribusi)
pada porsi sistematik (bukan random) dari percobaan (penduga linier) selanjutnya
suatu fungsi dinamakan fungsi link.
Universitas Sumatera Utara
8
Model linier tergeneralisasi diformulasikan oleh Nelder dan Wedderburn sebagai
suatu cara menyatukan variasi model-model statistika yang lain, termasuk regresi
linier, regresi logistik dan regresi Poisson, dibawah satu kerangka. Hal ini memberikan
mereka untuk mengembangkan suatu algoritma umum untuk penaksiran likelihood
maksimum dalam semua model ini. Perluasannya natural meliputi banyak modelmodel lain yang baik.
Dalam suatu model linier tergeneralisasi, masing-masing menghasilkan variabel
tak bebas, Y dianggap menjadi generasi dari suatu fungsi distribusi khusus dalam
eksponensial famili, suatu range yang besar dari distribusi probabilitas termasuk
distribusi-distribusi normal, binomial dan poisson, diantara yang lain. Mean(µ) dari
distribusi itu bergantung pada variabel bebas X, berikutnya: E(Y ) = µ = g −1 (Xβ)
Dimana E(Y ) adalah nilai perkiraan dari Y ; Xβ adalah penduga linier, suatu kombinasi linier dari parameter tak diketahui β; g adalah fungsi link. Dalam kerangka
ini, varians adalah suatu fungsi khusus V , dari mean: Var(Y ) = V (µ) = V =
V (g −1 (Xβ)). Tepat jika V mengikuti dari distribusi eksponensial famili, tetapi boleh
disederhanakan menjadi varians adalah suatu fungsi dari nilai prediksi.
Parameter tak diketahui β adalah perkiraan khusus dengan likelihood maksimum,
quasi-likelihood maksimum, atau teknik Bayesian.
2.3 Statistika Bayes
Menurut Berger (1985), dalam teori penaksiran dan teori keputusan, suatu penaksir Bayes atau suatu peraturan Bayes adalah suatu penaksir atau peraturan keputusan bahwa ukuran minimum nilai pengharapan posterior dari suatu loss fungsi (posterior expected loss). Ekuivalen, ukuran maksimum posteriornya dari suatu fungsi
utilitas.
Selanjutnya menurut Lehman dan Casella (1998), andaikan suatu parameter
tak diketahui θ adalah mengetahui suatu distribusi prior π. Memperkirakan σ = σ(x)
menjadi suatu penaksir dari θ (didasarkan pada beberapa ukuran x), dan memperkirakan L(θ, σ) menjadi suatu loss fungsi, seperti squared error. Resiko Bayes dari σ
didefinisikan Eπ{L(θ, σ)}, dimana pengharapan diambil melebihi distribusi probabilitas dari θ : fungsi resiko didefinisikan sebagai suatu fungsi dari σ. Suatu penaksir
σ diketahui menjadi suatu penaksir jika ukuran minimumnya resiko Bayes diantara
semua penaksir. Ekuivalen, penaksir yang mana ukuran minimum posterior expected
loss E{L(θ, σ)|x} untuk masing-masing x juga ukuran minimum resiko Bayes dan
Universitas Sumatera Utara
9
oleh karena itu adalah suatu penaksir Bayes.
Jika prior adalah tidak layak kemudian suatu penaksir yang posterior expected loss
berukuran minimum untuk masing-masing x dinamakan suatu penaksir Bayes tergeneralisir.
Contoh : penaksiran minimum mean square error.
Kebanyakan fungsi resiko yang lazim digunakan untuk penaksiran Bayesian adalah
mean square error (MSE), juga dinamakan squared error risk. MSE didefinisikan sebagai MSE = E[(θ̂(x)θ)].
Dimana pengharapan diambil melebihi distribusi joint dari θ dan x.
Menggunakan MSE sebagai resiko, perkiraan Bayes dari parameter tak diketahui
R
adalah mean simpel dari distribusi posterior, θ̂(x) = E[θ|X] = θf(θ|x) dθ. Dikenal
sebagai penaksir minimum mean square error (MMSE). Resiko Bayes dalam hal ini
adalah varians posterior.
Selanjutnya menurut Walpole (2007), metode klasik dari perkiraan dipelajari begitu jauh semata-mata didasarkan pada informasi yang diberikan oleh sampel random.
Metode ini pada dasarnya menafsirkan probabilitas sebagai frekuensi relatif. Sebagai
contoh, pada kedatangan 95% interval kepercayaan untuk p, pernyataan ditafsirkan:
P (−1, 96 < Z < 1, 96) = 0, 95 untuk mean 95% dari waktu dalam percobaan yang
berulang-ulang Z akan turun antara -1,96 dan 1,96. Karena Z =
x̄−µ
√ .
σ/ n
Untuk suatu
sampel normal dengan varians diketahui, pernyataan probabilitas disini berarti bahwa
√
√
95% dari interval random (x̄ − 1, 96σ/ nx̄ + 1, 96σ/ n) berisi kebenaran rata-rata.
Pendekatan lain untuk metode statistik perkiraan dinamakan metodologi Bayesian.
Menggunakan metodologi Bayesian dapat diperoleh distribusi posterior dari parameter. Penaksiran Bayes dapat juga diperoleh menggunakan distribusi posterior
ketika mendatangkan suatu fungsi loss. Misalnya, perkiraan Bayes yang terpopuler
digunakan adalah dibawah squared-error loss function yang mirip dengan least squares
estimates. Rata-rata dari distribusi posterior π(θ|X), menunjukkan θ∗ , dinamakan
perkiraan Bayes dari θ, dibawah squared- error loss function.
Universitas Sumatera Utara
Download