Uploaded by ejambormias

@Model Linear Campuran

advertisement
Model Linear Campuran
(Mixed Linear Models)
Dr. Edizon Jambormias




Model linear campuran merupakan metode baku
untuk menduga pengaruh acak dari suatu
parameter.
Terdapat dua parameter penting yang saling terkait
dalam prediksi dan dihasilkan dalam analisis, yaitu
nilai prediksi tak bias linear terbaik (best linear
unbiased prediction, BLUP) dan komponen ragam.
Komponen ragam terdiri atas ragam tiap faktor
acak, ragam galat, ragam total dan proporsi ragam
faktor acak terhadap total.
Bila faktor acak adalah bahan genetik, maka
proporsi ragam faktor acak terhadap total ini
merupakan heritabilitas.



Awalnya dikembangkan oleh C.R. Henderson di
tahun 1940’an
Digunakan sangat luas dalam pemuliaan hewan
dengan kemampuan prediksi yang sangat
akurat.
BLUP adalah batasan umum yang mengacu ke
dua prosedur:
◦ Pengertian BLUP –‘P’ mengacu pada prediction
dalam model pengaruh acak (dimana ada struktur
peragam)
◦ BLUE – ‘E’ mengacu pada estimation dalam model
pengaruh tetap (tak ada struktur peragam)



“Best” (“Terbaik”) berarti memiliki ragam
minimum
“Linear” berati bahwa predictions atau
estimates merupakan fungsi linear dari
pengamatan
Unbiased (ketakbiasan)
◦ Nilai harapan estimates = ini nilai yang benar
◦ predictions memiliki nilai harapan nol
Log Normal Distributions




Akurasi BLUP karena menggunakan metode
pendugaan parameter yang bukan berbasis
pendekatan kuadrat terkecil (least square), tetapi
berbasis metode kemungkinan maksimum
(maximum likelihood).
Metode yang umum digunakan adalah metode
kemungkinan maksimum terestriksi (restricted
maximum likelihood, REML).
Peningkatan akurasi BLUP terjadi ketika bias yang
timbul dari penyusutan diimbangi oleh reduksi
dalam ragam secara iteratif.
BLUP juga dapat memaksimalkan korelasi antara
nilai factor acak sebenarnya dengan nilai faktor
acak prediktif.
p
yij   0    j x ji   ij
j 1
dimana:
β0 = nilai tengah keseluruhan (overall mean),
βk = koefisien pengaruh tetap faktor ke-j, j = 1, 2,
..., p
xkj = peubah penjelas (explanatory variable) ke-j
dan pengamatan ke-i, dan
εij = pengaruh sisa.
Linear model (matriks)
Y = X’ + ε
Parameter estimates
b = (X’X)-1X’Y
Source
df
SS
MS
Regression
Residual
p
n-p
b’X’Y
Y’Y - b’X’Y
MSR
MSE
Total
n
Y’Y
q
p
k 1
j 1
yijk   0    k xkj   zij ui  ijk
dimana:
β0 = nilai tengah keseluruhan (overall mean),
βk = koefisien pengaruh tetap faktor ke-k, k = 1, 2, ..., q
xkj = peubah penjelas (explanatory variable) ke-k dan
pengamatan ke-j,
ui = pengaruh acak faktor ke-i, i = 1, 2, ..., i
zij = peubah indikator biner untuk pengaruh acak faktor ke-i
dan pengamatan ke-j, dan
εijk = pengaruh sisa.
Matriks Rancangan
Y = X’ + Z’u + e
Pengaruh Tetap


Pengaruh Acak
Pengaruh tetap adalah konstanta
◦ Nilai tengah keseluruhan (overall mean)
◦ Pengaruh lingkungan (mean across trials)
Klasifikasi
Pengaruh acak memiliki struktur peragam
untuk tujuan
◦ nilai faktor acak
BLUP
◦ simpangan atau sisaan
Yij =  + ti + uj + eij
ti = pengaruh blok ke-i
uj = pengaruh kultivar ke-j
Dalam notasi matriks:
 4.45 


 4.61 


5.27


 5.00 


 5.82 
 5.79 


1

1

 1
1

1
1

Y = X’ + Z’u + e
1
1 

1   0
1   b0    0



0   b1   0
0    0
0
0 

0
1
0
1
0
0
0
0
0
0
1
0
e

0   u   e11 
0   1   12 
1   u2    e14 
0   u3   e22 
0   u4   e23 
1     e 
 24 




Dalam kasus yang paling sederhana (semua data
setimbang, satu-satunya pengaruh tetap adalah
overall mean) dan BLUP adalah:
𝜎𝜏2
𝐵𝐿𝑈𝑃 𝜇𝑖 = 2
2 𝑦𝑖. − 𝑦..
𝜎𝜏 + 𝜎𝑒
Jika 𝜎𝜏2 /(𝜎𝜏2 +𝜎𝑒2 ) tinggi, nilai BLUP dekat dengan nilai
amatan.
Jika 𝜎𝜏2 /(𝜎𝜏2 +𝜎𝑒2 ) rendah, nilai BLUP mengecil (shrink)
terhadap overall mean
Penggunaan penduga maksimum likelihood dapat
meningkatkan prediksi secara akurat.
q


p
Model linear baku: y   0    k xkj   zij ui  
k 1
j 1
Rerata peubah respons:
q
p
k 1
j 1
E ( y )     0    k xkj   zij ui  X ' β  Z ' u

dimana X ' β  Z ' u = prediktor linear.
Hubungan respons rata-rata  dengan prediktor
linear X ' β  Z ' u oleh fungsi penghubung:
g (μ)  Xβ  Zu

Model regresi yang merepresentasikan respons
rata-rata diberikan oleh inverse linking:
E ( y )    g 1 ( Xβ  Zu)



Kekonvergenan predictor linear vs link
function.
Likelihood ratio test seperti the Deviance, the
scaled deviance, AIC, BIC, AAIC, etc. Model
terbaik adalah model dengan nilai terkecil.
Khusus generalized linear mixed models:
◦ Scaled Pearson’s Chi-Square Test:
2
ˆ
(
y


)
2
2
i
i


:

Pearson’s Chi-Square Test:

nq
V ( i )
i 1
n

2
n
ˆ
(
y


)
1
i
2   i
φ i 1 V ( i )
Contoh Percobaan Jagung: Rancangan Acak Lengkap
• 5 zuriat populasi jagung diteliti
• Percobaan dilakukan menggunakan rancangan acak
lengkap dengan 4 ulangan untuk setiap zuriat
• Peubah respons adalah bobot tongkol jagung (kg/10
m 2)
Zuriat
1
2
3
4
5
5.95
5.07
4.82
3.87
5.53
Ulangan
6.21 5.40
6.71 5.46
5.11 4.68
4.16 4.11
5.82 4.29
5.18
4.98
4.52
4.84
4.70
data prog;
input Progeny Yield;
cards;
1 5.95
1 6.21
1 5.40
1 5.18
2 5.07
2 6.71
2 5.46
2 4.98
3 4.82
3 5.11
3 4.68
3 4.52
4 3.87
4 4.16
4 4.11
4 4.84
5 5.53
5 5.82
5 4.29
5 4.70
;
* Linear Method;
proc glm data=prog;
class Progeny;
model Yield = Progeny;
run;
* Restricted Maximum Likelihood Method;
proc mixed data=prog;
class Progeny;
model Yield = / solution ddfm=sat;
random Progeny / solution ;
run;
* Maximum Likelihood Method;
proc mixed data=prog method=ML;
class Progeny;
model Yield = / solution ddfm=sat;
random Progeny / solution ;
run;
Linear Models
The GLM Procedure
Dependent Variable: Yield
Source
Model
Error
Corrected Total
DF
4
15
19
R-Square
0.533419
Sum of
Squares
5.50782000
4.81767500
10.32549500
Coeff Var
11.17692
Mean Square
1.37695500
0.32117833
Root MSE
0.566726
F Value
4.29
Pr > F
0.0164
Yield Mean
5.070500
Source
Progeny
DF
4
Type I SS
5.50782000
Mean Square
1.37695500
F Value
4.29
Pr > F
0.0164
Source
Progeny
DF
4
Type III SS
5.50782000
Mean Square
1.37695500
F Value
4.29
Pr > F
0.0164
The Mixed Procedure
Model Information
Data Set
Dependent Variable
Covariance Structure
Estimation Method
Residual Variance Method
Fixed Effects SE Method
Degrees of Freedom Method
WORK.PROG
Yield
Variance Components
REML
Profile
Model-Based
Satterthwaite
Class Level Information
Class
Progeny
Levels
5
Values
1 2 3 4 5
Max Obs Per Subject
20
Observations Used
20
Observations Not Used
0
Total Observations
20
Iteration History
Iteration
Evaluations
Download
Study collections