Model Linear Campuran (Mixed Linear Models) Dr. Edizon Jambormias Model linear campuran merupakan metode baku untuk menduga pengaruh acak dari suatu parameter. Terdapat dua parameter penting yang saling terkait dalam prediksi dan dihasilkan dalam analisis, yaitu nilai prediksi tak bias linear terbaik (best linear unbiased prediction, BLUP) dan komponen ragam. Komponen ragam terdiri atas ragam tiap faktor acak, ragam galat, ragam total dan proporsi ragam faktor acak terhadap total. Bila faktor acak adalah bahan genetik, maka proporsi ragam faktor acak terhadap total ini merupakan heritabilitas. Awalnya dikembangkan oleh C.R. Henderson di tahun 1940’an Digunakan sangat luas dalam pemuliaan hewan dengan kemampuan prediksi yang sangat akurat. BLUP adalah batasan umum yang mengacu ke dua prosedur: ◦ Pengertian BLUP –‘P’ mengacu pada prediction dalam model pengaruh acak (dimana ada struktur peragam) ◦ BLUE – ‘E’ mengacu pada estimation dalam model pengaruh tetap (tak ada struktur peragam) “Best” (“Terbaik”) berarti memiliki ragam minimum “Linear” berati bahwa predictions atau estimates merupakan fungsi linear dari pengamatan Unbiased (ketakbiasan) ◦ Nilai harapan estimates = ini nilai yang benar ◦ predictions memiliki nilai harapan nol Log Normal Distributions Akurasi BLUP karena menggunakan metode pendugaan parameter yang bukan berbasis pendekatan kuadrat terkecil (least square), tetapi berbasis metode kemungkinan maksimum (maximum likelihood). Metode yang umum digunakan adalah metode kemungkinan maksimum terestriksi (restricted maximum likelihood, REML). Peningkatan akurasi BLUP terjadi ketika bias yang timbul dari penyusutan diimbangi oleh reduksi dalam ragam secara iteratif. BLUP juga dapat memaksimalkan korelasi antara nilai factor acak sebenarnya dengan nilai faktor acak prediktif. p yij 0 j x ji ij j 1 dimana: β0 = nilai tengah keseluruhan (overall mean), βk = koefisien pengaruh tetap faktor ke-j, j = 1, 2, ..., p xkj = peubah penjelas (explanatory variable) ke-j dan pengamatan ke-i, dan εij = pengaruh sisa. Linear model (matriks) Y = X’ + ε Parameter estimates b = (X’X)-1X’Y Source df SS MS Regression Residual p n-p b’X’Y Y’Y - b’X’Y MSR MSE Total n Y’Y q p k 1 j 1 yijk 0 k xkj zij ui ijk dimana: β0 = nilai tengah keseluruhan (overall mean), βk = koefisien pengaruh tetap faktor ke-k, k = 1, 2, ..., q xkj = peubah penjelas (explanatory variable) ke-k dan pengamatan ke-j, ui = pengaruh acak faktor ke-i, i = 1, 2, ..., i zij = peubah indikator biner untuk pengaruh acak faktor ke-i dan pengamatan ke-j, dan εijk = pengaruh sisa. Matriks Rancangan Y = X’ + Z’u + e Pengaruh Tetap Pengaruh Acak Pengaruh tetap adalah konstanta ◦ Nilai tengah keseluruhan (overall mean) ◦ Pengaruh lingkungan (mean across trials) Klasifikasi Pengaruh acak memiliki struktur peragam untuk tujuan ◦ nilai faktor acak BLUP ◦ simpangan atau sisaan Yij = + ti + uj + eij ti = pengaruh blok ke-i uj = pengaruh kultivar ke-j Dalam notasi matriks: 4.45 4.61 5.27 5.00 5.82 5.79 1 1 1 1 1 1 Y = X’ + Z’u + e 1 1 1 0 1 b0 0 0 b1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 e 0 u e11 0 1 12 1 u2 e14 0 u3 e22 0 u4 e23 1 e 24 Dalam kasus yang paling sederhana (semua data setimbang, satu-satunya pengaruh tetap adalah overall mean) dan BLUP adalah: 𝜎𝜏2 𝐵𝐿𝑈𝑃 𝜇𝑖 = 2 2 𝑦𝑖. − 𝑦.. 𝜎𝜏 + 𝜎𝑒 Jika 𝜎𝜏2 /(𝜎𝜏2 +𝜎𝑒2 ) tinggi, nilai BLUP dekat dengan nilai amatan. Jika 𝜎𝜏2 /(𝜎𝜏2 +𝜎𝑒2 ) rendah, nilai BLUP mengecil (shrink) terhadap overall mean Penggunaan penduga maksimum likelihood dapat meningkatkan prediksi secara akurat. q p Model linear baku: y 0 k xkj zij ui k 1 j 1 Rerata peubah respons: q p k 1 j 1 E ( y ) 0 k xkj zij ui X ' β Z ' u dimana X ' β Z ' u = prediktor linear. Hubungan respons rata-rata dengan prediktor linear X ' β Z ' u oleh fungsi penghubung: g (μ) Xβ Zu Model regresi yang merepresentasikan respons rata-rata diberikan oleh inverse linking: E ( y ) g 1 ( Xβ Zu) Kekonvergenan predictor linear vs link function. Likelihood ratio test seperti the Deviance, the scaled deviance, AIC, BIC, AAIC, etc. Model terbaik adalah model dengan nilai terkecil. Khusus generalized linear mixed models: ◦ Scaled Pearson’s Chi-Square Test: 2 ˆ ( y ) 2 2 i i : Pearson’s Chi-Square Test: nq V ( i ) i 1 n 2 n ˆ ( y ) 1 i 2 i φ i 1 V ( i ) Contoh Percobaan Jagung: Rancangan Acak Lengkap • 5 zuriat populasi jagung diteliti • Percobaan dilakukan menggunakan rancangan acak lengkap dengan 4 ulangan untuk setiap zuriat • Peubah respons adalah bobot tongkol jagung (kg/10 m 2) Zuriat 1 2 3 4 5 5.95 5.07 4.82 3.87 5.53 Ulangan 6.21 5.40 6.71 5.46 5.11 4.68 4.16 4.11 5.82 4.29 5.18 4.98 4.52 4.84 4.70 data prog; input Progeny Yield; cards; 1 5.95 1 6.21 1 5.40 1 5.18 2 5.07 2 6.71 2 5.46 2 4.98 3 4.82 3 5.11 3 4.68 3 4.52 4 3.87 4 4.16 4 4.11 4 4.84 5 5.53 5 5.82 5 4.29 5 4.70 ; * Linear Method; proc glm data=prog; class Progeny; model Yield = Progeny; run; * Restricted Maximum Likelihood Method; proc mixed data=prog; class Progeny; model Yield = / solution ddfm=sat; random Progeny / solution ; run; * Maximum Likelihood Method; proc mixed data=prog method=ML; class Progeny; model Yield = / solution ddfm=sat; random Progeny / solution ; run; Linear Models The GLM Procedure Dependent Variable: Yield Source Model Error Corrected Total DF 4 15 19 R-Square 0.533419 Sum of Squares 5.50782000 4.81767500 10.32549500 Coeff Var 11.17692 Mean Square 1.37695500 0.32117833 Root MSE 0.566726 F Value 4.29 Pr > F 0.0164 Yield Mean 5.070500 Source Progeny DF 4 Type I SS 5.50782000 Mean Square 1.37695500 F Value 4.29 Pr > F 0.0164 Source Progeny DF 4 Type III SS 5.50782000 Mean Square 1.37695500 F Value 4.29 Pr > F 0.0164 The Mixed Procedure Model Information Data Set Dependent Variable Covariance Structure Estimation Method Residual Variance Method Fixed Effects SE Method Degrees of Freedom Method WORK.PROG Yield Variance Components REML Profile Model-Based Satterthwaite Class Level Information Class Progeny Levels 5 Values 1 2 3 4 5 Max Obs Per Subject 20 Observations Used 20 Observations Not Used 0 Total Observations 20 Iteration History Iteration Evaluations