1 pendekatan bayesian untuk mendeteksi faktor

advertisement
PENDEKATAN BAYESIAN UNTUK MENDETEKSI
FAKTOR-FAKTOR YANG BERPENGARUH PADA
SCREENING EXPERIMENT
Budhi Handoko
Jurusan Statistika FMIPA Universitas Padjadjaran
Jl. Bandung – Sumedang km. 21 Jatinangor Jawa Barat
Email : [email protected]
Abstrak
Rancangan faktorial fraksional dan ortogonal array merupakan alat yang powerful untuk
mengidentifikasi faktor-faktor yang aktif/berpengaruh. Namun seringkali metode analisis yang
konvensional tidak bisa digunakan untuk mengidentifikasinya, disebabkan struktur alias yang
kompleks. Dengan menggunakan pendekatan bayesian, faktor yang aktif/ berpengaruh dapat
ditentukan dengan cara menghitung peluang posterior marjinalnya, yang bisa diterapkan baik untuk
desain ortogonal maupun nonortogonal untuk data yang hilang atau akibat pengaturan faktor yang
tidak sesuai.
Kata Kunci : Analisis bayesian, desain ortogonal, struktur alias.
1
1. Pendahuluan
Dalam suatu percobaan, respon dapat dipengaruhi oleh banyak faktor. Namun, bisa jadi hanya
sedikit faktor yang mempengaruhi respon atau disebut sebagai faktor yang aktif/berpengaruh. Hal ini
oleh Box dan Meyer (1986) sebagai factor sparsity. Screening experiment merupakan eksperimen
yang bertujuan untuk menentukan faktor-faktor yang penting atau aktif dari sekumpulan faktor-faktor
percobaan. Terdapat dua jenis desain yang sering digunakan dalam screening experiment, yaitu
rancangan fraksional faktorial dan Plackett-Burman. Rancangan fraksional faktorial yang ditemukan
oleh Box dan Hunter (1961) merupakan suatu rancangan yang jumlah percobaannya merupakan
pangkat dari 2, yaitu 8, 16, 32, dst. Rancangan ini sering disebut sebagai rancangan geometrik dan
memiliki struktur alias yang sederhana. Sedangkan rancangan Plackett-Burman yang ditemukan oleh
Plackett dan Burman (1946) merupakan rancangan yang jumlah percobaannya bukan merupakan
pangkat dari dua melainkan perkalian dari 4, yaitu 12, 20, 24, dst. Rancangan ini sering disebut
sebagai rancangan nongeometrik dan memiliki struktur alias yang kompleks.
Terdapat beberapa metode yang dapat digunakan untuk menganalisis faktor-faktor yang
penting atau aktif dalam rancangan fraksional faktorial dan Plackett-Burman, yaitu Pertama,
identifikasi faktor aktif dari efek utama yang mempunyai kontras yang besar yang dilakukan oleh
Daniel (1976) dan Box, dkk (1978) menggunakan plot peluang normal, Box dan Meyer (1986) dengan
plot bayes, dan Lenth (1989) menggunakan pseudo-standard error. Kedua, metode Jurans Word yaitu
menganggap hanya sebagian kecil faktor yang berpengaruh dan faktor-faktor ini bisa saling
berinteraksi. Ketiga, adalah metode bayesian yaitu metode yang mempertimbangkan semua hipotesis
dari model-model faktor terhadap respon. Makalah ini membahas pendeteksian faktor yang
berpengaruh menggunakan pendekatan bayesian.
2. Metode Analisis
Pendekatan bayes yang digunakan adalah dengan mempertimbangkan semua model dari
faktor dan respon dan memilih yang paling cocok dengan data. Metode bayes akan mengidentifikasi
setiap model dan menghitung nilai peluang posteriornya. Pendekatan ini mirip dengan metode
pemilihan model regresi terbaik menggunakan regresi all-subset. Misalkan terdapat sekumpulan
model yaitu M0, M1, ...,Mm. Setiap model Mi mempunyai sebuah vektor parameter i, sehingga
distribusi sampling dari data y, dengan diberikan model Mi, dijelaskan melalui desitas peluang
f(y|Mi,i). Peluang prior dari model Mi adalah p(Mi) dan densitas peluang prior dari i adalah f(i|Mi).
Densitas prediktif dari y, jika diberikan model Mi, ditulis f(y|Mi) dan diberikan melalui persamaan
berikut:
f ( y | M i )   f ( y | M i , θ i ) f (θ i | M i )dθ i
R
dimana Ri adalah sekumpulan nilai yang mungkin dari i. Peluang posterior dari model Mi, jika
diberikan data y adalah sebagai berikut :
2
p(M i | y) 
p(M i ) f ( y | M i )
m
 p(M
h0
h
)f (y | Mh)
Peluang posterior p(Mi|y) digunakan untuk melakukan identifikasi model. Model yang sesuai
diidentifikasikan dengan nilai peluang posterior yang besar.
Dalam screening experiment dengan k buah faktor, misalkan Mi menyatakan model bahwa
subset dari faktor-faktor fi adalah aktif, dimana 0  fi  k. Terdapat 2k buah model Mi, dimulai dari i =
0 (tidak ada faktor aktif) sampai i = 2k-1 (terdapat k faktor yang aktif). Nilai  menyatakan peluang
prior bahwa sebuah faktor aktif. Untuk screening experiment, dimana kurang dari setengah faktor yang
penting, nilai  yang sesuai akan berada pada rentang dari 0 – 0,5. Sehingga peluang prior p(Mi) untuk
model Mi adalah π i (1  π)
f
k  fi
. Untuk keperluan perhitungan nilai  ditetapkan 0,25 dan nilai 
dipilih yang meminimumkan peluang tidak ada faktor yang berpengaruh/aktif.
Jika Xi merupakan matriks dengan kolom untuk setiap efek pada model Mi dikodekan -1 dan
+1 untuk faktor dengan dua level, juga memuat sebuah kolom bernilai 1 untuk rata-ratanya dan kolom
untuk interaksi yang diinginkan. Misalkan juga terdapat ti yang merupakan jumlah efek tanpa rata-rata.
Dimensi untuk Xi menjadi n x (1+ti). βi adalah vektor dari efek untuk model Mi yang berukuran (1+ti)
x 1. y adalah vektor respon berukuran n x 1. Fungsi distribusi peluang dari y jika diberikan model Mi
adalah sebagai berikut
f ( y | M i i )  f ( y | M i ,  ,  i )    n exp[ ( y  X i  i )' (Y  x i  i ) / 2 2 ]
Elemen dari βi berdistribusi prior normal dengan rata-rata nol dan varians γ2σ2. Parameter γ merupakan
nilai dari efek relatif terhadap noise eksperimen. β0 dan log (σ) berdistribusi prior non informatif
dimana f(β0, σ)  1/ σ. Setelah diperoleh data vektor y , peluang posterior dari model Mi adalah
1/ 2
fi
X 0' X 0
   ti
p( M i | y )  C 
 
1  
i  X i' X i
1/ 2
 S ( ˆ i )  ˆ i i ˆ i


S ( ˆ 0 )





 ( n 1) / 2
dengan
i 
1
2
0 0 
0 I 
i

ˆ i  (i  X i' X i ) 1 X i' y
S ( ˆ i )  ( y  X i ˆ i )' ( y  X i ˆ i )
Nilai peluang posterior p(Mi|y) digunakan untuk menghitung peluang posterior marjinal Pj bahwa
sebuah faktor aktif, dengan melakukan penjumlahan sebagai berikut
3
Pj 
 p( M
i
| y)
M i | faktor j aktif
Peluang Pj dihitung berdasarkan 2k model Mi yang mungkin. Nilai yang besar dari Pj menunjukkan
faktor j yang aktif. Perhitungan posterior dilakukan dengan menggunakan paket program MATLAB
6.5 dengan inputan berupa matriks rancangan dan respon y.
3. Aplikasi Metode Bayes Untuk Menganalisis Faktor yang Berpengaruh
Penentuan Faktor yang Berpengaruh pada Rancangan Plackett-Burman
Penelitian mengenai daya tahan baja dilakukan oleh Hunter, Hodi, dan Eager (1982) menggunakan
rancangan Plackett-Burman dengan banyaknya percobaan (run) sebanyak 12. Penelitian ini
menggunakan tujuh buah faktor dan respon yang diukur adalah daya tahan baja tersebut. Matriks
rancangan ditunjukkan pada Tabel 1 berikut ini.
Tabel 1. Hasil Eksperimen Pengukuran Daya Tahan Baja
Menggunakan Rancangan Plackett-Burman n = 12.
Run
A
B
C
D
E
F
G
Y
1
+
+
-
+
+
+
-
6.058
2
+
-
+
+
+
-
-
4.733
3
-
+
+
+
-
-
-
4.625
4
+
+
+
-
-
-
+
5.899
5
+
+
-
-
-
+
-
7.000
6
+
-
-
-
+
-
+
5.752
7
-
-
-
+
-
+
+
5.682
8
-
-
+
-
+
+
-
6.607
9
-
+
-
+
+
-
+
5.818
10
+
-
+
+
-
+
+
5.917
11
-
-
+
-
+
+
+
9.863
12
-
-
-
-
-
-
-
4.809
Keterangan : Faktor A = Struktur awal
D = Pemanasan
B = Ukuran
E = Tingkat Pendinginan
C = Tekanan
F = Polish
G = Perlakuan akhir
Y = adalah logaritma natural dari daya tahan baja
Hasil efek taksiran menggunakan metode analitik konvensional tampak pada Tabel 2 dan diagram plot
normal ditunjukkan pada Gambar 2 berikut ini:
4
Tabel 2 Efek Taksiran Eksperimen Daya Tahan Baja
Kolom
Efek Taksiran
A
0.326
B
0.294
C
-0.246
D
-0.516
E
0.15
F
0.915
G
0.183
8
0.446
9
0.453
10
0.081
11
-0.242
Berdasarkan Tabel 2 tersebut tampak bahwa faktor yang mempunyai efek taksiran yang lebih besar
dari yang lain adalah faktor Ddan F. Faktor D mempunyai efek negatif, sedangkan faktor F
mempunyai efek positif. Demikian juga plot peluang normal pada Gambar 1 juga memperlihatkan
hasil yang sama.
Namun hasil yang agak berbeda ditunjukkan oleh pendekatan bayesian yang ditunjukkan pada Gambar
2. Faktor F dan G diidentifikasi sebagai faktor yang berpengaruh/aktif dalam eksperimen ini dengan
peluang posterior 0,979 dan 0,964 sedangkan Faktor D nilai peluang posteriornya kecil, yaitu 0,058.
Untuk menganalisis faktor F dan G, ditampilkan data asli yang disusun berdasarkan level dari faktor F
dan G. yang tampak pada Gambar 3.
.
Gambar 1 Plot peluang normal faktor-faktor eksperimen
5
Faktor
Peluang
Posterior
(Pj)
NONE
0.011
A
0.008
B
0.005
C
0.007
D
0.058
E
0.015
F
0.979
G
0.964
0
0.2
0.4
0.6
0.8
1
Gambar 2 Peluang Posterior Marjinal Faktor yang aktif (γ = 1,5)
Gambar 3 Data Hasil Eksperimen Asli untuk Faktor F dan G
Berdasarkan Level-levelnya
Berdasarkan Gambar 3 tersebut, data yang diperoleh merupakan hasil pengaruh gabungan dari faktor F
dan G. Dengan metode konvensional efek utama dari G kecil sehingga tidak muncul dalam plot
peluang normal. Sehingga pengaruh interaksi dari F dan G tidak dapat dijelaskan menggunakan
metode konvensional. Namun dengan pendekatan bayesian ini pengaruh interaksi tersebut dapat
dideteksi.
6
Penentuan Faktor yang Berpengaruh pada Rancangan Faktorial Fraksional
Pendekatan bayesian akan diterapkan pada rancangan faktorial fraksional 28-4 yaitu penelitian
mengenai injection molding dari Box, dkk (1978). Matriks rancangan dan responnya ditunjukkan pada
Tabel 3 berikut ini
Tabel 3. Hasil Eksperimen injection molding
Menggunakan Rancangan Faktorial Fraksional 28-4.
Keterangan :
Run
A
B
C
D
E
F
G
H
Y
1
-
-
-
+
+
+
-
+
14.0
2
+
-
-
-
-
+
+
+
16.8
3
-
+
-
-
+
-
+
+
15.0
4
+
+
-
+
-
-
-
+
15.4
5
-
-
+
+
-
-
+
+
27.6
6
+
-
+
-
+
-
-
+
24.0
7
-
+
+
-
-
+
-
+
27.4
8
+
+
+
+
+
+
+
+
22.6
9
+
+
+
-
-
-
+
-
22.3
10
-
+
+
+
+
-
-
-
17.1
11
+
-
+
+
-
+
-
-
21.5
12
-
-
+
-
+
+
+
-
17.5
13
+
+
-
-
+
+
-
-
15.9
14
-
+
-
+
-
+
+
-
21.9
15
+
-
-
+
+
-
+
-
16.7
16
-
-
-
-
-
-
-
-
20.3
Faktor A = Suhu cetakan
E = Tekanan Booster
B = Kelembaban
F = Siklus Waktu
C = Tekanan Tahanan
G = Ukuran Gate
D = Ketebalan
H = Kecepatan Sekrup
Y = besarnya penyusutan
Dengan menggunakan metode konvensional efek taksirannya nampak pada Tabel 4. Berdasarkan
Tabel 4 tersebut, menunjukkan bahwa kontras yang bersesuaian dengan efek C, E, dan
AE+BF+CH+DG nilainya lebih besar dari efek-efek yang lain. Faktor H mempunyai efek yang kecil.
Box, dkk (1978) menduga bahwa baik interaksi AE ataupun CH mempunyai kontras yang besar
7
berkaitan dengan struktur alias AE+BF+CH+DG karena melibatkan variabel-variabel dengan efek
utama yang besar. Faktor A, C, E, dan H berpotensi menjadi faktor aktif dalam eksperimen ini.
Tabel 4 Efek Taksiran Eksperimen Injection Molding
Alias String
Efek Taksiran
A
-0.35
B
-0.05
C
2.75
D
-0.15
E
-1.9
F
-0.05
G
0.3
H
0.6
AB+CG+DH+EF
-0.3
AC+BG+DF+EH
0.45
AD+BH+CF+EH
-0.2
AE+BF+CH+DG
2.3
AF+BE+CD+GH
-0.15
AG+BC+FH+DE
-0.1
AH+BD+CE+FG
-0.3
Hasil perhitungan peluang posterior {Pj} dengan pendekatan bayesian disajikan pada Gambar 4. Dari
Gambar tersebut, Faktor A, C, E dan H mempunyai peluang posterior 0,764, sedangkan faktor-faktor
yang lain mempunyai peluang posterior sama dengan nol, sehingga jelaslah faktor-faktor A, C, E, dan
H merupakan faktor yang aktif.
8
Faktor
Peluang
Posterior
(Pj)
NONE
0.000
A
0.764
B
0.000
C
0.764
D
0.000
E
0.764
F
0.000
G
0.000
H
0.764
0.0
0.2
0.4
0.6
0.8
1.0
Gambar 4. Peluang Posterior Marjinal Faktor yang Aktif (γ = 2,0)
4. Kesimpulan
Analisis dengan metode konvensional pada rancangan Plackett-Burman tidak dapat
menjelaskan fenomena pengeruh bersama antara dua faktor hal ini terbukti dengan interaksi tidak
nampak pada plot normal efek (atau metode yang lain berdasarkan kontras kolom ortogonal) dan
faktor yang penting dapat secara lengkap diabaikan. Analisis bayesian dapat memfasilitasi identifikasi
faktor-faktor aktif. Semua kemungkinan penjelasan dari data dipertimbangkan, termasuk interaksi, dan
yang dapat menjelaskan data dengan baik ditunjukkan dengan peluang posterior yang besar. Telah
ditunjukkan dalam makalah ini, bahwa model yang sangat masuk akal, yang tidak dapat ditemukan
menggunakan analisis konvensional, dapat diidentifikasi menggunakan metode bayesian.
Analisis pada rancangan faktorial fraksional dengan pendekatan bayesian juga menghasilkan
pendeteksian yang jelas tentang faktor-faktor yang berpengaruh/aktif dibandingkan metode
konvensional.
9
5. Daftar Pustaka
Box, G. E. P. dan Hunter, J. S. (1961), “The 2k-p Fractional Factorial Designs”, Technometrics 3, hal.
311-351, 449-458.
Box, G. E. P, Hunter, W.G., dan Hunter, J.S. (1978). Statistics for experimenter. John Wiley and Sons,
New York.
Box, G. E. P. dan Meyer, R. D. (1986), “An Analysis for Unreplicated Fractiional Factorials”,
Technometrics 28, hal. 11-16.
Daniel, C. (1959), “Use of Hal-Normal Plots in Interpreting Factorial Two-Level Experiments”,
Technometrics 1, hal. 311-341.
Hunter, G.., Hodi, F.S., dan Eager, T.W. (1982).”Highcycle Fatigue of Weld Repaired Cast Ti-6A14V”.Metallurgical Transactions 13A, pp. 1589-1594.
Lenth, R. V. (1989), “Quick and Easy Analysis of Unreplicated Factorials”, Technometrics 31, hal.
469-473.
Plackett, R.L. dan Burman, J .P. (1946), “ Design of Optimal Multifactorial Experiments”, Biometrika
23, hal. 305-325.
10
Download