PENDEKATAN BAYESIAN UNTUK MENDETEKSI FAKTOR-FAKTOR YANG BERPENGARUH PADA SCREENING EXPERIMENT Budhi Handoko Jurusan Statistika FMIPA Universitas Padjadjaran Jl. Bandung – Sumedang km. 21 Jatinangor Jawa Barat Email : [email protected] Abstrak Rancangan faktorial fraksional dan ortogonal array merupakan alat yang powerful untuk mengidentifikasi faktor-faktor yang aktif/berpengaruh. Namun seringkali metode analisis yang konvensional tidak bisa digunakan untuk mengidentifikasinya, disebabkan struktur alias yang kompleks. Dengan menggunakan pendekatan bayesian, faktor yang aktif/ berpengaruh dapat ditentukan dengan cara menghitung peluang posterior marjinalnya, yang bisa diterapkan baik untuk desain ortogonal maupun nonortogonal untuk data yang hilang atau akibat pengaturan faktor yang tidak sesuai. Kata Kunci : Analisis bayesian, desain ortogonal, struktur alias. 1 1. Pendahuluan Dalam suatu percobaan, respon dapat dipengaruhi oleh banyak faktor. Namun, bisa jadi hanya sedikit faktor yang mempengaruhi respon atau disebut sebagai faktor yang aktif/berpengaruh. Hal ini oleh Box dan Meyer (1986) sebagai factor sparsity. Screening experiment merupakan eksperimen yang bertujuan untuk menentukan faktor-faktor yang penting atau aktif dari sekumpulan faktor-faktor percobaan. Terdapat dua jenis desain yang sering digunakan dalam screening experiment, yaitu rancangan fraksional faktorial dan Plackett-Burman. Rancangan fraksional faktorial yang ditemukan oleh Box dan Hunter (1961) merupakan suatu rancangan yang jumlah percobaannya merupakan pangkat dari 2, yaitu 8, 16, 32, dst. Rancangan ini sering disebut sebagai rancangan geometrik dan memiliki struktur alias yang sederhana. Sedangkan rancangan Plackett-Burman yang ditemukan oleh Plackett dan Burman (1946) merupakan rancangan yang jumlah percobaannya bukan merupakan pangkat dari dua melainkan perkalian dari 4, yaitu 12, 20, 24, dst. Rancangan ini sering disebut sebagai rancangan nongeometrik dan memiliki struktur alias yang kompleks. Terdapat beberapa metode yang dapat digunakan untuk menganalisis faktor-faktor yang penting atau aktif dalam rancangan fraksional faktorial dan Plackett-Burman, yaitu Pertama, identifikasi faktor aktif dari efek utama yang mempunyai kontras yang besar yang dilakukan oleh Daniel (1976) dan Box, dkk (1978) menggunakan plot peluang normal, Box dan Meyer (1986) dengan plot bayes, dan Lenth (1989) menggunakan pseudo-standard error. Kedua, metode Jurans Word yaitu menganggap hanya sebagian kecil faktor yang berpengaruh dan faktor-faktor ini bisa saling berinteraksi. Ketiga, adalah metode bayesian yaitu metode yang mempertimbangkan semua hipotesis dari model-model faktor terhadap respon. Makalah ini membahas pendeteksian faktor yang berpengaruh menggunakan pendekatan bayesian. 2. Metode Analisis Pendekatan bayes yang digunakan adalah dengan mempertimbangkan semua model dari faktor dan respon dan memilih yang paling cocok dengan data. Metode bayes akan mengidentifikasi setiap model dan menghitung nilai peluang posteriornya. Pendekatan ini mirip dengan metode pemilihan model regresi terbaik menggunakan regresi all-subset. Misalkan terdapat sekumpulan model yaitu M0, M1, ...,Mm. Setiap model Mi mempunyai sebuah vektor parameter i, sehingga distribusi sampling dari data y, dengan diberikan model Mi, dijelaskan melalui desitas peluang f(y|Mi,i). Peluang prior dari model Mi adalah p(Mi) dan densitas peluang prior dari i adalah f(i|Mi). Densitas prediktif dari y, jika diberikan model Mi, ditulis f(y|Mi) dan diberikan melalui persamaan berikut: f ( y | M i ) f ( y | M i , θ i ) f (θ i | M i )dθ i R dimana Ri adalah sekumpulan nilai yang mungkin dari i. Peluang posterior dari model Mi, jika diberikan data y adalah sebagai berikut : 2 p(M i | y) p(M i ) f ( y | M i ) m p(M h0 h )f (y | Mh) Peluang posterior p(Mi|y) digunakan untuk melakukan identifikasi model. Model yang sesuai diidentifikasikan dengan nilai peluang posterior yang besar. Dalam screening experiment dengan k buah faktor, misalkan Mi menyatakan model bahwa subset dari faktor-faktor fi adalah aktif, dimana 0 fi k. Terdapat 2k buah model Mi, dimulai dari i = 0 (tidak ada faktor aktif) sampai i = 2k-1 (terdapat k faktor yang aktif). Nilai menyatakan peluang prior bahwa sebuah faktor aktif. Untuk screening experiment, dimana kurang dari setengah faktor yang penting, nilai yang sesuai akan berada pada rentang dari 0 – 0,5. Sehingga peluang prior p(Mi) untuk model Mi adalah π i (1 π) f k fi . Untuk keperluan perhitungan nilai ditetapkan 0,25 dan nilai dipilih yang meminimumkan peluang tidak ada faktor yang berpengaruh/aktif. Jika Xi merupakan matriks dengan kolom untuk setiap efek pada model Mi dikodekan -1 dan +1 untuk faktor dengan dua level, juga memuat sebuah kolom bernilai 1 untuk rata-ratanya dan kolom untuk interaksi yang diinginkan. Misalkan juga terdapat ti yang merupakan jumlah efek tanpa rata-rata. Dimensi untuk Xi menjadi n x (1+ti). βi adalah vektor dari efek untuk model Mi yang berukuran (1+ti) x 1. y adalah vektor respon berukuran n x 1. Fungsi distribusi peluang dari y jika diberikan model Mi adalah sebagai berikut f ( y | M i i ) f ( y | M i , , i ) n exp[ ( y X i i )' (Y x i i ) / 2 2 ] Elemen dari βi berdistribusi prior normal dengan rata-rata nol dan varians γ2σ2. Parameter γ merupakan nilai dari efek relatif terhadap noise eksperimen. β0 dan log (σ) berdistribusi prior non informatif dimana f(β0, σ) 1/ σ. Setelah diperoleh data vektor y , peluang posterior dari model Mi adalah 1/ 2 fi X 0' X 0 ti p( M i | y ) C 1 i X i' X i 1/ 2 S ( ˆ i ) ˆ i i ˆ i S ( ˆ 0 ) ( n 1) / 2 dengan i 1 2 0 0 0 I i ˆ i (i X i' X i ) 1 X i' y S ( ˆ i ) ( y X i ˆ i )' ( y X i ˆ i ) Nilai peluang posterior p(Mi|y) digunakan untuk menghitung peluang posterior marjinal Pj bahwa sebuah faktor aktif, dengan melakukan penjumlahan sebagai berikut 3 Pj p( M i | y) M i | faktor j aktif Peluang Pj dihitung berdasarkan 2k model Mi yang mungkin. Nilai yang besar dari Pj menunjukkan faktor j yang aktif. Perhitungan posterior dilakukan dengan menggunakan paket program MATLAB 6.5 dengan inputan berupa matriks rancangan dan respon y. 3. Aplikasi Metode Bayes Untuk Menganalisis Faktor yang Berpengaruh Penentuan Faktor yang Berpengaruh pada Rancangan Plackett-Burman Penelitian mengenai daya tahan baja dilakukan oleh Hunter, Hodi, dan Eager (1982) menggunakan rancangan Plackett-Burman dengan banyaknya percobaan (run) sebanyak 12. Penelitian ini menggunakan tujuh buah faktor dan respon yang diukur adalah daya tahan baja tersebut. Matriks rancangan ditunjukkan pada Tabel 1 berikut ini. Tabel 1. Hasil Eksperimen Pengukuran Daya Tahan Baja Menggunakan Rancangan Plackett-Burman n = 12. Run A B C D E F G Y 1 + + - + + + - 6.058 2 + - + + + - - 4.733 3 - + + + - - - 4.625 4 + + + - - - + 5.899 5 + + - - - + - 7.000 6 + - - - + - + 5.752 7 - - - + - + + 5.682 8 - - + - + + - 6.607 9 - + - + + - + 5.818 10 + - + + - + + 5.917 11 - - + - + + + 9.863 12 - - - - - - - 4.809 Keterangan : Faktor A = Struktur awal D = Pemanasan B = Ukuran E = Tingkat Pendinginan C = Tekanan F = Polish G = Perlakuan akhir Y = adalah logaritma natural dari daya tahan baja Hasil efek taksiran menggunakan metode analitik konvensional tampak pada Tabel 2 dan diagram plot normal ditunjukkan pada Gambar 2 berikut ini: 4 Tabel 2 Efek Taksiran Eksperimen Daya Tahan Baja Kolom Efek Taksiran A 0.326 B 0.294 C -0.246 D -0.516 E 0.15 F 0.915 G 0.183 8 0.446 9 0.453 10 0.081 11 -0.242 Berdasarkan Tabel 2 tersebut tampak bahwa faktor yang mempunyai efek taksiran yang lebih besar dari yang lain adalah faktor Ddan F. Faktor D mempunyai efek negatif, sedangkan faktor F mempunyai efek positif. Demikian juga plot peluang normal pada Gambar 1 juga memperlihatkan hasil yang sama. Namun hasil yang agak berbeda ditunjukkan oleh pendekatan bayesian yang ditunjukkan pada Gambar 2. Faktor F dan G diidentifikasi sebagai faktor yang berpengaruh/aktif dalam eksperimen ini dengan peluang posterior 0,979 dan 0,964 sedangkan Faktor D nilai peluang posteriornya kecil, yaitu 0,058. Untuk menganalisis faktor F dan G, ditampilkan data asli yang disusun berdasarkan level dari faktor F dan G. yang tampak pada Gambar 3. . Gambar 1 Plot peluang normal faktor-faktor eksperimen 5 Faktor Peluang Posterior (Pj) NONE 0.011 A 0.008 B 0.005 C 0.007 D 0.058 E 0.015 F 0.979 G 0.964 0 0.2 0.4 0.6 0.8 1 Gambar 2 Peluang Posterior Marjinal Faktor yang aktif (γ = 1,5) Gambar 3 Data Hasil Eksperimen Asli untuk Faktor F dan G Berdasarkan Level-levelnya Berdasarkan Gambar 3 tersebut, data yang diperoleh merupakan hasil pengaruh gabungan dari faktor F dan G. Dengan metode konvensional efek utama dari G kecil sehingga tidak muncul dalam plot peluang normal. Sehingga pengaruh interaksi dari F dan G tidak dapat dijelaskan menggunakan metode konvensional. Namun dengan pendekatan bayesian ini pengaruh interaksi tersebut dapat dideteksi. 6 Penentuan Faktor yang Berpengaruh pada Rancangan Faktorial Fraksional Pendekatan bayesian akan diterapkan pada rancangan faktorial fraksional 28-4 yaitu penelitian mengenai injection molding dari Box, dkk (1978). Matriks rancangan dan responnya ditunjukkan pada Tabel 3 berikut ini Tabel 3. Hasil Eksperimen injection molding Menggunakan Rancangan Faktorial Fraksional 28-4. Keterangan : Run A B C D E F G H Y 1 - - - + + + - + 14.0 2 + - - - - + + + 16.8 3 - + - - + - + + 15.0 4 + + - + - - - + 15.4 5 - - + + - - + + 27.6 6 + - + - + - - + 24.0 7 - + + - - + - + 27.4 8 + + + + + + + + 22.6 9 + + + - - - + - 22.3 10 - + + + + - - - 17.1 11 + - + + - + - - 21.5 12 - - + - + + + - 17.5 13 + + - - + + - - 15.9 14 - + - + - + + - 21.9 15 + - - + + - + - 16.7 16 - - - - - - - - 20.3 Faktor A = Suhu cetakan E = Tekanan Booster B = Kelembaban F = Siklus Waktu C = Tekanan Tahanan G = Ukuran Gate D = Ketebalan H = Kecepatan Sekrup Y = besarnya penyusutan Dengan menggunakan metode konvensional efek taksirannya nampak pada Tabel 4. Berdasarkan Tabel 4 tersebut, menunjukkan bahwa kontras yang bersesuaian dengan efek C, E, dan AE+BF+CH+DG nilainya lebih besar dari efek-efek yang lain. Faktor H mempunyai efek yang kecil. Box, dkk (1978) menduga bahwa baik interaksi AE ataupun CH mempunyai kontras yang besar 7 berkaitan dengan struktur alias AE+BF+CH+DG karena melibatkan variabel-variabel dengan efek utama yang besar. Faktor A, C, E, dan H berpotensi menjadi faktor aktif dalam eksperimen ini. Tabel 4 Efek Taksiran Eksperimen Injection Molding Alias String Efek Taksiran A -0.35 B -0.05 C 2.75 D -0.15 E -1.9 F -0.05 G 0.3 H 0.6 AB+CG+DH+EF -0.3 AC+BG+DF+EH 0.45 AD+BH+CF+EH -0.2 AE+BF+CH+DG 2.3 AF+BE+CD+GH -0.15 AG+BC+FH+DE -0.1 AH+BD+CE+FG -0.3 Hasil perhitungan peluang posterior {Pj} dengan pendekatan bayesian disajikan pada Gambar 4. Dari Gambar tersebut, Faktor A, C, E dan H mempunyai peluang posterior 0,764, sedangkan faktor-faktor yang lain mempunyai peluang posterior sama dengan nol, sehingga jelaslah faktor-faktor A, C, E, dan H merupakan faktor yang aktif. 8 Faktor Peluang Posterior (Pj) NONE 0.000 A 0.764 B 0.000 C 0.764 D 0.000 E 0.764 F 0.000 G 0.000 H 0.764 0.0 0.2 0.4 0.6 0.8 1.0 Gambar 4. Peluang Posterior Marjinal Faktor yang Aktif (γ = 2,0) 4. Kesimpulan Analisis dengan metode konvensional pada rancangan Plackett-Burman tidak dapat menjelaskan fenomena pengeruh bersama antara dua faktor hal ini terbukti dengan interaksi tidak nampak pada plot normal efek (atau metode yang lain berdasarkan kontras kolom ortogonal) dan faktor yang penting dapat secara lengkap diabaikan. Analisis bayesian dapat memfasilitasi identifikasi faktor-faktor aktif. Semua kemungkinan penjelasan dari data dipertimbangkan, termasuk interaksi, dan yang dapat menjelaskan data dengan baik ditunjukkan dengan peluang posterior yang besar. Telah ditunjukkan dalam makalah ini, bahwa model yang sangat masuk akal, yang tidak dapat ditemukan menggunakan analisis konvensional, dapat diidentifikasi menggunakan metode bayesian. Analisis pada rancangan faktorial fraksional dengan pendekatan bayesian juga menghasilkan pendeteksian yang jelas tentang faktor-faktor yang berpengaruh/aktif dibandingkan metode konvensional. 9 5. Daftar Pustaka Box, G. E. P. dan Hunter, J. S. (1961), “The 2k-p Fractional Factorial Designs”, Technometrics 3, hal. 311-351, 449-458. Box, G. E. P, Hunter, W.G., dan Hunter, J.S. (1978). Statistics for experimenter. John Wiley and Sons, New York. Box, G. E. P. dan Meyer, R. D. (1986), “An Analysis for Unreplicated Fractiional Factorials”, Technometrics 28, hal. 11-16. Daniel, C. (1959), “Use of Hal-Normal Plots in Interpreting Factorial Two-Level Experiments”, Technometrics 1, hal. 311-341. Hunter, G.., Hodi, F.S., dan Eager, T.W. (1982).”Highcycle Fatigue of Weld Repaired Cast Ti-6A14V”.Metallurgical Transactions 13A, pp. 1589-1594. Lenth, R. V. (1989), “Quick and Easy Analysis of Unreplicated Factorials”, Technometrics 31, hal. 469-473. Plackett, R.L. dan Burman, J .P. (1946), “ Design of Optimal Multifactorial Experiments”, Biometrika 23, hal. 305-325. 10