regresi proses gaussian

advertisement
ABSTRACT
NILA FAULINA. Robust Regression M-Estimation, S-Estimation, and MMEstimation in Multiple Regression. Under direction of AUNUDDIN and ITASIA
DINA S.
In classical multiple regression, the ordinary least squares estimation is the
best method if assumptions are met to obtain regression weights when analyzing
data. However, if the data does not satisfy some of these assumptions, then sample
estimates and results can be misleading. Therefore, statistical techniques that are
able to cope with or to detect outlying observations have been developed. Robust
regression is an important method for analyzing data that are contaminated with
outliers. It can be used to detect outliers and to provide resistant results in the
presence of outliers. The purpose of this study is compare robust regression Mestimation, S-estimation, and MM-estimation with ordinary least square methods
via simulation study. The simulation study is used in determine which methods
best in all of the linear regression scenarios.
Keywords: Robust Regression, M-Estimation, S-Estimation, MM-Estimation,
Outlier.
RINGKASAN
NILA FAULINA. Regresi Kekar Penduga M, Penduga S, dan Penduga MM pada
Analisis Regresi Berganda. Dibawah bimbingan AUNUDDIN dan ITASIA
DINA S.
Metode kuadrat terkecil (MKT) atau ordinary least square (OLS)
merupakan salah satu metode yang sering digunakan untuk mendapatkan nilainilai penduga parameter dalam pemodelan regresi. Penggunaan MKT memerlukan
beberapa asumsi klasik yang harus dipenuhi oleh komponen sisaan atau galat (εi)
dalam model yang dihasilkan. Beberapa asumsi itu antara lain adalah bahwa
komponen sisaan memenuhi asumsi kenormalan, kehomogenan ragam, dan tidak
ada autokorelasi. Myers (1990) menyatakan bahwa apabila asumsi klasik itu
terpenuhi, maka penduga parameter yang diperoleh bersifat best linear unbiased
estimator (BLUE).
Dalam berbagai kasus ditemui berbagai hal yang menyebabkan tidak
terpenuhinya asumsi klasik tersebut. Saat asumsi ada yang tidak terpenuhi, maka
penggunaan MKT akan memberikan kesimpulan yang bersifat kurang baik atau
nilai penduga parameternya bersifat bias, interpretasi hasil yang diberikan juga
menjadi tidak valid.
Salah satu penyebab tidak terpenuhinya asumsi klasik adalah adanya
pencilan (outliers) pada data amatan. Pencilan ini dapat diketahui secara visual
atau secara eksak dengan melakukan diagnosis sisaan dari model regresi yang
terbentuk. Suatu data dinyatakan sebagai pencilan berdasarkan kriteria tertentu
dalam metode diagnosis sisaan yang digunakan.
Selanjutnya, diperlukan alternatif metode penduga parameter lain yang dapat
mengatasi adanya pencilan dalam data amatan. Metode itu adalah metode regresi
kekar (robust), beberapa penduga yang sering digunakan adalah penduga M,
penduga S, dan penduga MM. Diharapkan, melalui metode regresi kekar dapat
diperoleh penduga parameter yang lebih baik yang bersifat bias dan mempunyai
ragam minimum sehingga menghasilkan model yang lebih baik dari model hasil
MKT.
Penelitian ini menggunakan data simulasi yang dibangkitkan sebanyak 100
data dan diulang sebanyak 20 kali. Plot pencaran titik data antara peubah respon
dengan peubah penjelas mengungkapkan bahwa secara keseluruhan pola pencaran
titik tersebut bisa didekati oleh garis lurus (model regresi linier). Titik-titik yang
terlihat terlalu jauh dari kumpulan data disebut sebagai pencilan.
Hasil pendugaan parameter β0 pada kelompok data tanpa pencilan (0%
pencilan) dugaan yang diperoleh hampir sama untuk setiap metode. Namun dapat
dikatakan yang paling baik dari keempat metode adalah MKT karena lebih
mendekati nilai parameter. Pada kelompok data dengan pencilan 5% penduga
yang paling baik diantara keempat metode adalah metode penduga S. Sedangkan
hasil dugaan MKT sangat jauh dari yang diharapkan. Pada kelompok data dengan
pencilan 10% penduga yang paling baik diantara keempat metode adalah metode
penduga M. Pada kelompok data dengan pencilan 15% secara keseluruhan metode
regresi kekar memberikan hasil yang hampir sama dalam menduga koefisien
regresi. Dari hasil pendugaan dapat dilihat bahwa penduga MKT merupakan
penduga yang sangat peka terhadap pencilan. Nilai dugaan yang diperoleh dari
MKT menyimpang jauh dari nilai yang diharapkan.
Hasil pendugaan parameter β1 pada kelompok data tanpa pencilan (0%
pencilan) dugaan yang diperoleh hampir sama untuk setiap metode. Namun dapat
dikatakan yang paling baik dari keempat metode adalah metode penduga S karena
lebih mendekati nilai parameter. Pada kelompok data dengan pencilan 5%
penduga S dan penduga MM memberikan hasil yang hampir sama dan merupakan
penduga terbaik. Untuk hasil dugaan MKT masih jauh dari yang diharapkan. Pada
kelompok data dengan pencilan 10% metode regresi kekar memberikan hasil yang
hampir sama. Pada kelompok data dengan pencilan 15% juga memberikan hasil
yang tidak berbeda jauh, namun dapat dikatakan metode yang paling baik adalah
metode penduga S. Dari hasil pendugaan dapat dilihat bahwa penduga MKT
merupakan penduga yang sangat peka terhadap pencilan karena hasil yang
diberikan masih menyimpang dari nilai yang diharapkan.
Hasil pendugaan parameter β2 pada kelompok data tanpa pencilan (0%
pencilan) dugaan yang diperoleh hampir sama untuk setiap metode. Namun dapat
dikatakan yang paling baik dari keempat metode adalah metode penduga MM.
Pada kelompok data dengan pencilan 5% penduga yang paling baik diantara
keempat metode adalah metode penduga S. Sedangkan hasil dugaan MKT hampir
mendekati nilai yang diharapkan. Pada kelompok data dengan pencilan 10%
penduga yang paling baik diantara keempat metode adalah metode penduga S.
Pada kelompok data dengan pencilan 15% penduga M merupakan penduga yang
paling baik.
Dari penelitian ini disimpulkan bahwa metode regresi kekar penduga M,
penduga S, dan penduga MM lebih kekar terhadap pencilan dibandingkan MKT.
Dengan membandingkan dugaan koefisien regresi dan efisiensi dari penduga
diketahui bahwa penduga M lebih efisien dalam mengatasi pencilan dibandingkan
penduga S dan penduga MM. Sedangkan antara penduga S dan penduga MM,
penduga MM mempunyai efisiensi lebih baik daripada penduga S. Namun secara
keseluruhan semakin besar persentase pencilan efisiensi masing-masing penduga
semakin menurun.
Kata kunci : Regresi Kekar, Penduga M, Penduga S, Penduga MM, Pencilan
Download