Manajemen data pencilan pada analisis regresi

advertisement
1
PENDAHULUAN
TINJAUAN PUSTAKA
Latar Belakang
Multikolinearitas merupakan masalah
yang sering muncul dalam analisis regresi
linear berganda. Masalah tersebut terjadi
ketika adanya korelasi yang kuat antara
peubah penjelas. Hal ini dapat menyebabkan
matriks X’X memiliki kondisi buruk (ill
condition) atau hampir singular yang pada
akhirnya akan menyebabkan nilai penduga
ragam bagi parameter regresi menjadi lebih
besar (Draper & Smith 1992).
Salah satu metode yang digunakan untuk
mengatasi adanya multikolinearitas dalam
regresi linear berganda adalah Regresi
Komponen Utama (RKU). Metode ini
mengatasi multikolinearitas dengan cara
membentuk komponen-komponen utama yang
tidak
saling
berkorelasi.
Komponenkomponen utama ini dibentuk dari peubah
penjelasnya yang dihasilkan dari penguraian
matriks ragam-peragam. Untuk menduga
matriks ragam-peragam biasanya digunakan
metode kemungkinan maksimum (Maximum
Likelihood Estimation). Namun, metode
pendugaan ini sangat sensitif terhadap
pencilan. Oleh karena itu, digunakan metode
Determinan Peragam Minimum (Minimum
Covariance
Determinant/MCD),
yang
diperkenalkan oleh Rousseeuw pada tahun
1984, yang merupakan metode pendugaan
matriks ragam-peragam yang kekar terhadap
pencilan.
Komponen-komponen utama yang telah
terbentuk kemudian diregresikan terhadap
peubah respon. Metode Kuadrat Terkecil
(MKT) biasanya digunakan untuk pendugaan
parameter regresi. Saat menduga parameter
regresi terdapat juga kemungkinan adanya
pencilan ketika satu atau lebih komponen
utama diregresikan dengan peubah respon,
sehingga digunakan Metode Kuadrat Terkecil
Terpotong (MKTT) yang diharapkan dapat
menyusun model regresi yang kekar.
Penelitian ini akan menggunakan MCD
untuk menduga matriks ragam-peragam dalam
analisis regresi komponen utama. Sedangkan
parameter regresi akan diduga dengan
menggunakan MKT dan MKTT.
Analisis Regresi Linear Berganda
Analisis regresi linear berganda adalah
salah satu alat statistika untuk mengevaluasi
hubungan antara peubah respon dengan
beberapa peubah penjelas. Model regresi
linear berganda yang melibatkan p peubah
penjelas (x1,x2,…,xp) yang terkoreksi dengan
rataannya adalah
Tujuan
Tujuan dari penelitian ini adalah untuk
membandingkan kekekaran metode MCDMKT dan MCD-MKTT terhadap data yang
dikontaminasi dengan pencilan.
Dalam notasi matriks dapat disajikan
sebagai berikut:
dengan y adalah vektor peubah respon
berukuran nx1, X adalah matriks peubah
penjelas berukuran nxp, β adalah vektor
koefisien regresi berukuran px1 dan ε adalah
vektor
sisaan,
dengan
(Saefuddin et al 2009).
Salah satu metode yang digunakan untuk
menduga parameter regresi dalam regresi
linear berganda adalah MKT. Konsep dasar
dari MKT untuk menduga parameter regresi
adalah dengan jalan meminimumkan jumlah
kuadrat simpangan nilai pengamatan dengan
nilai dugaan (Aunuddin 2005).
Multikolinearitas
Salah satu asumsi dalam analisis regresi
berganda adalah tidak adanya korelasi yang
kuat antara peubah penjelasnya atau disebut
multikolinearitas. Hal ini dapat menyebabkan
MKT menghasilkan penduga yang tidak
efisien karena matriks yang dibangun untuk
menduga parameter yaitu X’X hampir
singular sehingga penduga ragam bagi
parameter regresi menjadi lebih besar dari
seharusnya (Myers 1989).
Analisis Kompnen Utama
Analisis Komponen Utama (AKU) adalah
metode analisis peubah ganda yang bertujuan
memperoleh peubah-peubah baru (komponen
utama) yang berasal dari peubah asalnya.
Komponen-komponen utama yang terbentuk
tidak
saling
berkorelasi
dan
dapat
diungkapkan dalam bentuk
dengan W adalah nilai atau skor
komponen utama, X adalah matriks data
terkoreksi oleh rataannya (centered), dan V
adalah matriks berukuran pxp yang kolom kei merupakan vektor ciri ke-i dari matriks
ragam-peragam
dan akar-akar cirinya
disusun dalam urutan
(Jollife 2002).
Download