Ukuran Kesesuaian dalam Analisis Biplot Biasa

advertisement
10
PENDAHULUAN
Latar Belakang
Biplot merupakan metode eksplorasi
analisis data peubah ganda yang dapat
memberikan gambaran secara grafik tentang
kedekatan antar objek, keragaman peubah,
korelasi antar peubah, dan keterkaitan antara
peubah dengan objek. Selain itu, analisis
biplot digunakan untuk menggambarkan
hubungan antara peubah dan objek yang
berada pada ruang berdimensi tinggi ke dalam
ruang berdimensi rendah (dua atau tiga). Dari
biplot diperoleh tiga matriks pendekatan yang
terkait dengan data, peubah, dan objek.
Ukuran kesesuaian dari ketiga matriks
tersebut dikemukakan oleh Gabriel pada tahun
2002.
Hasil representasi yang diberikan oleh
analisis biplot itu pada umumnya tidak dapat
menghasilkan visualisasi tentang keragaman
dengan baik maka diperlukan analisis biplot
dengan modus vektor diperpanjang. Biplot
imbuhan (augmented biplot) merupakan
modifikasi dari biplot biasa yang memberikan
gambaran ragam seperti yang diperoleh dari
data (Bartkowiak dan Szustalewicz 1995).
Analisis procrustes adalah salah satu
metode yang menyatakan perbedaan dua atau
lebih konfigurasi n-titik sebagai nilai numerik.
Nilai numerik yang dihasilkan metode ini
dapat digunakan untuk ukuran kesesuaian
(goodness of fit) antar konfigurasi. Dalam
analisis procrustes dikenal tiga transformasi
geometris untuk menghitung nilai perbedaan
minimum dari dua konfigurasi. Ketiga
transformasi geometris tersebut yaitu translasi,
rotasi dan dilasi. Dari ketiga transformasi ini
dapat digunakan untuk menentukan ukuran
kesesuaian yang optimal.
Salah satu kegunaan dalam analisis biplot
biasa maupun imbuhan adalah untuk
pemetaan.
Gambaran
posisi
prestasi
mahasiswa
Beasiswa
Utusan
Daerah
Departemen Agama Institut Pertanian Bogor
(BUD DEPAG IPB) dapat digunakan untuk
memperoleh pemetaan provinsi. Pemetaan ini
diharapkan dapat memberikan masukan dalam
memperoleh gambaran keunggulan dan
kekurangan dari setiap provinsi sehingga
dapat mengevaluasi kinerja pondok pesantren
masing-masing provinsi serta perencanaan
dan target peningkatan mutu pendidikan
Madrasah Aliyah.
Institut Pertanian Bogor (IPB) sebagai
salah satu perguruan tinggi negeri, bekerja
sama dengan Departemen Agama (DEPAG)
untuk mendidik mahasiswa yang berasal dari
pondok
pesantren
berbagai
provinsi.
Mahasiswa BUD DEPAG IPB hampir
mewakili beberapa provinsi di Indonesia,
diharapkan mampu memberikan gambaran
prestasi dan pemetaan mutu pendidikan setiap
provinsinya. Indikator prestasi mahasiswa
biasanya dikaitkan dengan pencapaian prestasi
akademik berupa nilai mutu tiap mata kuliah
yang diambil dan Indeks Prestasi Kumulatif
(IPK) nya.
Permasalahan
yang
muncul
ialah
bagaimana ukuran kesesuaian yang diperoleh
dari analisis biplot biasa dan analisis biplot
imbuhan dengan nilai minimum dari ketiga
transformasi di atas dan penerapannya untuk
pemetaan provinsi berdasarkan prestasi
mahasiswa BUD DEPAG IPB.
Tujuan
Tujuan dari penulisan karya ilmiah ini
ialah:
1. Memperoleh gambaran umum tentang
representasi ukuran kesesuaian analisis
biplot imbuhan.
2. Penerapan kasus analisis biplot biasa dan
imbuhan dalam pemetaan provinsi
berdasarkan prestasi mahasiswa BUD
DEPAG IPB (dalam studi kasus
mahasiswa BUD DEPAG TPB IPB tahun
akademik 2009/2010).
LANDASAN ANALISIS
Analisis Biplot
Analisis
biplot
pertama
kali
diperkenalkan oleh Gabriel pada tahun 1971.
Elaborasi
analisis
biplot
secara
komprehensif diberikan oleh Greenacre pada
tahun 2010. Biplot berupa suatu peragaan
grafik dari matriks data Y dalam plot dengan
menumpangtindihkan vektor-vektor dalam
ruang berdimensi rendah, biasanya dua (atau
tiga) yang mewakili vektor-vektor baris
matriks Y (gambaran objek) dengan vektorvektor kolom matriks Y (gambaran peubah).
11
Informasi yang dapat diperoleh dari biplot
antara lain ialah:
1. Kedekatan antar objek.
Dua objek dengan karakteristik yang sama
akan digambarkan sebagai dua titik yang
posisinya berdekatan.
2. Keragaman peubah.
Peubah
dengan
keragaman
kecil
digambarkan sebagai vektor yang pendek,
sedangkan peubah dengan keragaman
besar digambarkan sebagai vektor yang
panjang.
3. Korelasi antar peubah.
Peubah digambarkan sebagai vektor. Jika
sudut dua peubah lancip
90° maka
korelasinya bernilai positif. Apabila sudut
dua peubah tumpul
90°
maka
korelasinya bernilai negatif. Sedangkan
jika sudut dua peubah siku-siku maka
tidak saling berkorelasi.
4. Keterkaitan peubah dengan objek.
Karakteristik suatu objek bisa disimpulkan
dari posisi relatifnya dengan peubah. Jika
posisi objek searah dengan arah vektor
peubah maka objek tersebut nilainya di
atas rata-rata, jika berlawanan maka
nilainya di bawah rata-rata, dan jika
hampir di tengah-tengah maka nilainya
mendekati rata-rata.
Analisis biplot dikembangkan atas dasar
Dekomposisi Nilai Singular (DNS) atau
Singular Value Decomposition (SVD).
adalah matriks data dengan n
Misalkan n
objek dan p peubah. Selanjutnya
dikoreksi
terhadap nilai rata-ratanya sehingga diperoleh
matriks Y,
1
n
T
(1)
dengan 1 adalah vektor
1 yang semua
unsurnya bernilai 1. Matriks koragam
dari
matriks ialah
1
n
1
T
(2)
r
sedangkan matriks korelasi
matriks ialah
⁄
dengan
⁄
diag
⁄
√
dari
(3)
,
√
,..,
adalah matriks diagonal.
T
, ,…,
Misalkan matriks n
maka didefinisikan jarak Euclid antara objek
ke-i
dan
ke-j
sebagai
,
T
dan jarak Mahalanobis
antara
objek
ke-i
dan
ke-j
T
,
sebagai
.
Matriks
berpangkat r dengan
min ,
dapat dinyatakan sebagai SVD
berikut:
n
T
n
(4)
(Aitchison & Greenacre 2002) dengan U dan
W merupakan matriks ortonormal kolom,
T
T
. Matriks W
sehingga
adalah matriks yang kolom-kolomnya terdiri
yang berpadanan dengan
dari vektor eigen
T
dari matriks
.
nilai eigen positif
Matriks U adalah matriks yang kolomkolomnya merupakan vektor eigen-vektor
eigen yang berpadanan dengan nilai eigenT
dengan
nilai eigen positif dari matriks
hubungan
r
p
diag
λ , λ ,..., λ
,
,…,
(6)
,
n
(5)
,...,
(7)
dengan λ
λ
λ
0 dan λ
disebut nilai singular dari matriks . Dalam
Jolliffe (2002) persamaan (4) dapat diuraikan
menjadi
T
(8)
,
Misalkan
, ,…,
persamaan (8) menjadi
T
,…,
maka
T
dan
T
(9)
dengan demikian setiap elemen ke- (i, j) unsur
matriks Y dapat dinyatakan sebagai berikut:
T
. Vektor
merepresentasikan
y
objek ke-i matriks Y, dan vektor
merepresentasikan peubah ke-j matriks Y.
Jika Y berpangkat dua, maka vektor baris
dan vektor kolom
dapat digambarkan
dalam ruang dimensi dua. Sedangkan matriks
Y yang berpangkat lebih dari dua dapat
didekati dengan matriks berpangkat dua,
sehingga persamaan dapat ditulis menjadi
2y
T
dengan
masing-masing
dan
mengandung dua unsur pertama vektor dan
. Dengan pendekatan tersebut matriks Y
dapat disajikan dalam ruang dimensi dua.
Nilai yang digunakan dapat merupakan
nilai sebarang
0, 1 , tetapi pengambilan
12
nilai-nilai ekstrim yaitu
0 dan
1 berimplikasi pada interpretasi biplot.
a. Jika
0, maka
dan
akibatnya
T
T T
maka
T
T
T
T
T
T
(10)
diperoleh :
T
1 , dengan
adalah
•
koragam peubah ke-i dan ke-j.
•
1 , dengan
√
menggambarkan keragaman peubah
ke-i.
• Korelasi antara peubah ke-i dan ke-j
dijelaskan oleh cosinus sudut antara h
dan h (misal: ), yaitu
T
cos
• Jika Y berpangkat p maka
1
T
artinya kuadrat
jarak Mahalanobis antara
dan
sebanding dengan kuadrat jarak
Euclid antara
dan , serta adalah
matriks koragam dari Y.
b. Jika
1, maka
dan
,
akibatnya :
T
T
T T
T
T
T
Artinya,
T
atau kuadrat jarak
Euclid antara dan akan sama dengan
kuadrat jarak Euclid antara dan .
Ukuran Kesesuaian Analisis Biplot
Menurut Gabriel (2002), biplot tidak
hanya sebagai pendekatan matriks data Y
T
, tetapi
dengan menggunakan matriks
T
sebagai pendekatan
juga hasil perkalian
dari matriks T yang berkaitan dengan
ragam koragam dan korelasi antar peubah dan
T
T
sebagai pendekatan bagi
matriks
yang berkaitan dengan ukuran ketakmiripan
T
T
dan
antar objek. Secara umum
sebagai pendekatannya. Jika
T
GF
,
min
1
11
Persamaan di atas dapat ditulis menjadi:
GF
,
tr
T
T
tr
tr
T
Y dan H adalah suatu matriks, di mana H
merupakan pendekatan Y. Ukuran kesesuaian
analisis biplot sebagai ukuran kedekatan dari
tiga bentuk matriks, yaitu:
1. Kesesuaian data:
T
tr
T
,
tr
T
T
tr
T
tr
T
T
2. Kesesuaian peubah:
GF
T
,
T
tr
T
T
T
tr
T
T
T
T
3. Kesesuaian objek:
GF
T
,
T
T
tr
tr
T
T
tr
T
dengan tr
dinamakan teras dari matriks
segi M atau jumlah elemen diagonal dari
matriks segi M sehingga dituliskan tr
∑
.
T
T
T
λ
di mana
.
Rumus umum yang dikemukakan oleh
Gabriel untuk ukuran kesesuaian analisis
biplot ini adalah sebagai berikut:
GF
T
T
T
,
λ
T
Analisis Biplot Imbuhan
Masalah yang timbul adalah pengaruh
pendekatan dalam ruang bagian berdimensi
rendah dalam mencerminkan hubungan yang
benar antara objek dan peubah dalam ruang
data lengkap. Ini menyebabkan bahwa
representasi yang diberikan oleh biplot
kadang-kadang baik, buruk, atau cukup. Hasil
representasi yang diberikan oleh analisis
biplot imbuhan (augmented biplot) itu dapat
menghasilkan visualisasi lebih baik mengenai
keragaman. Biplot imbuhan merupakan
modifikasi dari biplot biasa yang memberikan
gambaran ragam seperti yang diperoleh dari
data (Bartkowiak dan Szustalewicz 1995).
T
Berdasarkan persamaan (9)
akan dilakukan pendekatan dengan matriks
T
.
berdimensi lebih rendah yaitu
Dengan demikian matriks yang berpengaruh
13
dalam biplot imbuhan yaitu matriks yang
merepresentasikan suatu peubah.
Algoritme untuk membangun biplot
imbuhan dari biplot biasa:
1. Matriks B merepresentasikan peubah yang
merupakan pendekatan untuk analisis
biplot biasa.
merepresentasikan peubah
2. Matriks
yang merupakan pendekatan untuk analisis
biplot imbuhan.
menyatakan panjang vektor
3. Misalkan
dari pendekatan analisis biplot biasa.
menyatakan panjang
4. Misalkan
dari pendekatan analisis biplot
vektor
imbuhan.
5. Hubungan antara matriks B dengan
adalah
, dengan
matriks
merupakan matriks diagonal berupa
konstanta yang menyatakan besarnya
peregangan atau pemampatan dari vektor
biplot biasa.
dan
adalah
6. Hubungan antara
| |
.
(Bartkowiak dan Szustalewicz 1995).
Analisis Procrustes
Misalkan X dan Y merupakan matriks
yang berukuran
dan
yang
masing-masing
adalah
representasi
konfigurasi
yang
akan
dibandingkan.
Koordinat titik ke-i pada ruang Euclid yang
diberikan oleh nilai-nilai baris ke-i pada
matriks. Konfigurasi pertama berada pada
ruang berdimensi p dan koordinat titik ke-i
, ,…,
. Sedangkan konfigurasi
yaitu
kedua berada pada ruang berdimensi q dan
, ,…,
.
koordinat titik ke-i yaitu
Jika
maka konfigurasi kedua berada
dalam subruang dari ruang berdimensi p.
Berdasarkan analisis procrustes, perbedaan
ruang dimensi ini dapat diselesaikan dengan
memasangkan
kolom nol di kanan Y
sehingga menjadi matriks berukuran
.
Dengan demikian, dapat digunakan secara
umum
.
Untuk menentukan ukuran kesesuaian
dalam dua konfigurasi, analisis procrustes
menggunakan jumlah kuadrat jarak antara titik
yang bersesuaian yaitu
,
∑
tr
∑
T
(12)
(Bakhtiar dan Siswadi 2011).
Translasi
Translasi dapat diartikan sebagai proses
pemindahan seluruh titik dengan jarak yang
tetap dan arah yang sama. Dari persamaan
(12) diperoleh
,
2
∑
(13)
Penguraian dari persamaan (13) menghasilkan
,
,
(14)
dengan
,
,…,
,
,…,
∑
1
1
y
untuk j=1, 2, ... , p
dan
merupakan konfigurasi X dan
dan
masingY setelah ditranslasi.
masing adalah sentroid kolom dari X dan Y.
merupakan jarak dari kedua
Sedangkan
sentroid kolom X dan Y. Untuk menghasilkan
0.
E yang minimum, maka
Dengan demikian, nilai perbedaan
minimum antara dua konfigurasi X dan Y
setelah ditranslasi adalah
,
,
∑
∑
(15)
Rotasi
Rotasi dapat didefinisikan sebagai suatu
proses pemindahan seluruh titik dengan sudut
yang tetap tanpa mengubah jarak setiap titik
terhadap sentroidnya. Dalam transformasi ini
dilakukan penggandaan konfigurasi dengan
suatu matriks ortogonal.
Rotasi Y terhadap X dilakukan dengan
mengalikan matriks Y dengan matriks
14
ortogonal Q yaitu
,
,
T
.
dengan T
Dengan demikian, perbedaan minimum
konfigurasi X dengan Y setelah penyesuaian
dengan rotasi ialah
,
,
inf
tr
tr
2tr
tr
T T
tr
T T
tr
tr
tr
tr
tr
T
T
T
T T
∑
T
T
∑
Karena Q merupakan matriks ortogonal
T
juga merupakan matriks
maka
T
ortogonal. Dimisalkan
maka berlaku 1
1, sehingga
tr
T T
tr ∑
∑
tr ∑
Jadi, tr ∑
akan maksimum jika
T
∑ ∑. Kondisi ini dapat
∑
T
(Bakhtiar 1995).
dipenuhi jika
Dilasi
Dilasi
dapat
didefinisikan
sebagai
pembesaran atau pengecilan jarak setiap titik
dalam konfigurasi terhadap sentroidnya.
T
tr
tr
(17)
T
(18)
T
tr
T
T T
Nilai E akan minimum jika tr
maksimum. Jadi, dipilih matriks ortogonal Q
T T
.
yang memaksimumkan tr
Teorema
Jika X dan Y merupakan elemen dalam
dan Q elemen dalam
merupakan
T T
akan
matriks ortogonal maka tr
T
dengan
maksimum bila dipilih
∑ T merupakan hasil Dekomposisi Nilai
Singular Bentuk Lengkap (DNSBL) dari
matriks T .
Bukti:
Andaikan ∑ T merupakan hasil DNSBL
sehingga p T
dari matriks p T
T ∑
∑
.
adalah matriks diagonal
p
dengan
dan U, V merupakan matriks
ortogonal, sehingga
,
inf
Secara aljabar, perbedaan minimum
setelah dilakukan penyesuaian dengan dilasi
ialah
,
T
T
,
(16)
Secara aljabar, nilai perbedaan minimum
setelah dilakukan penyesuaian dengan rotasi
ialah
,
Dilasi Y terhadap X dilakukan dengan
mengalikan konfigurasi Y dengan suatu skalar
c. Konfigurasi setelah dilasi menjadi cY.
Dengan demikian perbedaan minimum antara
dua konfigurasi setelah dilasi ialah
T
2 tr
T
(19)
Persamaan (19) merupakan fungsi kuadrat
dengan variabel c. Syarat untuk memperoleh
nilai E yang minimum ialah turunan pertama
sama dengan nol dan turunan kedua lebih
besar nol. Dengan terlebih dahulu menentukan
titik kritis dari turunan pertama sehingga
diperoleh c sebagai titik tetap.
2 tr
T
T
2 tr
T
2 tr
0
T
2 tr
tr
tr
T
T
(20)
Untuk membuktikan nilai E minimum
ialah turunan kedua dari persamaan (19) harus
lebih dari nol.
2 tr
T
0
Dari bukti di atas dapat disimpulkan
bahwa nilai E minimum dengan nilai c pada
persamaan (20). Setelah itu, substitusi nilai c
ke dalam persamaan (19) sehingga diperoleh
nilai E yang minimum sebagai berikut
,
T
tr
tr
tr
tr
2
T
2 tr
T
T
T
tr
T
T
tr
tr
T
tr
T
tr
tr
tr
T
T
tr
T
2
T
tr
tr
tr
T
tr
tr
T
T
T
T
Download