10 PENDAHULUAN Latar Belakang Biplot merupakan metode eksplorasi analisis data peubah ganda yang dapat memberikan gambaran secara grafik tentang kedekatan antar objek, keragaman peubah, korelasi antar peubah, dan keterkaitan antara peubah dengan objek. Selain itu, analisis biplot digunakan untuk menggambarkan hubungan antara peubah dan objek yang berada pada ruang berdimensi tinggi ke dalam ruang berdimensi rendah (dua atau tiga). Dari biplot diperoleh tiga matriks pendekatan yang terkait dengan data, peubah, dan objek. Ukuran kesesuaian dari ketiga matriks tersebut dikemukakan oleh Gabriel pada tahun 2002. Hasil representasi yang diberikan oleh analisis biplot itu pada umumnya tidak dapat menghasilkan visualisasi tentang keragaman dengan baik maka diperlukan analisis biplot dengan modus vektor diperpanjang. Biplot imbuhan (augmented biplot) merupakan modifikasi dari biplot biasa yang memberikan gambaran ragam seperti yang diperoleh dari data (Bartkowiak dan Szustalewicz 1995). Analisis procrustes adalah salah satu metode yang menyatakan perbedaan dua atau lebih konfigurasi n-titik sebagai nilai numerik. Nilai numerik yang dihasilkan metode ini dapat digunakan untuk ukuran kesesuaian (goodness of fit) antar konfigurasi. Dalam analisis procrustes dikenal tiga transformasi geometris untuk menghitung nilai perbedaan minimum dari dua konfigurasi. Ketiga transformasi geometris tersebut yaitu translasi, rotasi dan dilasi. Dari ketiga transformasi ini dapat digunakan untuk menentukan ukuran kesesuaian yang optimal. Salah satu kegunaan dalam analisis biplot biasa maupun imbuhan adalah untuk pemetaan. Gambaran posisi prestasi mahasiswa Beasiswa Utusan Daerah Departemen Agama Institut Pertanian Bogor (BUD DEPAG IPB) dapat digunakan untuk memperoleh pemetaan provinsi. Pemetaan ini diharapkan dapat memberikan masukan dalam memperoleh gambaran keunggulan dan kekurangan dari setiap provinsi sehingga dapat mengevaluasi kinerja pondok pesantren masing-masing provinsi serta perencanaan dan target peningkatan mutu pendidikan Madrasah Aliyah. Institut Pertanian Bogor (IPB) sebagai salah satu perguruan tinggi negeri, bekerja sama dengan Departemen Agama (DEPAG) untuk mendidik mahasiswa yang berasal dari pondok pesantren berbagai provinsi. Mahasiswa BUD DEPAG IPB hampir mewakili beberapa provinsi di Indonesia, diharapkan mampu memberikan gambaran prestasi dan pemetaan mutu pendidikan setiap provinsinya. Indikator prestasi mahasiswa biasanya dikaitkan dengan pencapaian prestasi akademik berupa nilai mutu tiap mata kuliah yang diambil dan Indeks Prestasi Kumulatif (IPK) nya. Permasalahan yang muncul ialah bagaimana ukuran kesesuaian yang diperoleh dari analisis biplot biasa dan analisis biplot imbuhan dengan nilai minimum dari ketiga transformasi di atas dan penerapannya untuk pemetaan provinsi berdasarkan prestasi mahasiswa BUD DEPAG IPB. Tujuan Tujuan dari penulisan karya ilmiah ini ialah: 1. Memperoleh gambaran umum tentang representasi ukuran kesesuaian analisis biplot imbuhan. 2. Penerapan kasus analisis biplot biasa dan imbuhan dalam pemetaan provinsi berdasarkan prestasi mahasiswa BUD DEPAG IPB (dalam studi kasus mahasiswa BUD DEPAG TPB IPB tahun akademik 2009/2010). LANDASAN ANALISIS Analisis Biplot Analisis biplot pertama kali diperkenalkan oleh Gabriel pada tahun 1971. Elaborasi analisis biplot secara komprehensif diberikan oleh Greenacre pada tahun 2010. Biplot berupa suatu peragaan grafik dari matriks data Y dalam plot dengan menumpangtindihkan vektor-vektor dalam ruang berdimensi rendah, biasanya dua (atau tiga) yang mewakili vektor-vektor baris matriks Y (gambaran objek) dengan vektorvektor kolom matriks Y (gambaran peubah). 11 Informasi yang dapat diperoleh dari biplot antara lain ialah: 1. Kedekatan antar objek. Dua objek dengan karakteristik yang sama akan digambarkan sebagai dua titik yang posisinya berdekatan. 2. Keragaman peubah. Peubah dengan keragaman kecil digambarkan sebagai vektor yang pendek, sedangkan peubah dengan keragaman besar digambarkan sebagai vektor yang panjang. 3. Korelasi antar peubah. Peubah digambarkan sebagai vektor. Jika sudut dua peubah lancip 90° maka korelasinya bernilai positif. Apabila sudut dua peubah tumpul 90° maka korelasinya bernilai negatif. Sedangkan jika sudut dua peubah siku-siku maka tidak saling berkorelasi. 4. Keterkaitan peubah dengan objek. Karakteristik suatu objek bisa disimpulkan dari posisi relatifnya dengan peubah. Jika posisi objek searah dengan arah vektor peubah maka objek tersebut nilainya di atas rata-rata, jika berlawanan maka nilainya di bawah rata-rata, dan jika hampir di tengah-tengah maka nilainya mendekati rata-rata. Analisis biplot dikembangkan atas dasar Dekomposisi Nilai Singular (DNS) atau Singular Value Decomposition (SVD). adalah matriks data dengan n Misalkan n objek dan p peubah. Selanjutnya dikoreksi terhadap nilai rata-ratanya sehingga diperoleh matriks Y, 1 n T (1) dengan 1 adalah vektor 1 yang semua unsurnya bernilai 1. Matriks koragam dari matriks ialah 1 n 1 T (2) r sedangkan matriks korelasi matriks ialah ⁄ dengan ⁄ diag ⁄ √ dari (3) , √ ,.., adalah matriks diagonal. T , ,…, Misalkan matriks n maka didefinisikan jarak Euclid antara objek ke-i dan ke-j sebagai , T dan jarak Mahalanobis antara objek ke-i dan ke-j T , sebagai . Matriks berpangkat r dengan min , dapat dinyatakan sebagai SVD berikut: n T n (4) (Aitchison & Greenacre 2002) dengan U dan W merupakan matriks ortonormal kolom, T T . Matriks W sehingga adalah matriks yang kolom-kolomnya terdiri yang berpadanan dengan dari vektor eigen T dari matriks . nilai eigen positif Matriks U adalah matriks yang kolomkolomnya merupakan vektor eigen-vektor eigen yang berpadanan dengan nilai eigenT dengan nilai eigen positif dari matriks hubungan r p diag λ , λ ,..., λ , ,…, (6) , n (5) ,..., (7) dengan λ λ λ 0 dan λ disebut nilai singular dari matriks . Dalam Jolliffe (2002) persamaan (4) dapat diuraikan menjadi T (8) , Misalkan , ,…, persamaan (8) menjadi T ,…, maka T dan T (9) dengan demikian setiap elemen ke- (i, j) unsur matriks Y dapat dinyatakan sebagai berikut: T . Vektor merepresentasikan y objek ke-i matriks Y, dan vektor merepresentasikan peubah ke-j matriks Y. Jika Y berpangkat dua, maka vektor baris dan vektor kolom dapat digambarkan dalam ruang dimensi dua. Sedangkan matriks Y yang berpangkat lebih dari dua dapat didekati dengan matriks berpangkat dua, sehingga persamaan dapat ditulis menjadi 2y T dengan masing-masing dan mengandung dua unsur pertama vektor dan . Dengan pendekatan tersebut matriks Y dapat disajikan dalam ruang dimensi dua. Nilai yang digunakan dapat merupakan nilai sebarang 0, 1 , tetapi pengambilan 12 nilai-nilai ekstrim yaitu 0 dan 1 berimplikasi pada interpretasi biplot. a. Jika 0, maka dan akibatnya T T T maka T T T T T T (10) diperoleh : T 1 , dengan adalah • koragam peubah ke-i dan ke-j. • 1 , dengan √ menggambarkan keragaman peubah ke-i. • Korelasi antara peubah ke-i dan ke-j dijelaskan oleh cosinus sudut antara h dan h (misal: ), yaitu T cos • Jika Y berpangkat p maka 1 T artinya kuadrat jarak Mahalanobis antara dan sebanding dengan kuadrat jarak Euclid antara dan , serta adalah matriks koragam dari Y. b. Jika 1, maka dan , akibatnya : T T T T T T T Artinya, T atau kuadrat jarak Euclid antara dan akan sama dengan kuadrat jarak Euclid antara dan . Ukuran Kesesuaian Analisis Biplot Menurut Gabriel (2002), biplot tidak hanya sebagai pendekatan matriks data Y T , tetapi dengan menggunakan matriks T sebagai pendekatan juga hasil perkalian dari matriks T yang berkaitan dengan ragam koragam dan korelasi antar peubah dan T T sebagai pendekatan bagi matriks yang berkaitan dengan ukuran ketakmiripan T T dan antar objek. Secara umum sebagai pendekatannya. Jika T GF , min 1 11 Persamaan di atas dapat ditulis menjadi: GF , tr T T tr tr T Y dan H adalah suatu matriks, di mana H merupakan pendekatan Y. Ukuran kesesuaian analisis biplot sebagai ukuran kedekatan dari tiga bentuk matriks, yaitu: 1. Kesesuaian data: T tr T , tr T T tr T tr T T 2. Kesesuaian peubah: GF T , T tr T T T tr T T T T 3. Kesesuaian objek: GF T , T T tr tr T T tr T dengan tr dinamakan teras dari matriks segi M atau jumlah elemen diagonal dari matriks segi M sehingga dituliskan tr ∑ . T T T λ di mana . Rumus umum yang dikemukakan oleh Gabriel untuk ukuran kesesuaian analisis biplot ini adalah sebagai berikut: GF T T T , λ T Analisis Biplot Imbuhan Masalah yang timbul adalah pengaruh pendekatan dalam ruang bagian berdimensi rendah dalam mencerminkan hubungan yang benar antara objek dan peubah dalam ruang data lengkap. Ini menyebabkan bahwa representasi yang diberikan oleh biplot kadang-kadang baik, buruk, atau cukup. Hasil representasi yang diberikan oleh analisis biplot imbuhan (augmented biplot) itu dapat menghasilkan visualisasi lebih baik mengenai keragaman. Biplot imbuhan merupakan modifikasi dari biplot biasa yang memberikan gambaran ragam seperti yang diperoleh dari data (Bartkowiak dan Szustalewicz 1995). T Berdasarkan persamaan (9) akan dilakukan pendekatan dengan matriks T . berdimensi lebih rendah yaitu Dengan demikian matriks yang berpengaruh 13 dalam biplot imbuhan yaitu matriks yang merepresentasikan suatu peubah. Algoritme untuk membangun biplot imbuhan dari biplot biasa: 1. Matriks B merepresentasikan peubah yang merupakan pendekatan untuk analisis biplot biasa. merepresentasikan peubah 2. Matriks yang merupakan pendekatan untuk analisis biplot imbuhan. menyatakan panjang vektor 3. Misalkan dari pendekatan analisis biplot biasa. menyatakan panjang 4. Misalkan dari pendekatan analisis biplot vektor imbuhan. 5. Hubungan antara matriks B dengan adalah , dengan matriks merupakan matriks diagonal berupa konstanta yang menyatakan besarnya peregangan atau pemampatan dari vektor biplot biasa. dan adalah 6. Hubungan antara | | . (Bartkowiak dan Szustalewicz 1995). Analisis Procrustes Misalkan X dan Y merupakan matriks yang berukuran dan yang masing-masing adalah representasi konfigurasi yang akan dibandingkan. Koordinat titik ke-i pada ruang Euclid yang diberikan oleh nilai-nilai baris ke-i pada matriks. Konfigurasi pertama berada pada ruang berdimensi p dan koordinat titik ke-i , ,…, . Sedangkan konfigurasi yaitu kedua berada pada ruang berdimensi q dan , ,…, . koordinat titik ke-i yaitu Jika maka konfigurasi kedua berada dalam subruang dari ruang berdimensi p. Berdasarkan analisis procrustes, perbedaan ruang dimensi ini dapat diselesaikan dengan memasangkan kolom nol di kanan Y sehingga menjadi matriks berukuran . Dengan demikian, dapat digunakan secara umum . Untuk menentukan ukuran kesesuaian dalam dua konfigurasi, analisis procrustes menggunakan jumlah kuadrat jarak antara titik yang bersesuaian yaitu , ∑ tr ∑ T (12) (Bakhtiar dan Siswadi 2011). Translasi Translasi dapat diartikan sebagai proses pemindahan seluruh titik dengan jarak yang tetap dan arah yang sama. Dari persamaan (12) diperoleh , 2 ∑ (13) Penguraian dari persamaan (13) menghasilkan , , (14) dengan , ,…, , ,…, ∑ 1 1 y untuk j=1, 2, ... , p dan merupakan konfigurasi X dan dan masingY setelah ditranslasi. masing adalah sentroid kolom dari X dan Y. merupakan jarak dari kedua Sedangkan sentroid kolom X dan Y. Untuk menghasilkan 0. E yang minimum, maka Dengan demikian, nilai perbedaan minimum antara dua konfigurasi X dan Y setelah ditranslasi adalah , , ∑ ∑ (15) Rotasi Rotasi dapat didefinisikan sebagai suatu proses pemindahan seluruh titik dengan sudut yang tetap tanpa mengubah jarak setiap titik terhadap sentroidnya. Dalam transformasi ini dilakukan penggandaan konfigurasi dengan suatu matriks ortogonal. Rotasi Y terhadap X dilakukan dengan mengalikan matriks Y dengan matriks 14 ortogonal Q yaitu , , T . dengan T Dengan demikian, perbedaan minimum konfigurasi X dengan Y setelah penyesuaian dengan rotasi ialah , , inf tr tr 2tr tr T T tr T T tr tr tr tr tr T T T T T ∑ T T ∑ Karena Q merupakan matriks ortogonal T juga merupakan matriks maka T ortogonal. Dimisalkan maka berlaku 1 1, sehingga tr T T tr ∑ ∑ tr ∑ Jadi, tr ∑ akan maksimum jika T ∑ ∑. Kondisi ini dapat ∑ T (Bakhtiar 1995). dipenuhi jika Dilasi Dilasi dapat didefinisikan sebagai pembesaran atau pengecilan jarak setiap titik dalam konfigurasi terhadap sentroidnya. T tr tr (17) T (18) T tr T T T Nilai E akan minimum jika tr maksimum. Jadi, dipilih matriks ortogonal Q T T . yang memaksimumkan tr Teorema Jika X dan Y merupakan elemen dalam dan Q elemen dalam merupakan T T akan matriks ortogonal maka tr T dengan maksimum bila dipilih ∑ T merupakan hasil Dekomposisi Nilai Singular Bentuk Lengkap (DNSBL) dari matriks T . Bukti: Andaikan ∑ T merupakan hasil DNSBL sehingga p T dari matriks p T T ∑ ∑ . adalah matriks diagonal p dengan dan U, V merupakan matriks ortogonal, sehingga , inf Secara aljabar, perbedaan minimum setelah dilakukan penyesuaian dengan dilasi ialah , T T , (16) Secara aljabar, nilai perbedaan minimum setelah dilakukan penyesuaian dengan rotasi ialah , Dilasi Y terhadap X dilakukan dengan mengalikan konfigurasi Y dengan suatu skalar c. Konfigurasi setelah dilasi menjadi cY. Dengan demikian perbedaan minimum antara dua konfigurasi setelah dilasi ialah T 2 tr T (19) Persamaan (19) merupakan fungsi kuadrat dengan variabel c. Syarat untuk memperoleh nilai E yang minimum ialah turunan pertama sama dengan nol dan turunan kedua lebih besar nol. Dengan terlebih dahulu menentukan titik kritis dari turunan pertama sehingga diperoleh c sebagai titik tetap. 2 tr T T 2 tr T 2 tr 0 T 2 tr tr tr T T (20) Untuk membuktikan nilai E minimum ialah turunan kedua dari persamaan (19) harus lebih dari nol. 2 tr T 0 Dari bukti di atas dapat disimpulkan bahwa nilai E minimum dengan nilai c pada persamaan (20). Setelah itu, substitusi nilai c ke dalam persamaan (19) sehingga diperoleh nilai E yang minimum sebagai berikut , T tr tr tr tr 2 T 2 tr T T T tr T T tr tr T tr T tr tr tr T T tr T 2 T tr tr tr T tr tr T T T T