Pertemuan 3 & 4 INTERPRETASI GEOMETRI DAN GENERALISASI VARIANS • Interpretasi Geometri pada Sampel • Generalisasi varians , Interpretasi Geometri pada Sampel Sample Geometry and Random Sampling Data sampel (multivariat) observation (multivariat) observation dimana Setiap baris dari matriks X merepresentasikan sebuah pengukuran multivariat Perhatikan bahwa matriks data dua cara yang berbeda : 1. dapat di plot dengan Plot n buah titik dalam ruang p dimensi. Vektor baris merepresentasikan observasi ke j yang memuat koordinat sebuah titik observasi (multivariate) ke j Dalam hal ini vektor mean sampel merupakan pusat titik keseimbangan data 2. Plot data X atas p buah vektor d dalam ruang n dimensi. Kolom-kolom matriks dipandang sebagi vektor-vektor dengan n komponen . , Interpretasi Geometri (i) Ilustrasi 2.1 Data sampel Titik yang pertama mempunyai koordinat Titik yang kedua mempunyai koordinat Titik yang ketiga mempunyai koordinat Rata-rata = x2 5 4 Plot data untuk n=3 titik dalam p=2 dimensi 3 2 1 -2 -1 1 2 3 4 5 x1 Tampak bahwa mean sampsl merupakan titik kesetimbangan atau pusat gravitasi dari plot data Interpretasi Geometri (ii) Kolom-kolom data dipandang sebagai koordinatkoordinat vektor. Dari data sampel diperoleh vektor 5 3 dan 5 3 3 Plot data atas p=2 vektor dalam ruang dimensi n=3 4 , Hubungan Interpretasi Geometri (i) dan (ii) Pertama-tama konstruksi vektor 1 berukuran (nx1) : Vektor membentuk sudut yang sama besar terhadap sumbu-sumbu koordinat sehingga vctor mempunyai panjang 1 (uniter) pada arah sudut yang sama. Misalkan vector unit vektor pada unit vektor dimana mean sampel maka proyeksi vector adalah pada Dari uraian tersebut, setiap vektor , dapat dekomposisi sebagai berikut dimana vektor Vektor deviasi atau men terkoreksi (mean corrected) Dari contoh sebelumnya diketahui bahwa dan tegak lurus pada vektor diberikan oleh vektor sehingga diperoleh Selanjutnya hitung vektor-vektor deviasi Tampak bahwa tegak lurus pada , karena demikian pula tegak lurus pada , karena Jadi dekomposisi vektor-vektor adalah dan Plot dekomposisi vektor kedalam komponen mean dan vektor deviasi 0 Translasi vektor-vektor d ke titik asal 0 Z Vektor 1 membentuk sudut yang sama besar terhadap sumbu-sumbu koordinat X, Y dan Z 0 1 Y Untuk n dimensi: X 1 dan vektor mempunyai panjang =1 Hasil yang diperoleh 1 2 Perkalian titik sama dengan Ini berarti matriks varians-covarian sampel dapat di peroleh melalui vektor-vektor deviasi 3 Koefisien korelasi sampel adalah coinus sudut apit antara vektor dengan *) tergantung dari pembagi n atau (n-1) untuk rumus varians dan kovarians Rangkuman dari contoh soal atau dimana Matriks varians-covarian sampel dapat pula di peroleh melalui vektorvektor deviasi sebagai berikut diperoleh atau Hubungan antara dan Unbiased sample variance-covariance Matrix GENERALISASI VARIANS Pandang matriks varians-covarians sampel dari p peubah Martriks S ini mengandung p varians dan kovarians yang berpotensi berbeda Determinan dari matriks varians-covarians sampel S , merupakan ringkasan sebuah angka dari matriks tersebut dan dinamakan generalisasi varian sampel dan dinotasikan sebagai untuk untuk ; Luas jajaran genjang yang dibentuk oleh vektor-vektor deviasi dan adalah tetapi dan maka Juga Jadi untuk Atau secara aljabar , luas jajaran genjang yang dibentuk oleh vektor2 dan dimana Untuk “Large” generalized sample variance, for p=3 “Small” generalized sample variance, for p=3 KASUS DIMANA GENERALIZED VARIANS BERNILAI NOL Generalized varians bernilai nol berarti paling sedikit satu baris dari matriks deviasi dapat di tulis sebagai kombinasi linier dari kolom-kolom yang lain. Secara geometris, hal ini berarti suatu vector deviasi , katakanlah terletak pada hyperplane yang dihasilkan oleh dimana yang dapat diekspresikan atas kombinas linier dari kolom-kolom lainnya Ilustrasi 2.2 Diberikan matriks data Tunjukan bahwa generalisasi varians = 0 , dan tentukan vektor deviasi yang tergenerasi Solusi vektor mean adalah vektor vektor deviasi adalah diperoleh Tampak bahwa d3 merupakan kombinasi linier dari d1 dan d2 , yaitu Jadi d3 yang tereduksi, atau terletak pada bidang yang dibentuk oleh d1 dan d2. Akibatnya, volume benda yang terbentuk dalam ruang dimensi tiga adalah nol, yang disebabkan oleh , hal ini dapat diperiksa sebagai berikut : Diperoleh matriks varians-covarians sampel dan Matrik S ini juga dapat diperoleh dengan menggunakan rumus Secara aljabar, dapat di periksa bahwa volume paralel epipedum yang dibentuk oleh vektor-vektor deviasi d1, d2 dan d3 adalah V =0, yaitu Paralel epipedum Dalam hal ini d3 terletak pada bidang yang dibentuk d1 dan d2 Generalisasi Varians yang lainnya • Generalisasi varians sampel untuk variabel yang di standarisasi dihitunng melalui Hubungan antara dan diberikan oleh Vektor deviasi di, terkadang memiliki panjang bervariasi (sangat panjang / sangat pendek). Sehingga mempengaruhi perhitungan volume. Oleh karena itu sering diperlukan pemberian skala untuk semua vektor deviasi agar memiliki panjang yang sama. Penberian skala terhadap vektor-vektor deviasi, ekivalen dengan mengganti setiap observasi awal (origine) dengan nilai standar Akibatnya, matriks varians-covarian sampel adalah matriks R mendekati nol akan membesar jika koefisien korelasi Nilai dari dan akan mengecil jika satu atau beberapa koefisien korelasi mendekati 1 atau -1 dimana sama dengan cosinus sudut apit antara vektor2 deviasi (terstandar) dan • Generalisasi varians sampel yang di hitung melali total varians sampel Total varian sampel Ilustrasi 3 , Diperoleh Jadi Sedangkan total varians sampel adalah Total varian sampel dan