Ukuran Penyebaran Data Arum Handini Primandari, M.Sc. Ukuran Variasi • Selain menentukan pemusatan data, suatu aspek studi deskriptif data harus mengukur variansi di sekitar pusat data. • Perhatikan dua jenis data berikut yang memiliki pusat data yang sama: • Oleh karena mean sampel adalah ukuran pemusatan data x variasi dari setiap data terhadap pusat data (mean sample) tercermin dari simpangannya (deviasinya) dari mean, yaitu: deviasi observasi – mean sampel xx • Contoh: terdapat himpunan data: 3, 5, 7, 7, 8, dan memiliki mean sebesar 6, maka simpangannya adalah: Data Deviasi 3 -3 5 -1 7 1 7 1 8 2 • Untuk sembarang himpunan data, jumlah seluruh deviasi adalah 0. x x • Untuk mengukur sebaran, kita harus mengeliminasi tanda negatif (-) sebelum menjumlahkan dan merata-ratakan, yaitu dengan mengkuadratkan. Ukuran penyebaran data disebut variansi sampel. Variansi dirumuskan: n s2 x x i1 2 n1 • Variansi disebut juga dengan ragam. • Untuk memperoleh ukuran variabilitas dengan satuan yang sama dengan satuan datanya, maka kita ambil akar dari variansi, yang dinamakan deviasi standar/ simpangan baku, yaitu: n s x x i1 2 n1 Estimasi Variansi untuk Data Berkelompok • Jika x1, x2, …, xk adalah titik-titik tengah kelas yang masingmasing memiliki frekuensi f1, f2, …, fk, maka variansi data tersebut adalah: n fx fx i i i1 s2 i1 nn 1 k 2 i i k 2 Ukuran Variasi yang lain • Ukuran variasi yang lain yang sering digunakan adalah: – Rentang sampel Rentang sampel = data terbesar – data terkecil – Rentang antar-kuartil sampel Rentang antarkuartil sampel = Kuartil ketiga – kuartil pertama Diagram Kotak (boxplot) • Boxplot menggambarkan lima serangkai nilai yaitu: data terkecil, Q1, Q2, Q3, data terbesar. • Contoh: Q2 Q1 data terkecil Q3 data terbesar Memeriksa Distribusi • Penyajian data, misalnya dalam histogram, mempunyai tujuan agar kita data melihat distribusi data tersebut: apakah distribusi data simetris atau condong (skewed) ke kanan (right tail) atau kiri (left tail). • Kita dapat menentukan distribusi dari bentuk, pemusatan, dan penyebaran nya. • Kita dapat mendeteksi kecondongan dari statistik 5 serangkai dengan membandingkan seberapa jauh kuartil pertama dan data terkecil dari median (left tail) dengan seberapa jauh kuartil ketiga dan data terbesar dengan median (right tail). Outliers (Pencilan) • Outliers adalah observasi yang dianggap luar biasa (ekstrim) jauh dari sebagian besar data • Prosedur yang umum dipakai untuk menentukan outliers adalah dengan rentang antarkuartil. • Suatu data dicurigai merupakan outliers, jika: – kurang dari Q1-H, atau – Lebih dari Q3+H dengan H = 1.5*(Q3 – Q1) Latihan 1 Tentukan simpangan baku dari data berikut: persentase penduduk berumur 10 tahun ke atas yang bekerja menurut jam kerja selama seminggu: Jam kerja Persentase 0–9 2 10 – 19 6 20 – 29 22 30 – 39 27 40 – 49 23 50 – 59 15 60 – 69 5 Latihan 2 • Biaya iklan dari 40 produk sabun (dalam juta rupiah) adalah sebagai berikut: 138 150 167 111 127 151 177 149 123 148 195 128 124 169 160 161 145 156 173 170 135 163 163 166 159 134 154 155 120 137 122 140 120 112 123 144 159 175 157 183 • Tentukan: – – – – Variansi Standar deviasi Tentukan Q1, Q2, Q3 Adakah data yang menjadi outliers Referensi • Bhattacharya, G. K., dan R. A., Johnson, 1997, Statistical Concept and Methods, John Wiley and Sons, New York. • Soejoeti, Zanzawi, 2014, Metode Statistik 1, Universitas Terbuka, Tangerang Selatan. • Walpole, R.E., 1995, Pengantar Statistika Edisi ke3, diterjemahkan oleh: Bambang Sumantri, Gramedia Pustaka Utama, Jakarta.