Ukuran Penyebaran Data Arum Handini Primandari, M.Sc. Ayundyah Kesumawati, M.Si Ukuran Variasi • Selain menentukan pemusatan data, suatu aspek studi deskriptif data harus mengukur variansi di sekitar pusat data. • Perhatikan dua jenis data berikut yang memiliki pusat data yang sama: • Oleh karena mean sampel adalah ukuran pemusatan data x variasi dari setiap data terhadap pusat data (mean sample) tercermin dari simpangannya (deviasinya) dari mean, yaitu: deviasi observasi – mean sampel xx • Contoh: terdapat himpunan data: 3, 5, 7, 7, 8, dan memiliki mean sebesar 6, maka simpangannya adalah: Data Deviasi 3 -3 5 -1 7 1 7 1 8 2 • Untuk sembarang himpunan data, jumlah seluruh deviasi adalah 0. x x • Untuk mengukur sebaran, kita harus mengeliminasi tanda negatif (-) sebelum menjumlahkan dan merata-ratakan, yaitu dengan mengkuadratkan. Ukuran penyebaran data disebut variansi sampel. Variansi dirumuskan: n s2 x x 2 i1 n1 • Variansi disebut juga dengan ragam. • Untuk memperoleh ukuran variabilitas dengan satuan yang sama dengan satuan datanya, maka kita ambil akar dari variansi, yang dinamakan deviasi standar/ simpangan baku, yaitu: n s x x 2 i1 n1 Estimasi Variansi untuk Data Berkelompok • Jika x1, x2, …, xk adalah titik-titik tengah kelas yang masingmasing memiliki frekuensi f1, f2, …, fk, maka variansi data tersebut adalah: n fx fx i i i1 s2 i1 nn 1 k 2 i i k 2 Ukuran Variasi yang lain • Ukuran variasi yang lain yang sering digunakan adalah: – Rentang sampel Rentang sampel = data terbesar – data terkecil – Rentang antar-kuartil sampel Rentang antarkuartil sampel = Kuartil ketiga – kuartil pertama Diagram Kotak (boxplot) • Boxplot menggambarkan lima serangkai nilai yaitu: data terkecil, Q1, Q2, Q3, data terbesar. • Contoh: Q2 Q1 data terkecil Q3 data terbesar Outliers (Pencilan) • Outliers adalah observasi yang dianggap luar biasa (ekstrim) jauh dari sebagian besar data • Prosedur yang umum dipakai untuk menentukan outliers adalah dengan rentang antarkuartil. • Jika suatu data jauhnya dari boks dalam boxplot 1.5 kali rentang antarkuartil, maka data tersebut kemungkinan adalah outliers. Memeriksa Distribusi • Penyajian data, misalnya dalam histogram, mempunyai tujuan agar kita data melihat distribusi data tersebut: apakah distribusi data simetris atau condong (skewed) ke kanan (right tail) atau kiri (left tail). • Kita dapat menentukan distribusi dari bentuk, pemusatan, dan penyebaran nya. • Kita dapat mendeteksi kecondongan dari statistik 5 serangkai dengan membandingkan seberapa jauh kuartil pertama dan data terkecil dari median (left tail) dengan seberapa jauh kuartil ketiga dan data terbesar dengan median (right tail). Referensi • Bhattacharya, G. K., dan R. A., Johnson, 1997, Statistical Concept and Methods, John Wiley and Sons, New York. • Soejoeti, Zanzawi, 2014, Metode Statistik 1, Universitas Terbuka, Tangerang Selatan. • Walpole, R.E., 1995, Pengantar Statistika Edisi ke3, diterjemahkan oleh: Bambang Sumantri, Gramedia Pustaka Utama, Jakarta.