UKURAN STATISTIK DESKRIPTIF Oleh: Sardin A. Ukuran Statistik, Parameter, dan Statistik Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan data statistik melalui proses sritmatik tertentu. Dalam analisis data, ukuran statistik ini mengisyaratkan gejala spesifik, misalnya Gejala Letak Pusat Pengelompokkan Data, Gejala Penyebaran/Variasi/ Keseragaman Data, atau gejala lainnya yang dikandung oleh data yang sedang dianalisis. Apabila ukuran statistik ini diperolehnya atas dasar perhitungan yang menyeluruh (complete enumeration) atau sensus, maka namanya parameter, sedangkan jik adiperolehnya atas dasar perhitungan terhadap data statistik yang ada dalam sampel, ukuran statistik ini disebut statistik. B. Ukuran Gejala Pusat Ukuran ini mengisyaratkan letak pemusatan pengelompokkan data. Oleh karena itu ukuran-ukuran statistik ini disebut juga Ukuran Letak (Measures of Location). 1. Rata-Rata Hitung (Average atau Mean) Terdapat dua rata-rata hitung yaitu rata-rata hitung untuk populasi yang berukuran N dan rata-rata hitung untuk sampel berukuran n. Jika yang dicari adalah rata-rata hitung untuk populasi, maka dapat diperoleh dengan menggunakan rumus: N x i 1 i N Contoh 1. Diperoleh data tentang nilai yang diperoleh 5 mahasiswa pada mata kuliah statistika, yaitu; 30, 50, 60, 40, dan 60. Jika data berasal dari populasi, hitunglah berapa nilai rata-rata nilai statistika untuk 5 orang di atas. Jawab: Karena data berasal dari populasi, maka rata-rata dapat dihitung sebagai berikut: 30 50 60 40 60 48 5 Jika yang dicari adalah rata-rata sample, maka rata-rata dapat diperoleh dengan menggunakan rumus: n x x i 1 i n Contoh 2. Seorang pengamat makanan mengambil secara random sebanyak 7 kaleng terhadap makanan kaleng yang bertujuan untuk mengetahui kadar zat beracun (dalam prosen) yang terdapat dalam kaleng tersebut. Data yang dikumpulkan dari 7 buah kaleng tersebut adalah: 1,8 , 2,1 , 1,7 , 1,6 , 0,9 , 2,7 , dan 1,8. Hitunglah rata-rata sampel? Jawab: karena data berasal dari sampel, maka dapat dihitung: x 1,8 21, 1,7 0,9 2,7 1,8 1,8% 7 Rumus yang dipergunakan untuk menghitung rata-rata dari data bergolong adalah: X f x f i i i Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah: a. Nilai numerik rata-rata hitung ditentukan secara ketat oleh bilanganbilangan yang menyusunnya. b. Nilai numerik rata-rata hitung adalah unik. c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim. d. Rata-rata hitung hanya boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel yang memenuhi tingkat pengukuran sekurang-kurangnya interval, e. Apabila dalam rentetan data yang dihadapi terdapat bilangan ekstrim, tidak disarankan untuk menggunakan rata-rata hitung sebagai ukuran gejala pusat, sebab bisa memberikan kesimpukan yang keliru. f. Tidak disarankan untuk mengambil kesimpulan yang hanya didasarkan kepada rata-rata hitung. 2. Median Median merupakan suatu harga yang merupakan titik tengah dari keseluruhan harga pada suatu satuan data. Oleh karena itu terdapat 50% data yang berada di bawah atau sama dengan nilai tersebut dan terdapat 50% lagi data yang berada di atas atau sama dengan data tersebut. Contoh 3. Dari 5 orang mahasiswa yang mengikuti ujian statistik diperoleh angka; 82, 93, 86, dan 79. Tentukan median jika data tersebut berasal dari populasi. Jawab: angka yang diperoleh harus disusun terlebih dahulu dari kecil ke besar, sehingga diperoleh: 79 82 86 92 93 Jadi median dari data tersebut adalah : Me = 86 Contoh 4. Untuk mengetahui kadar nikotin yang terkandung di dalam rokok, diambil sampel berukuran 6 (rokok) yang diperoleh data (dalam miligram) sebagai berikut: 2,3 , 2,7 , 2,5 , 2,9 , 3,1 , dan 1,9. Tentukan mediannya! Jawab: Data diurutkan dari kecil ke besar, sehingga diperoleh: 1,9 2,3 2,5 2,7 2,9 3,1 Median terletak antara angka 2,5 dan 2,7, oleh karena itu median ditentukan dengan cara: Me 2,5 2,7 2,6 mi ligram 2 Untuk menghitung Median dari data bergolong, dipergunakan rumus: 1 n -F Me b p 2 f b p F f = = = = batas bawah, di mana median akan terletak panjang kelas interval jumlah semua frekuansi sebelum kelas interval frekuensi kelas median Adapun yang menjadi sifat-sifat dari penggunaan median adalah sebagai berikut: a. Nilai numerik median tidak ditentukan secara ketat oleh bilangan-bilangan yang menyusunnya. Oleh karena itu, jika dalam rentetan bilangan ada yang berubah nilai numeriknya, median belum tentu berubah. b. Median tidak dipengaruhi oleh nilai ekstrim, dan nilai median adalah unik. c. Median boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel yang memenuhi skala pengukuran sekurang-kurangnya ordinal. Apabila dalam rentetan bilangan terdapat nilai ekstrim, disarankan untuk menggunakan median sebagai pengganti rata-rata hitung. 3. Modus Modus didefinisikan sebagai bilangan yang paling banyak muncul atau bilangan yang frekuensi kemunculannya paling besar dari sutau satuan data. Modus tidak selalu dengan mudah diperoleh. Hal ini akan terjadi jika dihadapkan pada suatu harga yang mempunyai frekuensi kemunculan yang sama dengan yang lainnya. Contoh 5. Jika diperoleh data tentang besarnya sumbangan yang diberikan oleh tiap propinsi untuk pengungsian di Aceh yang dinyatakan dalam juta, diperoleh data: 9, 10, 5, 9, 9, 7, 8, 6, 10, dan 11 juta, maka modus dalam hal ini adalah 9 juta. Contoh 6. Dikumpulkan data terhadap 12 sekolah menengah umum yang diambil secara acak untuk mengetahui banyaknya siswa di sekolah tersebut yang diterima di PTN. Diperoleh data; 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1, dan 4. Pada kasus ini terjadi dua bilangan yang frkeuensi kemunculannya paling banyak yaitu 2 dan 4, dan kedua bilangan tersebut adalah modus untuk data yang kita peroleh ini. Jika terjadi pada suatu satuan data bermodus seperti ini disebut bimodal. Contoh 7. Tidak terdapat modus pada satuan data yang diperoleh pada contoh 3. Untuk menghitung modus pada data bergolong dipergunakan rumus: b Mo b p 1 b1 b2 b p b1 b2 = batas kelas interval dengan frekuensi terbanyak = panjang kelas interval = frekuensi pada kelas modus dikurangi frekwensi kelas terdekat sebelumnya = frkuensi kelas modus dikurangi frekuensi kelas interval berikutnya. Adapun yang menjadi sifat-sifat dan penggunaan modus adalah sebagai berikut: a. Nilai numerik modus tidak unik (dalam sebuah rentetan data bisa terdapat lebih dari sebuah modus). b. Modus digunakan sebagai ukuran gejala pusat untuk variabel dengan tingkat pengukuran sekurang-kurangnya nominal. Dari sifat-sifat penggunaan ukuran gejala pusat berdasarkan skala pengukuran, maka dapat digambArkan secara sederhana seperti pada tabel 2.1. di bawah ini TABEL 2.1. PENGGUNAAN UKURAN GEJALA PUSAT BERDASARKAN SKALA PENGUKURAN DATA Skala Pengukuran Nominal Ordinal Interval/Rasio Mean V Ukuran Gejala Pusat Median Modus V V V V V C. Ukuran Dispersi atau Ukuran Variasi Selain ukuran gejala pusat, terdapat ukuran lain yaitu ukuran dispersi atau ukuran vasiasi yang mengisyaratkan keseragaman data. Nilai numerik ukuran ini tidak pernah negatif (selalu positif). Apabila nilai ukuran ini diperoleh sama dengan nol (0), hal ini menunjukkan bahwa data yang kita miliki keadaannya seragam sempurna (tidak ada variasi, atau semua bilangan nilai numeriknya sama). Oleh karena itu makin jauh nilai numerik ukuran ini dari nol (0), makin tidak seragam keadaan data tersebut. Terdapat bebeapa ukuran variasi yang biasa digunakan, yang juga akan diuraikan di sini, adalah; rentang (range), varians (variance), simpangan baku (standar deviation), koefisien variasi (koeficient of variation), rentang antar kuartil (interquartiles ranges), dan indeks dispersi (index of dispersion). 1. Rentang Rentang pada suatu satuan data adalah selisih terbesar dan terkecil dari suatu satuan data tersebut. Contoh 8. IQ lima orang anggota keluarga adalah; 108, 112, 127, 118, dan 113. Tentukan rentangnya! Jawab: Rentang dari 5 IQ tersebut adalah 127 – 108 = 19. 2. Varians (variance) Rumus yang dipergunakan untuk menghitung varians, jika data berasal dari populasi adalah: N xi N 2 i 1 x1 N 2 i 1 N 2 Sedangkan varians yang dihitung berdasarkan sampel dihitung dengan rumus: n xi n 2 i 1 x1 n s 2 i 1 n -1 2 3. Simpangan Baku (Standar Deviation) Simpangan baku didefinisikan sebagai akar dari Varians. Oleh karena itu rumus simpangan baku adalah: 2 Untuk sampel adalah; s s2 Varians dan simpangan bau hanya boleh digunakan sebagai alat pembanding keseragaman data, apabila data yang dibandingkan keseragamannya itu berasal dari variabel yang sama dengan satuan pengukuran (unit of measurement) yang sama pula. Varians dan Simpangan Baku hanya valid digunakan sebagai ukuran variasi untuk variabel yang memenuhi tingkat pengukuran sekurang-kurangnya interval. 4. Indeks Dispersi atau Indeks Variasi Kualitatif (Index of Dispersion or Index of Qualitative Variation) Untuk mengukur keseragaman (variasi) data yang mempunyai tingkat pengukuran nominal, digunakan Indeks dispersi dengan rumus: 2 C C 2 C. f i - f i ID i 1 2 i 1 C f i c - 1 i 1 Nilai numerik ID terbatas: 0 ID 1 ID = 0 menunjukkan bahwa data seragam sempurna. Keadaan ini terjadi apabila semua frekuensi terdapat pada satu kategri dan kategori lainnya frekuensinya sama dengan nol (0). ID=1 mengisyaratkan variasi maksimal. Fenomenon ini terjadi jika frekuensi terbagi rata untuk semua kategori. Contoh: Hasil penelitian Mahasiswa di Desa X tentang jenis pekerjaan penduduk disajikan dalam data sebagai berikut: No. Kategori Pekerjaan 1. PNS 2. ABRI 3. Pedagang 4. Petani 5. Buruh 6 Pelajar/Mahasiswa 7. Lain-lain Jumlah penduduk 15 tahun lebih Banyaknya 75 9 38 142 208 196 81 749 Untuk menghitung Indeks Dispersi diperlukan data: No. 1. 2. 3. 4. 5. 6 7. Jumlah ID Kategori Pekerjaan PNS ABRI Pedagang Petani Buruh Pelajar/Mahasiswa Lain-lain (7) (749 2 - 115555) 0,926356637 (7492 ) (7 - 1) fi 75 9 38 142 208 196 81 749 fi2 5625 81 1444 20164 43264 38416 6561 115555 Jika dijadikan persen, maka ID = 92,6356637%, dibulatkan ID = 92,6%. 5. Ukuran Kemiringan Ukuran statistik ini mengisyaratkan keadaan bentuk kurva distribusi data nilainilai sebuah variabel, apakah Simetri atau Miring (kurvanya landai ke kiri atau ke kanan). Salah satu rumus yang menyatakan kurva distribusi data adalah koefisien kemiringan yang didasarkan kepada kuartil. KK Q(1) Q(3) - 2M ; - 1 KK 1 Q (3) - Q(1) KK > 0; kurva miring positif (kurva landai ke kanan) KK = 0; kurva simetri KK < 0; kurva miring negatif (kurva landai ke kiri)