ukuran statistik deskriptif

advertisement
UKURAN STATISTIK DESKRIPTIF
Oleh: Sardin
A. Ukuran Statistik, Parameter, dan Statistik
Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan data
statistik melalui proses sritmatik tertentu. Dalam analisis data, ukuran statistik ini
mengisyaratkan gejala spesifik, misalnya Gejala Letak Pusat Pengelompokkan
Data, Gejala Penyebaran/Variasi/ Keseragaman Data, atau gejala lainnya yang
dikandung oleh data yang sedang dianalisis.
Apabila ukuran statistik ini diperolehnya atas dasar perhitungan yang
menyeluruh (complete enumeration) atau sensus, maka namanya parameter,
sedangkan jik adiperolehnya atas dasar perhitungan terhadap data statistik yang ada
dalam sampel, ukuran statistik ini disebut statistik.
B. Ukuran Gejala Pusat
Ukuran ini mengisyaratkan letak pemusatan pengelompokkan data. Oleh
karena itu ukuran-ukuran statistik ini disebut juga Ukuran Letak (Measures of
Location).
1. Rata-Rata Hitung (Average atau Mean)
Terdapat dua rata-rata hitung yaitu rata-rata hitung untuk populasi yang
berukuran N dan rata-rata hitung untuk sampel berukuran n. Jika yang dicari
adalah rata-rata hitung untuk populasi, maka dapat diperoleh dengan
menggunakan rumus:
N

x
i 1
i
N
Contoh 1. Diperoleh data tentang nilai yang diperoleh 5 mahasiswa pada mata
kuliah statistika, yaitu; 30, 50, 60, 40, dan 60. Jika data berasal dari populasi,
hitunglah berapa nilai rata-rata nilai statistika untuk 5 orang di atas.
Jawab: Karena data berasal dari populasi, maka rata-rata dapat dihitung sebagai
berikut:

30  50  60  40  60
 48
5
Jika yang dicari adalah rata-rata sample, maka rata-rata dapat diperoleh dengan
menggunakan rumus:
n
x
x
i 1
i
n
Contoh 2. Seorang pengamat makanan mengambil secara random sebanyak 7
kaleng terhadap makanan kaleng yang bertujuan untuk mengetahui kadar zat
beracun (dalam prosen) yang terdapat dalam kaleng tersebut. Data yang
dikumpulkan dari 7 buah kaleng tersebut adalah: 1,8 , 2,1 , 1,7 , 1,6 , 0,9 , 2,7 ,
dan 1,8. Hitunglah rata-rata sampel?
Jawab: karena data berasal dari sampel, maka dapat dihitung:
x
1,8  21,  1,7  0,9  2,7  1,8
 1,8%
7
Rumus yang dipergunakan untuk menghitung rata-rata dari data bergolong
adalah:
X
f x
f
i
i
i
Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah:
a. Nilai numerik rata-rata hitung ditentukan secara ketat oleh bilanganbilangan yang menyusunnya.
b. Nilai numerik rata-rata hitung adalah unik.
c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim.
d. Rata-rata hitung hanya boleh dihitung (valid sebagai ukuran gejala pusat)
untuk variabel yang memenuhi tingkat pengukuran sekurang-kurangnya
interval,
e. Apabila dalam rentetan data yang dihadapi terdapat bilangan ekstrim, tidak
disarankan untuk menggunakan rata-rata hitung sebagai ukuran gejala
pusat, sebab bisa memberikan kesimpukan yang keliru.
f. Tidak disarankan untuk mengambil kesimpulan yang hanya didasarkan
kepada rata-rata hitung.
2. Median
Median merupakan suatu harga yang merupakan titik tengah dari
keseluruhan harga pada suatu satuan data. Oleh karena itu terdapat 50% data
yang berada di bawah atau sama dengan nilai tersebut dan terdapat 50% lagi
data yang berada di atas atau sama dengan data tersebut.
Contoh 3. Dari 5 orang mahasiswa yang mengikuti ujian statistik diperoleh
angka; 82, 93, 86, dan 79. Tentukan median jika data tersebut berasal dari
populasi.
Jawab: angka yang diperoleh harus disusun terlebih dahulu dari kecil ke besar,
sehingga diperoleh:
79
82
86
92
93
Jadi median dari data tersebut adalah : Me = 86
Contoh 4. Untuk mengetahui kadar nikotin yang terkandung di dalam rokok,
diambil sampel berukuran 6 (rokok) yang diperoleh data (dalam miligram)
sebagai berikut: 2,3 , 2,7 , 2,5 , 2,9 , 3,1 , dan 1,9. Tentukan mediannya!
Jawab: Data diurutkan dari kecil ke besar, sehingga diperoleh:
1,9
2,3
2,5
2,7
2,9
3,1
Median terletak antara angka 2,5 dan 2,7, oleh karena itu median ditentukan
dengan cara:
Me 
2,5  2,7
 2,6 mi ligram
2
Untuk menghitung Median dari data bergolong, dipergunakan rumus:
 1 n -F
Me  b  p  2

 f 
b
p
F
f
=
=
=
=
batas bawah, di mana median akan terletak
panjang kelas interval
jumlah semua frekuansi sebelum kelas interval
frekuensi kelas median
Adapun yang menjadi sifat-sifat dari penggunaan median adalah sebagai
berikut:
a. Nilai numerik median tidak ditentukan secara ketat oleh bilangan-bilangan
yang menyusunnya. Oleh karena itu, jika dalam rentetan bilangan ada yang
berubah nilai numeriknya, median belum tentu berubah.
b. Median tidak dipengaruhi oleh nilai ekstrim, dan nilai median adalah unik.
c. Median boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel
yang memenuhi skala pengukuran sekurang-kurangnya ordinal.
Apabila dalam rentetan bilangan terdapat nilai ekstrim, disarankan untuk
menggunakan median sebagai pengganti rata-rata hitung.
3. Modus
Modus didefinisikan sebagai bilangan yang paling banyak muncul atau
bilangan yang frekuensi kemunculannya paling besar dari sutau satuan data.
Modus tidak selalu dengan mudah diperoleh. Hal ini akan terjadi jika
dihadapkan pada suatu harga yang mempunyai frekuensi kemunculan yang
sama dengan yang lainnya.
Contoh 5. Jika diperoleh data tentang besarnya sumbangan yang diberikan oleh
tiap propinsi untuk pengungsian di Aceh yang dinyatakan dalam juta, diperoleh
data: 9, 10, 5, 9, 9, 7, 8, 6, 10, dan 11 juta, maka modus dalam hal ini adalah 9
juta.
Contoh 6. Dikumpulkan data terhadap 12 sekolah menengah umum yang
diambil secara acak untuk mengetahui banyaknya siswa di sekolah tersebut
yang diterima di PTN. Diperoleh data; 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1, dan 4. Pada
kasus ini terjadi dua bilangan yang frkeuensi kemunculannya paling banyak
yaitu 2 dan 4, dan kedua bilangan tersebut adalah modus untuk data yang kita
peroleh ini. Jika terjadi pada suatu satuan data bermodus seperti ini disebut
bimodal.
Contoh 7. Tidak terdapat modus pada satuan data yang diperoleh pada contoh
3.
Untuk menghitung modus pada data bergolong dipergunakan rumus:
 b 
Mo  b  p  1 
 b1  b2 
b
p
b1
b2
= batas kelas interval dengan frekuensi terbanyak
= panjang kelas interval
= frekuensi pada kelas modus dikurangi frekwensi kelas terdekat
sebelumnya
= frkuensi kelas modus dikurangi frekuensi kelas interval
berikutnya.
Adapun yang menjadi sifat-sifat dan penggunaan modus adalah sebagai
berikut:
a. Nilai numerik modus tidak unik (dalam sebuah rentetan data bisa terdapat
lebih dari sebuah modus).
b. Modus digunakan sebagai ukuran gejala pusat untuk variabel dengan
tingkat pengukuran sekurang-kurangnya nominal.
Dari sifat-sifat penggunaan ukuran gejala pusat berdasarkan skala
pengukuran, maka dapat digambArkan secara sederhana seperti pada tabel 2.1. di
bawah ini
TABEL 2.1.
PENGGUNAAN UKURAN GEJALA PUSAT
BERDASARKAN SKALA PENGUKURAN DATA
Skala
Pengukuran
Nominal
Ordinal
Interval/Rasio
Mean
V
Ukuran Gejala Pusat
Median
Modus
V
V
V
V
V
C. Ukuran Dispersi atau Ukuran Variasi
Selain ukuran gejala pusat, terdapat ukuran lain yaitu ukuran dispersi atau
ukuran vasiasi yang mengisyaratkan keseragaman data. Nilai numerik ukuran ini
tidak pernah negatif (selalu positif). Apabila nilai ukuran ini diperoleh sama
dengan nol (0), hal ini menunjukkan bahwa data yang kita miliki keadaannya
seragam sempurna (tidak ada variasi, atau semua bilangan nilai numeriknya sama).
Oleh karena itu makin jauh nilai numerik ukuran ini dari nol (0), makin tidak
seragam keadaan data tersebut. Terdapat bebeapa ukuran variasi yang biasa
digunakan, yang juga akan diuraikan di sini, adalah; rentang (range), varians
(variance), simpangan baku (standar deviation), koefisien variasi (koeficient of
variation), rentang antar kuartil (interquartiles ranges), dan indeks dispersi (index
of dispersion).
1. Rentang
Rentang pada suatu satuan data adalah selisih terbesar dan terkecil dari
suatu satuan data tersebut.
Contoh 8. IQ lima orang anggota keluarga adalah; 108, 112, 127, 118, dan 113.
Tentukan rentangnya!
Jawab: Rentang dari 5 IQ tersebut adalah 127 – 108 = 19.
2. Varians (variance)
Rumus yang dipergunakan untuk menghitung varians, jika data berasal dari
populasi adalah:
 N 
  xi 
N
2  i 1

x1 
N
 2  i 1
N
2
Sedangkan varians yang dihitung berdasarkan sampel dihitung dengan rumus:
 n 
  xi 
n
2  i 1

x1 
n
s 2  i 1
n -1
2
3. Simpangan Baku (Standar Deviation)
Simpangan baku didefinisikan sebagai akar dari Varians. Oleh karena itu rumus
simpangan baku adalah:
  2
Untuk sampel adalah;
s  s2
Varians dan simpangan bau hanya boleh digunakan sebagai alat pembanding
keseragaman data, apabila data yang dibandingkan keseragamannya itu berasal
dari variabel yang sama dengan satuan pengukuran (unit of measurement) yang
sama pula.
Varians dan Simpangan Baku hanya valid digunakan sebagai ukuran variasi
untuk variabel yang memenuhi tingkat pengukuran sekurang-kurangnya
interval.
4. Indeks Dispersi atau Indeks Variasi Kualitatif (Index of Dispersion or
Index of Qualitative Variation)
Untuk mengukur keseragaman (variasi) data yang mempunyai tingkat
pengukuran nominal, digunakan Indeks dispersi dengan rumus:
2
 C  C 2
C.   f i  -  f i
ID   i 1 2 i 1
 C 
  f i  c - 1
 i 1 
Nilai numerik ID terbatas: 0  ID  1
ID = 0 menunjukkan bahwa data seragam sempurna. Keadaan ini terjadi
apabila semua frekuensi terdapat pada satu kategri dan kategori lainnya
frekuensinya sama dengan nol (0). ID=1 mengisyaratkan variasi maksimal.
Fenomenon ini terjadi jika frekuensi terbagi rata untuk semua kategori.
Contoh:
Hasil penelitian Mahasiswa di Desa X tentang jenis pekerjaan penduduk
disajikan dalam data sebagai berikut:
No.
Kategori Pekerjaan
1.
PNS
2.
ABRI
3.
Pedagang
4.
Petani
5.
Buruh
6
Pelajar/Mahasiswa
7.
Lain-lain
Jumlah penduduk 15 tahun lebih
Banyaknya
75
9
38
142
208
196
81
749
Untuk menghitung Indeks Dispersi diperlukan data:
No.
1.
2.
3.
4.
5.
6
7.
Jumlah
ID 
Kategori Pekerjaan
PNS
ABRI
Pedagang
Petani
Buruh
Pelajar/Mahasiswa
Lain-lain
(7) (749 2 - 115555)
 0,926356637
(7492 ) (7 - 1)
fi
75
9
38
142
208
196
81
749
fi2
5625
81
1444
20164
43264
38416
6561
115555
Jika dijadikan persen, maka ID = 92,6356637%, dibulatkan ID = 92,6%.
5. Ukuran Kemiringan
Ukuran statistik ini mengisyaratkan keadaan bentuk kurva distribusi data nilainilai sebuah variabel, apakah Simetri atau Miring (kurvanya landai ke kiri atau
ke kanan).
Salah satu rumus yang menyatakan kurva distribusi data adalah koefisien
kemiringan yang didasarkan kepada kuartil.
KK 
Q(1)  Q(3) - 2M
; - 1  KK   1
Q (3) - Q(1)
KK > 0; kurva miring positif (kurva landai ke kanan)
KK = 0; kurva simetri
KK < 0; kurva miring negatif (kurva landai ke kiri)
Download