Statistika dan Aplikasi Komputer Sesi 2: Ukuran Sentral dan Persebaran Program Pasca Sarjana Universitas Indonesia Magister Kajian Kependudukan & Ketenagakerjaan Semester Gasal 2012/2013 Garis Besar • Meninjau tugas pertemuan ke-1 • Ukuran sentral/pemusatan: Rerata/rata-rata, median, modus • Ukuran persebaran: range (jangkauan), deviasi/simpangan rata-rata, varians, standar deviasi (simpangan baku); • Ukuran kecondongan (skewness); dan • Distribusi frekuensi dan latihan 12/09/2012 E. L. Pardede 2 Tugas 1: Populasi & Sampel di mana: = proporsi populasi P = proporsi sampel n = besarnya sampel Untuk tingkat keyakinan 95% E. L. Pardede 3 Hasil Pilkada Gubernur DKI Jakarta Sumber: (3) Diolah dari http://www.republika.co.id/berita/menuju-jakarta1/news/12/07/19/m7ev7i-ini-hasil-resmi-jumlah-suara-pilkada-dki-putaran-satu 12/09/2012 4 Ukuran Pemusatan/Sentral Ukuran pemusatan: nilai tunggal yang mewakili suatu kumpulan data yang menunjukkan (lokasi) pusat dari nilai data 1. Rata-rata hitung (arithmetic mean): rata-rata hitung populasi dan sampel, rata-rata hitung tertimbang (weighted mean) 2. Median (nilai tengah) 3. Modus: nilai yang paling sering muncul 12/09/2012 E. L. Pardede 5 Rata-rata Hitung Populasi Untuk data tidak berkelompok, rata-rata hitung populasi adalah jumlah seluruh nilai dalam populasi dibagi dengan jumlah observasi dalam populasi: di mana (myu) rata-rata hitung populasi N = jumlah observasi dalam populasi X = nilai tertentu dalam populasi = penjumlahan dari.... E. L. Pardede 6 Rata-rata Hitung Sampel Untuk data tidak berkelompok, rata-rata hitung sampel adalah jumlah seluruh nilai dalam sampel dibagi dengan jumlah observasi dalam sampel: di mana X bar, rata-rata sampel n = jumlah observasi dalam sampel E. L. Pardede 7 Rata-rata Hitung Tertimbang Rata-rata hitung tertimbang dari sekelompok angka X1, X2, ..., Xn, dengan bobot w1, w2, ...,wn, dapat dihitung dengan rumus berikut: E. L. Pardede 8 Latihan 1 E. L. Pardede 9 Ciri-ciri/Sifat dari Rata-rata Hitung Rata-rata hitung paling sering digunakan; membutuhkan data dengan skala pengukuran interval dan rasio. Sifat/ciri utamanya: – Semua nilai observasi digunakan dalam penghitungan – Setiap data memiliki nilai rata-rata hitung yang unik – Dihitung dengan menjumlahkan semua nilai dibagi dengan jumlah observasi – Jumlah simpangan (deviasi) dari nilai rata-rata adalah nol. – Nilainya dipengaruhi oleh nilai data yang ekstrim (besar atau kecil) 12/09/2012 E. L. Pardede 10 Median Median atau nilai tengah adalah titik tengah dari nilai-nilai observasi setelah observasi diurutkan dari nilai terkecil ke nilai terbesar (membagi observasi menjadi dua atau masing-masing 50%). – Nilai di atas dan di bawah median jumlahnya sama dalam data yang terurut. – Untuk observasi yang jumlahnya genap, median adalah rata-rata hitung dari dua nilai di tengah data terurut. 12/09/2012 E. L. Pardede 11 Ciri-ciri/Sifat Median • Nilai median unik untuk setiap data. • Tidak terpengaruh oleh nilai yang ekstrim (sangat besar atau sangat kecil) tepat untuk menggambarkan kecenderungan sentral ketika ada nilai-nilai ekstrim • Bisa dicari/dihitung untuk data yang berskala ukuran rasio, interval, dan ordinal. • Dapat dihitung untuk distribusi frekuensi dengan kelas interval yang terbuka jika mediannya tidak di kelas yang terbuka tersebut. 12/09/2012 E. L. Pardede 12 Modus Modus adalah nilai obervasi yang paling sering muncul. E. L. Pardede 13 Latihan 2 E. L. Pardede 14 Kapan menggunakan ukuran sentral tertentu? • Modus: paling mudah, tetapi paling tidak cukup untuk menggambarkan ukuran sentral • Median: lebih berguna dan lebih mudah dipakai, terutama jika ada nilai ekstrim • Tetapi Rata-rata hitunglah yang memperhitungkan semua nilai dalam observasi dan yang paling sering digunakan 12/09/2012 E. L. Pardede 15 Posisi Relatif dari Rata-rata, Median dan Modus E. L. Pardede 16 Ukuran persebaran Untuk apa mempelajari ukuran persebaran? – Pengukuran seperti rata-rata atau median penting untuk menggambarkan pusat/sentral dari data, tetapi ukuran ini tidak menggambarkan apa pun tentang persebaran data. – Contoh: kedalaman sungai yang akan diseberangi; – Persebaran data dapat dibandingkan dengan melihatnya dalam distribusi tertentu. 12/09/2012 17 E. L. Pardede Ukuran-ukuran persebaran • Range Range = Nilai Terbesar – Nilai Terkecil (jangkauan) • Simpangan/Deviasi Rata-rata • Varians Populasi • Standar Deviasi Populasi 18 Varians & Standar Deviasi Sampel Faktor Koreksi • Varians sampel • Standar Deviasi Sampel E. L. Pardede 19 Latihan 3 E. L. Pardede 20 Rata-rata Hitung untuk Data Berkelompok di mana: M = f = n = 12/09/2012 rata-rata sampel nilai tengah dari setiap kelas/kelompok frekuensi dari tiap kelas jumlah observasi dalam sampel 21 E. L. Pardede Standar Deviasi/Simpangan Baku dari Data Berkelompok di mana: s M = f = n = = 12/09/2012 standar deviasi sampel nilai tengah dari setiap kelas/kelompok frekuensi dari tiap kelas jumlah observasi dalam sampel rata-rata sampel 22 E. L. Pardede Median dari Data Berkelompok di mana: Md median sampel L = batas bawah/tepi kelas lokasi median n = jumlah observasi dalam sampel Cf = frekuensi kumulatif sebelum kelas lokasi median f = frekuensi dari tiap kelas i = besarnya interval kelas 12/09/2012 23 E. L. Pardede Modus dari Data Berkelompok di mana: Mo modus sampel L = batas bawah/tepi kelas lokasi modus d1 = selisih frekuensi kelas lokasi modus dengan frekuensi kelas sebelumnya d2 = selisih frekuensi kelas lokasi modus dengan frekuensi kelas sesudahnya i = besarnya interval kelas 12/09/2012 24 E. L. Pardede Teorema Chebyshev • Teorema Chebyshev: Untuk suatu kelompok data (sampel/populasi), proporsi nilai-nilai yang berada dalam standar deviasi dari rata-rata hitung k sekurang-kurangnya 1-1/k2, di mana k merupakan konstanta bernilai > 1. • Implikasinya: 75% atau ¾ data berada pada kisaran ± 2s, 89,9% data berada pada kisaran ± 3s, dan 96% data berada pada kisaran ± 5s. 12/09/2012 25 E. L. Pardede Teorema Chebyshev: Contoh Nilai rata-rata hitung harga saham ( ) Rp. 490,7 dengan standar deviasi (s) Rp. 144,7. Berapa jumlah perusahaan dengan harga saham berkisar Rp. 201,3 – Rp. 780,1? (210,3; 780,1) = 490,7 ± 2 x 144,7 (210,3; 780,1) = ± 2s, berarti k = 2 Dengan rumus 1-1/k2 = 1-1/22 = 1-1/4=3/4 (75%) 12/09/2012 E. L. Pardede 26 Hukum Empirik Distribusi Simetrik 12/09/2012 27 E. L. Pardede Ukuran Kecondongan (Skewness) • Selain ukuran sentral (rata-rata, median, dan modus) dan ukuran persebaran (range, varians, standar deviasi), karakteristik lain dari data adalah bentuknya. • Berdasarkan pengamatan, ditemukan ada empat bentuk kecondongan data yang umum: – – – – 12/09/2012 Simetris (symmetric) Condong positif (positively skewed) Condong negatif (negatively skewed) Bimodal. E. L. Pardede 28 Bentuk-bentuk Kecondongan Data 12/09/2012 E. L. Pardede 29 Rumus Ukuran Kecondongan • Nilai koefisien kecondongan (skewness atau sk): -3 sk 3. – Nilai sk yang mendekati -3, misalnya -2,57: kecondongan negatif yang besar – Nilai sk 1,63: kecondongan positif yang sedang – Nilai sk 0, yang muncul jika rata-rata dan median sama: distribusi simetris dan tidak terdapat kecondongan. 12/09/2012 30 Pearson’s coefficient of skewness E. L. Pardede Tugas: Ukuran Sentral & Persebaran 1. Berdasarkan data 50 Lansia dari IFLS 2007: a) Hitung rata-rata, median, dan modus usia untuk seluruh sampel dan masing-masing untuk lansia laki-laki dan lansia perempuan! b) Hitung jangkauan, varians, dan standar deviasi usia lansia laki-laki dan lansia perempuan! Apa yang dapat Anda simpulkand dari hasilnya? c) Sampel mana yang persebaran usianya paling mendekati simetris? (Hitung kecondongannya!) 12/09/2012 E. L. Pardede 31 Tugas: Ukuran Sentral & Persebaran 2. Pilih sampel acak 3 kali (=3 sampel) dari populasi tinggi badan mahasiswa S2KK BKKBN/Reguler (5 orang dari 16 orang). a) Hitung standar deviasi ketiga sampel tersebut! b) Apakah terbukti perlunya faktor koreksi (n-1) untuk standar deviasi sampel (s) agar lebih mendekati standar deviasi populasi ()? 12/09/2012 E. L. Pardede 32 Tugas: Ukuran Sentral & Persebaran 3. Kelompokkanlah data Lansia dalam 5 tahunan (60-64, 65-69, dst.). a) Hitung rata-rata, median, modus, varians, dan standar deviasi data tersebut dengan metode untuk data berkelompok! b) Bandingkan hasilnya dengan hasil dalam tugas no. 1. Apakah rumus data terkelompok tersebut merupakan aproksimasi yang baik untuk ukuran sentral dan persebaran? 12/09/2012 E. L. Pardede 33