STATISTIK DISKRIPTIF Seorang manajer bank ingin mengetahui nasabah dar banknya berkisar umur berapa, ketika mengambil atau menabung berapa jumlah uang yang ditarik atau ditabung? 3.1 Ukuran Pemusatan Untuk Data Tidak Berkelompok. Salah satu ukuran untuk menggambarkan sekelompok data adalah ukuran pemusatan (central of tendency). Ukuran pemusatan (central of tendency) memberikan informasi mengenai pusat atau nilai tengah dari sekelompok angka. Contoh. Data Tidak Berkelompok: Umur Pembeli HP 28 23 27 30 24 35 29 21 25 18 21 31 19 22 44 17 24 29 42 31 24 41 34 24 27 32 28 25 25 35 25 17 24 29 22 Data Tidak Berkelompok: Umur Pembeli HP 28 23 27 30 24 35 29 21 25 18 21 31 19 22 44 17 24 29 42 31 24 41 34 24 27 32 28 25 25 35 25 17 24 29 22 Ukuran pemusatan dapat menyediakan informasi umur rata-rata manajer UKM; umur manajer UKM yang terletak ditengah atau umur yang paling sering muncul. Ukuran pemusatan untuk data tidak berkelompok: a) The Mode (Modus) b) The Median (Nilai tengah) c) The Mean (Rata-rata) The mode. The mode adalah nilai yang sering muncul dalam sejumlah data tertentu. Cara mengetahui the mode: Mengurutkan data Steam and Leaf Data Tidak Berkelompok: Umur Pembeli HP 28 23 27 30 24 35 29 21 25 18 21 31 19 22 44 17 24 29 42 31 24 41 34 24 27 32 28 25 25 35 25 17 24 29 22 Mengurutkan data 28 23 27 30 24 35 29 21 25 18 32 28 25 25 35 25 17 24 29 22 24 41 34 24 27 21 31 19 22 44 17 24 29 42 31 Setelah diurutkan menjadi: 17 17 18 19 21 21 22 22 23 24 24 24 24 24 25 25 25 25 27 27 28 28 29 29 29 30 31 31 32 34 35 35 41 42 44 17 17 18 19 21 21 22 22 23 24 24 24 24 24 25 25 25 25 27 27 28 28 29 29 29 30 31 31 32 34 35 35 41 42 44 Jumlah angka paling banyak adalah = 24 tahun Umur Manajer UKM 86 77 91 60 55 76 92 47 88 67 23 59 72 75 83 77 68 82 97 89 81 75 74 39 67 79 83 70 78 91 68 49 56 94 81 Steam and Leaf Steam Leaf 2 3 3 9 4 7 9 5 5 6 9 6 0 7 7 8 8 7 0 2 4 5 5 6 7 7 8 1 1 2 3 3 6 8 9 9 1 1 2 4 7 8 9 LATIHAN: Data Tidak Berkelompok: Umur Manajer Perusahaan 42 26 32 34 57 30 58 37 50 30 53 40 30 47 49 50 40 32 31 40 52 28 23 35 25 30 36 58 26 50 55 30 43 64 52 49 33 43 46 32 61 31 30 40 60 74 37 29 43 54 Data Tidak Berkelompok: Umur Pembeli HP 28 23 27 30 24 35 29 21 25 18 21 31 19 22 44 17 24 29 42 31 24 41 34 24 27 32 28 25 25 35 25 17 24 29 22 The Median. The median adalah nilai tengah dari sejumlah angka yang telah diurutkan. Jika jumlah angka dari sejumlah angka tersebut adalah ganjil, maka mediannya adalah angka yang dtengah Jika jumlah angka dari sejumlah angka tersebut adalah genap, maka mediannya adalah dua angka yang dtengah dibagi 2 Contoh: Angka berjumlah ganjil 28 23 27 30 24 35 29 21 25 18 35 29 21 25 18. Urutkan menjadi: 18 18 21 21 23 24 25 25 27 28 29 29 30 35 35. Nilai median =25 Angka berjumlah genap 28 23 27 30 24 35 29 21 27 18 35 29 21 25 18 12. urutkan menjadi 12 18 18 21 21 23 24 25 27 27 28 29 29 30 35 35. Nilai median = (25+27)/2 = 26 The Mean. a) The arithmetic mean (average) (μ) untuk populasi dan ( ) untuk sampel adalah penjumlahan seluruh angka dibagi dengan jumlah angka. o Populaton mean = μ = o Sampel mean = 𝐗 = 𝐍 𝐢=𝟏 𝐗 𝐢 𝐍 𝐢=𝟏 𝐗 𝐢 𝐧 𝐍 Contoh. Ada 5 kecelakaan pada hari rabu di beberapa kota. Korbannya 24,13,19,26, dan 11 pasien. The population mean = (24 + 13 + 19 + 26 + 11)/5 = 18,6 Ada angka 57,86,42,38,90 dan 66, maka jika angka ini merupakan sampel, maka sample mean= Sample mean = (57+86+42+38+90+66)/6 = 63,167 3.2 Penghitungan The Mean untuk Data Berkelompok. Kelompok data tidak memberikan informasi mengenai nilai individu. The mean untuk data berkelompok = o μdata berkelompok = Contoh. 𝐟𝐌 Umur Frekuensi 𝐟 10-15 6 15-20 22 20-25 35 25-30 29 30-35 16 35-40 8 40-45 4 45-50 2 Umur Frekuensi Nilai Tengah fM 10-15 6 12,5 15-20 22 17,5 20-25 35 22,5 25-30 29 27,5 30-35 16 32,5 35-40 8 37,5 40-45 4 42,5 45-50 2 47,5 75 385 787.5 797.5 520 300 170 95 3,130 122 o μdata berkelompok = = 3,130/122 = 25,66 𝐟𝐌 𝐟 b) The Weighted mean (μ) μ= μ= 𝐰𝟏 𝐗 𝟏+𝐰𝟐𝐱𝟐+𝐖𝟑𝐗𝟑+⋯+𝐖𝐍𝐗𝐍 𝐰𝟏 +𝐰𝟐 +𝐰𝟑 +⋯+𝐰𝐍 𝒘𝒊 𝑿𝒊 𝒘𝒊 Contoh. Sorang mahasiswa memperoleh nilai dar 3 matakuliah yang memiliki bobot 3 sks, 2sks,dan 3 sksk dengan nilai A, B, B. Nilai rata-rata mahasiswa tersebut: μ= 𝟑∗𝟒+𝟐∗𝟑+𝟑∗𝟑 𝟑+𝟐+𝟑 = 3,375 c) The Geometric mean (μ) Geometric mean menghitung rata-rata dengan memperhatikan tingkat pertumbuhan kumulatif dari waktu ke waktu RG = [(1+R1) (1+R1) … (1+R1)]0.5 -1 Contoh. Periode 0 1 2 Harga Saham 500 600 550 R1= (600-500)/500 = 0,2 R1= (550-600)/600 = -0,083 Arithmetic mean = (0,2-0,083)/2 = 0,05833 RG = [(1+0,2)(1-0,083)]0.5-1 = 0,04883 3.3 Ukuran Variabilitas Untuk Data Tidak Berkelompok. Ukuran pemusatan menggambarkan pusat atau dari sejumlah data atau porsi inti (data terpusat) dari sekelompok data. Peneliiti menggunakan ukuran lain yakni variabilitas yang menggambarkan sebaran/dispersi dari sejumlah data. Contoh. Suatu perusahaan memliki 25 orang tenaga pemasaran dan nilai penjualannya terletak pada median $1,200,000. apakah tenaga pemasaran dapat dkatakan berhasil sebagai tim pemasaran atau tidak?. Jika tenaga pemasaran yang lain ada yang menjual $ 5,000,000 dan yang lain $ 150,0000,apakah dianggap berhasil? Variabilitas untuk data: a) Tidak Berkelompok diukur dengan range, mean absolute deviation, variance, dan standard deviation b) Berkelompok diukur dengan variance dan standard deviation Range (jangkauan). Range adalah selisih antara nilai terbesar dengan terkecil dari suatu jumlah data tertentu. Contoh. Jangkauan = 3.240.000 – 540.000 = 2.700.000 Harga Tanah/meter Kota 2012 A Rp 540.000 B 600.000 C 750.000 D 1.300.000 E 1.400.000 F 2.200.000 G 2.800.000 H 3.240.000 Mean Absolute Deviation (MAD). MAD adalah rata-rata nilai deviasi/penyimpangan absolut dari the mean. MAD = ǀ𝐗−𝛍ǀ 𝐍 Contoh. Umur Manajer (Xi) Mean 5 9 16 μ = 65/5 = 13 Deviation from the mean (Xi – μ) ǀX-μǀ -8 8 -4 4 3 3 17 4 4 18 5 5 ∑Xi = 65 ∑(X – μ)=0 ∑ǀX-μǀ=24 MAD = 24/5 = 4.8 3 μ -4 -8 4 5 Series1 Variance dan Standard Deviation. Populasi. Variance adalah rata-rata nilai deviasi/penyimpangan dari the arithmetic mean yang dikuadratkan. Standard Deviation adalah akar dati variance. σ2= σ= 𝐗−𝛍 𝐍 √ 𝟐 𝐗−𝛍 𝐍 𝟐 Contoh. Umur Manajer (Xi) Mean Deviation from the mean (Xi – μ) (Xi-μ)2 -8 64 -4 16 16 3 9 17 4 16 18 5 25 ∑Xi = 65 ∑(X – μ)=0 ∑(Xi-μ)2 =130 5 9 μ = 65/5 = 13 Variance = 130/5 = 26 Standard Deviation = √ 26 = 5.1 Sample. Sample varance (S2) dan sample SD (S). Penggunaan sample variance dan standard deviation merupkan estimasi dari population variance dan standard deviation. Perbedaan population dan sample varance dan standard deviation terletak pada simbol variance dan standard deviation dan pembaginya. Untuk populasi, pembaginya adalah n dan untuk sample, pembaginya adalah n-1. Pembagi n-1 untuk sample varance dan standard deviation akan memberikan hasil estimasi bagi nilai populasi. 2 (𝑿− 𝑿)𝟐 Variance (S )= Deviation Standard (S)=√s2 𝒏−𝟏 Contoh. Dekan mengambil 8 orang mahasiswa sebagai sample untuk diukur tingkat IQ dengan hasil sbb: Mahasiswa IQ (X - Ẋ )2 A 106 138,06 B 109 76,56 C 114 14,06 D 116 3,06 E 121 10,56 F 122 18,06 G 125 52,56 H 129 126,56 ∑Xi =942 ∑(X - Ẋ )2 = 439,48 𝟗𝟒𝟐 𝑿= = 𝟏𝟏𝟕, 𝟕𝟓 𝟖 2 Variance (S )= (𝑿− 𝑿)𝟐 𝟒𝟑𝟗,𝟒𝟖 𝒏−𝟏 = 𝟖−𝟏 = 𝟔𝟐, 𝟕𝟖 Deviation Standard (S)=√s2 = √62,78 = 7,92 Makna Standard Deviation. Apa itu standard deviation? Apa yang standard deviation lakukan dan apa artinya?. Ada 2 cara untuk mengaplkasikan SD: (a) Aturan empiris; dan (b) Teorema Chebyshev (a) Aturan Empiris Aturan ini menyatakan bahwa sebagian besar (hampir semua) nilai-nilai dari sejumlah data berada pada batasan standard deviation dengan syarat sejumlah data tersebut berdistrbusi normal. Aturan empirisnya menggunakan 3 standard deviation: a). 1σ; b). 2σ; dan c). 3σ Jarak dari Rata-Rata Persentase Nilai yang berada dalam jarak μ ± 1σ 68% μ ± 2σ 95% μ ± 3σ 99,7% Contoh. 8 16 18 11 12 17 18 14 20 6 DATA UMUR ARTIS REMAJA 22 17 19 19 16 13 20 16 12 21 13 10 11 20 9 8 16 11 10 18 11 20 18 11 10 8 17 16 7 17 MEAN SD BB BA 14.4 4.44 9.96 18.84 KURANG LEBH 68% DATA BERADA PADA BATAS BB DAN BA b) Teorema Chebyshev Teorema ini berlaku untuk semua distribusi tanpa melihat bentuk. Oleh karena dapat dberlakukan ke semua distribusi, maka teorema ini lebh konservatif daripada aturan empiris. Teorema inii menyatakan bahwa dalam k standard deviation dari mean, maka minimal proporsi data adalah sebesar (1-1/k2) TEOREMA CHEBYSHEV Jumlah SD Jarak dari RataRata Minimum Proporsi Data dalam Jarak (1-1/k2) k=2 μ ± 2σ 1-1/22 =75% k=3 μ ± 3σ 1-1/32 =89% k=4 μ ± 4σ 1-1/42 =94% Oleh karena rumus tersebut digunakan untuk menghitung proporsi dalam teorema chebyshev, maka setiap nilai k > 1 dapat digunakan. Contoh. jika k=2,5, maka minimal 84% nilai data-data terletak dalam μ ± 2.5σ 1-1/k2 = 1-1/2.52 = 0.84 Z Score. Z Score adalah luas standard deviation dari nilai x datas atau dibawah Mean. Z= 𝐱− 𝛍 95% 𝛔 2.5% -2σ +2σ 2.5% Jika Z score negatif berarti data nilai x berada dibawah mean dan jika Z score positf berarti nilai x berada diatas mean. Contoh. Mean = 50 dan standard deviation = 10, maka ahli statistik ingin menentukan Z score untuk nilai 70. Nilai X=70 adalah 20 unit diatas mean. Z = (70-50)/10 = 2. Nilai 70 terletak pada 2σ diatas mean, maka 95% dari data nilai berada antara 30 sampai 70, tapi 5% data nilai berada diluar jangkauan tersebut (dibawah 30 dan atau datas 70) 2.5% 2.5% -2σ 30 +2σ 50 70