Ilustrasi Data nilai ujian Statistik Dasar dari 15 mahasiswa Program Studi tertentu semester ganjil tahun 2008: 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 Statdas, Februari 2009 1. Populasi dan Sampel 2. Statistik dan Statistika Berapa rata‐ rata nilai ujian? 3. Jenis‐jenis Observasi 4. Statistika Deskriptif •Sari Numerik •Penyajian Data Statistika deskriptif © 2008 by USP & UM ; last edited Feb’09 Apakah rata‐rata nilai tahun ini lebih baik daripada tahun lalu? Seberapa menyebarnya kemampuan dari mahasiswa? Adakah mahasiswa yang perlu perhatian khusus? Inferensi statistik © 2008 by UM Statistik dan Statistika Jenis‐jenis Statistika 1. Statistika deskriptif: metode yang berkaitan Statistik : nilai-nilai ukuran data yang mudah dimengerti. Contoh : statistik liga sepak bola Indonesia dengan pengumpulan dan penyajian data. 2. Statistika inferensi: metode yang berkaitan dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi. (Pokok Bahasan/Bab 9-12) Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data. © 2008 by UM 2 3 © 2008 by UM 4 1 Populasi dan Sampel Jenis‐jenis Observasi Populasi OBSERVASI / DATA KUALITATIF Sampel setiap obyek populasi memiliki kemungkinan/kesempatan yang p sama untuk terpilih Nominal Ordinal/Rank Diskrit Kontinu Sampel Acak hasil pengukuran atau pengamatan Data © 2008 by UM 5 Tidak mengenal urutan dan operasi aritmatika Mengenal urutan dan operasi aritmatika B h b Berhubungan d dengan ‘proses menghitung’, dan pengamatan atas himpunan terhitung. Didasarkan pada suatu selang/interval sehingga meliputi semua bilangan riil Warna batuan (abuabu, hitam, putih, coklat, dll), jenis kelamin , dll Ukuran baju (S, M, L, XL), ukuran kepuasan (tidak suka sama sekali, tidak suka, biasa saja, suka, sangat suka) Banyaknya pekerja yang dibutuhkan dalam suatu area pertambangan, jarak yang dilangkahi seseorang (bisa mundur, bisa maju) per 0,5 meter Berat batuan, luas area pertambangan, jarak tempuh truk pengangkut, suhu, dll 6 © 2008 by UM Karakteristik Distribusi Statistika Deskriptif 1. PARAMETER DISTRIBUSI Metode yang berkaitan dengan pengolahan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Ukuran Pemusatan Ukuran Uk Penyebaran 2. BENTUK DISTRIBUSI bentuk distribusi data © 2008 by UM KUANTITATIF 7 Berpuncak Jamak Berpuncak Tunggal # modus > 1 # modus = 1 mean, median, modus, kuartil atas, kuartil bawah, dll Range, simpangan baku, variansi, jangkauan antar kuartil, dll Kemencengan skewness Kelancipan kurtosis Simetris Menceng/skew Positif Menceng/skew Negatif mean = median mean > median mean < median © 2008 by UM 8 2 CONTOH KASUS Ukuran Pemusatan Data Berikut adalah data nilai ujian Statistik Dasar dari 15 mahasiswa Program g Studi tertentu. ((n = 15)) 1. Mean (rata-rata) 1 x= n 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 x1 x2 x9 x12 x15 Data yang diurutkan: x(9) x(12) i i =1 Contoh : x1 + x2 + ... + x15 15 87 + 37 + ... + 46 = = 67, 60 15 x(15) maksimum minimum Adakah perbedaan dari penyajian kedua data di atas? 9 © 2008 by UM 26 37 39 46 49awal) 59 ) 69 76 8350% data (akhir 83 83 87 akhir) 87 95 50 % data (awal 50 % data ( 50% data ( ) 95 x(8) 3x 2x © 2008 by UM 10 4. Kuartil 26 37 39 46 49 25 % 59 69 76 8325 % 83 83 87 87 95 95 25 % 25 % 2x 2. Median Nilai tengah yang membagi dua kelompok data sama banyak. q1 q3 q2 = med Kuartil bawah (q1) : q1 = x ⎛ n +1 ⎞ q1 = x⎛ 15+1 ⎞ = x(4) = 46 ⎜ ⎟ ⎝ 4 ⎠ med = x(8) = 76 ⎜ ⎟ ⎝ 4 ⎠ Kuartil tengah g (q2) : q2 = x⎛ 2(( n +1)) ⎞ = x⎛ n +1 ⎞ ⎜ ⎝ 3. Modus Nilai yang paling sering muncul. mod = 83 © 2008 by UM ∑x x= 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x(1) x(2) n 4 ⎟ ⎠ ⎜ ⎟ ⎝ 2 ⎠ q2 = x⎛ 15+1 ⎞ = x(8) = 76 ⎜ ⎟ ⎝ 2 ⎠ Kuartil atas (q3) : q3 = x⎛ 3( n +1) ⎞ 11 © 2008 by UM ⎜ ⎝ 4 ⎟ ⎠ q3 = x⎛ 3(15+1) ⎞ = x(12) = 87 ⎜ ⎝ 4 ⎟ ⎠ 12 3 5. Persentil Ukuran Penyebaran Data 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p25 p75 p50 = med • Persentil ke-i : 1. Jangkauan data (Range) R = 95 – 26 = 69 R = datamax – datamin 2. Variansi = x⎛ i ( n +1) ⎞ ⎛ 1 n 1 ⎜ 2 s2 = x x − = ( ) ∑ i n − 1 i =1 n − 1 ⎜⎜ ⎝ ⎜ ⎟ ⎝ 100 ⎠ • Persentil ke-50 : = x 50( n +1) = x n +1 ⎛ ⎞ ⎛ ⎞ ⎜ ⎝ 100 ⎟ ⎠ ⎜ ⎟ ⎝ 2 ⎠ • Persentil ke-25 dan Persentil ke-75? kuartil bawah kuartil atas 13 Data Pencilan Data yang nilainya berbeda jauh dari kelompok g lain. yang data y Bagaimana mendeteksi data pencilan ?? 1. Hitung dq dq = 41 2. Hitung BBP = q1 – k.dq BBP = 46 – (1,5)(41) = -15,5 Pilih nilai k = 3/2 (tidak mutlak) 3. Hitung BAP = q3 + k.dq BAP = 87 + (1,5)(41) = 148,5 4. Pencilan bawah < BBP tidak ada pencilan bawah 5. Pencilan atas > BAP © 2008 by UM 2 ⎞ ⎟ ⎟ ⎟ ⎠ s2 = 529,2571 JKXX median © 2008 by UM ⎛ n ⎞ ⎜ ∑ xi ⎟ n ⎝ i =1 ⎠ 2 x − ∑ i n i =1 tidak ada pencilan atas 15 3. Simpangan Baku (standard deviation) s = 529, 2571 = 23, 01 s = √s2 4. Jangkauan antar kuartil dq = q3 – q1 dq = q3 – q1 = 87 – 46 = 41 © 2008 by UM SARI NUMERIK Count (banyak data, n) Sum (jumlah data) Average (rata-rata) Median (kuartil tengah) Mode (modus) Minimum Maximum Range Standard Deviation Variance Skewness Kurtosis 25th Percentile (persentil-25) 50th Percentile (persentil-50) 75th Percentile (persentil-75) Interquartile Range (dk) * Perhitungan dengan Mic. Excel © 2008 by UM 15 1014 67.6 76 83 26 95 69 23.01 529.2571 -0.50* -1.23* 46 76 87 41 14 mean < median Menceng kiri 16 4 Penyajian Data Pie Chart 1. 1 Pie Chart 9 9% 10% 2. Dot Plot 3. Histogram 23% 58% 4. Diagram Batang – Daun (stem ‐ leaf) 5. Diagram Kotak – Titik (box plot) 6. y Pie Pi chart h t merupakan k grafik fik yang b berbentuk b t k li lingkaran k yang dll… Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik. Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya. © 2008 by UM mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%). y Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kelompok data. 17 © 2008 by UM 18 Histogram Dot Plot 3.5 3 frekuensi 2.5 2 1.5 1 0.5 0 0 20 40 60 80 100 nilai y Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutan y Titik ditumpuk diatas nilai data yang digambarkan. © 2008 by UM y Histogram adalah gambar berdasarkan distribusi frekuensi y Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle). y Daerah setiap rectangle sebanding dengan frekuensinya. 19 © 2008 by UM 20 5 Diagram Batang-Daun (Stem-Leaf) Diagram Kotak‐Titik (Box‐Plot) 100 max 95 90 85 80 q2 76 70 q3 mean 60 50 47.5 40 30 q1 min 26 20 10 y Stem atau batang, g mirip dengan g g grup data pada histogram, g 0 sedangkan leaf atau daun, mirip dengan frekuensi. y Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di belakangnya akan merupakan leaf atau daun. y Melalui stem-Leaf masih dapat dilihat nilai data mentahnya. © 2008 by UM 21 menggunakan grup data seperti pada histogram dan diagram batang daun. y Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak. 22 © 2008 by UM Kelemahan dan Keunggulan Pencilan pada Box Plot * y Box B Plot Pl t di digunakan k untuk t k menyelidiki lidiki di distribusi t ib i ttanpa KELEMAHAN DOT PLOT pencilan atas Tidak efektif untuk ukuran data yang besar Lama max kedua q3 q2 HISTOGRAM Nilai data tidak nampak mean BATANG‐DAUN min ketiga © 2008 by UM Nilai data asli dapat diperkirakan Nil i d li d di ki k Histogram peluang dapat memberi gambaran tentang distribusi populasi Tidak menuntut ketelitian dalam mencatat setiap nilai data Cepat q1 * * Banyak perhitungan KEUNGGULAN Cepat pencilan bawah BOX PLOT 23 © 2008 by UM Tidak memerlukan perhitungan Menuntut ketelitian mencatat Nilai data asli dapat dilihat p daun Memudahkan perhitungan berbagai parameter Membutuhkan perhitungan yang panjang Box plot dapat memberi gambaran tentang bentuk distribusi populasi Terdiri dari parameter‐ parameter dari data yang sudah diurutkan Efektif untuk membandingkan bentuk distribusi beberapa kelompok data sekaligus 24 6 Bentuk Distribusi Ideal Normal Transformasi Data y Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih simetris. y Transformasi Tangga Tukey -1/x2 -1/x mean = median untuk bentuk distribusi : skewness positif Memiliki bentuk distribusi yang simetris, yaitu : Skewness = 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0 © 2008 by UM 25 Transformasi Data Contoh Kasus x y = x2 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 7569 9 1369 3481 2401 4761 9025 6889 7569 1521 9025 6889 5776 6889 676 2116 © 2008 by UM transformasi Lebih mendekati simetris (skew = 0) dibanding sebelum transformasi (skew = -0,5) √x log (x) x x2 data awal x3 10x untuk bentuk distribusi : skewness negatif Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x. © 2008 by UM 26 Referensi y Djauhari, j M.A., 2001, Catatan Kuliah Analisis Data. y Devore, J.L. and Peck, R., Statistics – The Exploration and Analysis of Data, USA: Duxbury Press, 1997. y Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang dan skew = -0,18 ** Ketika data ditransformasi, maka satuan dari data juga akan berubah 27 Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995. y Walpole, Ronald E. et.al, Probability and Statistics for Engineers and Scientist, 8th Ed., New Jersey: Pearson-Prentice Hall 2007. y Wild, C.J. and Seber, G.A.F., Chance Encounters – A first Course in Data Analysis and Inference, USA: John Wiley&Sons,Inc., 2000. y Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. © 2008 by UM 28 7