36 OUTLINE BAHAN AJAR STATISTIKA DASAR (PAF-201) Kompetensi Umum: Setelah mengikuti matakuliah ini mahasiswa diharapkan mampu menyajikan data yang telah dikumpulkan dan mampu menganalisis meng analisis data statistik secara benar. BAB I. PENDAHULUAN 1.1 Statistik dan Statistika 1.2 Jenis-jenis statistika 1.2.1 Statistika Deskriptif 1.2.2 Statistika Inferensia 1.3 Jenis-Jenis Data 1.3.1 Data Nominal 1.3.2 Data Ordinal 1.3.2 Data Interval 1.3.2 Data Rasio Bab II. I I. TEKNIK TEKN IK MENYAJIKAN DATA DATA 2.1 Pendahuluan 2.2 Statistik Lima Serangkai 2.3 Diagram Dahan dan Daun (Sten-And-Leaf Plot). 2.4 Tabel Distribusi Frekuensi 2.5 Histogram 2.6 Boxplot Bab III. PROBABILITAS 3.1 Permutasi dan Kombinasi 3.2 Definisi probabilitas 3.3 Ruang Kejadian dan Ruang Sampel 3.4 Kejadian Tunggal 37 3.5 Kejadian Majemuk 3.6 Kejadian Saling Bebas 3.7 Kejadian tidak saling bebas Rule) 3.8 Atural Bayes (Bayes Rule) Bab IV. DISTRIBUSI PROBABILITAS 4.1 Pengertian variabel random 4.2 Distribusi Probabilitas 4.3 Distribusi Probabilitas Diskret 4.3.1 Distribusi Binomial 4.3.2 Distribusi Poisson 4.4 Distribusi Probabilitas Kontinu 4.4.1 Distribusi Normal 4.4.2 Distribusi t-Student Bab V. DISTRIBUSI SAMPLING STATISTIK 5.1 Distribusi sampling rata-rata 5.2 Distribusi sampling selisih dua rata-rata 5.3 Distribusi sampling proporsi 5.4 Distribusi sampling selisih dua proporsi 5.5 Distribusi sampling variansi 5.6 Distribusi sampling rasio variansi Bab VI. SELANG KEPERCAYAAN KEPERCAYAAN 6.1 Selang kepercayaan bagi rata-rata 6.2 Selang kepercayaan bagi selisih dua rata-rata 6.3 Selang kepercayaan bagi proporsi 6.4 Selang kepercayaan bagi selisih dua proporsi 6.5 Selang kepercayaan bagi variansi 6.6 Selang kepercayaan bagi rasio variansi 38 Bab VII. UJI HIPOTESIS 7.1 Uji Hipotesis bagi rata-rata 7.2 Uji Hipotesis bagi selisih dua rata-rata 7.3 Uji Hipotesis bagi proporsi 7.4 Uji Hipotesis bagi selisih dua proporsi 7.5 Uji Hipotesis bagi variansi 7.6 Uji Hipotesis bagi rasio variansi 7.7 Uji Kebaikan Suai (Goodness(Goodness- of-Fit) DAFTAR PUSTAKA 39 BAHAN AJAR STATISTIKA DASAR Tinjauan Mata Kuliah Mata kuliah Statistika Dasar mengkaji masalah 1). Teknik menyajikan data kuantitatif maupun kualitatif, Diskret dan Kontinu 4). 2). Kombinasi dan permutasi, 3). Probabilitas dan Distribusi Probabilitas, Variabel Random 5). Ekspektasi Variabel Random 6). Distribusi Sampling Statistik 7). Selang Kepercayaan dan 8). Uji Hipotesis. Setelah menyelesaikan kuliah statistika dasar, mahasiswa diharapkan mampu menyajikan data yang telah dikumpulkan, mampu menganalisis data, mampu menarik kesimpulan berdasarkan statistik deskriptif maupun inferensia. Untuk mahamami dan mengaplikasikan materi mata kuliah ini mahasiswa harus secara aktif mengerjakan soal-soal latihan yang ada di buku acuan. 40 BAB II TEKNIK MENYAJIKAN DATA 2.1 Pendahuluan Kumpulan data yang berupa hasil pengukuran terhadap variabel tertentu pada umumnya tidak akan memiliki nilai yang persis sama satu dengan lainnya. Variasi nilainilai pengamatan ini dapat kita lihat melalui pola distribusinnya dan pola ini dapat berguna dalam menentukan karakteristik distribusi dari data tersebut. Penciri numerik yang penting adalah ukuran pemusatan yaitu berupa nilai tempat sebgian besar dari data tersebut mengumpul, dan distribusi data yang menunjukkan besarnya rentangan atau jarak persebaran (distribusi) dari titik pusatnya. Dalam BAB ini akan dibahas cara pemeriksaan bentuk atau pola distribusi data dan penetuan karakteristiknya. Pertama yang akan disajikan adalah teknik mencari dan menyajikan statistik lima serangkai, yaitu nilai minimum, nilai maksimum, median, kuartil 1 dan kuartil 3, membuat diagram dahan (batang) dan daun (Stem-and-leaf), diagram kotak garis (Boxplot), dan terakhir adalah mengkonstruksi Tabel frekuensi dan histogram. 2.2 Statistik Lima Serangkai Statistik lima serangkai, sesuai namanya, terdiri dari serangkaian lima statistik yang terdiri dari nilai minimum, kuartil 1, median (kuartil 2), kuartil 3, dan maksimum. Dalam pemahaman kelima statistik lima serangkai ini akan kita lihat dalam bentuk bagan sebagai berikut : Misalkan kita mempunyai sekumpulan data, maka data tersebut dapat dipilah-pilah sesuai urutannya menurut kelima statistik lima serangkai tersebut. 25% a K1 25% 25% Median (K2) 25% K3 b a = nilai yang paling kecil K1 atau kuartil 1= suatu nilai yang membagi data sedemikian sehingga sekitar 25% dari data tersebut berada di bawahnya. Jadi kuartil 1 adalah suatu nilai yang berada pada posisi ¼ dari banyaknya data setelah data tersebut diurutkan Kuartil 2 (Median) 41 Median atau K2 = suatu nilai yang membagi data sedemikian sehingga kira-kira 50% dari data tersebut berada di bawahnya dan 50% berada di atasnya. Jadi Kuartil 2 (Median) adalah suatu nilai yang berada pada posisi ½ dari banyaknya data setelah data tersebut diurutkan K3 atau kuartil 3 = suatu nilai yang membagi data sedemikian sehingga sekitar 25% dari data tersebut berada di atasnya. Jadi Kuartil 3 berada pada posisi ¾ dari banyaknya data setelah data tersebut diurutkan b = nilai yang paling besar contoh 1: Tentukan statistik lima serangkai darai data berikut ini : 11 6 17 9 12 4 4 14 20 10 15 Jawab: Terlebih dahulu data asal diurutkan dari kecil ke besar : 4 4 a 6 k1 9 10 11 k2 12 14 15 k3 17 20 b Berdasarkan data yang telah terurut, maka diperoleh: nilai minimum =4, kuartil 1=6, median=11, kuartil 3=15 dan nilai maksimum=20 contoh 2: Misalkan kita mempunyai sekumpulan data berikut: 102 135 76 108 50 104 77 116 95 122 130 86 114 109 71 130 42 109 71 117 70 132 146 138 77 109 109 89 126 117 88 71 86 77 72 80 105 86 96 70 83 86 Tentukanlah statistik lima serangkai untuk kasus data pada 135 102 33 64 101 37 109 104 141 125 109 55 73 151 82 88 133 97 contoh 2 di atas ! Langkah awal untuk menentukan statistik lima serangkai adalah mengurutkan data tersebut: 33 1 71 11 86 37 2 72 12 86 42 3 73 13 86 50 4 76 14 86 55 5 77 15 88 64 6 77 16 88 70 7 77 17 89 70 8 80 18 95 71 9 82 19 96 71 10 83 20 97 42 21 101 31 109 41 130 51 22 102 32 109 42 130 52 23 102 33 109 43 132 53 24 104 34 114 44 133 54 25 104 35 116 45 135 55 26 105 36 117 46 135 56 27 108 37 117 47 138 57 28 109 38 122 48 141 58 29 109 39 125 49 146 59 30 109 40 126 50 151 60 1. a=33 2. Nilai K1 berada pada posisi ¼ (60+1) = 15.25 K1 = X15 + ¼ (X16-X15) = 77+ ¼ (77-77) =77. 3. Nilai Median (K2) berada pada posisi median : (n+1)/2 = 61/2=30.5 Median = ½ (X30+X31) = ½ (97+101)= 99 4. Nilai K3 berada pada posisi ¾ (60+1) =, 45.75 K3 = 116 + ¾ (117-116)=116+ 0.75 = 116.75. 3. Nilai maksimum =151 2.3 Diagram Dahan dan Daun ( Sten-And-Leaf Plot). Diagram dahan dan daun disusun baris perbaris secara vertikal, dan cukup efektif dalam menggambarkan pola distribusi data yang berukuran kecil. Seperti dalam istilah pohon, daun melekat pada dahan (batang), jadi dalam hal ini satuan dahan adalah satuan yang terbesar sedangkan daun lebih kecil. Jika angka-angka yang kita miliki berkisar antara 00 sampai 99, maka yang dijadikan sebagai dahan adalah puluhan sedanhgkan daunnya adalah satuan. Ketika angka-angka yang kita miliki berkisar antara 0 sampai 9, maka tekni penetuan dahannya adalah sebagai berikut: Untuk angka 0 dan 1 diberi simbol o Untuk angka 2 dan 3 diberi simbol t (two, three) Untuk angka 4 dan 5 diberi simbol f (four, five) Untuk angka 6 dan 7 diberi simbol s (six, seven) Untuk angka 8 dan 9 diberi simbol * Contoh 3 49 P(X=0)=P(BBB)=1/8 P(X=1)=P(MBB)+P(BMB)+P(BBM)=1/8 + 1/8 + 1/8 =3/8 P(X=2)=P(MMB)+P(MBM)+P(BMM)=1/8 + 1/8 + 1/8 =3/8 P(X=3)=P(MMM) =1/8 Sehingga tabel distribusi frekuensinya adalah : X P(X) 0 1 1 3 2 3 3 1 8 8 8 8 Contoh lainnya, dari percobaan yang sama, misalkan Y menyatakan banyaknya sisi belakang (B) yang muncul, dan P(Y)=P(Y=y) = probabilitas muncul B sebanyak y kali . jika sebuah koin setimbang dilempar 3 kali Y= 0, 1, 2, 3 50 Y P(Y)=P(Y=y) 0 1 1 3 2 3 3 1 8 8 8 8 Distribusi probabilitas ini dapat diringkas ke dalam suatu fungsi probabilitas a. Untuk Variabel random X P(X=x) P ( X 1 , untuk x = 0,3 8 3 = x) = , untuk x = 1,2 8 0, untuk x selainnya Atau dapat diringkas P( X n 1 x 1 3− x 1 − , untuk x = 0,1,2,3 = x) = x 2 2 0 , untukl x selainnya untuk variabel Y sama caranya dengan kasus variabel X (coba sendiri) Kita lihat bahwa distribusi probabilitas untuk variabel X dan Y sama, maka variabel X dan Y mempunyai distribusi identik. 51 Fungsi Distribusi Kumulatif (Cumulatif Distribution Function, disingkat CDF) dilambangkan dengan F(x). Definisi : fungsi F(x) disebut Fungsi Distribusi Kumulatif jika dan hanya jika 3 kondisi berikut terpenuhi: a. lim F ( x) = 0, dan lim F ( x ) = 1 x → −∝ x →∝ b. F(x) bukan fungsi yang monoton turun c. F(x) kontinu dari kanan Kita kembali ke contoh pelemparan sebuah koin dengan x menyatakan banyakanya sisi M muncul. F ( x) = P( X x ≤ x) = ∑ P( X = i ), untuk semua x i =1 0, − ∝< x < 0 1 , 0 ≤ x <1 8 4 F ( x) = , 1 ≤ x < 2 8 7 , 2 ≤ x < 3 8 1, 3 ≤ x <∝ Dengan cara yang sama, fungsi distribusi kumulatif bagi Y dan hasilnya akan sama. Rata-rata atau nilai ekspektasi dan variansi variabel diskret dapat dicari dengan menggunakan rumus sebagai berikut : Misalkan X adalah suatu variabel random diskret dengan fungsi massa probabilitas (fmp) P(X)=P(X=x), n Mean X = µ = ∑ X i P( X i ) i =1 n Variansi X = σ = ∑ X i 2 P( X i ) − µ 2 2 i =1 S tan dardeviasi = σ 2 =σ n Nilai Harapan X = E ( X ) = ∑ X i P( X i ) i =1 Penurunan rumus mean dan variansi berasal dari Nilai harapan (Expected Value), Mean = E(X) = µ dan Variansi dari variabel random X, atau disingkat Var(X) berasal dari definisi sebagai berikut: 52 Var(X) =E(X-E(X))2 (di statistika lanjutan definisi ini selalu digunakan), karena E(X)= µ, maka Variansi Var(X) =E(X- µ)2 , selanjutnya dapat diuraikan Var ( X ) = n ∑(X i − µ ) 2 P( X i ) i =1 n = ∑ ( X i 2 − 2 X i µ + µ 2 ) P( X i ) i =1 n = ∑ Xi 2 P( X i ) − 2µ i =1 n ∑X i P( X i ) + µ n 2 ∑ P( X ) i i =1 i =1 n = ∑ X i 2 P( X i ) − 2µµ + µ 2 i =1 n = ∑ X i 2 P( X i ) − µ 2 i =1 Untuk suatu distribusi yang probabilitas setiap titik sampelnya sama (probabilitas serba sama P(Xi)=1/n untuk semua i=1,2,…n), jika ada n t indakan atau peristiwa, maka : n Mean = µ = ∑X i i =1 n =X Sifat-Sifat Nilai Harapan Misalkan a dan b suatu konstanta, X adalah variabel random dengan mean (X) =µ dan Variansi (X)=Var(X)= σ2 , dan misalkan Y=a+bX, maka = ∑aP( X i ) = a ∑P ( X i ) = a 1. E (a) 2. E ( aX ) 3. E (Y ) 4. Var ( aX ) 5. Var (Y ) = ∑aX i P ( X i ) = a ∑X i P( X i ) = aE ( X ) = aµ = E ( a + bX ) = ∑( a + bX i ) P( X i ) = a ∑P( X i ) + b∑X i P ( X i ) = a + bµ = E ( aX − E (aX )) = E (Y − E (Y )) 2 2 = E ( a ( X − E ( X )) 2 2 2 = E ( b( X − E ( X )) ) 2 = b var( X ) = b σ 2 2 = E ( a + bX − a −bE ( X ) ) 2 = b E ( X − E ( X )) 2 = a E ( X − E ( X )) = E ( a + bX − E ( a + bX )) = E ( a + X − ( a + bE ( X )) = E (bX − bE ( X )) 2 2 2 2 2 2 2 = a Var ( X ) = a σ 2 63 Dalam menerapkan hampiran normal terhadap binom perlu dilakukan koreksi kontinuitas terlebih dahulu. Hal ini disebabkan karena distribusi binomial merupakan distribusi diskret sedangkan distribusi normal kontinu. Sebagai ilustrasi bahwa X =6 sama dengan luas empat persegi panjang yang alasnya berpusat di titik 6. Dengan bantuan Tabel binom diperoleh 0.1093. Nilai probabilitas ini kira-kira sama dengan luas daerah yang di arsir antara 5.5 sampai 6.5 (Gambar di bawah) 5.5 − 4 < Z < 6.5 − 4 1.41 1.41 P(5.5 < X < 6.5) = P P(1.06<Z<1.77) = P(0<Z<1.77) - P(0<Z<1.06) = 0.4616-0.3554 = 0.1062 Jika X berdistribusi Binomial P(X ≥6) dapat didekati dengan hampiran normal, yaitu P(X>5.5). 64 4.4.3 Distribusi t-Student Dari suatu populasi berukuran N dengan mean µ dan simpangan baku σ, dapat ditarik sampel berukuran n (n< N), dan dari sampel berikuran n ini dapati dicari rataratanya, misalkan x dan simpangan bakunya, s. statistik t didefinisikan sebagai t = x−µ s n distribusi t juga simetrik terhadap mean=0 tetapi variansinya lebih besar dari 1. Semakin ukuran sampel (n) semakin besar variansinya dan sebaliknya semakin besar ukuran sampel semakin kecil variansinya. Bila n→∞ maka kurva t menyerupai kurva Z. Db=∞ Db=8 Db=4 Gambar 4.4.3. Hubungan Kurva Z dan Kurva t 65 Tabel 4.4.3. Tabel t-student untuk berbagai derajat bebas dan α (alpha). tα Derajat Bebas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 ∝ α 0.25 1.000 0.817 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.674 0.10 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.282 Perhatikan bahwa nilai 0.05 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.645 0.03 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 1.960 0.01 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.326 0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.576 α merupakan daerah yang diarsir di sebelah kanan nilai-t tabel. Nilai α disini disebut sebagai taraf signifikan. Cara pembacaan tabel distribusi t : Misalkan kita akan mencari nilai t tabel jika diketahui nilai α=5% dengan derajat bebas 5, maka nilai t tabelnya sama dengan 2.015 (lihat nilai sel pada baris 5 dan pada kolom 0.05).