MOMEN, KEMIRINGAN DAN KERUNCINGAN, DISTRIBUSI NORMAL, DISTRIBUSI T, DISTRIBUSI F, DISTRIBUSI BINOMIAL, DISTRIBUSI POISSON, UJI NORMALITAS DAN HOMOGENITAS, UJI F DAN t, HIPOTESIS, DAN ANOVA Makalah Sebagai Salah Satu Tugas dalam Mata Kuliah ANALISIS STATISTIK Oleh: 1. Trilius Septaliana KR (20102512011) 2. Aisyah (20102512023) DOSEN PENGASUH : Dr. Ratu Ilma I.P.,M.Si PROGRAM PASCASARJANA UNIVERSITAS SRIWIJAYA TAHUN 2011 BAB 6 MOMEN, KEMENCENGAN DAN KURTOSIS 1. PENDAHULUAN Rata-rata dan varians sebenarnya merupakan hal istimewa dari kelompok ukuran lain yang disebut momen. Dari momen ini pula beberapa ukuran lain dapat diturunkan. Bentuk-bentuk sederhana dari momen dan ukuran-ukuran yang didapat daripadanya akan diuraikan di dalam bab ini. 2. MOMEN Misalkan diberikan variable x dengan harga-harga: x1, x2, …., xn. Jika A = sebuah bilangan tetap dan r = 0, 1, 2, ……., n, maka momen ke-r sekitar A, disingkat mr, didefinisikan oleh hubungan: (1) …………………………… = ) Σ( Untuk A = 0 didapat momen ke-r sekitar nol atau disingkat momen ke-r: − = (2) …………………………… Dari rumus (2), maka untuk r = 1 didapat rata-rata ̅ . Jika A = ̅ kita peroleh momen ke-r sekitar rata-rata, biasa disingkat dengan mr. Jadi didapat: (3) …………………………... = ( ̅) Untuk r = 2, rumus (3) memberikan varians s2. Untuk membedakan apakah momen itu untuk sampel atau untuk populasi, maka dipakai simbul: mr dan mr untuk momen sampel dan r dan r untuk momen populasi. Jadi, mr dan mr adalah statistik sedangkan r dan r merupakan parameter. Jika data telah disusun dalam daftar distribusi frekuensi, maka rumus-rumus di atas berturut-turut berbentuk: (4) ……………………….. = Σ ( − = (5) ……………………….. (6) ……………………….. ) = ( ̅) dengan n = fi, xi = tanda kelas interval dan fi = frekuensi yang sesuai dengan xi. Dengan menggunakan cara sandi, rumus 4 menjadi: = (7) ……………………… dengan, p = panjang kelas interval, Dari ci = variable sandi. , harga-harga mr untuk beberapa harga r, dapat ditentukan berdasarkan hubungan: = − ( ) = − 3 + 2( ) = −4 + 6( ) − 3( ) Contoh: Untuk menghitung empat buah momen sekitar rata-rata untuk data dalam daftar distribusi frekuensi, kita lakukan sebagai berikut. DATA fi ci fici 60 – 62 5 -2 -10 20 -40 80 63 – 65 18 -1 -18 18 -18 18 66 – 68 42 0 0 0 0 0 69 – 71 27 1 27 27 27 27 72 - 74 8 2 16 32 64 128 Jumlah 100 - 15 97 33 253 Dengan menggunakan rumus (7), maka: = =3 = =3 = 0,45 = 8,91 = =3 = 8,73 = =3 = 204,93 Sehingga dengan menggunakan hubungan di atas: = − ( ) = 8,73 − (0,45) = 8,53. = − 3 + 2( ) = 8,91 − 3(0,45)(8,73) + 2(0,45) = −2,69 = −4 + 6( ) − 3( ) = 204,93 − 4(0,45)(8,91) + 6(0,45) (8,73) − 3(0,45) = 199,38 Dari hasil ini, didapat varians s2 = m2 = 8,53. 3. KEMENCENGAN Kemencengan atau kecondongan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya ( ≠ Me ≠ Mo), sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan menceng. Jika distribusi memiliki ekor yang lebih panjang ke kanan daripada yang ke kiri maka distribusi disebut menceng ke kanan atau memiliki kemencengan positif. Sebaliknya, jika distribusi memiliki ekor yang lebih panjang ke kiri daripada yang ke kanan maka distribusi disebut menceng ke kiri atau memiliki kemencengan negatif. Berikut ini gambar kurva dari distribusi yang menceng ke kanan (menceng positif) dan menceng ke kiri (menceng negatif). Mo Gambar a Mo Gambar b Gambar 1 Kemencengan Distribusi (a) Menceng ke kanan (b) Menceng ke kiri Untuk mengetahui bahwa konsentrasi distribusi menceng ke kanan atau menceng ke kiri, dapat digunakan metode-metode berikut : 1. Koefisien Kemencengan Pearson Koefisien Kemencengan Pearson merupakan nilai selisih rata-rata dengan modus dibagi simpangan baku. Koefisien Kemencengan Pearson dirumuskan sebagai berikut: = − Keterangan : sk = koefisien kemencengan Pearson Apabila secara empiris didapatkan hubungan antar nilai pusat sebagai : − = 3( − ) Maka rumus kemencengan di atas dapat diubah menjadi : = 3( − ) Jika nilai sk dihubungkan dengan keadaan kurva maka : 1) sk = 0 kurva memiliki bentuk simetris; 2) sk> 0 nilai-nilai terkonsentrasi pada sisi sebelah kanan ( terletak di sebelah kanan Mo), sehingga kurva memiliki ekor memanjang ke kanan, kurva menceng ke kanan atau menceng positif; 3) sk< 0 nilai-nilai terkonsentrasi pada sisi sebelah kiri ( terletak di sebelah kiri Mo), sehingga kurva memiliki ekor memanjang ke kiri, kurva menceng ke kiri atau menceng negatif. Contoh soal : Berikut ini adalah data nilai ujian statistik dari 40 mahasiswa sebuah universitas. Nilai Ujian Statistika pada Semester 2, 2010 Nilai Ujian Frekuensi 31 – 40 4 41 – 50 3 51 – 60 5 61 – 70 8 71 – 80 11 81 – 90 7 91 – 100 2 Jumlah 40 a) Tentukan nilai sk dan ujilah arah kemencengannya (gunakan kedua rumus tersebut) ! b) Gambarlah kurvanya ! Penyelesaian: Nilai X f u u2 fu fu2 31 – 40 35,5 4 -4 16 -16 64 41 – 50 45,5 3 -3 9 -9 27 51 – 60 55,5 5 -2 4 -10 20 61 – 70 65,5 8 -1 1 -8 8 71 – 80 75,5 11 0 0 0 0 81 – 90 85,5 7 1 1 7 7 91 – 100 95,5 2 2 4 4 8 -32 134 Jumlah 40 = ∑ = a. ∑ ∑ + − ∑ = ) = + = 70,5 + . + , = 134 −32 − 40 40 = 10 1 − (∑ +2 = −32 = 75,5 − 8 = 67,5 40 = 75,5 + 10 1 (40) − 12 = 60,5 + 2 . 10 = 60,5 + 10 = 70,5 8 . , , = 10 (1,62) = 16,2 4 . 10 = 70,5 + 4,44 = 74,94 4+5 = −0,46 Oleh karena nilai sk-nya negatif (-0,46) maka kurvanya menceng ke kiri atau menceng negatif. b. Gambar kurvanya : Kurva nilai ujian statistik 12 10 8 6 4 2 0 35 45 56 66 76 86 96 Gambar 2 Kurva menceng ke kiri 2. Koefisien Kemencengan Bowley Koefisien kemencengan Bowley berdasarkan pada hubungan kuartil-kuartil (Q1, Q2 dan Q3) dari sebuah distribusi. Koefisien kemencengan Bowley dirumuskan : = ( ( )−( )+( − − − − ) ) atau = Keterangan : skB = −2 + − koefisien kemencengan Bowley; Q = kuartil Koefisien kemencengan Bowley sering juga disebut Kuartil Koefisien Kemencengan.Apabila nilai skB dihubungkan dengan keadaan kurva, didapatkan : 1) Jika Q3 – Q2 > Q2 – Q1 maka distribusi akan menceng ke kanan atau menceng secara positif. 2) Jika Q3 – Q2 < Q2 – Q1 maka distribusi akan menceng ke kiri atau menceng secara negatif. 3) skB positif, berarti distribusi mencengke kanan. 4) skB negatif, nerarti distribusi menceng ke kiri. 5) skB = ± 0,10 menggambarkan distribusi yang menceng tidak berarti dan skB> 0,30 menggambarkan kurva yang menceng berarti. Contoh soal : Tentukan kemencengan kurva dari distribusi frekuensi berikut : Nilai Ujian Matematika Dasar I dari 111 mahasiswa, 1997 Nilai Ujian Frekuensi 20,00 – 29,99 4 30,00 – 39,99 9 40,00 – 49,99 25 50,00 – 59,99 40 60,00 – 69,99 28 70,00 – 79,99 5 Jumlah 111 Penyelesaian : Kelas Q1 = kelas ke -3 = 1 − (∑ ) +4 . = 39,995 + 27,75 − 13 . 10 = 45,895 25 = 49,995 + 55,5 − 38 . 10 = 54,37 40 = 59,995 + 83,25 − 78 . 10 = 61,87 28 Kelas Q2 = kelas ke -4 = 1 − (∑ +2 ) . Kelas Q3 = kelas ke -5 = 3 − (∑ ) +4 . = −2 + − = 61,87 − 2(54,37) + 45,895 = −0,06 61,87 − 45,895 Karena skB negatif (=−0,06) maka kurva menceng ke kiri dengan kemencengan yang berarti. 3. Koefisien Kemencengan Persentil Koefisien Kemencengan Persentil didasarkan atas hubungan antar persentil (P90, P50 dan P10) dari sebuah distribusi. Koefisien Kemencengan Persentil dirumuskan : = ( − )−( − − ) Keterangan : skP = koefisien kemecengan persentil , P = persentil 4. Keofisien Kemencengan Momen Koefisien Kemencengan Momen didasarkan pada perbandingan momen ke-3 dengan pangkat tiga simpang baku. Koefisien menencengan momen dilambangkan dengan α3. Koefisien kemencengan momen disebut juga kemencengan relatif. Apabila nilai α3dihubungkan dengan keadaan kurva, didapatkan : 1) Untuk distribusi simetris (normal), nilai α3= 0, 2) Untuk distribusi menceng ke kanan, nilai α3 = positif, 3) Untuk distribusi menceng ke kiri, nilai α3= negatif, 4) Menurut Karl Pearson, distribusi yang memiliki nilai α3> ±0,50 adalah distribusi yang sangat menceng 5) Menurut Kenney dan Keeping, nilai α3 bervariasi antara ± 2 bagi distribusi yang menceng. Untuk mencari nilaiα3, dibedakan antara data tunggal dan data berkelompok. a. Untuk data tunggal Koefisien Kemencengan Momen untuk data tunggal dirumuskan : = α3 = koefisien kemencengan momen 1 ∑( − ) =2 b. Untuk data berkelompok Koefisien kemencengan momen untuk data berkelompok dirumuskan : = 1 ∑( − ) =2 atau = = ∑ −3 ∑ ∑ +2 ∑ dalam pemakaiannya, rumus kedua lebih praktis dan lebih mudah perhitungannya. 5. KERUNCINGAN ATAU KURTOSIS Keruncingan atau kurrtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secararelatif terhadap suatu distribusi normal. Berdasarkan keruncingannya, kurva distribusi dapat dibedakan atas tiga macam, yaitu sebagai berikut : 1) Leptokurtik Merupakan distribusi yang memiliki puncak relatif tinggi. 2) Platikurtik Merupakan distribusi yang memiliki puncak hampir mendatar 3) Mesokurtik Merupakan distribusi yang memiliki puncak tidak tinggi dan tidak mendatar Bila distribusi merupakan distribusi simetris maka distribusi mesokurtik dianggap sebagai distribusi normal. leptokurtik mesokurtik platikurtik Gambar 3. Keruncingan Kurva Untuk mengetahui keruncingan suatu distribusi, ukuran yang sering digunakan adalah koefisien kurtosis persentil. 1. Koefisien keruncingan Koefisien keruncingan atau koefisien kurtosis dilambangkan dengan4 (alpha 4). Jika hasil perhitungan koefisien keruncingan diperoleh : 1) Nilai lebih kecil dari 3, maka distribusinya adalah distribusi pletikurtik 2) Nilai lebih besar dari 3, maka distibusinya adalah distribusi leptokurtik 3) Nilai yang sama dengan 3, maka distribusinya adalah distribusi mesokurtik Untuk mencari nilai koefisien keruncingan, dibedakan antara data tunggal dan data kelompok. a. Untuk data tunggal 1 ∝ = ∑( − ) Contoh soal: Tentukan keruncingan kurva dari data 2, 3, 6, 8, 11 ! Penyelesaian : = 6; s = 3,67 - 1 ∝ = ∑( − ) ( − 2 -4 256 3 -3 81 6 0 0 8 2 16 11 5 625 Jumlah 0 978 ) 1 978 195,6 = 5 = = 1,08 (3,67) 181,4 Karena nilainya 1,08 (lebih kecil dari 3) maka distribusinya adalah distribusi platikurtik. b. Untuk data kelompok 1 ∝ = ∑( − ) atau ∝ = 2. ∑ −4 ∑ ∑ +6 ∑ ∑ −3 ∑ Koefisien Kurtosis Persentil Koefisien Kurtosis Persentil dilambangkan dengan K (kappa). Untuk distribusi normal, nilai K = 0,263. Koefisien Kurtosis Persentil, dirumuskan : 1 ( =2 − ) − Contoh soal : Berikut ini disajikan tabel distribusi frekuensi dari tinggi 100 mahasiswa universitas XYZ. a. Tentukan koefisien kurtosis persentil (K) ! b. Apakah distribusinya termasuk distribusi normal ! Tinggi Mahasiswa Universitas XYZ Tinggi (inci) frekuensi (f) 60 – 62 5 63 – 65 18 66 – 68 42 69 – 71 27 72 - 74 8 Jumlah 100 Penyelesaian : Kelas Q1 = kelas ke-3 = 1. − (∑ ) + 4 . 1.100 − 23 = 65,5 + 4 . 3 = 65,64 42 Kelas Q3 = kelas ke-4 = 3. − (∑ + 4 ) 3.100 − 65 = 68,5 + 4 . 3 = 69,61 27 . Kelas P10 = kelas ke-2 10. − (∑ + 100 = . 10.100 −5 = 62,5 + 100 . 3 = 63,33 18 . 90.100 − 65 = 68,5 + 100 . 3 = 71,28 27 ) Kelas P90 = kelas ke-4 90. − (∑ + 100 = ) Koefisien kurtosis persentil (K) adalah : 1 ( =2 − − ) 1 (69,61 − 65,64) =2 = 0,25 71,28 − 63,33 Karena nilai K = 0,25 (K<0,263) maka distribusinya bukan distribusi normal. BAB 7 DISTRIBUSI NORMAL Distribusi normal adalah distribusi dengan variabel acak kontinu atau sering disebut distribusi Gauss. Jika variabel acak kontinu X mempunyai fungsi densitas pada X = x dengan persamaan : ( )= 1 ( ) √2 dengan : π = nilai konstan yang bila ditulis dengan 4 desimal π = 3,1416 e = bilangan konstan, bila ditulis hingga 4 desimal, e = 2,7183. µ = parameter, ternyata merupakan rata-rata untuk distribusi. σ = parameter, merupakan simpangan baku untuk distribusi. Nilai x mempunyai batas - ∞ < x < ∞, maka dikatakan bahwa variabel acak X berdistribusi normal. Sifat-sifat penting distribusi normal : 1) Grafiknya selalu ada di atas sumbu datar X. 2) Bentuknya simetris terhadap x = µ. 3) Mempunyai satu modus, jadi kurva normal, tercapai pada x = µ sebesar , . 4) Grafiknya mendekati (berasimtotkan) sumbu datar x dimulai dari x = µ + 3σ ke kanan dan x = µ - 3σ ke kiri. 5) Luas daerah grafik selalu sama dengan satu unit persegi. Untuk setiap pasang µ dan σ, sifat-sifat di atas akan selalu dipenuhi, hanya bentuk kurvanya saja yang berlainan. Jika σ makin besar, kurvanya makin rendah (platikurtik) dan untuk σ makin kecil, kurvanya makin tinggi (leptokurtik). (A) (B) (A) kurva normal dengan µ = 10 dan σ = 5, sedangkan (B) kurva normal dengan µ = 20 dan σ = 7. Untuk menentukan peluang harga X antara a dan b, yakni P(a<X<b), digunakan rumus: ( < < )= ( / ( 2 ) ) Distribusi normal standar ialah distribusi dengan rata-rata µ = 0 dan simpangan baku σ = 1. Fungsi densitasnya berbentuk : ( )=− 1 / √2 Untuk z dalam daerah - ∞ < z < ∞. Untuk menentukan distribusi normal baku dapat menggunakan transformasi : = − − Grafiknya dapat dilihat seperti berikut ini : Normal Umum µ-3σ µ-2σ µ-σ µ µ+σ µ+2σ µ+3σ rata-rata = µ ≠ 0 Simpangan baku = σ ≠ 1 Normal Standar -3 -2 -1 0 1 2 3 rata-rata = 0 σ=1 Setelah didapatkan formasi distribusi normal baku dari distribusi normal umum dari rumus = − maka daftar distribusi normal dapat digunakan. Dengan daftar ini bagian-bagian luas dari distribusi normal baku dapat dicari dengan cara : 1) Hitung z sehingga dua desimal. 2) Gambarkan kurvanya seperti gambar sebelah kanan pada gambar di atas. 3) Letakkan harga z pada sumbu datar, lalu tarik garis vertikal hingga memotong kurva. 4) Luas yang tertera dalam daftar adalah luas daerah antara garis ini dengan garis tegak di titik nol. 5) Dalam daftar, cari tempat harga z pada kolom paling kiri hanya hingga satu desimal keduanya dicari pada baris paling atas. 6) Dari z di kolom kiri maju ke kanan dan dari z di baris atas turun ke bawah, maka didapat bilangan yang merupakan luas yang dicari. Bilangan yang didapat harus ditulis dalam bentuk 0,xxxx (bentuk 4 desimal). Karena seluruh luas = 1 dan kurva simetrik terhadap µ = 0, maka luas dari garis tegak pada titik nol ke kiri ataupun ke kanan adalah 0,5. Beberapa contoh, penggunaan daftar normal baku. Akan dicari luas daerah : 1) Antara z = 0 dan z = 2,15. Di bawah z pada kolom kiri cari 2,1 dan di atas sekali angka 5. Dari 2,1 maju ke kanan dan dari 5 menurun, didapat 4842. Luas daerah yang dicari, dapat dilihat daerah yang diarsir, = 0,4842. 0 2,15 2) Antara z = 0 dan z = -1,86. Karena z bertanda negatif, maka pada grafiknya diletakkan di sebelah kiri 0. Untuk daftar digunakan z = 1,86. Di bawah z kolom kiri dapatkan 1,8 dan di atas angka 6. Dari 1,8 ke kanan dan dari 6 ke bawah didapat 4686. Luas daerah = daerah diarsir = 0,4686. -1,86 0 3) Antara z = -1,50 dan z = 1,82. Dari grafik terlihat bahwa kita perlu mencari luas dua kali, lalu dijumlahkan. Mengikuti cara 1) untuk z = 1,82 dan cara di 2) untuk z = -1,50, masing-masing didapat 0,4656 dan 0,4332. Jumlah = luas yang dicari = 0,4332 + 0,4656 = 0,8988. -1,5 0 1,82 4) Antara z = 1,40 dan z = 2,65. Yang dicari adalah luas dari z = 0 sampai ke z = 1,40. Dengan cara yang dijelaskan di atas masing-masing didapat 0,4960 dan 0,4192. Luas yang dicari = 0,4960 – 0,4192 = 0,0768. 0 1,40 2,65 5) Dari z = 1,96 ke kiri. Luasnya sama dengan dari z = 0 ke kiri (= 0,5) ditambah luas dari z = 0 sampai ke z = 1,96. Untuk z = 1,96 dari daftar didapat 0,4750. Luas = 0,5 + 0,4750 = 0,9750. 0 1,96 6) Dari z = 1,96 ke kanan. Dari gambar 6) dapat dilihat bahwa yang dicari merupakan daerah yang tidak diarsir. Ini sama dengan luas dari z = 0 ke kanan (= 0,5) dikurangi luas dari z = 0 sampai ke z = 1,96 yang besarnya 0,4750. Luas = 0,5 – 0,4750 = 0,0250. Untuk mencari kembali z apabila luasnya diketahui, maka dilakukan langkah sebaliknya. Misalnya, jika luas = 0,4931, maka dalam badan daftar dicari 4931 lalu menuju ke pinggir sampai pada kolom z, didapat 2,4 dan menuju ke atas sampai batas z didapat 6. Harga z = 2,46. Beberapa bagian luas untuk distribusi normal umum dengan rata-rata µ dan simpangan baku σ tertentu dengan mudah dapat ditentukan. Tepatnya, jika sebuah fenomena berdistribusi normal, maka dari fenomena itu : 1) Kira-kira 68,27% dari kasus ada dalam daerah satu simpangan baku sekitar ratarata, yaitu antara µ - σ dan µ + σ. 2) Ada 95,45% dari kasus terletak dalam daerah dua simpangan baku sekitar ratarata, yaitu antara µ - 2σ dan µ + 2σ. 3) Hampir 99,73% dari kasus ada dalam daerah tiga simpangan baku sekitar ratarata, yaitu antara µ - 3σ dan µ + 3σ. Contoh : Berat barang siswa dalam suatu tour rata-rata 3,750 gram dengan simpangan baku 325 gram. Jika berat barang berdistribusi normal, maka tentukan ada : a) Berapa persen siswa yang mempunyai berta barang lebih dari 4.500 gram ? b) Berapa orang siswa yang yang memiliki berat barang antara 3.500 gram dan 4.500 gram, jika semuanya ada 10.000 siswa ? c) Berapa siswa yang orang siswa yang berat barangnya lebih kecil atau sama dengan 4.000 gram jika semuanya ada 10.000 siswa? d) Berapa orang siswa yang berat barangnya 4.250 gram jika semuanya ada 5.000 siswa? Penyelesaian : Dengan X = berat barang siswa dalam gram, µ = 3,750 gram, σ = 325 gram, maka : a) Dengan transformasi rumu = − s untuk X = 4.500 : 4.500 − 3.750 = 2,31 325 Berat yang lebih dari 4.500 gram, pada grafiknya ada disebelah kanan z = 2,31. Luas = − daerah ini = 0,5 – 0,4896 = 0,0104. Jadi ada 1, 04% dari dari berat barang siswa yang lebih dari 4.500 gram. 0 2,31 b) Dengan X = 3.500 dan X = 4.500 didapat : 3.500 − 3.750 = −0,77 = 2,31 325 Luas daerah yang perlu = daerah yang diarsir = 0,2794 + 0,4896 = 0,7690. Banyak = siswa yang berat barangnya antara 3.500 gram dan 4.500 gram diperkirakan ada (0,7690)(10.000) = 7.690. -0,77 0 2,31 c) Karena beratnya lebih kecil atau sama dengan 4.000 gram, maka beratnya harus lebih kecil dari 4.000,5 gram. = 4.000,5 − 3.750 = −0,77 325 Peluang berat barang siswa lebih kecil atau sama dengan 4.000 gram = 0,5 + 0, 2794 = 0,7794. Banyak siswa = (0,7794)(10.000) = 7794. d) Jika berat 4.250 gram berarti berat antara 4.249,5 gram dan 4.250,5 gram. Jadi untuk X = 4.249,5 dan X = 4.250,5 didapat : 4.249,5 − 3.750 = 1,53. 325 4.250,5 − 3.750 = = 1,54 325 Luas daerah yang perlu = 0,4382 – 0,4370 = 0,0012. = Banyak siswa = (0,0012)(5.000) = 6. Antara distribusi binom dan distribusi normal terdapat hubungan tertentu. Jika untuk fenomena yang berdistribusi binom berlaku : a) N cukup besar, b) π = P(A) = peluang peristiwa A terjadi, tidak terlalu dekat kepada nol, maka distribusi binom dapat didekati oleh distribusi normal dengan rata-rata µ = Nπ dan simpangan baku σ = (1 − ). Untuk pembakuan, agar daftar distribusi normal baku dapat dipakai, maka digunakan transformasi : = − (1 − ) Dengan X = variabel acak dalam distribusi diskrit yang menyatakan terjadinya peristiwa A. Karena disini telah mengubah variabel acak diskrit dari distribusi binom menjadi variabel acak kontinu dalam distribusi normal, maka nilai-nilai X perlu mendapat penyesuaian. Yang dipakai ialah dengan jalan menambah atau mengurangi dengan 0,5. Perhatikan distribusi binom oleh distribusi normal sangat berfaedah, antara lain untuk mempermudah perhitungan. Contoh : 10% dari siswa tergolong kategori A. Sebuah sampel acak terdiri atas 400 siswa telah diambil. Tentukan peluangnya akan terdapat : a) paling banyak 30 orang tergolong kategori A. b) Antara 30 dan 50 orang tergolong kategori A. c) 55 orang atau lebih termasuk kategori A. Penyelesaian : Soal ini merupakan soal distribusi binom. Tetapi lebih cepat dan mudah bila diselesaikan dengan distribusi normal. Kita ambil X = banyak siswa termasuk kategori A. Maka dari segi X ini didapat: µ = 0,1 x 400 orang = 40 0rang. Σ = √400 0,1 0,9 orang = 6 orang. a) Paling banyak 30 orang dari kategori A, berarti X = 0, 1, 2, ..., 30. Melakukan penyesuaian terhadap X, maka sekarang X menjadi - 0,5 < X < 30,5, sehingga : −0,5 − 40 = −6,57. 6 30,5 − 40 = = −1,58 6 Luas daerah yang diarsir adalah 0,5 – 0, 4429 = 0,0571. Peluangnya terdapat = paling banyak 30 orang termasuk kategori A adalah 0,0571. -1,58 0 b) Untuk distribusi normal, disini berlaku 30,5 < X < 49,5. Bilangan standar z-nya masing-masing : 30,5 − 40 49,5 − 40 = −1,58 = = +1,58. 6 6 Dari daftar distribusi normal baku terdapat peluang yang ditanyakan = 2(0,4429) = = 0,8858. c) 55 orang atau lebih untuk distribusi binom memberikan X > 54,5 untuk distribusi normal. Maka = 54,5 − 40 = 2,42 6 Sehingga kita perlu luas daerah dari Z = 2,42 ke kanan. Dari daftar distribusi normal baku didapat peluang yang dicari = 0,5 – 0,4922 = 0,0078. 0 2,42 Apabila kondisi populasi digambarkan dalam bentuk kurva, bisa dijumpai berbagai macam bentuk kurva. Hal ini tergantung dari kondisi penyebaran frekuensi skor yang terkumpul. Pada umumnya kondisi populasi dalam dunia pendidikan berdistribusi normal. Tetapi tidak selamanyapopulasi yang dijumpai akan berdistribusi normal, oleh karena itu, kita harus hati-hati dalam menghadapi data tersebut. Analisis statisik untuk data yang berdistribusi normal akan berbeda, dengan demikian maka interpretasinyapun akan dipengaruhi oleh bentuk distribusinya. Data populasi akan berdistribusi normal jika rata-rata nilainya sama dengan modenya serta sama dengan mediannya. Ini berarti bahwa sebagian nilai (skor) mengumpul pada posisi tengah, sedangkan frekuensi skor yang rendah dan yang tinggi menunjukkan kondisi yang semakin sedikit seimbang. Oleh karena penurunan frekuensi pada skor yang semakin rendah dan skor yang semakin tinggi adalah seimbang, maka penurunan garis kurva ke kanan dan ke kiri akan seimbang. Kurva normal mempunyai hubungan erat dengan data yang kontinue (interval mauoun ratio). Distribusi yang normal kurvanya merupakan distribusi yang paling banyak dijumpai dan digunakan sebagai pengembangan rumus-rumus statistik parametrik (inferensial statistik). Disamping itu, sifat normal ini yang paling banyak ditunjukkan oleh sifat populasi. Distribusi normal mempunyai sifat-sifat yang khusus, yaitu : 1. Bentuknya simetri dengan sumbu X. 2. Nilai rata-rata = mode = media. 3. Mode hanya satu (unimodal). 4. Ujung-ujung grafiknya hanya mendekati sumbu X atau dengan kata lain tidak akan bersinggungan maupun berpotongan dengan sumbu X (berasimtot dengan sumbu X). 5. Kurva akan landai jika rentangan skor besar, sebaliknya jika rentangan skor kecil maka kurvanya akan meninggi. 6. Luas daerah kurva akan sama dengan luas satu persegi empat. Bentuk kurva normal tergantung pada distribusi nilai/skor yang akan dibuat kurvanya. Penyebaran skor dan panjang pendeknya rentangan distribusi berpengaruh besar atau menentuka bentuk kurvanya. Jika jumlah responden sama, maka kurva normal dari distribusi skor tersebut akan berbeda bentuknya. Jenis bentuk kurva yang diakibatkan oleh perbedaan rentangan nilai dan simpangan baku ada tiga macam, yaitu : 1. Leptokurtik, merupakan bentuk kurva normal yang meruncing tinggi karena perbedaan frekuensi pada skor-skor yang mendekati rata-rata sangat kecil. 2. Platykurtic, merupakan kurva normal yang mendatar rendah karena perbedaan frekuensi pada skor-skor yang mendekati rata-rata sangat kecil. 3. Normal, merupakan bentuk kurva normal yang biasa, artinya bentuknya merupakan bentuk antara leptokurtic dan platykurtic, karena penyebaran skor biasa dan tidak terjadi kejutan-kejutan yang berarti. Bentuk ketiga kurva normal itu dapat dilihat pada grafik, berikut ini : (1) (2) (3) Kurva normal dapat pula dibuat berdasarkan skor yang telah ditransformasikan ke Z skor. Proses transformasi distribusi skor yang normal akan tetap menghasilkan distribusi Z skor yang normal pula. Untuk kepercayaan kita, dapat dibuktikan melalui contoh soal di bawah. Contoh : 1 Suatu penyebaran nilai matematika siswa pada suatu sekolah menengah pertama sebagai berikut : 65 65 60 70 70 70 75 75 75 75 80 80 80 85 85 90 Berdasarkan data tersebut di atas buatlah : 1. Perhitungan rata-rata dan simpangan bakunya. 2. Transformasi Z skor. 3. Kurva berdasarkan distribusi skor asli. 4. Kurva berdasarkan distribusi Z skor. Rumus rata-rata yang digunakan adalah rumus rata-rata hitung yaitu (∑X) : n, sedangkan simpangan bakunya dihitung dengan rumus = ∑( ) dan rumus = √ untuk sejumlah sampel, tetapi jika yang akan dihitung simpangan bakunya merupakan populasi maka pembagi pada perhitungan variance sebesar N. Jumlah skor adalah 1200 Jumlah responden adalah 16 Jadi, rata-ratanya adalah 1200 : 16 = 75 Jika data di atas merupakan populasi maka σ = 7,91 Jika data di atas merupakan sampel maka Sd = 8,16. Apabila kita menganggap bahwa skor tersebut adalah skor yang berasal dari populasi, maka Z skornya adalah : Untuk X = 60 Z skor = (60 - 75) : 7,91 = -1,90 Untuk X = 65 Z skor = (65 - 75) : 7,91 = -1,26 Untuk X = 70 Z skor = (70 - 75) : 7,91 = -0,63 Untuk X = 75 Z skor = (75 - 75) : 7,91 = 0 Untuk X = 80 Z skor = (80 - 75) : 7,91 = 0,63 Untuk X = 85 Z skor = (85 - 75) : 7,91 = 1,26 Untuk X = 90 Z skor = (90 - 75) : 7,91 = 1,90 Berdasarkan distribusi skor asli kurvanya adalah : 4 3 2 1 0 60 65 70 75 80 85 µ Berdasarkan distribusi Z skor kurvanya adalah : 1,90 1,26 0,63 90 95 1,26 1,90 95 4 3 2 1 0 0 µ 0,63 Jelas kini bahwa distribusi skor yang normal akan tetap normal walaupun dilakukan transformasi ke Z skor. Mengingat kurva normal tersebut simetri, maka garis tegak lurus pada sumbu X di titik µ akan membagi dua bagian kurva menjadi sama besar. Luas seluruh daerah di bawah kurva normal adalah 100% atau sama dengan 1 (satu), sehingga belahan kanan kurva normal dan belahan sebelah kiri kurva normal masing-masing mempunyai luas 0,5 atau 50%. Untuk lebih jelasnya tentang luas daerah di bawah kurva normal dapat dilihat pada figur di bawah. Melalui transformasi ke Z skor kita akan dapat mencari luar daerah di bawah kurva normal, untuk nilai-nilai Z tertentu. Dalam kasus ini kita hanya berpedoman pada tabel distribusi normal. Tabel ini disamping dapat digunakan untuk menentukan luas daerah di bawah kurva normal untuk batas titik tertentu, juga dapat digunakan untuk mencari titik tertentu. Tentunya apabila titik Z yang tidak diketahui, sedangkan luas daerah di bawah kurva normal diketahuinya. Cara menggunakan tabel ini sangat mudah karena dalam tabel hanya terdiri dari tiga kolom dan kita tinggal melihat pasangan angka antar kelompok dalam satu baris yang slah satu angkanya kita ketahui. -2 -1 0 µ 68, 26% 1 2 95,46% Selanjutnya dapat dijelaskan sebagai berikut : 1. Yang memuat berbagai kemungkinan nilai Z. 2. Yang menunjukkan luas daerah di bawah kurva antara titik µ atau 0 dengan nilai Z. 3. Yang menunjukkan luas daerah di bawah kurva diluar nilai Z atau luas daerah di bawah kurva di atass nilai Z. Pada luas kolom B dan C selalu berjumlah 0,5 karena jumlah B dan C merupakan setengah dari luas daerah di bawah kurva normal. Penggunaan kolom B dan C secara serentak (bersama) tidak pernah terjadi kecuali untuk mengontrol kebenaran angka-angka tersebut. Gunakan salah satu kolom B dan C sesuai dengan kebutuhannya. Contoh : 2 a. Jika diketahui Z skor 1,26 hitunglah luas daerah di bawah kurva normal antara µ dengan titik Z. b. Jika diketahui Z skor min 1,90 hitunglah luas daerah di bawah kurva normal antara µ dengan titik Z. c. Jika luas daerah di luar titik Z adalah 0,4207 carilah titik Z nya. d. Jika luas daerah diantara titik Z dengan µ adalah 0,1179 carilah titik Z nya. Dengan berpedoman pada tabel distribusi normal kita dapat menjawab semua soal di atas. 1. Lihat pada (tabel distribusi normal) pada kolom a yang mengandung Z 1,26, kemudian cari jodohnya pada kolom B diperoleh angka 0,3962. 2. Lihat pada kolom A yang mengandung Z 1,90 (tanda minus tidak mempengaruhi penentuan angka dalam tabel), kemudian cari jodohnya pada kolom B diperoleh angka 0,4713. 3. Lihat pada kolom C yang mengandung angka 0,4207, kemudian cari jodohnya di kolom A diperoleh 0,20. 4. Lihat pada kolom B yang mengandung angka 0,1179, kemudian cari jodohnya di kolom A diperoleh 0,30. BAB 8 DISTRIBUSI T DAN DISTRIBUSI F 1. DISTRIBUSI STUDENT ATAU DISTRIBUSI T Distribusi dengan variabel acak kontinu lainnya, selain dari distribusi normal, ialah distribusi Student atau distribusi t. Fungsi densitasnya adalah: ( )= ………………. (1) berlaku untuk harga-harga t yang memenuhi -∞ t ∞ dan K merupakan bilangan tetap yang besarnya bergantung pada n sedemikian sehingga luas daerah di bawah kurva sama dengan satu unit. Pada distribusi t ini terdapat bilangan (n – 1) yang dinamakan derajat kebebasan, akan disingkat dengan dk. Jika sebuah populasi mempunyai model dengan persamaan seperti dalam rumus (1), maka dikatakan populasi itu berdistribusi t dengan dk (n – 1). Bentuk grafiknya seperti distribusi normal baku, simetrik terhadap t = 0, sehingga sepintas lalu hamper tak ada bedanya. Untuk harga-harga n yang besar, biasanya n ≥ 30, distribusi t mendekati distribusi distribusi normal baku, yaitu: ( )=− 1 √2 Untuk perhitungan-perhitungan, daftar distribusi t sudah disusun berbentuk tabel. Daftar tersebut berisikan nilai-nilai t untuk dk dan peluang tertentu. Kolom paling kiri, kolom dk, berisikan derajat kebebasan, baris teratas berisikan nilai peluang. Untuk penggunaan daftar distribusi t, perhatikan gambar di samping. Gambar ini merupakan grafik distribusi t dengan dk = (baca: nu) dimana p = (n – 1). Luas bagian diarsir = p dan dibatasi paling kanan oleh tp. Harga tp inilah yang dicari dari daftar untuk pasangan dan p yang diberikan. 0 tp Contoh penggunaan daftar distribusi t. 1. Untuk n = 13, jadi dk = 12 dan p = 0,95, maka t = 1,78. Ini didapat dengan meliat tabel distrubusi t dengan jalan maju ke kanan dari 12 dan menurun dari 0,95. 2. Untuk n = 16, tentukan t supaya luas yang diarsir = 0,95. -t 0 t Dari grafik dapat dilihat bahwa luas ujung kiri = 1 – 0,95 = 0,05. Kedua ujung ini sama luas, jadi luas ujung kanan, mulai dari t ke kanan = 0,025. Mulai dari t ke kiri luasnya = 1 – 0,025 = 0,975. Harga p inilah yang dipakai untuk daftar. Dengan = 15 (lihat daftar distribusi t) kita maju ke kanan dan dari p = 0,975 kita menurun, didapat t = 2,13. Jadi, antara t = 2,13 luas yang diarsir = 0,95. 3. Tentukan t sehingga luas dari t ke kiri = 0,05 dengan dk = 9. Untuk ini p yang digunakan = 0,95. Dengan dk = 9 didapat t = 1,83. Karena yang diminta kurang dari 0,5 maka t harus bertanda negatif. Jadi, t = -1,83. 2. DISTRIBUSI F Distribusi F ini juga mempunyai variabel acak yang kontinu. Fungsi densitasnya mempunyai persamaan: ( ( )= ∙ ) ( ) ……………….. (2) Dengan variabel acak F memenuhi batas F 0, K = bilangan tetap yang harganya bergantung pada 1 dan 2, sedemikian sehingga luas di bawah kurva sama dengan satu, 1 = dk pembilang dan 2 = dk penyebut. Jadi, distribusi F ini mempunyai dua buah derajat kebebasan. Grafik distribusi F tidak simetrik dan umumnya sedikit positif. Seperti juga distribusi lainnya, untuk keperluan perhitungan dengan distribusi F, daftar distribusi F telah disediakan seperti daftar distribusi t. Daftar tersebut berisikan nilai-nilai F untuk peluang 0,01 dan 0,05 dengan derajat kebebasan 1 dan 2. Peluang ini sama dengan luas daerah ujung kanan yang diarsir, sedangkan dk = 1 ada pada baris paling atas dan dk = 2 pada kolom paling kiri. Untuk setiap pasang dk, 1 dan 2, daftar berisikan harga-harga F dengan kedua luas daerah ini 0,01 atau 0,05. F Untuk tiap dk = 2, daftar terdiri atas dua baris, yang atas untuk peluang p = 0,05 dan yang bawah untuk p = 0,01. Contoh: Untuk pasangan derajat kebebasan 1 = 24 dan 2 = 8, ditulis juga (1, 2) = (24, 8), maka untu p = 0,05 didapat F = 3,12 sedangkan untuk p = 0,01 didapat F = 5,28 (terdapat pada daftar distribusi F. Ini didapat dengan jalan mencari 24 pada baris atas dan 8 pada kolom kiri. Jika dari 24 turun dan dari 8 ke kanan, maka didapat bilanganbilangan tersebut. Yang atas untuk p = 0,05 dan yang bawah untuk p = 0,01. Notasi lengkap untuk nilai-nilai F dari daftar distribusi F dengan peluang p dan dk (1, 2) dan F0,01(24,8) = 5,28. Meski daftar yang diberikan hanya untuk peluang p = 0,01 dan p = 0,05, tetapi sebenarnya masih bias didapat nilai-nilai F dengan peluang 0,99 dan 0,95. Untuk itu, digunakan hubunga: ( )( , ) 1 = ( , ) Dalam rumus di atas, perhatikan antara p dan (p – 1) dan pertukaran antara derajat kebebasan (v1, 2) menjadi (2, 1). Contoh: Telah didapat F0,05(24,8) = 3,12 Maka, , ( , ) = , = 0,321. BAB 9 UJI NORMALITAS DAN UJI HOMOGENITAS 1. UJI NORMALITAS Uji normalitas berguna untuk menentukan data yang telah dikumpulkan berdistribusi normal atau diambil dari populasi normal. Metode klasik dalam pengujian normalitas suatu data tidak begitu rumit. Berdasarkan pengalaman empiris beberapa pakar statistik, data yang banyaknya lebih dari 30 angka (n > 30), maka sudah dapat diasumsikan berdistribusi normal. Biasa dikatakan sebagai sampel besar. Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak, sebaiknya digunakan uji statistik normalitas. Karena belum tentu data yang lebih dari 30 bisa dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30 belum tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik normalitas yang dapat digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk. 1. METODE CHI SQUARE (UJI GOODNESS OF FIT DISTRIBUSI NORMAL) Metode Chi-Square atau X2 untuk Uji Goodness of fit Distribusi Normal menggunakan pendekatan penjumlahan penyimpangan data observasi tiap kelas dengan nilai yang diharapkan. X2 Oi Ei Ei Keterangan : X2 = Nilai X2 Oi = Nilai observasi Ei = Nilai expected / harapan, luasan interval kelas berdasarkan tabel normal dikalikan N (total frekuensi) (pi x N) N = Banyaknya angka pada data (total frekuensi) Komponen penyusun rumus tersebut di atas didapatkan berdasarkan pada hasil transformasi data distribusi frekuensi yang akan diuji normalitasnya, sebagai berikut: Batas No Interval Z Xi X SD pi Oi Ei (pi x N) Kelas 1 2 3 dst Keterangan : Xi = Batas tidak nyata interval kelas Z = Transformasi dari angka batas interval kelas ke notasi pada distribusi normal pi = Luas proporsi kurva normal tiap interval kelas berdasar tabel normal (lampiran) Oi = Nilai observasi Ei = Nilai expected / harapan, luasan interval kelas berdasarkan tabel normal dikalikan N (total frekuensi) ( pi x N ) Persyaratan Metode Chi Square (Uji Goodness of fit Distribusi Normal) a. Data tersusun berkelompok atau dikelompokkan dalam tabel distribus frekuensi. b. Cocok untuk data dengan banyaknya angka besar ( n > 30 ) c. Setiap sel harus terisi, yang kurang dari 5 digabungkan. Signifikansi Signifikansi uji, nilai X2 hitung dibandingkan dengan X2 tabel (Chi-Square). Jika nilai X2 hitung < nilai X2 tabel, maka Ho diterima ; Ha ditolak. Jika nilai X2 hitung > nilai X2 tabel, maka maka Ho ditolak ; Ha diterima. Contoh : DIAMBIL TINGGI BADAN MAHASISWA DI SUATU PERGURUAN TINGGI TAHUN 1990 TINGGI BADAN JUMLAH 140 - 144 7 145 - 149 10 150 - 154 16 155 - 159 23 160 - 164 21 165 - 169 17 170 174 JUMLAH 6 100 Selidikilah dengan α = 5%, apakah data tersebut di atas berdistribusi normal? (Mean = 157.8; Standar deviasi = 8.09) Penyelesaian : 1. Hipotesis : Ho : Populasi tinggi badan mahasiswa berdistribusi normal H1 : Populasi tinggi badan mahasiswa tidak berdistribusi normal 2. Nilai α Nilai α = level signifikansi = 5% = 0,05 3. Rumus Statistik penguji X2 Oi Ei Ei Batas Interval Z Kelas Xi X SD pi Oi Ei (pi x N) 139.5 - 144.5 -2.26 - -1.64 0.4881 - 0.4495 = 0.0386 7 3.86 144.5 - 149.5 -1.64 - -1.03 0.4495 - 0.3485 = 0.1010 10 10.1 149.5 - 154.5 -1.03 - -0.41 0.3485 - 0.1591 = 0.1894 16 18.94 154.5 - 159.5 -0.41 - 0.21 0.1591 - 0.0832 = 0.2423 23 24.23 159.5 - 164.5 0.21 - 0.83 0.0832 - 0.2967 = 0.2135 21 21.35 164.5 - 169.5 0.83 - 1.45 0.2967 - 0.4265 = 0.1298 17 12.98 169.5 1.45 - 2.06 0.4265 - 0.4803 = 0.0538 6 5.38 174.5 JUMLAH 100 Luasan pi dihitung dari batasan proporsi hasil tranformasi Z yang dikonfirmasikan dengan tabel distribusi normal (Lampiran). X2 Oi Ei Ei 2 2 2 2 2 7 3.86 10 10.1 16 18.94 23 24.23 6 5.38 3.86 0.427 4. 10.1 18.94 24.23 5.38 Derajat Bebas Df = ( k – 3 ) = ( 5 – 3 ) = 2 5. Nilai tabel Nilai tabel X2 ; α = 0,05 ; df = 2 ; = 5,991. Tabel X2 (Chi-Square) pada lampiran. 6. Daerah penolakan - Menggunakan gambar Terima 0.1628 Tolak 5.991 - Menggunakan rumus |0,427 | < |5,991| ; berarti Ho diterima, Ha ditolak 7. Kesimpulan Populasi tinggi badan mahasiswa berdistribusi normal α = 0,05. 2. METODE LILLIEFORS (N KECIL DAN N BESAR) Metode Lilliefors menggunakan data dasar yang belum diolah dalam tabel distribusi frekuensi. Data ditransformasikan dalam nilai Z untuk dapat dihitung luasan kurva normal sebagai probabilitas komulatif normal. Probabilitas tersebut dicari bedanya dengan probabilitas komultaif empiris. Beda terbesar dibanding dengan tabel Lilliefors pada lampiran 4 Tabel Harga Quantil Statistik Lilliefors Distribusi Normal. No Xi Z Xi X SD F(X) S(X) | F(X)-S(X) | 1 2 3 dst Keterangan : Xi = Angka pada data Z = Transformasi dari angka ke notasi pada distribusi normal F(x) = Probabilitas komulatif normal S(x) = Probabilitas komulatif empiris PERSYARATAN a. Data berskala interval atau ratio (kuantitatif) b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi c. Dapat untuk n besar maupun n kecil. SIGNIFIKANSI Signifikansi uji, nilai | F (x) - S (x) | terbesar dibandingkan dengan nilai tabel Lilliefors. Jika nilai | F (x) - S (x) | terbesar < nilai tabel Lilliefors, maka Ho diterima ; Ha ditolak. Jika nilai | F(x) - S(x) | terbesar > dari nilai tabel Lilliefors, maka Ho ditolak ; Ha diterima. Tabel Lilliefors pada lampiran, Tabel Harga Quantil Statistik Lilliefors Distribusi Normal 3. METODE KOLMOGOROV-SMIRNOV Metode Kolmogorov-Smirnov tidak jauh beda dengan metode Lilliefors. Langkah-langkah penyelesaian dan penggunaan rumus sama, namun pada signifikansi yang berbeda. Signifikansi metode Kolmogorov-Smirnov menggunakan tabel pembanding Kolmogorov-Smirnov, sedangkan metode Lilliefors menggunakan tabel pembanding metode Lilliefors. No Xi Z Xi X SD FT FS | FT - FS | 1 2 3 dst Keterangan : Xi = Angka pada data Z = Transformasi dari angka ke notasi pada distribusi normal FT = Probabilitas komulatif normal FS = Probabilitas komulatif empiris PERSYARATAN a. Data berskala interval atau ratio (kuantitatif) b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi c. Dapat untuk n besar maupun n kecil. SIGINIFIKANSI Signifikansi uji, nilai |FT – FS| terbesar dibandingkan dengan nilai tabel Kolmogorov Smirnov. Jika nilai |FT – FS| terbesar <nilai tabel Kolmogorov Smirnov, maka Ho diterima ; Ha ditolak. Jika nilai |FT – FS| terbesar > nilai tabel Kolmogorov Smirnov, maka Ho ditolak ; Ha diterima. Tabel Kolmogorov Smirnov pada lampiran 5, Harga Quantil Statistik Kolmogorov Distribusi Normal. 4. METODE SHAPIRO WILK Metode Shapiro Wilk menggunakan data dasar yang belum diolah dalam tabel distribusi frekuensi. Data diurut, kemudian dibagi dalam dua kelompok untuk dikonversi dalam Shapiro Wilk. Dapat juga dilanjutkan transformasi dalam nilai Z untuk dapat dihitung luasan kurva normal. 1 k T3 ai X ni 1 X i D i 1 2 Keterangan : D = Berdasarkan rumus di bawah ai = Koefisient test Shapiro Wilk (lampiran 8) X n-i+1 = Angka ke n – i + 1 pada data Xi = Angka ke i pada data n 2 D X i X i 1 Keterangan : Xi = Angka ke i pada data yang X = Rata-rata data T dn G bn c n ln 3 1 T3 Keterangan : G = Identik dengan nilai Z distribusi normal T3 = Berdasarkan rumus di atas bn, cn, dn = Konversi Statistik Shapiro-Wilk Pendekatan Distribusi (lampiran) PERSYARATAN a. Data berskala interval atau ratio (kuantitatif) b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi c. Data dari sampel random Normal SIGNIFIKANSI Signifikansi dibandingkan dengan tabel Shapiro Wilk. Signifikansi uji nilai T3 dibandingkan dengan nilai tabel Shapiro Wilk, untuk dilihat posisi nilai probabilitasnya (p). Jika nilai p > 5%, maka Ho diterima ; Ha ditolak. Jika nilai p < 5%, maka Ho ditolak ; Ha diterima. Tabel Harga Quantil Statistik Shapiro-Wilk Distribusi Normal. Jika digunakan rumus G, maka digunakan tabel 2 distribusi normal. 2. UJI HOMOGENITAS Uji homogenitas dimaksudkan untuk memperlihatkan bahwa dua atau lebih kelompok data sampel berasal dari populasi yang memiliki variansi yang sama. Pada analisis regresi, persyaratan analisis yang dibutuhkan adalah bahwa galat regresi untuk setiap pengelompokan berdasarkan variabel terikatnya memiliki variansi yang sama. Hipotesis yang diuji adalah sebagai berikut. H0 : = =⋯= H1 : paling sedikit satu tanda sama dengan tidak berlaku Ada beberapa metoda yang telah ditemukan untuk melakukan pengujian ini, tetapi di sini hanya akan diberikan sebuah saja yang dikenal dengan nama uji Bartlett. Pengujian homogenitas data dengan uji Bartlett adalah untuk melihat apakah variansi-variansi k buah kelompok peubah bebas yang banyaknya data per kelompok bisa berbeda dan diambil secara acak dari data populasi masing-masing yang berdistribusi normal, berbeda atau tidak. Uji Bartlett dilakukan dengan menghitung x2. Harga x2 yang diperoleh dari perhitungan (x2hitung) selanjutnya dibandingkan dengan x2 dari tabel (x2tabel ), bila x2hitung < x2tabel , maka hipotesis nol diterima. Artinya data berasal dari populasi yang homogen. Langkah-langkah yang dapat dilakukan dalam pengujian homogenitas dengan uji Barlett adalah: 1. Menentukan kelompok-kelompok data, dan menghitung varians untuk tiap kelompok tersebut. 2. Membuat tabel pembantu untuk memudahkan proses perhitungan. 3. Menghitung varians gabungan. 4. Menghitung log dari varians gabungan. 5. Menghitung nilai Bartlett. 6. Menghitung nilai 7. Menentukan nilai dan titik kritis. 8. Membuat kesimpulan. Untuk memudahkan perhitungan, satuan-satuan yang diperlukan untuk uji Bartlett lebih baik disusun dalam sebuah daftar seperti tabel berikut. DAFTAR HARGA-HARGA YANG PERLU UNTUK UJI BARTLETT = H0 : Sampel 1 dk ke =⋯= ( log ) log 1 n1 - 1 1/ n1 - 1 log ( − 1) log 2 n2 - 1 1/ n2 - 1 log ( − 1) log nk - 1 1/ nk - 1 log ( − 1) log Σ( − 1) log . . . K Σ( Jumlah − 1) Σ ( 1 − 1) -- -- Dari daftar ini, kita hitung harga-harga yang diperlukan, yakni: 1. Varians gabungan dari semua sampel: = Σ ( − 1) ∙ Σ ( − 1) 2. Harga satuan B dengan rumus: = (log )Σ( − 1) Ternyata bahwa untuk uji Bartlett digunakan statistic chi-kuadrat. = (ln 10){( − 1)log } Dengan ln 10 = 2,3026, disebut logaritma asli dari bilangan 10. Dengan taraf nyata , kita tolak hipotesis H0 jika ( )( ) ≥ ( )( ), dimana didapat dari daftar distribusi chi-kuadrat dengan peluang (1−∝) dan = ( − 1). Keterangan: k = banyaknya kelompok ni = banyaknya data pada kelompok ke-i n = banyaknya seluruh data s2i = variansi sampel pada kelompok ke-i Contoh: Daftar Pertambahan Berat Badan (dalam kg) Siswa Sekolah T Setelah Percobaan Pertambahan berat badan karena makanan ke Data hasil pengamatan Dengan rumus = ( dk 1 2 3 4 Jumlah 4 4 3 3 14 2 12 14 6 9 20 15 16 14 23 10 16 18 10 19 20 19 17 22 ) = 29,3; = 21,5; Daftarnya menjadi: Sampel 1 3 4 , varians untuk tiap sampel kita hitung hasilnya: = 35,7; = 20,7. 1 0,25 0,25 0,33 0,33 1,16 log 29,3 21,5 35,7 20,7 -- 1,4669 1,3324 1,5527 1,3160 -- ( ) log 5,8676 5,3296 4,6581 3,9480 19,8033 Varians gabungan dari empat sampel itu adalah 4(29,3) + 4(21,5) + 4(35,7) + 4(20,7) = 26,6 4+4+3+3 = log 26,6 = 1,4249 dan = (1,4249)(14) = 19,9486, sehingga = maka log = (2,3026)(19,9486 − 19,8033) = 0,063. Jika = 0,05, dari daftar chi-kuadrat dengan dk = 3, didapat Ternyata bahwa = 0,063 < 7,81 sehingga hipotesis H0 : = , ( ) = = 7,81. = diterima dalam taraf 0,05. Jika harga yang dihitung cukup dekat dengan harga dari tabel,biasanya dilakukan koreksi terhadap rumus di atas dengan menggunakan faktor koreksi K sebagai berikut. =1+ 1 3( − 1) 1 1 − −1 Σ ( − 1) Dengan faktor koreksi ini, statistik = dengan di ruas kanan dihitung dengan yang dipakai sekarang ialah: 1 = (ln 10){( − 1)log }. BAB 10 DISTRIBUSI BINOMIAL DAN DISTRIBUSI POISSON 1. DISTRIBUSI BINOMIAL Suatu percobaan sering terdiri atas beberapa usaha, tiap usaha dengan dua kemungkinan hasil yang dapat diberi nama sukses dan gagal. Percobaan seperti ini disebut Percobaan Binomial. Distribusi binomial berasal dari percobaan binomial yaitu suatu proses Bernoulli yang diulang sebanyak n kali dan saling bebas. Distribusi Binomial merupakan distribusi peubah acak diskrit. Suatu percobaan binomial ialah yang memenuhi persyaratan berikut : 1. Percobaan terdiri atas n usaha yang berulang 2. Tiap usaha memberikan hasil yang dapat dikelompokkan sukses atau gagal. 3. Peluang sukses, dinyatakan dengan p, tidak berubah dari usaha yang satu ke yang berikutnya. 4. Tiap usaha bebas dengan usaha lainnya. Jika pada percobaan dalam eksperimen itu, P( A) tetap harganya, maka percobaan yang berulang-ulang dari eksperimen itu dinamakan percobaan Bernoulli. Sekarang lakukan percobaan Bernoulli sebanyak N kali secara independen, X diantaranya menghasilkan peristiwa A dan sisanya (N-X) peristiwa A . Jika P( A) untuk tiap percobaan, 1 P( A) , maka peluang terjadinya peristiwa A sebanyak X=x kali diantara N, dihitung oleh (distribusi binomial) : N p( x) P( X x) (1 ) N x x N Dengan x = 0,1,2,....N, 0< <1, dan merupakan koefisien binomial x N N! x x!( N x )! Distribusi binom mempunyai parameter, diantaranya yang akan kita gunakan ialah rata-rata dan simpangan baku . Rumusnya adalah : N dan N (1 ) Dengan pengertian bahwa parameter ini ditinjau dari peristiwa A. CONTOH : 1. Peluang untuk mendapatkan 6 bermuka G ketika melakukan undian dengan sebuah mata uang sebanyak 10 kali adalah : 10 P( X 6) 1 2 6 1 2 6 4 210 1 2 10 0, 2050 Dengan X = jumlah muka G yang nampak 2. 10% dari semacam benda tergolong A. Sebuah sampel berukuran 30 telah diambil secara acak. Berapa peluang sampel itu akan berisikan benda kategori A : a. Semuanya b. Sebuah c. Dua d. Paling sedikit sebuah e. Paling banyak dua buah f. Tentukan rata-rata terdapatnya kategori A Penyelesaian : a. Kita artikan X = banyak benda kategori A. Maka = peluang benda termasuk kategori A=0,10. Semuanya tergolong kategori A berarti X=30 30 30 0 P( X 30) 0,10 0,90 10 30 30 Nilai yang sangat kecil yang atau bisa sama dengan nol. b. Sebuah termasuk kategori A berarti X=1 30 1 29 P( x 1) 0,10 0,90 0,1409 1 Peluang sampel itu berisi sebuah benda kategori A adalah 0,1409 c. Di sini X = 2, sehingga : 30 2 28 P( x 2) 0,10 0,90 0,2270 2 d. Paling sedikit sebuah benda tergolong kategori A, berarti x=1,2,3,...30. Jadi perlu P( x 1) P( x 20) ....... P( x 30). Tetapi P( x 0) P( x 1) .... P( x 30) , sehingga yang dicari adalah 1 P( x 0) 30 0 30 Sekarang P( x 0) 0,10 0,90 0,0423 0 Peluang dalam sampel itu terdapat paling sedikit sebuah benda kategori A adalah : 1-0,0423=0,9577 e. Terdapat paling banyak 2 buah kategori A, berarti X=0,1,2. Perlu dicari P( x 0) P( x 1) P( X 2) . Di atas, semuanya ini telah dihitung. Hasilnya = 0,0423+0,1409+0,2270=0,4102 f. 30(0,1) 3 . Rata-rata diharapkan akan terdapat 3 benda termasuk kategori A dalam setiap kelompok yang terdiri atas 30 buah. PERHITUNGAN DISTRIBUSI BINOMIAL Exp : Pendekatan normal untuk binomial dengan n = 15, p = 0,4 Menurut Teorema Limit Pusat : Jika x suatu variabel random binomial dengan mean = np & variansi 2 = np(1 – p). Jika n cukup besar (n>30) dan p tidak terlalu dekat dengan 0 atau 1, maka : Contoh : Dalam ujian pilihan ganda, tersedia 200 pertanyaan dengan 4 alternatif jawaban dan hanya 1 jawaban yang benar. Jika seseorang memilih jawaban secara random, berapa peluang dia lulus ujian (syarat lulus : benar paling sedikit 60) ? Jawab : x = banyak jawaban yang benar p = 0,25 = ¼ 1 – p = 0,75 x Bin(200; 0,25) = n.p = 200x0,25 = 50 2 = n.p(1-p) = 200(0,25).(0,75) = 37,5 = 6,13 P(x ≥ 60) = Luas kurva normal dari x = 59,5 ke kanan Z1 = X1 59 ,5 50 = 1,55 6 ,13 A = 0,4394 P(x≥60) = 0,5 – 0,4394 = 0,0606 = 6,06 % 2. DISTRIBUSI POISSON Distribusi Poisson dipakai untuk menentukan peluang suatu kejadian yang jarang terjadi, tetapi mengenai populasi yang luas atau area yang luas dan juga berhubungan dengan waktu. Variabel acak diskrit X dikatakan mempunyai distribusi Poisson jika fungsi peluangnya berbentuk : P ( X ) P ( X x) e x x! Keterangan : x = 0,1,2,3,...., e = sebuah bilangan konstan yang jika dihitung hingga 4 desimal e=2,7183 = sebuah bilangan tetap. Ternyata bahwa distribusi Poisson ini mempunyai parameter : Distribusi Poisson sering digunakan untuk menentukan peluang sebuah peristiwa yang dalam area kesempatan tertentu diharapkan terjadinya sangat jarang. Ciri-ciri distribusi Poisson : 1. Percobaan di satu selang tertentu tak bergantung pada selang lain. 2. Peluang terjadinya satu percobaan singkat atau pada daerah yang kecil (jarangterjadi) 3. Peluang lebih dari satu hasil percobaan alkan terjadi dalam selang waktu yang singkat tersebut, dapat diabaikan. Beberapa contoh : a. Banyak orang yang lewat melalui pasar setiap hari, tetapi sangat jarang terjadi seseorang yang menemukan barang hilang dan mengembalikannya kepada si pemilik atau melaporkannya kepada polisi. b. Dalam tempo setiap 5 menit, operator telepon banyak menerima permintaan nomor untuk disambungkan, diharapkan jarang sekali terjadi salah sambung. c. Misalkan rata-rata ada 1,4 orang buta huruf untuk setiap 100 orang. Sebuah sampel berukuran 200 telah diambil. Jika x= banyak buta huruf per 200 orang, maka untuk kita sekarang 2,8 . Peluangnya tidak terdapat yang buta huruf adalah : e 2,8 2,8 e 2,8 0,0608 0! 0 p(0) Sedangkan peluang terdapatnya yang buta sama dengan 0,9392. Distribusi Poisson dapat pula dianggap sebagai pendekatan kepada distribusi binom. Jika dalam hal distribusi binom, N cukup besar sedangkan = peluang terjadinya peristiwa A, sangat dekat kepada nol sedemikian sehingga NP tetap, Untuk penggunaanya, sering dilakukan pendekatan ini jika N 50 sedangkan Np 5 . Contoh : Peluang seseorang akan mendapatkan reaksi buruk setelah disuntik besarnya 0,0005. Dari 4000 orang yang disuntik, tentukan peluang yang mendapat reaksi buruk : a. Tidak ada b. Ada 2 orang c. Lebih dari 2 orang d. Tentukan ada berapa orang diharapkan yang akan mendapat reaksi buruk Penyelesaian : a. Dengan menggunakan pendekatan distribusi Poisson kepada distribusi binom, maka Np 4000 0,0005 2 Jika X = banyak orang yang mendapatkan reaksi buruk akibat suntikan itu, maka : e 2 2 0 p ( 0) 0,1353 0! b. Dalam hal ini X = 2, sehingga p ( 2) e 2 2 2 0, 2706 2! Peluang ada 2 orang yang mendapat reaksi buruk adalah 0,2706 c. Yang menderita reaksi buruk lebih dari 2 orang, ini berarti X=3,4,5,.... Tetapi p(0) p (1) p(2) ..... 1 , maka p(3) p (4) .... 1 p (0) p (1) p (2) . Harga-harga p (0) dan p (2) sudah dihitung diatas. e 2 2 1 p(1) 0,2706 1! d. Peluang yang dicari adalah 1 (0,1353 0,2706 0,2706) 0,3235 Ini tiada lain diminta menentukan rata-rata . Diatas sudah dihitung 2 3. PENGUJIAN HIPOTESIS DALAM DISTRIBUSI NORMAL DAN DISTRIBUSI POISON Pada prinsipnya pengujian hipotesis yang berkaitan dengan distribusi normal, distribusi binomial, maupun distribusi poison adalah sama, perbedaan terletak pada saat kita merumuskan hipotesis dan melakukan transformasi ke Z skor. Pada saat distribusi binomial maupun poison kita berhubungan dengan data diskrit, sehingga dalam pengujian hipotesis adalah mengujinprobabilitas (bukan µ). Untuk mempermudah pemahaman pengujian hipotesis pada distribusi binomial, perhatikan contoh berikut : Suatu hasil penelitian terhadap keberhasilan belajar mahasiswa di perguruan tinggi dengan nilai yang memuaskan telah terbukti bahwa 80% mahasiswa yang orang tuanya adalah guru berhasil menyelesaikan program sarjana dengan memuaskan. Belakangan ini ada isu bahwa keberhasilan anak-anak guru dalam menyelesaikan program sarjana dengan memuaskan semakin turun. Untuk membuktikan hal tersebut, maka dilakukan penelitian dengan mengumpulkan sampel sebanyak 100 lulusan program sarjana yang orangtuanya adalah guru. Dari hasil pengumpulan data ternyata 75% dari sampel dapat menyelesaikan program sarjana dengan memuaskan. Berdasarkan dasar tersebut, apakah kita dapat menarik suatu kesimpulan bahwa persentase keberhasilan anak guru untuk menyelesaikan program sarjana dengan nilai memuaskan memang menurun? Untuk itu marilah kita uji kebenaran dugaan tersebut melalui pengujian hipotesis. Hipotesisnya adalah : Ho : P ≥ 0,80 H1 : P < 0,80 Apabila kita mengambil alpha sebesar 0,05 maka Z 0,05 adalah 1,645 (lihat tabel Z). Transformasi ke Z dapat dihitung dengan rumus 5.1. Z= Sedangkan standar error dapat dihitung dengan rumus 5.2. σp = ( . ): Untuk soal di atas, standar error dan transformasi ke Z adalah : σp = (0,80 0,20): 100 = 0,40 Dengan demikian maka : Z= , , , = , , = −1,25 Dengan memperhatikan hipotesis kita dapat menentukan daerah penerimaan hipotesis nol, yaitu ≥ − 0,05 = -1,645. Oleh karena Z hasil perhitungan > daripada Z tabel, maka kita menerima hipotesis nol. Dengan demikian maka kita dapat mengambil suatu kesimpulan bahwa : keberhasilan anak guru dalam menyelesaikan program sarjana dengan nilai memuaskan menurun. Kurva yang menggambarkan pengujian hipotesis sebenarnya bisa berupa dua kurva yang digambarkan secara bersama, sehingga tampak apakah perbedaan rata-rata populasi dengan rata-rata sampel terletak di daerah penerimaan Ho atau tidak. Jika kedua rata-rata itu masih terletak di daerah penerimaan hipotesis nol, maka rata-rata tersebut tidak mempunyai perbedaan yang berarti. Dengan kata lain tidak ada perbedaan antara rata-rata populasi dengan sampel (penelitian). Sebaliknya, apabila rata-rata data yang terkumpul tersebut terletak pada daerah penolakan Ho, maka perbedaan antara kedua rata-rata tersebut sangat besar, sehingga kita dapat mengambil suatu kesimpulan bahwa terdapat perbedaan yang signifikan antara kedua rata-rata tersebut. Daerah penerimaan dan penolakan Ho dapat dilihat dalam kurva di bawah ini : Untuk pengujian hipotesis yang menggunakan one tailed tes daerah alphanya cukup satu sisi, di kanan atau kiri. 0,025 Daerah penerimaan Ho BAB 11 UJI F DAN UJI T Uji F dikenal dengan Uji serentak atau uji Model/Uji Anova, yaitu uji untuk melihat bagaimanakah pengaruh semua variabel bebasnya secara bersama-sama terhadap variabel terikatnya. Atau untuk menguji apakah model regresi yang kita buat baik/signifikan atau tidak baik/non signifikan. Jika model signifikan maka model bisa digunakan untuk prediksi/peramalan, sebaliknya jika non/tidak signifikan maka model regresi tidak bisa digunakan untuk peramalan. Uji F dapat dilakukan dengan membandingkan F hitung dengan F tabel, jika F hitung > dari F tabel, (Ho di tolak Ha diterima) maka model signifikan atau bisa dilihat dalam kolom signifikansi pada Anova (Olahan dengan SPSS, Gunakan Uji Regresi dengan Metode Enter/Full Model ). Model signifikan selama kolom signifikansi (%) < Alpha (kesiapan berbuat salah tipe 1, yang menentukan peneliti sendiri, ilmu sosial biasanya paling besar alpha 10%, atau 5% atau 1%). Dan sebaliknya jika F hitung < F tabel, maka model tidak signifikan, hal ini juga ditandai nilai kolom signifikansi (%) akan lebih besar dari alpha. Uji t dikenal dengan uji parsial, yaitu untuk menguji bagaimana pengaruh masingmasing variabel bebasnya secara sendiri-sendiri terhadap variabel terikatnya. Uji ini dapat dilakukan dengan mambandingkan t hitung dengan t tabel atau dengan melihat kolom signifikansi pada masing-masing t hitung, proses uji t identik dengan Uji F (lihat perhitungan SPSS pada Coefficient Regression Full Model/Enter). Atau bisa diganti dengan Uji metode Stepwise. Pernggunaan Uji F dan t akan dijelaskan lebih lanjut dalam Bab selanjutnya. BAB 12 PENGUJIAN HIPOTESIS 1. PENDAHULUAN Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang dibuat untuk menjelaskan hal itu yang sering dituntut untuk melakukan pengecekannya. Jika asumsi atau dugaan itu dikhususkan mengenai populasi, umumnya mengenai nilai-nilai parameter populasi, maka hipotesis itu disebut hipotesis statistik. Langkah atau prosedur untuk menentukan apakan menerima atau menolak hipotesis disebut pengujian hipotesis. 2. DUA MACAM KEKELIRUAN Dalam melakukan pengujian hipotesis, ada dua macam kekeliruan yang dapat terjadi, dikenal dengan nama-nama : a) Kekeliruan tipe I : ialah menolak hipotesis yang sehaeusnya diterima, b) Kekeliruan tipe II : ialah menerima hipotesis yang sehaeusnya ditolak. Untuk mengingat hubungan antara hipotesis, kesimpulan dan tipe kekeliruan, dapat dilihat dalam tabel di bawah ini. TIPE KEKELIRUAN KETIKA MEMBUAT KESIMPULAN TENTANG HIPOTESIS KESIMPULAN Terima Hipotesis Tolak Hipotesis KEADAAN SEBENARNYA HIPOTESIS BENAR HIPOTESIS SALAH KELIRU BENAR (Kekeliruan Tipe II) KELIRU BENAR (Kekeliruan Tipe I) Agar penelitian dapat dilakukan maka kedua tipe kekeliruan itu kita nyatakan dalam peluang. Peluang membuat kekeliruan tipe I bisa dinyatakan dengan α (baca : alfa) atau disebut kekeliruan α, dan peluang membuat kekeliruan tipe II bisa dinyatakan dengan β (baca : beta) atau disebut kekeliruan β. Dalam penggunaannya α disebut taraf signifikan atau taraf arti atau sering juga disebut taraf nyata dengan harga yang biassa digunakan 0,01 atau 0,05. Dengan α = 0,05 atau disebut juga 5%, maka berarti kira-kira 5 dari setiap 100 kesimpulan bahwa kita akan menolak hipotesis yang seharusny diterima. 3. LANGKAH-LANGKAH PENGUJIAN HIPOTESIS Supaya nampak adanya dua pilihan, hipotesis H ini perlu didampingi oleh pernyataan lain yang isinya berlawanan, yang merupakan tandingan unttuk H dan dinyatakan dengan A. Pasangan H dan A ini, tepatnya H melawan A, lebih jauh juga menentukan kriteria pengujian yang terdiri dari daerah daerah penerimaan dan daerah penolakan hipotesis. Daerah penolakan hipotesis sering pula disebut daerah kritis. Jika yang diuji parameter (dalam penggunaannya bisa rata-rata µ, proporsi π, simpangan baku σ dan lain-lain) maka akan didapat hal-hal : a) Hipotesis mengandung pengertian sama. Dalam hal ini pasangan H dan A adalah : 1) H : = A : = 3) H : = A : > Dengan , 1 1 2) H : = A : ≠ 4) H : = A : < 1 1 1 dua harga berlainan yang diketahui. Pasangan 1) dinamakan pengujian sederhana lawan sederhana sedangkan yang lainnya merupakan pengujian sederhana lawan komposit. b) Hipotesis mengandung pengertian maksimum. Untuk ini H dan A berbentuk : H : ≤ A : > 1 Yang biasa dinamakan pengujian komposit lawan komposit. c) Hipotesis mengandung pengertian minimum. Perumusan H dan A berbentuk : H : ≥ A : < 1 Ini juga pengujian komposit lawan komposit. Yang akan dipelajari hanyalah pengujian terhadap hipotesis yang perumusannya mengandung pengertian sama atau tidak memiliki perbedaan, disebut hipotesis nol dengan lambang H0 melawan hipotesis tandingannya dengan lambang H1 yang mengandung pengertian tidak sama, lebih besar atau lebih kecil. H1 ini harus dipilih atau ditentukan penelitu sesuai dengan persoalan yang dihadapi. Pasangan Ho dan H1 yang telah dirumuskan, untuk kita disini akan dituliskan dalam bentuk : ∶ 0 = ∶ 0 ≠ atau ∶ 0 = ∶ 0 > atau ∶ 0 = ∶ 0 < Langkah berikutnya, kita pilih bentuk statistik mana yang harus digunakan, apakah z, t, X , F, atau lainnya. Kemudian berdasarkan pilihan taraf nyata α atau disebut juga ukuran daerah kritis, kriteria pengyjian kita tentukan. Peran hipotesis tandingan dalam penentuan daerah kritis adalah sebagai berikut : 1) Jika tandingan mempunyai perumusan tidak sama, maka dalam distribusi statistik yang digunakan, normal untuk angka z, Student untuk t, dan seterusnya, didapat dua daerah kritis masing-masing pada ujung-ujung distribusi. Luas daerah kritis adalah . Pengujian hipotesis ini dinamakan uji dua pihak. Daerah Penolakan (Daerah kritis) Daerah Penolakan (Daerah kritis) Luas = 1/2α Luas = 1/2α Daerah Penerimaan d1 d2 Kedua daerh dibatasi oleh d1 dan d2 yang didapat dari dari daftar distribusi yang bersanglutan dengan menggunakan peluang yang ditentukan oleh α. Kriteria yang didapat adalah : terima hipotesis jika harga statistik yang dihitung berdasarkan data penelitian jatuh antara d1 dan d2, dalam hal lainnya ditolak. 2) Untuk tandingan yang mempunyai perumusan lebih besar, maka dalam distribusi yang digunakan didapat sebuah daerah kritis yang letaknya di ujung sebelah kanan. Luas daerah kritis ini sama dengan α. Daerah Penolakan (Daerah kritis) Daerah Penolakan (Daerah kritis) Luas = 1/2α Daerah Penerimaan Luas = α d Harga d didapat dari daftar distribusi yang bersangkutan dengan peluang yang ditentukan oleh α, menjadi batas antara daerah kritis dan daerah penerimaan . Kriteria yang dipakai adalah : tolak jika statistik yang dihitung berdasarkan sampel yang tidak kurang dari d. Dalam hal lainnya kita terima . Pengujian ini kita namakan uji satu pihak. 3) Jika tandingan mengandung pernyataan yang lebih kecil, maka daerah kritis ada di ujung kiri distribusi yang digunakan. Luas daerah ini = α yang menjadi batas daerah penerimaan oleh bilangan d yang didapatkan dari daftar distribusi yang bersangkutan. Peluang untuk mendapat d ditentukan oleh taraf nyata α. Daerah Penolakan (Daerah kritis) Luas = α Daerah Penerimaan d Kriteria yang digunakan adalah : terima jika statistis yang dihitungkan berdasarkan penelitian lebih besar dari d sedangkan dalam hal lainnya kita tolak. Dalam hal ini kita mempunyai uji satu pihak, ialah pihak kiri. 4. MENGUJI RATA-RATA µ : UJI DUA PIHAK Misalkan suatu populasi berdistribusi normal dengan rata-rata µ dan simpangan baku σ. Akan diuji mengenai parameter rata-rata µ. Untuk ini bisa diambil sampel acak berukuran n, lalu hitung statistik dan s. Dibedakan sebagai berikut ; Jika σ diketahui ∶ 0 = ∶ 0 ≠ Untuk pasangan hipotesisnya µ µ Dengan µ sebuah harga yang diketahui, maka digunakan statistik : = ̅− µ √ Jika σ tidak diketahui Dalam kenyataannya σ sering tuidak diketahui. Dengan pasangan hipotesis ∶ 0 = ∶ 0 ≠ µ µ maka menggunakan statistik : = ̅− µ √ H0 kita terima jika − ( ∝) < < ( ∝) didapat dari daftar normal baku dengan peluang (1−∝). Dalam hal lainnya, H0 ditolak. 5. MENGUJI RATA-RATA µ : UJI SATU PIHAK Perumusan yang umum untuk uji pihak kanan mengenai rata-rata µ berdasarkan dan adalah : ∶ 0 = ∶ 0 > µ µ Misalkan suatu populasi berdistribusi normal dan sampel acak berukuran n. Maka dihitung statistik dan s. Didapat hal-hal berikut : Jika σ diketahui Jika simpangan baku σ untuk p0opulasi diketahui, seperti biasa digunakan statistik = ̅ . Sketsa untuk kriteria untuk pengujian seperti dalam gambar √ berikut: Daerah Penolakan (Daerah kritis) Daerah Penolakan (Daerah kritis) Luas = 1/2α Luas = α Daerah Penerimaan d Selanjutnya menggunakan distribusi normal baku. Batas kriteria didapat dari daftar normal baku. ditolak jika z ≥ , dengan , normal baku menggunakan peluang (0,5 - ). Dalam hal lainnya didapat dari daftar diterima. Jika σ tidak diketahui Jika σ tidak diketahui maka statistik yang digunakan untuk menguji ∶ 0 = ∶ 0 > Adalah statistik ̅ = µ µ . Kriteria pengujian didapat dari daftar distribusi √ Student t denga dk = (n - 1) dan peluang (1 – ). ditolak jika t ≥ dengan diterima dalam hal lainnya. Jika σ tidak diketahui, maka untuk uji pihak kiri tersebut digunakan statistik t seperti yang tertera dalam = ̅ . Dalam hal ini ditolak jika t ≤ - , dengan √ didapat dari daftar distribusi Student menggunakan peluang (1 – ) dan dk = (n 1). Untuk t > - , hipotesis diterima. 6. MENGUJI PROPORSI µ : UJI DUA PIHAK Misalkan ada populasi binom dengan proporsi peristiwa A = π. Berdasarkan sebuah sampel acak yang diambil dari populasi itu, akan diuji mengenai dua pihak. ∶ 0 = µ ∶ 0 ≠ µ dengan sebuah harga yang diketahui. Dari sampel yang berukuran n itu dihitung proporsi sampel adanya peristiwa A. Dengan menggunakan pendekatan oleh distribusi normal, maka untuk pengujian ini digunakan statistik z yang rumusnya : = − (1 − ) Kriteria untuk pengujian ini, dengan taraf nyata α adalah : terima − ( ) < z < ( ) , dimana peluang (1 − ). Dalam hal lainnya ( ) jika didapat dari daftar normal baku dengan ditolak. Contoh: Kita ingin menguji bahwa distribusi siswa laki-laki dan dan siswa perempuan yang menguasai statistika adalah sama. Sebuah sampel acak terdiri atas 4.800 orang siswa adalah 2.458 siswa laki-laki. Dalam taraf nyata 0,05. Betulkah distribusi siswa laki-laki dan perempuan itu sama? Jawab: Jika π = peluang terdapatnya siswa laki-laki, maka akan diuji pasangan hipotesis: ∶ ∶ x = 2.458, n = 4.800, dan 1 2 1 ≠ 2 = = didapat, − = (1 − 2.458 − 0,5 = 4.800 = 1,68 ) (0,5) (0,5) 4.800 Nilai z dari daftar normal baku dengan α = 0,05 adalah 1,96. Jadi kriteria pengujian yang dipakai : terima sedangkan dalam hal lain sehingga jika z hitung terletak antara -1,96 dan 1,96; ditolak. Harga z = 1,86 ada pada daerah penerimaan diterima. Kesimpulan : peluang siswa laki-laki dan perempuan sama besar. 7. MENGUJI PROPORSI : UJI SATU PIHAK Jika yang diuji dari populasi binom itu berbentuk: ∶ ∶ = > maka pengujian demikian merupakan uji pihak kanan. Untuk ini pun, statistic yang digunakan masih statistik z seperti tertera dalam rumus di atas. Yang berbeda hanyalah dalam penentuan kriteris pengujiannya. Dalam hal ini, tolak H0 jika ≥ , ∝, di mana , ∝, , ∝ didapat dari daftar normal baku dengan peluang (0,5−∝). Untuk < hipotesis H0 diterima. Contoh: Seorang pejabat mengatakan bahwa paling banyak 60% anggota masyarakat termasuk golongan A. sebuah sampel acak telah diambil yang terdiri atas 8.500 orang dan ternyata 5.426 termasuk golongan A. Apabila ∝= 0,01, benarkah pernyataan tersebut? Jawab: ∶ ∶ Yang akan di uji adalah = 5.426; = 8.500; = = > 0,6 0,6 (1 − ) = 0,4, maka diperleh: = 0,6; 5.426 − 0,6 = 8.500 = 2,79 ) 0,6(0,4) 8500 − (1 − Dengan taraf nyata ∝= 0,01 dari daftar normal baku memberikan = 2,79 > Harga = 2,33. Maka = 2,33. , ditolak dan uji sangat berarti. Ini mengatakan bahwa persentase anggota masyarakat golongan A sudah melampaui 60%. Untuk uji pihak kiri, maka pasangan hipotesis nol dan tandingannya adalah: ∶ ∶ = < Kriteria pengujiannya adalah tolak H0 jika ≤ , ∝, di mana , ∝ didapat dari daftar normal baku dengan peluang (0,5−∝). Dalam hal lainnya H0 diterima. Contoh: Akan diuji ∶ ∶ = < 0,3 0,3 Sampel acak berukuran n = 425 memberikan = 0,28. Bagaimana hasil pengujian dengan ∝= 0,05 ? Jawab: = − (1 − ) = 0,28 − 0,3 0,3(0,7) 425 = −0,90 Dari daftar normal baku dengan ∝= 0,05 didapat ≤ −1,64. Jelas bahwa kiri, maka tolak H0 jika daerah penerimaan H0. Jadi, : , = 1,64. Untuk uji pihak = −0,90 ada pada = 0,3 diterima pada taraf nyata 0,05. Pengujian tak berarti. 8. MENGUJI VARIANS A. Uji dua pihak Untuk ini, pasangan H0 dan H1 adalah: ∶ ∶ = ≠ Untuk menguji ini dipakai statistik chi-kuadrat, = ( − 1) Jika dalam pengujian dipakai taraf nyata ∝, maka kriteria pengujian adalah: terima H0 jika ∝ < < ∝ dimana ∝ dan didapat dari daftar distribusi chi-kuadrat ∝ = ( − 1) dan masing-masing dengan peluang dengan ∝ dan 1 − ∝ . Dalam hal lainnya H0 ditolak. B. Uji satu pihak Dalam kenyataannya sangat sering dikehendaki adanya varians yang berharga kecil. Untuk ini pengujian diperlukan dan akan merupakan uji pihak kanan: ∶ ∶ Statistik yang digunakan masih tetap ≥ Tolak H0 jika ∝ = dimana = > ( ) ∝ . Kriteria dalam hal ini adalah : didapat dari daftar distribusi chi-kuadrat = ( − 1) dan peluang (1−∝). Dalam hal lainnya H0 diterima. dengan Jika hipotesis nol dan tandingannya menyebabkan uji pihak kiri, yakni ∶ ∶ pasangan: = < Maka hal yang sebaliknya akan terjadi mengenai kriteria pengujian, yaitu tolak H0 jika ≤ ∝, di mana ∝ didapat dari daftar distribusi chi-kuadrat dengan = ( − 1) dan peluang ∝ sedangkan statistik = ( ) tetap dihitung dengan menggunakan rumus . 9. MENGUJI KESAMAAN DUA RATA-RATA : UJI DUA PIHAK Pasangan hipotesis nol dan tandingannya yang akan diuji adalah : ∶ ∶ = ≠ Untuk ini kita bedakan hal-hal berikut. Hal A : = = dan diketahui Statistik yang digunakan jika H0 benar adalah: = − 1 + 1 dengan taraf nyata ∝, maka kriteria pengujian adalah: terima H0 jika − ( dimana ∝) ( ∝) ( ∝) < < (1−∝). didapat dari daftar normal baku dengan peluang Dalam hal lainnya H0 ditolak. Hal B : = = tetapi tidak diketahui Jarang sekali tetapi diketahui besarnya. Jika H0 benar dan = = tidak diketahui harganya, statistik yang digunakan adalah = − 1 + 1 dengan = ( − 1) + ( − 1) + −2 Menurut teori distribusi sampling, maka statistik t di atas berdistribusi student dengan ∝ =( dimana + ∝ − 2). Kriteria pengujian adalah : terima H0 jika − didapat dari daftar distribusi t dengan peluang 1 − ∝. Dalam hal lainnya H0 ditolak. =( + ∝ < < − 2) dan ≠ Hal C : dan kedua-duanya tidak diketahui Pendekatan yang digunakan dengan statistik t berikut. − = + Kriteria pengujiannya adalah : terima hipotesis H0 jika + + − = dengan : ; = < + + < = = ) ∝ ,( ) ∝ ,( , m didapat dari daftar distribusi Student dengan peluang dan dk = m. untuk harga- harga t lainya, H0 ditolak. Hal D : Observasi Berpasangan = Untuk observasi berpasangan, kita ambil − . Hipotesis nol dan tandingannya adalah : ∶ ∶ Jika = − menghasilkan rata-rata , = − = 0 ≠ 0 ,…, = dan simpangan baku − , maka data , ,…, . Untuk pengujian hipotesis, gunakan : = √ dan terima H0 jika − ∝ dengan peluang 1 − ∝ dan < < ∝ dimana ∝ didapat dari daftar distribusi t = ( − 1). Dalam hal lainnya H0 ditolak. 10. MENGUJI KESAMAAN DUA RATA-RATA : UJI SATU PIHAK Sebagaimana dalam uji dua pihak, untuk uji satu pihak pun dimisalkan bahwa kedua populasi berdistribusi normal dengan rata-rata . Karena umumnya besar ditinjau hal-hal tersebut untuk keadaan dan simpangan baku tidak diketahui, maka di sini akan = atau ≠ . Hal A. Uji Pihak Kanan ∶ ∶ Yang diuji adalah = Dalam hal = > , maka statistik yang digunakan ialah : − = 1 + 1 dengan = ( − 1) + ( − 1) + −2 Kriteria pengujian yang berlaku ialah terima H0 jika < =( mempunyai harga-harga lain. Dengan ≠ Jika + ∝ dan tolak H0 jika t − 2), dan peluang (1−∝). , maka statistik yang digunakan adalah − = + Kriteria pengujiannya adalah : tolak hipotesis H0 jika + + ≥ Dan terima H0 jika sebaliknya, dengan : = ; = ; = ∝ ,( ) = ∝ ,( ) Peluang untuk penggunaan daftar distribusi t ialah (1−∝) sedangkan dk-nya masingmasing ( − 1) dan ( − 1). Untuk observasi berpasangan, pasangan hipotesis nol H0 dan hipotesis tandingan H1, untuk uji pihak kanan adalah ∶ ∶ = 0 > 0 Statistik yang digunakan masih statistik = √ dan tolak H0 jika peluang 1−∝ dan ≥ ∝ dimana = ( − 1). ∝ didapat dari daftar distribusi student dengan Contoh : untuk mempelajari kemampuan belajar tentang menjumlahkan bilangan, 10 anak laki-laki dan 10 anak perempuan telah diambil secara acak. Dari pengamatan masa lampau kemampuan belajar anak laki-laki umumnya lebih baik daripada kemampuan belajar anak perempuan. Hasil ujian yang dilakukan adalah : Laki-laki 30 21 21 27 20 25 27 22 28 18 Perempuan 31 22 37 24 30 15 25 42 19 38 Apakah yang dapat disimpulkan dari hasil ujian ini? Jawab: Dari data di atas, setelah dihitung berdasarkan beda (selisih) tiap pasangan data, didapat = 4,4 dan = 11,34, maka = = √ 4,4 = 1,227 11,34 √10 Dengan dk = 9 dan peluang 0,95 dari daftar distribusi student didapat , = 1,83. Karena t = 1,22 lebih kecil dari 1,83 maka H0 diterima. Dalam hal ini masih dapat dikatakan bahwa rata-rata hasil ujian anak laki-laki lebih baik daripada rata-rata hasil ujian anak perempuan. Hal B. Uji Pihak Kiri Perumusan hipotesis H0 dan hipotesis tandingan H1 untuk uji pihak kiri adalah : ∶ ∶ = < Langkah-langkah yang ditempuh dalam hal ini sejalan dengan yang dilakukan untuk uji pihak kanan. Jika = , kedua-duanya nilainya tidak diketahui, maka digunakan statistik = − 1 + 1 Kriteria pengujiannya adalah tolak H0 jika daftar distribusi t dengan =( t lainnya, H0 diterima. Jika ≠ + ≤ ∝ dimana ∝ − 2), dan peluang (1−∝). Untuk harga-harga , maka yang digunakan adalah statistik = didapat dari − + Kriteria pengujiannya adalah : tolak hipotesis H0 jika + + ≤ Dimana , , , semuanya seperti yang telah diuraikan di atas. Jika t lebih besar dari harga tersebut, maka H0 diterima. Untuk observasi berpasangan, hipotesis H0 dan tandingan yang akan diuji adalah: ∶ ∶ = 0 < 0 Statistik yang digunakan ialah statistik = √ dan tolak H0 jika ≤ ( ) ∝),( dan terima H0 untuk ≤ − ( ). ∝),( 11. MENGUJI KESAMAAN DUA PROPORSI : UJI DUA PIHAK Akan diuji hipotesis ∶ ∶ = ≠ Untuk ini digunakan pendekatan oleh distribusi normal dengan statistik : − = dengan = dan 1 + 1 = 1− . Jika dalam pengujian ini digunakan taraf nyata ∝, maka kriteria pengujiannya adalah: terima H0 jika − ( ∝) < < ( ∝) dimana ( ∝) didapat dari daftar normal baku dengan peluang (1−∝). Dalam hal lainnya H0 ditolak. Contoh : Suatu penelitian dilakukan di daerah T terhadap 250 pemilih. Ternyata 150 pemilih menyatakan akan memilih calon R. Di daerah S penelitian dilakukan terhadap 300 pemilih dan terdapat 162 yang akan memilih calon R. adaph perbedaan nyata mengenai pemilihan calon R di antara kedua daerah itu ? Jawab: Hipotesis yang akan di uji adalah : = = = 0,5673, dan 1 = 1 + = ≠ =1− = 0,4327. Maka, 150 162 250 − 300 1 1 (0,5673)(0,4327) 250 + 300 − = ∶ ∶ Kriteri pengujian adalah: terima H0 jika − ( ∝) = ( , ) = , = 1,96, sehingga −1,96 < ( ∝) < < = 1,42 ( ∝) dimana < 1,96. Dalam hal lainnya H0 ditolak. Jelas bahwa z = 1,42 ada dalam penerimaan H0. Kesimpulan: dalam taraf 5%, penelitian memperlihatkan bahwa tidak terdapat perbedaan yang nyata antara kedua daerah itu terhadap pemilihan calon R. 12. MENGUJI KESAMAAN DUA PROPORSI : UJI SATU PIHAK Untuk uji pihak kanan, maka pasangan hipotesisnya adalah: ∶ ∶ = > Statistik yang digunakan masih berdasarkan pendekatan distribusi normal, jadi digunakan statistik − = Dalam hal ini tolak H0 jika 1 ≥ ( , ∝) + 1 dan terima H0 untuk < ( , ∝) dengan ∝ = taraf nyata. Apabila uji pihak kiri, maka hipotesis nol H0 dan tandingannya adalah H1 berbentuk ∶ ∶ = < Dengan statistik yang sama seperti di atas, tolak H0 jika terima H0 untuk >− ( , ∝) ≤− ( , dengan ∝ = taraf nyata. Untuk kedua-duanya didapat dari daftar distribusi normal baku dengan peluang (0,5−∝). ∝) ( , dan ∝) BAB 13 ANALISIS VARIANS (ANOVA) Analisa varians (Analysis of Varianc) atau yang lebih dikenal dengan istilah ANOVA adalah suatu teknik untuk menguji kesamaan beberapa rata-rata secara sekaligus. Tujuannya untuk mengetahui apakah ada perbedaan rata-rata dalam sampel dengan perbedaan rata-rata antar sampel. Uji yang dipergunakan dalam ANOVA adalah uji F karena dipakai untuk pengujian dari 2 sampel.Anova dapat digolongkan ke dalam beberapa kriteria, yaitu : 1. Klasifikasi 1 arah ANOVA klasifikasi 1 arah merupakan ANOVA yang didasarkan pada pengamatan 1 kriteria. 2. Klasifikasi 2 arah ANOVA klasifikasi 2 arah merupakan ANOVA yang didasarkan pada pengamatan 2 kriteria. 3. Klasifikasi banyak arah ANOVA banyak arah merupakan ANOVA yang didasarkan pada pengamatan banyak kriteria. 1. ANOVA SATU ARAH (ONE WAY - ANOVA) Anava atau Anova adalah anonim dari analisis varian terjemahan dari analysis of variance, sehingga banyak orang yang menyebutnya dengan anova. Anova merupakan bagian dari metoda analisis statistika yang tergolong analisis komparatif (perbandingan) lebih dari dua rata-rata. Uji anova satu arah adalah untuk membandingkan lebih dari dua rata-rata. Sedangkang gunanya untuk menguji kemampuan generalisasi. Maksudnya dari signifikansi hasil penelitian (anava satu jalur). Jika terbukti berbeda berarti kedua sampel tersebut dapat digeneralisasikan, artinya data sampel dianggap dapat mewakili populasi. Anova pengembangan atau penjabaran lebih lanjut dari uji-t ( ). Uji-t atau uji-z hanya dapat melihat perbandingan dua kelompok data saja. Sedangkan anova satu jalur lebih dari dua kelompok data. Contoh: Perbedaan prestasi belajar statistika antara mahasiswa tugas belajar (X1), izin belajar (X2) dan umum (X3). Anova lebih dikenal dengan uji-F (Fisher Test), sedangkan arti variasi atau varian itu asalnya dari pengertian konsep “Mean Square” atau kuadrat rerata (KR). Rumusnya : = Dimana : JK = jumlah kuadrat (some of square) db = derajat bebas (degree of freedom) Menghitung nilai Anova atau F ( = = ) dengan rumus : ∶ = = ∶ Varian dalam group dapat juga disebut Varian Kesalahan (Varian Galat). Dapat dirumuskan : = ∑ (∑ = ∑ ) − − ∑ (∑ (∑ ) ) untuk = −1 untuk = − Dimana : (∑ ) = sebagai faktor koreksi N = Jumlah keseluruhan sampel (jumlah kasus dalam penelitian). A = Jumlah keseluruhan group sampel. Langkah-langkah uji anova satu arah 1) Sebelum anova dihitung, asumsikan bahwa data dipilih secara random, berdistribusi normal, dan variannya homogen. 2) Buatlah hipotesis ( )dalam bentuk kalimat. 3) Buatlah hipotesis ( )dalam bentuk statistik. 4) Buatlah daftar statistik induk. 5) Hitunglah jumlah kuadrat antar group ( = ∑ (∑ ) − (∑ ) = (∑ ) + ) dengan rumus : (∑ ) + ) − (∑ = −1 ) dengan rumus : = 6) Hitunglah derajat bebas antar group dengan rumus : 7) Hitunglah kudrat rerata antar group ( (∑ ) 8) Hitunglah jumlah kuadrat dalam antar group ( = ∑ − ∑ = (∑ ) dengan rumus : ) + + − (∑ ) + 9) Hitunglah derajat bebas dalam group dengan rumus : 10) Hitunglah kuadrat rerata dalam antar group ( 11) Carilah dengan rumus : (∑ ) = − + (∑ ) dengan rumus : ) = = 12) Tentukan taraf signifikansinya, misalnya α = 0,05 atau α = 0,01 13) Cari dengan rumus : = ( )( , ) 14) Buat Tabel Ringkasan Anova TABEL RINGKASSAN ANOVA SATU ARAH Sumber Jumlah Kuadrat Derajat Varian (SV) (JK) bebas (db) Antar group (∑ ) (A) − Dalam group − (D) Total − (∑ ) (∑ ) (∑ ) Taraf Rerata Signifikan (KR) ( ) α A–1 N–A N–1 ≥ 15) Tentukan kriteria pengujian : jika dan konsultasikan antara Kuadrat dengan , maka tolak - - - berarti signifan kemudian bandingkan. 16) Buat kesimpulan. KASUS Seorang ingin mengetahui perbedaan prestasi belajar untuk mata kuliah dasar-dasar statistika antara mahassiswa tugas belajar, izin belajarn dan umum. Data diambil dari nilai UTS sebagai berikut : Tugas belajar ( Izin belajar ( Umum ( ) ) ) = 6 8 5 7 7 6 6 8 7 6 7 = 11 orang = 5 6 6 7 5 5 5 6 5 6 8 7 = 12 orang = 6 9 8 7 8 9 6 6 9 8 6 8 = 12 orang Buktikan apakah ada perbedaan atau tidak? LANGKAH-LANGKAH MENJAWAB : 1) Diasumsikan bahwa data dipilih secara random, berdistribusi normal, dan variannya homogen. 2) Hipotesis ( ) dalam bentuk kalimat. = Terdapat perbedaan yang signifikan antara mahasiswa tugas belajar, izin belajar dan umum. = Tidak ada perbedaan yang signifikan antara mahasiswa tugas belajar, izin belajar dan umum. 3) Hipotesis ( : ) dalam bentuk statistik ≠ = : = = 4) Daftar statistik induk NILAI UTS No 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. STATISTIK n / Varian ( ) 6 8 5 7 7 6 6 8 7 6 7 - 5 6 6 7 5 5 5 6 5 6 8 7 6 9 8 7 8 9 6 6 9 8 6 8 11 73 943 6,64 484,45 12 71 431 5,92 420,08 12 90 692 7,5 675 TOTAL (T) N = 35 234 1616 6,69 1564,46 0,85 0,99 1,55 1,13 5) Menghitung jumlah kuadrat antar group ( = (∑ ) − (∑ ) ) dengan rumus : ( = ) ( + ) + ( ) − ( ) = 1579,53 − 1564,46 15,07 6) Hitunglah derajat bebas antar group dengan rumus : = −1=3–1=2 A = jumlah group A 7) Hitunglah kudrat rerata antar group ( = ) dengan rumus : 15,07 = 7,54 2 = 8) Hitunglah jumlah kuadrat dalam antar group ( = (∑ − ) 2 = (493 + 431 + 692) − ) dengan rumus : 2 73 71 90 + + 11 12 12 2 = 1616 − 1579,53 = 36,47 9) Hitunglah derajat bebas dalam group dengan rumus : = − = 35 – 3 = 32 10) Hitunglah kuadrat rerata dalam antar group ( = 11) Carilah = ) dengan rumus : 36,47 = 1,14 32 dengan rumus : = = , , = 6,61 12) Tentukan taraf signifikansinya, misalnya α = 0,05 13) Cari dengan rumus : = ( )( = ( , = ( , )( , , ) )( , ) ) = 3,30 Cara mencari : Nilai = 3,30 dan arti angka ( , )( , ) 0,95 = Taraf kepercayaan 95% atau taraf signifikan 5%. Angka 2 = pembilang atau hasil dari db . Angka 32 = penyebut atau hasil dari db . Apabila angka 2 dicari ke kanan dan angka 32 ke bawah maka akan bertemu dengan nilai = 3,30 . Untuk taraf signifikansi 5% dipilih pada bagian ats dan 1% dipilih pada bagian bawah. 14) Buat Tabel Ringkasan Anova TABEL RINGKASSAN ANOVA SATU JALUR Sumber Jumlah Kuadrat Derajat Kuadrat Taraf Varian (JK) bebas (db) Rerata Signifikan (KR) ( ) (SV) Antar 15,07 2 7,54 6,61 group (A) < 0,05 = 3,30 Dalam 36,47 32 1,14 - - 51,54 34 - - - group (D) Total 15) Tentukan kriteria pengujian : jika ≥ , maka tolak berarti signifan. Setelah dikonsultasikan dengan tabel F kemudian dibandingkan antara dengan .ternyata : > atau 6,61 > 3,30 maka tolak berarti signifikan. 16) Kesimpulan. ditolak dan diterima. Jadi, terdapat perbedaan yang signifikan antara mahasiswa tugas belajar, izin belajar dan umum. 2. ANOVA DUA ARAH (TWO-WAY ANOVA) Pengujian anova dua arah mempunyai beberapa asumsi diantaranya: 1. Populasi yang diuji berdistribusi normal, 2. Varians atau ragam dan populasi yang diuji sama, 3. Sampel tidak berhubungan satu dengan yang lain. Tujuan dari pengujian anova dua arah adalah untuk mengetahui apakah ada pengaruh dari berbagai kriteria yang diuji terhadap hasil yang diinginkan. Anova dua arah dibagi menjadi dua bagian, yakni sebagai berikut. 1. Anova Dua Arah tanpa Interaksi Pengujian klasifikasi dua arah tanpa interaksi merupakan pengujian hipotesis beda tiga rata-rata atau lebih dengan dua faktor yang berpengaruh dan interaksi antara kedua faktor tersebut ditiadakan. Jumlah Sumber Varians Kuadrat Derajat Bebas Rata-Rata Baris JKB b–1 Rata-Rata Kolom JKK k–1 Error JKE (k – 1) (b – 1) JKT kb - 1 Total Rata-Rata Kuadrat = = = − 1 dan = ( − 1)( − 1) Kolom : = − 1 dan = ( − 1)( − 1) Jumlah Kuadrat Total )= − Jumlah Kuadrat Baris ( )= ( )= ∑ − Jumlah Kuadrat Kolom ∑ = = Baris : ( f0 − = Jumlah Kuadrat Error ( )= − − Keterangan : T = total Contoh: Berikut ini adalah hasil perhektar dari 4 jenis padi dengan penggunaan pupuk yang berbeda. V1 V2 V3 V4 T P1 4 6 7 8 25 P2 9 8 10 7 34 P3 6 7 6 5 24 19 21 23 20 83 Dengan taraf nyata 5%, ujilah apakah rata-rata hasil perhektar sama untuk : a. Jenis pupuk (pada baris), b. Jenis tanaman (pada kolom). Jawab: 1. Hipotesis = a. = = = − = b. =0 = = = ≠0 =0 − ≠0 2. Taraf nyata ( ) = 5% = 0,05 ( ): a. Untuk baris = −1 =3−1 =2 = ( − 1)( − 1) = (3 − 1)(4 − 1) = 6 ( = ) ; ( ; ) , = 5,14 b. Untuk kolom = −1 =4−1 =3 = ( − 1)( − 1) = (3 − 1)(4 − 1) = 6 ( ; ) = , ( ; ) = 4,76 3. Kriteria Pengujian ≤ 5,14 a. > 5,14 ≤ 4,76 b. > 4,76 4. Perhitungan = = − ∑ − =4 +9 + … +5 − = ∑ − = , 25 + 34 + 24 83 2357 6889 − = − 4 4(3) 4 12 = 589,25 − 574,08 = = 83 = 605 − 574,08 = 4(3) , 19 + 21 + 23 + 20 83 1731 6889 − = − 3 4(3) 3 12 = 577 − 574,08 = , = − = 30,92 − 15,17 − 2,92 = , 15,17 15,17 = = 7,585 = 7,59 3−1 2 2,92 2,92 = = = 0,97 4−1 3 12,83 12,83 = = = = 2,14 ( − 1)( − 1) 3(2) 6 = = = = = − = 7,59 = 3,55; 2,14 = = 0,97 = 0,45 2,14 5. Kesimpulan a. Karna = 3,55 < , ( ; ) = 5,14, maka H0 diterima. Jadi, rata-rata hasil perhektar sama untuk pemberian ketiga jenis pupuk tersebut. b. Karna = 0,45 < , ( ; ) = 4,76, maka H0 diterima. Jadi, rata-rata hasil perhektar sama untuk penggunaan ke-4 varietas tanaman tersebut. 2. Anova Dua Arah dengan Interaksi Pengujian klasifikasi dua arah dengan interaksi merupakan pengujian beda tiga rata-rata atau lebih dengan dua faktor yang berpengaruh dan pengaruh interaksi antara kedua faktor tersebut diperhitungkan. Jumlah Sumber Varians Kuadrat Rata-Rata Baris JKB b–1 Rata-Rata Kolom JKK k–1 JK (BK) (k – 1) (b – 1) Interaksi Rata-Rata Derajat Bebas = JKE = = ( = Error JKT bkn - 1 = − Jumlah Kuadrat Baris = ∑ − Jumlah Kuadrat Kolom = ∑ − Jumlah Kuadrat Bagi Interaksi Baris Kolom )= ∑ ∑ − ∑ − ∑ + Jumlah Kuadrat Error = Keterangan : T = total = = Jumlah Kuadrat Total ( ) bk(n-1) = Total f0 Kuadrat − − − ( ) Contoh: Ekonomi Tingkat Keluarga Tingkat Aktivitas Ekstrakulikuler t1 t2 t3 t4 Total V1 V2 V3 64 72 74 66 81 51 70 64 65 65 57 47 63 43 58 58 52 67 59 66 58 68 71 39 65 59 42 58 57 53 41 61 59 46 53 38 723 736 651 Nb: untuk mempermudah dalam penyelesaian, masing-masing dijumlahkan dulu. = 4; = 3; =3 Jawab: 1. Hipotesis ∶ = = = = ∶ = = = ) = =( = − 2. Taraf nyata 5% = 0,05 > ( ; , > , ≠0 =0 − =( > =0 − = ∶ = ; ( )( ( ; > 3,01 ⟶ ) ) ) ≠0 ) =( ) =…= ( ( ) =0 ) ≠0 Total 607 510 527 466 2110 > ( ; > ; ( )( , > ) ( ; , ) ) > 3,40 ⟶ > ( > )( ( , > )( ( ; , ); ( ) ); ( )( ) ) > 2,51 ⟶ 3. Perhitungan = − = 64 + 66 + ⋯ + 38 − = 127448 − = ∑ ∑ = ( )= = ∑ 2110 36 = 127448 − 123669 = 3779 − = 607 + 510 + 527 + 466 2110 − = 1157 9 36 − = 723 + 736 + 651 2110 − = 350 12 36 ∑ − ∑ − ∑ + 200 + ⋯ + 150 607 + ⋯ + 466 723 + 736 + 651 2110 − − + 3 9 12 36 = 771 = − = = = = ( = − − ( ) = 3779 − 350 − 1157 − 771 = 1501 1157 = 385,67; 4−1 ) 771 = = 128,5; (3)(2) 385,67 = 6,17 > 62,54 = = , 350 = 175 3−1 1501 = = 62,54 24 = = = 175 = 2,8 < 62,54 = = 128,5 = 2,05 < 62,54 , , 4. Kesimpulan Tingkat aktivitas ekstrakulikuler berpengaruh terhadap prestasi, tingkat ekonomi tidak berpengaruh terhadap prestasi siswa dan adanya interaksi antara tingkat ekonomi dengan ekstrakulikuler. DAFTAR PUSTAKA Irianto, Agus. 2008. Statistik Konsep Dasar dan Aplikasinya. Jakarta: Kencana. Hasan, Iqbal. 2006. Analisis Data Penelitian dengan Statistik. Jakarta: Bumi Aksara. Riduwan. Dasar-Dasar Statistika. 2005. Bandung : Alfabeta. Sudjana. 2002. Metoda Statistika edisi ke 6. Bandung: Tarsito. Tedjo N Raksonoatmodjo. 2009. Statistika Teknik. Jakarta : Refilka Aditama.