Analisa Data Statistik Ratih Setyaningrum , MT Referensi Agoes Soehianie, Ph.D Daftar Isi Inferensi Statistik Hipotesa Statistik : Konsep Umum Hipotesa statistik adalah sebuah klaim/pernyataan atau conjecture tentang populasi. Contoh masalah yg akan dijawab dengan hipotesa statistik: Apakah merokok menaikkan resiko kanker? Apakah tipe darah ada hubungannya dengan berat badan? Berapa persen pemilih yg akan memilih calon A sebagai presiden? Benar atau tidaknya sebuah hipotesa statistik secara mutlak hanya akan diperoleh bilamana seluruh populasi dipelajari. Hal ini sulit atau tidak mungkin pada banyak kasus. Sehingga diambil sampel saja, berdasarkan data dari sampel kemudian diambil keputusan untuk menerima atau menolak hipotesa tentang populasi. Situasi Yang Mungking Dalam Test Hipotesa Statistik H0 benar H0 salah H0 Tidak ditolak Keputusan Benar Error Tipe II (β) H0 Ditolak Error Tipe I (α) Keputusan Benar Error tipe I adalah situasi dimana H0 benar tetapi ditolak (berarti H1 diterima) Besarnya probabilitas ( α) untuk melakukan error tipe I disebut juga tingkat signifikan (level of significance) dari test statistik. Error tipe II adalah situasi dimana H0 salah tetapi tidak ditolak, sehingga H1 tidak diterima Daerah Kritis dan Nilai Kritis Daerah kritis adalah luas ekor di kurva normal, yang menyatakan probabilitas untuk mendapatkan nilai rata-rata sampel lebih besar atau lebih kecil dari nilai kritis tertentu, walaupun nilai rata-rata populasinya sebesar X=X0. Luas daerah kritis ini mencerminkan probabilitas untuk menolak H0 walaupun sebenarnya H0 benar. Nilai kritis Daerah kritis Test 1 Ekor dan 2 Ekor Jika Hipotesa Alternatif berupa ketidaksamaan disebut test 1 ekor: H0 : X = X0 H1 : X > X0 Atau H0 : X = X0 H1 : X < X0 Sedangkan jika H1 berupa ketidaksamaan disebut test 2 ekor: H0 : X = X0 H1 : X ≠ X0 Prosedur Testing Hipotesis Dengan Error Tipe I ditentukan dulu (α Fixed) 1. 2. 3. 4. 5. 6. Tuliskan H0 dan H1 Pilih tingkat signifikan yaitu α (biasanya 5% atau 10%) Pilih test statistik yg sesuai dan nilai kritis yg membatasi daerah kritis sesuai dengan tingkat signifikan yg dipilih Hitung statistik yg bersesuaian dengan (3) di atas berdasarkan sampel data. Ambil keputusan : H0 ditolak jika hasil hitung test statistik masuk di daerah kritis, kalau tidak H0 tidak bisa ditolak (atau terima H1) Buat kesimpulan Test STatistik Berkenaan dengan Rata-Rata 1 Populasi (Variansi Populasi diketahui) Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (σ) diketahui . Dari sampel yg diambil berukuran n diketahui ratarata sampelnya xs. Test – 1 ekor 1. Tuliskan H0 dan H1 H0 : μ = μ0 H1 : μ ≠ μ0 2. Pilih tingkat signifikan : α (misal 5%) 3. Test statistik bagi rata-rata adalah nilai Z dari rata-rata, karena α=5% maka nilai kritis yg bersesuaian dari tabel adalah Z0.025 = 1.96 dan –Z0.025 (test 2 ekor). Daerah kritis adalah Z>1.96 atau Z<-1.96. 4. Hitung Z dari sampel x Z hitung / n 5. Ambil keputusan berdasarkan (4) dan (3) Contoh Sebuah pabrik senar pancing mengklaim produk barunya memiliki kekuatan rata-rata 8kg dan standard deviasi 0.5kg. Sampel random 50 buah senar baru tsb menghasilkan rata-rata kekuatan 7.8kg. Periksalah hipotesa μ=8kg tsb dengan alternative μ≠8kg dengan tingkat signifikan 1%. Solusi 1. H0: μ=8 dan H1: μ≠8 2. α = 0.01 3. Daerah kritis Z0.005 = 2.575 Tolak H0 jika Z < -2.575 atau Z > 2.575, dengan Z x / n 4. Hitung statistik: Z hitung x / n Z hitung 8 7.8 2.83 0.5 / 50 5. Keputusan : Tolak H0 sebab Zhitung < -2.575 6. Kesimpulan: kekuatan rata-rata senar tidak 8 kg (kenyataannya < 8 kg) Soal: test 1 ekor Sampel random 100 catatan kematian di USA tahun lalu menyatakan umur rata-rata penduduknya 71.8 tahun. Misalkan diketahui standard deviasi populasi adalah 8.9 tahun, apakah hasil ini mendukung dugaan bahwa umur rata-rata penduduk USA lebih dari 70 tahun? Pergunakan tingkat signifikan 5%. Test STatistik Berkenaan dengan Rata-Rata 1 Populasi (Variansi Populasi Tidak diketahui) Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (σ) TIDAK diketahui tetapi populasi dianggap normal. Dari sampel yg diambil berukuran n diketahui rata-rata sampelnya xs. Maka statistik yg bersesuaian adalah student-t statistik: x 0 t S/ n Dengan derajat kebebasan v=n-1 Contoh Hasil studi tentang konsumsi listrik berbagai peralatan rumah tangga mengklaim bahwa vacuum cleaner rata-rata mengkonsumsi 46 KwH/tahun. Sampel random 12 rumah tangga yg memiliki vacuum cleaner menghasilkan rata-rata 42 KwH/tahun dengan standard deviasi sampel 11.9 KwH. Apakah hasil ini menyarankan bahwa sebenarnya vacuum cleaner mengkonsumsi listrik ratarata di bawah 46 KwH /tahun? Pergunakanlah tingkat signifikan 5% dan asumsikan populasimnya terdistribusi normal. Solusi 1. H0: μ=46 dan H1: μ < 46 2. α = 0.05 3. Daerah kritis (1 ekor, student-t) n= 12, derajat kebebasan v=n-1=11 t0.05 =-1.796 (ekor kiri) Tolak H0 jika t < -1.796 4. Hitung statistik: x 42 46 thitung 1.16 S / n 11.9 / 12 5. Keputusan : Tidak bisa menolak H0 sebab thitung > -1.796 6. Kesimpulan: rata-rata konsumsi listrik vacuum cleaner tidak secara signifikan kurang dari 46 KwH/tahun Test STatistik Berkenaan dengan Rata-Rata 2 Populasi (Variansi Populasi diketahui) Situasi : berdasarkan 2 set sampel dengan rata-rata xSA dan xSB yg berasal dari dua populasi, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Jika variansi populasi (σ1 dan σ2 ) diketahui, maka variabel statistik: Z ( x1 x2 ) ( 1 2 ) 12 n1 Akan terdistribusi normal standard. 22 n2 Contoh Pabrik benang mengklaim bahwa rata-rata kekuatan benang tipe A paling tidak 12 kg lebih besar dibandingkan benang tipe B. Untuk memeriksa klaim tersebut diambil sampel 50 buah dari tiap-tiap tipe benang. Ternyata sampel benang A memiliki rata-rata kekuatan 86.7 kg, standard deviasi populasi dari benang tipe A diketahui 6.26 kg. Sedangkan rata-rata kekuatan sampel benang B adalah 77.8 kg, dan dari data-data sebelumnya diketahui standard deviasi kekuatan benang B adalah 5.61. Periksalah klaim pabrik tsb pada tingkat signifikan 5%. Solusi Diketahui: Benang A nA = 50 xsA = 86.7 σA = 6.26 α=5% Klaim : xSA-xsB > 12 1. Benang B nB=50 xsB = 77.8 σB = 5.61 Hipotesa H0: μA- μB ≤ 12 H1: μA- μB> 12 2. 3. Tingkat signifikansi α=5% Daerah kritis Solusi 3. Daerah kritis Test statistik untuk kasus ini adalah Z, : Z ( x1 x2 ) ( 1 2 ) 12 n1 22 n2 dengan nilai kritis Z0.05 = 1.65. Tolak H0 jika Z > 1.65 4. Hitung statistik Z hitung ( x1 x2 ) ( 1 2 ) 2 1 n1 5. 2 2 n2 (86.7 77.8) (12) 6.26 50 2 2 2.608 5.61 50 Keputusan Karena Zhitung = -2.608 < 1.65, maka Tidak bisa menolak H0, jadi μA-μB ≤ 12 Test STatistik Berkenaan dengan Rata-Rata 2 Populasi (Variansi Populasi TIDAK diketahui TAPI SAMA) Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA dan xSB serta standard deviasi sampel SA dan SB yang berasal dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan σ2 ) TIDAK diketahui tapi dapat dianggap SAMA, maka variabel statistik: ( x1 x2 ) ( 1 2 ) t 1 1 SP n1 n1 S 2P (n1 1) S12 (n2 1) S 22 n1 n2 2 Akan terdistribusi menurut student t dengan derajat kebebasan v=n1+n2-2 Contoh Kecepatan penipisan lapisan pelindung produksi dari sebuah pabrik ditest secara statistik. Pabrik tsb ingin mengetahui perbedaan kecepatan penipisan lapisan pelindung yg terbuat dari bahan A dan dari bahan B. 12 sampel dari bahan A dicek, dan didapati rata-rata penipisan 85 unit dan standard deviasi 4. Sedangkan 10 buah sampel dari bahan B memiliki rata-rata 81 dengan sampel standard deviasi 5. Dapatkah disimpulkan bahwa rata-rata penipisan bahan A lebih besar dari 2 unit dibandingkan penipisan bahan B? Asumsikan populasi keduanya normal, dan variansi kedua populasi sama. Pergunakan tingkat signigikan 5% Solusi Diketahui: Sampel A Sampel B nA = 12 nB = 10 xsA = 85 xSB = 81 SA = 4 SB = 5. σ tidak diketahui, tapi dianggap sama. Populasi normal. α= 5% Klaim μA – μB > 2 Solusi 1. Hipotesa H0: μA – μB ≤ 2 H1: μA – μB > 2 2. Tingkat signifikan α = 5% 3. Daerah kritis Test statistik yg dipakai adalah student t, dengan derajat kebebasan v=nA+nB – 2 = 12+10-2 = 20, dengan t adalah ( x x ) ( 1 2 ) t 1 2 1 1 SP n1 n1 S 2 P (n1 1) S12 (n2 1) S 22 n1 n2 2 Nilai kritis t0.05 = 1.725 (untuk v=20). Tolak H0 jika t > t0.05 = 1.725 Solusi 4. Hitung statistik: S 2 P (n1 1) S12 (n2 1) S 22 (12 1) * 42 (10 1) * 52 4.478 n1 n2 2 12 10 2 t hitung ( x1 x2 ) ( 1 2 ) (85 81) (2) 1.04 1 1 1 1 SP 4.478 n1 n1 12 10 5. Keputusan: Karena thitung < 1.725, maka H0 tak dapat ditolak, Berarti μA – μB ≤ 2, tak dapat disimpulkan rata-rata penipisan bahan A tak dapat disimpulkan lebih dari 2 unit dibandingkan dari bahan B Test Statistik Berkenaan dengan Rata-Rata 2 Populasi (Variansi Populasi TIDAK diketahui TAPI BEDA) Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA dan xSB serta standard deviasi sampel SA dan SB yang berasal dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan σ2 ) TIDAK diketahui tapi dapat dianggap BEDA, maka variabel statistik: t ( x1 x2 ) ( 1 2 ) S12 S 22 n1 n2 dengan derajat kebebasan v: 2 S S n1 n2 2 2 2 S1 / n1 S 22 / n2 n1 1 n2 1 2 1 2 2 Contoh Berikut ini adalah data lama waktu pemutaran film yg diproduksi oleh dua buah rumah produksi: Rumah Produksi LAMA WAKTU (menit) A 102 80 B 81 98 109 92 165 97 134 92 87 114 Hipotesanya adalah rata-rata lama waktu film produksi B lebih lama 10 menit dibandingkan rumah produksi A, dengan alternatif hipotesanya adalah lama waktu film dari A kelebihannya < 10 menit dibandingkan dengan film produksi B. Pergunakan tingkat signifikansi 10% dan asumsikan distribusi populasi A dan B normal dengan variansi yang tidak sama! Solusi Perhitungan rata-rata dan variansi XA 102 80 98 109 92 XB N dA=XA-Xsa dB=XB-Xsb dA2 dB2 81 5.8 -29 33.64 841 -16.2 55 262.4 3025 x x j j N 165 97 1.8 -13 3.24 169 12.8 24 163.8 576 -4.2 -18 17.64 324 134 92 87 481 770 Rata 96.2 110 S2 (x j x )2 j N 1 x A 96.2 xB 110 -23 529 S A2 480.8 / 4 120.2 4 16 S B2 5480 / 6 913.3 114 Sum N 480.8 5480 Solusi Variabel t : t ( xB x A ) ( B A ) S A2 S B2 n A nB (110 96.2) (10) 0.306 120.2 / 5 913.3 / 7 Derajat kebebasan v: 2 2 S12 S 22 120 . 2 913 . 3 n1 n2 5 7 2 8.00 2 2 2 2 2 120 . 2 / 5 913 . 3 / 7 S1 / n1 S /n 2 2 5 1 7 1 n1 1 n2 1 Solusi 1. Hipotesa H0: μB – μA ≥ 10 H1: μB – μA <10 2. Tingkat signifikan α = 0.1 3. Daerah kritis Test statistik yg dipakai adalah variabel t: t ( x1 x2 ) ( 1 2 ) S12 S 22 n1 n2 Nilai kritis -t0.1 = -1.397 untuk derajat kebebasan v=8 Tolak H0 jika t < -1.397 Solusi 4. Perhitungan statistik: thitung ( xB x A ) ( B A ) S A2 S B2 n A nB (110 96.2) (10) 0.306 120.2 / 5 913.3 / 7 5. Keputusan: Karena thitung > -1.397 maka H0 tak bisa ditolak atau lama waktu film A memang lebih dari 10 menit dari pada film B Test Statistik Berkenaan dengan Pengamatan Pasangan Data Situasi : Pengamatan pasangan data, dengan d1, d2 dst adalah selisih dari data-data hasil pengamatan yang diambil dari populasi normal. Ingin diketahui apakah rata-rata selisihnya sama dengan nilai tertentu. Dari sampel-sampel diketahui rata-rata dan standard deviasi selisih sampel sebagai D dan SD. Variabel statistik yg diperiksa adalah: t d D SD / n dimana μD adalah rata-rata populasi yang memiliki distribusi student t dengan derajat kebebasan v=n-1